如何使用 SSML 标记自定义生成的语音
编辑
Wave.video 使用Amazon Polly技术从文本生成音轨。有时,默认结果并不完美,您可能需要调整语音。下面是 SSML 标签,希望对您有所帮助!
如何开始在文本到语音中使用 SSML
这很简单!将文本放入两个<speak>
标记中:
<说>你好!</说
请注意,有些 SSML 标签不能用于神经语音,反之亦然。请确保使用正确的标记。
如何暂停
TTS 会在逗号、句末和段落后自动暂停。创建额外停顿的最简单方法是使用<break>
标记。普通语音和神经语音都可以使用。
该标签有不同的参数来定义暂停的强度:弱、中、强、x-强
。此外,您还可以使用时间
参数指定暂停的确切时间。请参阅下面的示例:
<speak>
Oh, laziness, come, come to me, <break strength="strong"/> alone.
You’re called for by soft coolness and good rest <break time="0.8s"/>
Only in you I see my goddess own
</speak>
如何改变音调或让声音更响亮/更安静
您可以使用 <prosody> 标签使声音变大或变小。使用silent、x-soft、soft、medium、loud、x-loud
值来改变声音
:
<speak> 每个人都想知道<prosody volume="x-loud">蓝调</prosody>从何而来? </speak>
想要更严格地控制音量?只需输入分贝值即可。试试吧
<speak> And everything <prosody volume="-5dB">看起来不错</prosody> tonight </speak>
注: +6 分贝几乎使音量翻倍,-6 分贝则使音量降低 50%。
普通文本到语音和神经文本到语音都支持音量控制。
加快或减慢语速
同样的<prosody>
标签在这里也有帮助!速度可以通过速率
属性设置,使用x-慢、慢、中、快、x-快
或百分比。试试这个:
<speak> <prosody rate="x-slow">红色货车,黄色货车。</prosody> <prosody rate="fast">红色货车,黄色货车。</prosody> <prosody rate="200%">红色货车,黄色货车。
既适用于神经语音,也适用于普通语音。
强调
要强调一个词,请使用带有level
属性的<emphasis>
标签。它有 3 个选项,下面是它们的工作原理:
强
: 增大音量,放慢语速,使讲话声音更大,语速更慢。适度
:增大音量,放慢语速,但比 "强 "小。默认为中等。减小
:降低音量并加快语速。语音更柔和,语速更快。
这里有一个例子:
<speak> <emphasis level="reduced">她是那个</emphasis><emphasis level="strong">会注意到</emphasis>春天的第一朵骁勇<emphasis level="moderate">正在绽放</emphasis>的人</emphasis> </speak>
强调对神经声音不起作用。
新闻播报员讲话
您在寻找新闻播报员风格的演讲稿吗?我们可以满足您的需求!
<speak> <amazon:domain name="news"> 摘自 1912 年 4 月 16 日星期二出版的《卫报》:白星邮轮 "泰坦尼克号 "的处女航以灾难告终。泰坦尼克号于周三从南安普顿出发前往纽约。周日深夜,它在纽芬兰大浅滩附近撞上了冰山。泰坦尼克号通过无线电报发出了求救信号,附近的几艘邮轮及时捕捉到了信号并作出了反应。
不过,有些神经语音也可以使用这种技巧:
马修或乔安娜的声音 (en-US)
卢佩
艾米 (en-GB)
想用 SSML 做更多事情?
在亚马逊 Polly 文档中了解此功能的所有选项。