如何使用 SSML 标记自定义生成的语音

编辑

Wave.video 使用Amazon Polly技术从文本生成音轨。有时,默认结果并不完美,您可能需要调整语音。下面是 SSML 标签,希望对您有所帮助!

如何开始在文本到语音中使用 SSML

这很简单!将文本放入两个<speak>标记中:

<说>你好!</说

请注意,有些 SSML 标签不能用于神经语音,反之亦然。请确保使用正确的标记。

如何暂停

TTS 会在逗号、句末和段落后自动暂停。创建额外停顿的最简单方法是使用<break>标记。普通语音和神经语音都可以使用。

该标签有不同的参数来定义暂停的强度:弱、中、强、x-强。此外,您还可以使用时间参数指定暂停的确切时间。请参阅下面的示例:

<speak>
Oh, laziness, come, come to me, <break strength="strong"/> alone.
You’re called for by soft coolness and good rest <break time="0.8s"/>
Only in you I see my goddess own
</speak>

如何改变音调或让声音更响亮/更安静

您可以使用 <prosody> 标签使声音变大或变小。使用silent、x-soft、soft、medium、loud、x-loud值来改变声音

<speak> 每个人都想知道<prosody volume="x-loud">蓝调</prosody>从何而来? </speak>

想要更严格地控制音量?只需输入分贝值即可。试试吧

<speak> And everything <prosody volume="-5dB">看起来不错</prosody> tonight </speak>

注: +6 分贝几乎使音量翻倍,-6 分贝则使音量降低 50%。

普通文本到语音和神经文本到语音都支持音量控制。

加快或减慢语速

同样的<prosody>标签在这里也有帮助!速度可以通过速率属性设置,使用x-慢、慢、中、快、x-快或百分比。试试这个:

<speak> <prosody rate="x-slow">红色货车,黄色货车。</prosody> <prosody rate="fast">红色货车,黄色货车。</prosody> <prosody rate="200%">红色货车,黄色货车。

既适用于神经语音,也适用于普通语音。

强调

要强调一个词,请使用带有level属性的<emphasis>标签。它有 3 个选项,下面是它们的工作原理:

  • : 增大音量,放慢语速,使讲话声音更大,语速更慢。

  • 适度:增大音量,放慢语速,但比 "强 "小。默认为中等。

  • 减小:降低音量并加快语速。语音更柔和,语速更快。

这里有一个例子:

<speak> <emphasis level="reduced">她是那个</emphasis><emphasis level="strong">会注意到</emphasis>春天的第一朵骁勇<emphasis level="moderate">正在绽放</emphasis>的人</emphasis> </speak>

强调对神经声音不起作用。

新闻播报员讲话

您在寻找新闻播报员风格的演讲稿吗?我们可以满足您的需求!

<speak> <amazon:domain name="news"> 摘自 1912 年 4 月 16 日星期二出版的《卫报》:白星邮轮 "泰坦尼克号 "的处女航以灾难告终。泰坦尼克号于周三从南安普顿出发前往纽约。周日深夜,它在纽芬兰大浅滩附近撞上了冰山。泰坦尼克号通过无线电报发出了求救信号,附近的几艘邮轮及时捕捉到了信号并作出了反应。

不过,有些神经语音也可以使用这种技巧:

  • 马修或乔安娜的声音 (en-US)

  • 卢佩

  • 艾米 (en-GB)

想用 SSML 做更多事情?

亚马逊 Polly 文档中了解此功能的所有选项。