SSMLタグを使って生成された音声をカスタマイズする方法
Wave.videoは、テキストからオーディオトラックを生成するためにAmazon Pollyテクノロジーを使用しています。時々、デフォルトの結果は完璧ではなく、音声を調整したくなるかもしれません。そんなときに役立つSSMLタグを紹介します!
音声合成でSSMLを使い始めるには
簡単だ!テキストを2つの<speak>
タグの中に入れてください:
<発言>こんにちは!</発言
SSMLのタグの中には、neural voicesでは機能しないものがあり、またその逆もありますのでご注意ください。ここで正しいものを使っていることを確認してください。
ポーズの取り方
TTSはコンマや文末、段落の後に自動的にポーズを作ります。追加のポーズを作る最も簡単な方法は、<break>
タグを使うことです。これは通常の音声とニューラル音声の両方で利用できます。
このタグには、休止の強さを定義するさまざまなパラメーターがある:弱、中、強、x-strong
。また、time
パラメータで一時停止の正確な時間を指定することもできる。以下の例を参照してください:
<speak> ああ、怠惰よ、来なさい、<break strength="strong"/>私のところに来なさい、一人で <break time="0.8s"/>柔らかな涼しさと良い休息があなたを求めている <break time="0.8s"/>あなたの中にだけ、私は自分の女神を見る</speak>。
声のピッチを変えたり、大きくしたり小さくしたりする方法
<prosody>タグで音声を大きくしたり小さくしたりできます。silent、x-soft、soft、medium、loud、x-loudの
値を使って変更してください:
<speak>誰もが<prosody volume="x-loud">ブルースはどこから来たのか</prosody>と疑問に思っていることだろう。 </speak>。
もっと厳密に音量をコントロールしたいですか?dB単位で数値を指定するだけです。試してみてください:
<speak> そして今夜はすべて<prosody volume="-5dB">いい感じ</prosody> </speak
注: +6dBで音量はほぼ2倍になり、-6dBで50%静かになる。
音量調節は、通常の音声合成とニューラル音声合成の両方に対応している。
スピーチを速くしたり遅くしたりする
ここでも同じ<prosody>
タグが役立ちます!速度は、x-slow、slow、medium、fast、x-fast
、またはパーセンテージを使ってrate
属性で設定できます。これを試してみてください:
<speak> <prosody rate="x-slow">赤いローリー、黄色いローリー。</prosody> <prosody rate="fast">赤いローリー、黄色いローリー。</prosody> <prosody rate="200%">赤いローリー、黄色いローリー。
神経音声と通常の音声の両方に対応。
強調する
単語を強調するには、<emphasis>
タグとlevel
属性を使います。このタグには3つのオプションがあります:
Strong
:音量を上げ、話す速度を遅くする。中程度
:音量を上げ、話す速度を遅くするが、強よりは小さい。デフォルトはModerate。縮小
:音量を下げ、話す速度を速める。話し方が柔らかく、速くなる。
例を挙げよう:
<speak> <emphasis level="reduced">彼女は、春一番のキンギョソウが<emphasis level="moderate">咲いていることに<emphasis level="strong">気づく</emphasis>人だ</speak>。
神経音声では強調は効かない。
ニュースキャスターのスピーチ
ニュースキャスタースタイルのスピーチをお探しですか?お任せください!
<speak> <amazon:domain name="news"> ガーディアン紙1912年4月16日火曜日版より:史上最大の客船、ホワイトスター・ライナー、タイタニック号の処女航海は、大惨事に終わった。タイタニック号は水曜日にサウサンプトンからニューヨークへの航海を開始した。日曜日の夜遅く、ニューファンドランドのグランドバンクス沖で氷山に衝突した。無線電信によって、タイタニック号は遭難信号を発信した。 </amazon:domain> </speak> </amazon:domain> </speak>。
しかし、このトリックは一部の神経音声で利用できる:
マシューまたはジョアンナの声(英語)
ルーペ
エイミー
SSMLをもっと使いたい?
この機能のすべてのオプションについては、Amazon Pollyのドキュメントをご覧ください。