SSMLタグを使って生成された音声をカスタマイズする方法

編集

Wave.videoは、テキストからオーディオトラックを生成するためにAmazon Pollyテクノロジーを使用しています。時々、デフォルトの結果は完璧ではなく、音声を調整したくなるかもしれません。そんなときに役立つSSMLタグを紹介します!

音声合成でSSMLを使い始めるには

簡単だ!テキストを2つの<speak>タグの中に入れてください:

<発言>こんにちは!</発言

SSMLのタグの中には、neural voicesでは機能しないものがあり、またその逆もありますのでご注意ください。ここで正しいものを使っていることを確認してください。

ポーズの取り方

TTSはコンマや文末、段落の後に自動的にポーズを作ります。追加のポーズを作る最も簡単な方法は、<break>タグを使うことです。これは通常の音声とニューラル音声の両方で利用できます。

このタグには、休止の強さを定義するさまざまなパラメーターがある:弱、中、強、x-strong。また、timeパラメータで一時停止の正確な時間を指定することもできる。以下の例を参照してください:

<speak> ああ、怠惰よ、来なさい、<break strength="strong"/>私のところに来なさい、一人で <break time="0.8s"/>柔らかな涼しさと良い休息があなたを求めている <break time="0.8s"/>あなたの中にだけ、私は自分の女神を見る</speak>。

声のピッチを変えたり、大きくしたり小さくしたりする方法

<prosody>タグで音声を大きくしたり小さくしたりできます。silent、x-soft、soft、medium、loud、x-loudの値を使って変更してください:

<speak>誰もが<prosody volume="x-loud">ブルースはどこから来たのか</prosody>と疑問に思っていることだろう。 </speak>。

もっと厳密に音量をコントロールしたいですか?dB単位で数値を指定するだけです。試してみてください:

<speak> そして今夜はすべて<prosody volume="-5dB">いい感じ</prosody> </speak

注: +6dBで音量はほぼ2倍になり、-6dBで50%静かになる。

音量調節は、通常の音声合成とニューラル音声合成の両方に対応している。

スピーチを速くしたり遅くしたりする

ここでも同じ<prosody>タグが役立ちます!速度は、x-slow、slow、medium、fast、x-fast、またはパーセンテージを使ってrate属性で設定できます。これを試してみてください:

<speak> <prosody rate="x-slow">赤いローリー、黄色いローリー。</prosody> <prosody rate="fast">赤いローリー、黄色いローリー。</prosody> <prosody rate="200%">赤いローリー、黄色いローリー。

神経音声と通常の音声の両方に対応。

強調する

単語を強調するには、<emphasis>タグとlevel属性を使います。このタグには3つのオプションがあります:

  • Strong:音量を上げ、話す速度を遅くする。

  • 中程度:音量を上げ、話す速度を遅くするが、強よりは小さい。デフォルトはModerate。

  • 縮小:音量を下げ、話す速度を速める。話し方が柔らかく、速くなる。

例を挙げよう:

<speak> <emphasis level="reduced">彼女は、春一番のキンギョソウが<emphasis level="moderate">咲いていることに<emphasis level="strong">気づく</emphasis>人だ</speak>。

神経音声では強調は効かない。

ニュースキャスターのスピーチ

ニュースキャスタースタイルのスピーチをお探しですか?お任せください!

<speak> <amazon:domain name="news"> ガーディアン紙1912年4月16日火曜日版より:史上最大の客船、ホワイトスター・ライナー、タイタニック号の処女航海は、大惨事に終わった。タイタニック号は水曜日にサウサンプトンからニューヨークへの航海を開始した。日曜日の夜遅く、ニューファンドランドのグランドバンクス沖で氷山に衝突した。無線電信によって、タイタニック号は遭難信号を発信した。 </amazon:domain> </speak> </amazon:domain> </speak>。

しかし、このトリックは一部の神経音声で利用できる:

  • マシューまたはジョアンナの声(英語)

  • ルーペ

  • エイミー

SSMLをもっと使いたい?

この機能のすべてのオプションについては、Amazon Pollyのドキュメントをご覧ください。