Wave.video maakt gebruik van Amazon Polly-technologie om audiotracks te genereren uit tekst. Soms is het standaardresultaat niet vlekkeloos, en wilt u misschien de spraak afstemmen. Hier komen de SSML tags voor uw hulp!

Hoe gebruik je SSML in je tekst-naar-spraak programma?

Het is gemakkelijk! Zet je tekst in twee <speak> tags:

<Hallo!

Merk op dat sommige SSML-tags niet werken met neurale stemmen, en omgekeerd. Zorg ervoor dat je de juiste gebruikt .

Hoe maak je een pauze

TTS maakt automatisch pauzes na komma's, uiteinden van zinnen en alinea's. De eenvoudigste manier om een extra pauze in te lassen is de code <break>. Deze is beschikbaar voor zowel gewone als neurale stemmen.

Deze tag heeft verschillende parameters die bepalen hoe sterk de pauze zal zijn: zwak, medium, sterk, x-sterk. Ook kun je de exacte tijd van de pauze opgeven met de parameter tijd. Zie de voorbeelden hieronder:

<speak>
Oh, luiheid, kom, kom tot mij, <break strength="strong"/> alleen.
Je wordt opgeroepen door zachte koelte en goede rust <break time="0.8s"/>
Alleen in jou zie ik mijn godin eigen
</speak>

Hoe verander je de toonhoogte van de stem of maak je hem luider/sneller?

Je kunt de stem luider of stiller laten klinken met <prosody> tag. Gebruik de waarden silent, x-soft, soft, medium, loud, x-loud om het te veranderen:

<speak>
Iedereen vraagt zich af <prosody volume="x-loud">waar komt de blues vandaan?
</speak>

Wil je het volume strikter regelen? Zet gewoon een waarde in dB. Probeer het eens:

<speak>
En alles <prosody volume="-5dB">ziet er goed uit</prosody> vanavond
</speak>

Opmerking: +6dB verdubbelt bijna het volume, -6dB maakt het 50% stiller.

Volumeregeling wordt ondersteund door zowel gewone als neurale tekst-naar-spraak.

Sneller of langzamer spreken

Dezelfde <prosody> tag helpt hier! Snelheid kan worden ingesteld met het rate attribuut met x-slow, slow, medium, fast, x-fast of percentage. Probeer dit eens:

<speak>
<prosody rate="x-slow">Rode vrachtauto, gele vrachtauto.</prosody>
<prosody rate="fast">Rode vrachtauto, gele vrachtauto.</prosody>
<prosody rate="200%">Rode vrachtauto, gele vrachtauto.</prosody>
</speak>

Werkt zowel voor neurale als gewone stemmen.

Leg de nadruk op

Om een woord te benadrukken gebruik je de <emphasis> tag met het level attribuut. Het heeft 3 opties, hier staat hoe ze werken:

  • Sterk: Verhoogt het volume en vertraagt de spreeksnelheid, zodat er luider en langzamer gesproken wordt.

  • Matig: Verhoogt het volume en vertraagt de spreeksnelheid, maar minder dan sterk. Matig is de standaardinstelling.

  • Verminderd: Verlaagt het volume en versnelt de spreeksnelheid. De spraak is zachter en sneller.

Hier is een voorbeeld:

<speak>
<emphasis level="reduced">Zij is degene</emphasis>
die <emphasis level="strong">zal merken</emphasis>
dat de eerste leeuwenbek van de lente <emphasis level="moderate">in bloei staat</emphasis>
</speak>

Benadrukken werkt niet met neurale stemmen.

Nieuwslezeres toespraak

Op zoek naar een speech in de stijl van een nieuwslezer? We hebben dat onder controle!

<speak>
<amazon:domain name="news">
Uit de dinsdag 16 april 1912 editie van The Guardian krant: De eerste reis van de White Star liner Titanic, het grootste schip ooit te water gelaten, is uitgelopen op een ramp. De Titanic begon haar reis van Southampton naar New York op woensdag. Zondagavond laat sloeg zij op een ijsberg voor de Grand Banks van Newfoundland. Via draadloze telegrafie zond zij noodsignalen uit, en verschillende schepen waren dichtbij genoeg om de oproep op te vangen en te beantwoorden.
</amazon:domain>
</speak>

Deze truc is echter beschikbaar voor sommige neurale stemmen:

  • Matthew of Joanna stemmen (en-US)

  • Lupe (es-US)

  • Amy (en-GB)

Wil je meer doen met SSML?

Ontdek alle mogelijkheden van deze functie in de Amazon Polly documentatie.

Heeft dit je vraag beantwoord?