Kennis toepassen op onze zinnen

From Control Systems Technology Group
Jump to navigation Jump to search

Terug: Week 3


Zinnen

In het onderstaande bestand staan alle bewerkte zinnen:

File:Robotstemmen.zip

De zinnen die in de enquête worden gebruikt zijn de volgende 7 schuingedrukte zinnen.

  • 0. Hello I am Will! Thank you for joining. Let's see how your typical shower goes.


Do you take a shower every day? (yes/no)

  • 1. Yes: (Sad) It is such a shame that you choose to behave in this way.
  • 2. No: (Happy) Yes, that is the way to go!


On the average, do you shower longer than ten minutes? (yes/no)

  • 3. Yes: (Sad) You let me down. Please change your behavior.
  • 4. No: (Happy) That is what I would like to hear!


Do you turn off the shower when you are using shampoo or soap? (yes/no)

  • 5. No: (Sad) I am disappointed that you waste so much water.
  • 6. Yes: (Happy) That is fantastic. Keep up the good work!


Zin 1:

Duration:

Zin 1 heeft 14 lettergrepen. Uitgaande van 1.91 lettergrepen per seconde, zou het fragment rond de 7.3 seconden moeten duren. Het onderzoek dat dit zegt is daarentegen maar met drie mensen uitgevoerd. De resultaten zijn dus niet extreem betrouwbaar. (Emotions and Speech: some acoustic correlates.) Wij vinden persoonlijk dat 1.91 lettergrepen per seconde veel te langzaam is voor onze zin. Per zin is het natuurlijk ook verschillende, doordat spreeksnelheid ook afhangt van de lengte van alle woorden. Mede door de lage betrouwbaarheid van de bron en het feit dat wij een andere zin gebruiken, verhogen wij de snelheid naar 2.5 lettergrepen/sec. Dit komt overeen met -5 voor speech rate in acapelabox.

De langere woorden 'shame' en 'behave' hebben we relatief langzamer laten uitspreken dan de andere (korte) woorden. We hebben hiervoor 'shame' en 'behave' verlangzaamd (17%) en een aantal andere woorden versneld, omdat anders het totaal te langzaam werd. De woorden die versneld zijn, zijn; 'that you choose' (10%) en 'in this way'.


Gemiddelde toonhoogte (F0):

We hebben de waarde op -5 gezet in acapelabox.


Amplitude:

Verdriet is volgens onderzoek iets zachter dan neutraal, maar met het oogpunt op het feit dat het anders zo zou kunnen zijn dat participanten hun geluid zachter zetten na een blije stem (die 10 dB harder is) en vervolgens de verdrietige stem niet goed meer kunnen verstaan, hebben we de verdrietige stem net zo hard gemaakt als de neutrale stem.


Pitch variaties:

Uit de grafiekjes van (Prosody and speak state: paralinguistics, prgmatics, and proficiency) blijkt dat er vlak na het begin een kleine frequentieverhoging te horen is. Deze hebben we toegepast op 'shame'. De hoogte is met 5% toegenomen.


Zin 2:

Duration:

Zin 2 heeft 7 lettergrepen. De spreeksnelheid die uit onze bronnen blijkt ligt rond de 4.15 lettergrepen per seconde.(Emotions and Speech: some acoustic correlates.) (Emotions and speech: some acoustic correlates). We zetten de speech rate op +15. De snelheid komt dan neer op 3.5 lettergrepen per seconde.

Audacity: We willen meer nadruk leggen op 'that' en daarvoor moet we het tempo van dit woord verlagen en het woord dus verlengen. Verder passen we niets aan aan het tempo aangezien alle woorden 1 lettergreep hebben en het verschil verder dus niet uitmaakt.


Gemiddelde toonhoogte (F0):

We hebben de waarde op +5 gezet.


Amplitude:

We hebben de amplitde 7 dB hoger gezet dan die van de neutrale zin. De hoogste piek van de neutrale zin staat op -12 dB dus we hebben een nieuwe piekamplitude van -5 dB ingesteld voor zin 2 met blije emotie.

Zoals al genoemd willen we meer de nadruk leggen op 'that' dus hiervan hebben we amplitude nog wat hoger ingesteld door het gebruiken van de combinatietool. Daarnaast willen we minder nadruk lekker op 'way' dus verlagen wij hier de amplitude van.


Pitch variaties:

Er mag meer enthousiasme op de woorden 'Yes' en 'go'. Voor het woord 'Yes' hebben we de frequentie met 10% verhoogd. De frequentie van het woord 'go' is met 8% verhoogd.


Zin 3:

Duration:

Zin 3 heeft 11 lettergrepen. We zetten deze ook weer op -5. De snelheid van deze zin komt dan neer op 2.2 lettergrepen per seconde.

De woorden 'please' en 'behavior' zijn de langste woorden. Daarnaast klinkt het voor ons idee ook het natuurlijkste om deze het langer te maken. Beide woorden hebben we met 15% verlengd. 'Change' hebben we met 25% verkort omdat acapelabox het woord om een bepaalde reden erg langzaam uitspreekt. Daarnaast hebben we 'ange' nog eens 10% extra verkort.' 'Down' hebben 15% vertraagd.

'Let me' klonk erg snel achter elkaar, dus daar tussenin hebben we de spatie 50% verlengd. Daarnaast is 'let me' in z'n geheel nog met 20% verlengd.

Gemiddelde toonhoogte (F0):

We hebben de waarde op -5 gezet.


Amplitude:

De hardheid van de stem hebben we weer aangepast aan de neutrale zin, net als bij zin 1, om te voorkomen dat de zin onhoorbaar wordt.

Het begin van 'down' klinkt harder om het woord enigszins te benadrukken. Dit omdat wij hoorden dat wij het ook zo uitspreken wanneer we de zin zelf reproduceren.


Pitch variaties:

'Down' hebben we 5% verlaagd, om het einde van de eerste zin omlaag te laten gaan. Dit is een kenmerk voor verdriet. (Emotive Qualities in Robot Speech). De toonhoogte van 'let' hebben we 5% verhoogd zodat het karakteristieke golfje in frequentieverandering voor verdriet hoorbaar is. (Emotions and Speech: some acoustic correlates).

Ditzelfde principe hebben we toegepast op de tweede zin. 'Please' is verhoogd met 5% en 'havior' is verlaagd met 3%.


Zin 4:

Duration:

Zin 4 heeft 8 lettergrepen. Speech rate wordt ingesteld op +15. Snelheid komt dan neer op 4 lettergrepen per seconde.


Gemiddelde toonhoogte (F0):

We hebben de waarde op +5 gezet.

De lengte van het woord 'hear' hebben we met 25% verlengd, oftewel de spreeksnelheid 25% langzamer gezet.


Amplitude:

We hebben de blije versie van deze zin 7 dB harder gemaakt dan de neutrale versie van deze zin. De amplitude is nu veranderd van -12 naar -5.

We hebben de amplitude van 'what' en 'like' verlaagd, omdat de stem erg hakkelig sprak. Hierdoor wordt niet elk woord afzonderlijk even hard benadrukt en klinkt het dus vloeiender.

Voor 'hear' hebben we de amplitude verhoogd.


Pitch variaties:

Het woord 'hear' hebben we met 5% verhoogd in toonhoogte.


Zin 5:

Duration:

Zin 5 heeft 13 lettergrepen. We zetten de instellingen voor deze zin ook weer op -5. De snelheid van deze zin komt neer op 2.9 lettergrepen per seconde.

De lange woorden in deze zin zijn 'disappointed' en 'water'. Om de zin in het algemeen niet te langzaam te maken, versnellen we de korte woorden ipv vertragen van de langzame woorden.

'I am' en 'that you' hebben we met 15% versneld.

'Pointed' uit disappointed en 'water' zijn verlengd met 15%. Daarnaast is 'ter' uit water nog eens met 10% verlengd.


Gemiddelde toonhoogte (F0):

We hebben de waarde op -5 gezet.


Amplitude:

De maximale amplitude hebben we gelijkgetrokken met die van de neutrale zin.

De amplitude van 'dissapointed' is verhoogd. Geleidelijk wordt het woord weer zachter zodat het volume in de zin geen sprongen maakt.


Pitch variatie:

'am' is 5% verhoogd om de frequentie contour uit de grafiek van (Emotions and Speech: some acoustic correlates) te volgen.

'Ter' uit water hebben we met 5% verlaagd, om de zin lager af te laten lopen.


Zin 6:

Duration:

Zin 6 heeft 10 lettergrepen. We zetten de speech rate weer op +15. De snelheid komt dan neer op 3.3 lettergrepen per seconde.

In deze zin zit maar één woord met meerdere lettergrepen. Uit de literatuur weten we dat bij blijheid woorden met één lettergreep gemiddeld sneller worden gesproken. Aangezien alle andere woorden in deze zin één lettergreep bevatten, hebben we deze woorden niet allemaal versneld, maar we hebben 'fantastic' langzamer gemaakt. We hebben zelf beoordeeld hoeveel langzamer het woord het beste klinkt. Naast het hele woord hebben we 'ta' apart ook met 25% opgerekt om het gehele woord extra nadruk te geven.


Gemiddelde toonhoogte (F0):

We hebben de waarde op +5 gezet.


Amplitude:

De amplitude wordt weer 7 dB harder gezet vergeleken met de neutrale versie van deze zin. Dus de max. amplitude stijgt van -12 naar -5 dB.

'tas' uit 'fantastic' hebben we harder gemaakt.

De amplitude van 'good' hebben we verhoogd.


Pitch variaties:

De woorden 'fantastic', 'good' en 'work' hebben we met 5% verhoogd.