The focus of the article is on whether emotions could be traced in the temporal structure of Estonian speech. There are two research questions, namely, (a) Do emotions affect speech rate? and (b) What detectable traces, if any, might emotions generate in word prosody? To answer question (a), the articulation rate of emotional utterances was measured and the results were compared with those on neutral speech. The difference revealed was statistically significant. To answer question (b), the relations between emotions and the temporal characteristics of words with a vowel-centered structure were investigated. Sound durations were measured, various duration ratios were computed and various combinations of the characteristics where subjected to statistical analysis. The results revealed a certain difference between the temporal characteristics of Q2 and Q3 feet, and a loss of the difference between the second and third quantity degrees in sad speech.
Fundamental frequency (F0, perceived as pitch) is an important prosodic cue of emotion. The aim of the present study was to find out if sentence emotion has any influence detectable in the F0 height and range of Estonian read-out speech. Thus the F0 of each vowel found in Estonian read-out sentences was measured, and its median for three emotions (anger, joy, sadness) and for neutral speech was calculated. In addition, the F0 range was measured for emotional and neutral speech, as well as the height of F0 for sentence-initial and sentence-final positions. The results revealed that in the investigated material, F0 was highest for joy and lowest for anger. The F0 range, however, was widest for anger and narrowest for sadness. The differences in F0 height at the beginning versus the end of sentences were not statistically significant, either for pairs of emotions or for emotions compared with neutral speech.
The goal of this study was to conduct modelling experiments, the purpose of which was the expression of three basic emotions (joy, sadness and anger) in Estonian parametric text-to-speech synthesis on the basis of both a male and a female voice. For each emotion, three different test models were constructed and presented for evaluation to subjects in perception tests. The test models were based on the basic emotions’ characteristic parameter values that had been determined on the basis of human speech. In synthetic speech, the test subjects most accurately recognized the emotion of sadness, and least accurately the emotion of joy. The results of the test showed that, in the case of the synthesized male voice, the model with enhanced parameter values performed best for all three emotions, whereas in the case of the synthetic female voice, different emotions called for different models: the model with decreased values was the most suitable one for the expression of joy, and the model with enhanced values was the most suitable for the expression of sadness and anger. Logistic regression was applied to the results of the perception tests in order to determine the significance and contribution of each acoustic parameter in the emotion models, and the possible need to adjust the values of the parameters.Kokkuvõte. Kairi Tamuri ja Meelis Mihkla: Põhiemotsioonide väljendusvõimalused eestikeelsel parameetrilisel kõnesünteesil. Uurimistöö eesmärk oli läbi viia modelleerimiseksperimente kolme põhiemotsiooni (rõõmu, kurbuse ja viha) väljendamiseks eestikeelsel parameetrilisel kõnesünteesil nii mees- kui ka naissünteeshääle baasil. Selleks koostati iga emotsiooni kohta kolm erinevat katsemudelit, mida lasti katseisikutel tajutestidel hinnata. Katsemudelite aluseks oli inimkõne põhjal määratud põhiemotsioonidele omased parameetrite väärtused. Emotsioonidest tunti sünteeskõnes kõige paremini ära kurbuse-emotsioon ning kõige halvemini rõõmu-emotsioon. Testitulemused näitasid, et kui meessünteeshääle puhul töötas kõigi kolme emotsiooni puhul kõige paremini võimendatud väärtuste mudel, siis naissünteeshääle puhul vajasid erinevad emotsioonid erinevaid mudeleid: rõõmu väljendamiseks sobis kõige paremini vähendatud väärtuste mudel, kurbuse ja viha väljendamiseks võimendatud väärtuste mudel. Tajutestide tulemusi analüüsiti logistilisel regressioonil, et teha kindlaks üksikute akustiliste parameetrite olulisus ja osakaal emotsiooni mudelites ning parameetrite väärtuste korrigeerimisvajadused.Märksõnad: eesti keel, emotsioonid, kõnesüntees, akustiline mudel, kõnetempo, intensiivsus, põhitoon
Ülevaade. Formante peetakse üheks emotsiooni peegeldavaks akustiliseks parameetriks -kõneleja emotsionaalne seisund võib põhjustada muutusi häälikute formantstruktuuris. Uurimuse eesmärgiks on teada saada, kas ja kuidas mõjutab lausungi emotsioon eestikeelse etteloetud emotsionaalse kõne lühikesi vokaale ning ettelugeja artikulatsiooni täpsust. Selleks mõõdeti etteloetud emotsionaalse ning neutraalse kõne lühikeste rõhuliste vokaalide a, i, u esimest ja teist formanti. Uurimistulemustest selgus, et emotsioonipaariti (k.a neutraalne kõne) on statistiliselt olulised erinevused olemas vokaalide a ja i esimeste formantide (F1) keskmistes. Teine formant (F2) emotsioonide eristamisel olulist rolli ei mängi. Vokaalide redutseerumist ja artikulatsiooni täpsust uuriti eukleidilise kauguse arvutamise abil. Tulemused näita-sid, et viha-ja rõõmu-lausungites jääb kõneleja artikulatsiooni täpsus võrreldes neutraalse kõnega enam-vähem samaks, kurbuse-lausungites see aga langeb.* Võtmesõnad: emotsionaalne kõne, akustika, formantanalüüs, artikulatsiooni täpsus, eesti keel
Ülevaade. Pausidele on emotsionaalse kõne uurimustes suhteliselt vähe tähelepanu pööratud. Ilmselt seetõttu, et pausid ei ole esmased emotsiooni kandvad akustilised tunnused. Siiski on teada, et pausidel on emotsioonide eristamisel oma roll. Artiklis antakse vastus kahele küsimusele: kas eestikeelse etteloetud emotsionaalse teksti pausid sõltuvad oluliselt teksti emotsioonist ning kas teksti emotsioon on ära tuntav ainult pausierinevuste põhjal.* Võtmesõnad: emotsioonide akustika, etteloetud tekst, pausigrupid, pauside arv, pauside asukoht, pauside iseloom, pauside kestus, kõne-süntees, eesti keel
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.