Ülevaade. Tartu Ülikoolis kogutakse suulise eesti keele korpust ja (selle alamosana) dialoogikorpust, et uurida inimestevahelist suhtlust. Kaugem eesmärk on luua kasutajaliideseid, mis võimaldaksid inimkõne vahendusel suhelda elektrooniliste andmebaasidega. Suhtluse modelleerimine on edukam, kui selle aluseks võetud inimsuhtluse uurimine tehakse suurel eri allkeeli sisaldaval korpusel ning viiakse läbi nii kvantitatiivne kui ka kvalitatiivne analüüs. Artikkel tutvustab Tartu Ülikooli suulise eesti keele korpuse ehitust, transkribeerimise põhimõtteid ja dialoogiaktide annoteerimiseks kasutatavat tüpoloo-giat. Rakendusena vaadeldakse ametlikes telefonikõnedes esinevate päringute keelevaliku seletusi.* Võtmesõnad: suulise keele korpus, dialoogikorpus, transkriptsioon, dialoogiaktid, märgendamine, suuline suhtlus, eesti keel
SissejuhatusTänapäeval muutuvad järjest populaarsemaks nn intelligentsed kasutajaliidesed, mis võimaldavad inimkõne vahendusel suhtlemist elektrooniliste andmebaasidega. Väga lihtsa suhtluse modelleerimine (nt telefoninumbrite küsimine) ei vaja kuigivõrd tegeliku suulise keele ja selle kasutuse analüüsi. Kui aga soovitakse luua arvutiprogrammi, mis suudaks dialoogis osaleda inimesele võrdväärse partnerina, siis ei ole see ilma inimeste suhtlust analüüsimata võimalik.Suulise keele analüüs nõuab korpust. Enamasti on kasutajaliideste loomiseks kasutatud piiratud korpusi, mis sisaldavad suhtlust kindlate ülesannete raames ja mis on tihti kogutud rollimängude abil. Näiteks korpus COCONUT 1 koosneb inimestevahelistest arvuti kaudu vahendatud dialoogidest, milles osalejad teevad koostööd ! Tööd toetavad Eesti Teadusfond (grant nr 7503) ning Haridus-ja Teadusministeerium (siht nantseeritav teema "Loomulike keelte arvutitöötluse formalismide ja efektiivsete algoritmide väljatöötamine ning eesti keelele rakendamine" ja riiklik programm "Eesti keele keeletehnoloogiline tugi"). Täname anonüümseid retsensente.
Eesti partikkel jah täidab mitmeid suhtlusfunktsioone, teatmeteostes kajastuvad neist vaid mõned. Partiklite jah/jaa funktsioone suhtluses on uurinud R. Kasterpalu müügivestluste näitel. Analüüs näitab, et partikleid jah/jaa kasutatakse lisaks samameelsuse või jaatuse väljendamisele ka suhtlussekventside jätkamiseks ja lõpetamiseks. Lõpetav funktsioon on naaberpaari järelliikmel (nt vastus kas-küsimusele), aga ka järelliikmele järgneval ülekinnitusel (nt ettepanekuga nõustumisel). Partikleid jah/jaa kasutatakse samuti huvi mittepakkuva teema lõpetamiseks ning keset pooleliolevat kõnevooru kuuldeloleku ja vastuvõtu signaalina. O. Gerassimenko registratuurikõnede võrdluskorpus kinnitab neid tulemusi ning näitab, et eesti partiklite jah/jaa kasutusala on vene suhtluspartiklist oluliselt laiem. Erinevalt eesti partiklitest jah/jaa ei esine vene partiklit infosoovi vastuvõtmisel ning kuuldeloleku ja vastuvõtu signaalina. Küsimus-vastus sekventsis järgneb jah/jaa ootuspärasele vastusele. Tõlkesõnaraamatutes praeguseks käsitlemata erinevused nimetatud partiklite kasutuses tunduvad autoritele piisavalt olulised, et kajastada neid keeleõppes
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.