Proceedings of the Third Workshop on Computational Linguistics For Uralic Languages 2017
DOI: 10.18653/v1/w17-0601
|View full text |Cite
|
Sign up to set email alerts
|

Synchronized Mediawiki based analyzer dictionary development

Abstract: Open-source analyzer dictionary development is being implemented for Skolt Sami, Ingrian, Moksha-Mordvin, etc. in the Helsinki CSC infrastructure; home of the Finnish Kielipankki 'Language Bank' and Termipankki 'Term Bank'. The proximity of minority-language corpora in need of annotation and the multiple usage of controlled wikimedia-type dictionaries make CSC an attractive site for synchronized transducer dictionary development. The open-source FST development of Uralic and other minority languages at Giellat… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1
1

Citation Types

0
9
0
2

Year Published

2020
2020
2022
2022

Publication Types

Select...
3
3
2
1

Relationship

4
5

Authors

Journals

citations
Cited by 15 publications
(11 citation statements)
references
References 0 publications
0
9
0
2
Order By: Relevance
“…Aineiston karttuessa projektin aikana hankittiin vielä myöhemmin toinen tallennuspalvelin, suki5, joka toi projektille toiset 20 teratavua tallennustilaa. Projektin palvelimet toimivat työvälineinä myös joillekin yhteistyökumppaneille toimien esimerkiksi Mediawikin testialustana Jack Rueterin Wiki-pohjaiselle sanakirjalle [36]. Palvelimista suki1, suki2 sekä suki5 ovat edelleen FIN-CLARIN infrastruktuurin aktiivisessa käytössä palvellen esimerkiksi Vaikuttavuussäätiön rahoittamaa "Language Identification of Speech and Text" -hanketta 11 sekä Muinaisen Lähiidän imperiumit -huippuyksikköä.…”
Section: Laskentaympäristöunclassified
See 1 more Smart Citation
“…Aineiston karttuessa projektin aikana hankittiin vielä myöhemmin toinen tallennuspalvelin, suki5, joka toi projektille toiset 20 teratavua tallennustilaa. Projektin palvelimet toimivat työvälineinä myös joillekin yhteistyökumppaneille toimien esimerkiksi Mediawikin testialustana Jack Rueterin Wiki-pohjaiselle sanakirjalle [36]. Palvelimista suki1, suki2 sekä suki5 ovat edelleen FIN-CLARIN infrastruktuurin aktiivisessa käytössä palvellen esimerkiksi Vaikuttavuussäätiön rahoittamaa "Language Identification of Speech and Text" -hanketta 11 sekä Muinaisen Lähiidän imperiumit -huippuyksikköä.…”
Section: Laskentaympäristöunclassified
“…Useille harvinaisemmille kielille saatiin aineistoa Jack Rueterin Koneen Säätiön rahoittamalta AKU-projektilta (Avointa kieliteknologiaa uralilaisille vähemmistökielille "Open-source Language Technology for Uralic Minority Languages"). 36 Näistä kielistä mainittakoon inkeroinen, hanti, komi ja nenetsi.…”
Section: Olemassa Olevien Kielikorpusten Inventaariounclassified
“…Despite the low number of speakers, they had the presentations of the Sami cultural event simultaneously interpreted from Skolt Sami to Finnish and from other Sami languages to Skolt Sami by professional interprets. Thanks to Rueter's continuous efforts for the digital revitalization of the language, Skolt Sami has an extensive digital multilingual dictionary [30] and FST morphology [27]. The situtaion of Skolt Sami is fortunate in the sense that it is one of many Sami languages.…”
Section: Endangered But How Endangered?mentioning
confidence: 99%
“…More recently, there have been efforts for using rule-based methods together with neural networks to achieve the same goal (Ens et al, 2019;Hämäläinen & Wiechetek, 2020). A variety of dictionary building methods has also emerged for language documentation (Garrett, 2018;Rueter & Hämäläinen, 2017). These tools provide a valuable resource for rule-based language modeling.…”
Section: Related Workmentioning
confidence: 99%