Universal dependencies (UD) is a framework for morphosyntactic annotation of human language, which to date has been used to create treebanks for more than 100 languages. In this article, we outline the linguistic theory of the UD framework, which draws on a long tradition of typologically oriented grammatical theories. Grammatical relations between words are centrally used to explain how predicate–argument structures are encoded morphosyntactically in different languages while morphological features and part-of-speech classes give the properties of words. We argue that this theory is a good basis for cross-linguistically consistent annotation of typologically diverse languages in a way that supports computational natural language understanding as well as broader linguistic studies.
RESUMO:Neste artigo apresentamos a filosofia geral da Gramateca -um ambiente para fazer uma gramática da língua portuguesa baseada em corpos -e alguns estudos no seu âmbito, nomeadamente o estudo (1) dos conectores condicionais, (2) das palavras referentes ao corpo humano e (3) das emoções na língua. A ênfase é na metodologia, e apresentamos detalhadamente o sistema Rêve para rever e partilhar anotações linguísticas. Ao descrever os vários estudos, indicamos também as metamorfoses e melhorias por que essa ferramenta passou, assim como o tipo de perguntas e de resultados que já conseguimos obter em áreas muito diversas. PALAVRAS-CHAVE:Corpos. Anotação. Semântica. Ferramentas de corpora.ABSTRACT: This paper presents the general philosophy of Gramateca, for corpus-based Portuguese grammar studies, by reporting on three different studies -conditional connectives, body terms, and emotionsemphasizing methodological aspects. It presents in detail the Rêve system, which allows revising and sharing annotations of Rêve's underlying corpora. While describing the different studies we also report on the improvement of the Rêve tool, and discuss the kinds of questions and results already available for diverse fields. KEYWORDS:Corpus. Annotation. Semantics. Corpora tools. ApresentaçãoNeste artigo apresentamos a filosofia geral da Gramateca 1 -um ambiente para fazer gramática com base em corpos 2 . Gramática, aqui, é entendida em sentido amplo e compreende * Universidade de Oslo e Linguateca ** Universidade de Lisboa (FLUL) *** PUC-Rio e Linguateca **** Universidade do Minho e Linguateca ***** Linguateca 1 http://www.linguateca.pt/Gramateca 2 Utilizamos ao longo do artigo o termo "corpo", como já foi defendido em Santos (2008, p. 43): "Vejamos o próprio exemplo da linguística com corpos: este último objecto tem sido variadamente chamado corpora (plural corpora), córpus (plural corpora ou córpus), mas parece não ter sido sequer equacionado o uso duma palavra genuinamente portuguesa e semelhante, corpo, empregue aliás de forma análoga em linguagem legal: corpo de delito. Na acepção mais lata de corpo como colecção de textos, é usada naturalmente a palavra acervo no Brasil,
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.