RESUMO:Neste artigo apresentamos a filosofia geral da Gramateca -um ambiente para fazer uma gramática da língua portuguesa baseada em corpos -e alguns estudos no seu âmbito, nomeadamente o estudo (1) dos conectores condicionais, (2) das palavras referentes ao corpo humano e (3) das emoções na língua. A ênfase é na metodologia, e apresentamos detalhadamente o sistema Rêve para rever e partilhar anotações linguísticas. Ao descrever os vários estudos, indicamos também as metamorfoses e melhorias por que essa ferramenta passou, assim como o tipo de perguntas e de resultados que já conseguimos obter em áreas muito diversas.
PALAVRAS-CHAVE:Corpos. Anotação. Semântica. Ferramentas de corpora.ABSTRACT: This paper presents the general philosophy of Gramateca, for corpus-based Portuguese grammar studies, by reporting on three different studies -conditional connectives, body terms, and emotionsemphasizing methodological aspects. It presents in detail the Rêve system, which allows revising and sharing annotations of Rêve's underlying corpora. While describing the different studies we also report on the improvement of the Rêve tool, and discuss the kinds of questions and results already available for diverse fields.
KEYWORDS:Corpus. Annotation. Semantics. Corpora tools.
ApresentaçãoNeste artigo apresentamos a filosofia geral da Gramateca 1 -um ambiente para fazer gramática com base em corpos 2 . Gramática, aqui, é entendida em sentido amplo e compreende * Universidade de Oslo e Linguateca ** Universidade de Lisboa (FLUL) *** PUC-Rio e Linguateca **** Universidade do Minho e Linguateca ***** Linguateca 1 http://www.linguateca.pt/Gramateca 2 Utilizamos ao longo do artigo o termo "corpo", como já foi defendido em Santos (2008, p. 43): "Vejamos o próprio exemplo da linguística com corpos: este último objecto tem sido variadamente chamado corpora (plural corpora), córpus (plural corpora ou córpus), mas parece não ter sido sequer equacionado o uso duma palavra genuinamente portuguesa e semelhante, corpo, empregue aliás de forma análoga em linguagem legal: corpo de delito. Na acepção mais lata de corpo como colecção de textos, é usada naturalmente a palavra acervo no Brasil,
In this paper we describe the first evaluation contest (track) for Portuguese whose goal was to detect and classify relations between named entities in running text, called ReRelEM. Given a collection annotated with named entities belonging to ten different semantic categories, we marked all relationships between them within each document. We used the following fourfold relationship classification: identity, included-in, located-in, and other (which was later on explicitly detailed into twenty different relations). We provide a quantitative description of this evaluation resource, as well as describe the evaluation architecture and summarize the results of the participating systems in the track.
This paper studies the field of admiração in their two meanings in Portuguese, namely: veneration/respect and surprise, using the framework suggested in Belinda Maia’s PhD thesis (Maia 1994/1996). After presenting briefly her findings and methodology, we investigate (i) the distribution of the vague words of the field of admiração by the two meanings, and discuss the heuristics used in its rule-based distinction; (ii) the distribution of admiração by genre, tense and person; (iii) its presence in negative sentences; and (iv) its antonym(s).
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.