Este artigo apresenta o levantamento e a análise de bases lexicais verbais do português brasileiro (PB), que podem ser utilizadas em tarefas de Processamento de Língua Natural (PLN). Para tanto, considerou-se para análise apenas bases de dados com extensão superior a 1.000 lexemas verbais, disponíveis de maneira on-line e gratuita e atualizadas nos últimos 10 anos. Sendo assim, o estudo recaiu sob a análise crítica e comparada de três bases lexicais: VerbNet.Br (SCARTON, 2013), Verbo-Brasil (DURAN; ALUÍSIO, 2015) e VerboWeb (CANÇADO et al., 2018), destacando-se seus pontos comuns e divergentes. Acredita-se que esta pesquisa contribui com a atualização do estado da arte, no que se refere às bases lexicais verbais do PB da última década, além de elencar ações investigativas futuras para criação, revisão e/ou ampliação de recursos descritivos linguísticos do PB.
Dependency Grammar has recently gained relevance with the increase of works using its methodology to perform automatic syntactic analysis. They are very productive in terms of syntactic disambiguation, considering the binary arrangement of the trees, and they also have been shown to be much more efficient for automatic parsing (NIVRE, 2005, p.1). With this new demand, Dependency Grammar has become a relevant term in Natural Language Processing works (KÜBLER et al., 2009; DE MARNEFFE and NIVRE; 2019). However, studies related to Dependency Grammars were marginalized compared to the traditional methodology of syntactic analysis, the constituents analysis, which made it difficult to access the theoretical foundation that this type of methodology follows. Considering this, this work intends to make an introductory review of the fundamentals that govern most of the syntactic theories that use the dependency methodology, to make the Dependency Grammar models, as well as the concept of dependency, clearer and more accessible.
Neste trabalho, investiga-se o comportamento sintático-semântico do verbo "falar" no português brasileiro (PB) em um corpus jornalístico e em três bases de dados verbais do PB (VerbNet.Br, VerboWeb e Verbo-Brasil). Os dados demonstram a polivalência e complexidade de "falar". Além disso, no que se refere à análise das bases de dados, foi possível constatar a necessidade de revisões manuais, realizadas por linguistas, e/ou ampliações das descrições linguísticas, principalmente ao considerar a relevância de construções com o verbo "falar" para diferentes aplicações na área de Processamento de Língua Natural.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.