http://dx.doi.org/10.5007/1984-8420.2016v17n1p64Desde, pelo menos, o século XIX, o uso do clítico acusativo de terceira pessoa (o, a) em português brasileiro cedeu espaço para duas estratégias: (a) o uso do pronome tônico ele, ela ou (b) o uso do chamado objeto direto nulo. Partindo da hipótese básica de Creus & Menuzzi (2004) sobre o traço semântico do referente ter papel central para o condicionamento da retomada anafórica com pronome ou com objeto nulo, defendemos a ideia de que existe uma estratégia não marcada e outra marcada em se tratando da retomada anafórica para objetos diretos em 3ª pessoa. Através de reanálises de testes propostos por Creus & Menuzzi e aplicações de novos testes, procuramos mostrar que a estratégia marcada é a utilização de um pronome e a estratégia não marcada, o uso de categoria vazia na posição de objeto, sendo o traço semântico do referente a ser retomado relevante para cada opção.
Neste trabalho, revisitamos o estudo de Ayres & Othero (2016), sobre o condicionamento de objetos nulos e pronomes em PB, na retomada anafórica de objeto direto de 3ª pessoa, na fala infantil, a partir das duas hipóteses consolidadas na literatura, a saber: a hipótese do conjunto de traços de animacidade e especificidade (cf. Cyrino, 1994/1997 e Casagrande, 2007, por exemplo), e a hipótese do gênero semântico (cf. Creus e Menuzzi, 2004, Othero et al., 2016, por exemplo). Como em seu estudo esses autores não distinguiram elipses de VP de objetos nulos, aqui nós separamos esses dois tipos de categoria vazia e as analisamos. Além disso, verificamos se o condicionamento dos objetos nulos e das elipses de VP ocorre em contextos semelhantes, tendo em vista que essas estruturas possuem formas superficialmente parecidas.
Sujeitos nulos têm sido largamente investigados em línguas naturais. O português brasileiro (PB), em particular, desperta muito interesse pelo assunto, pois aparentemente o PB está em processo de mudança, de uma língua pro-drop para uma língua pro-drop parcial (cf. BIBERAUER et al., 2010; HOLMBERG et al., 2009; DUARTE; MARINS, 2021; SOARES et al., 2019). Neste artigo, investigamos sujeitos nulos em PB assumindo que sujeitos referenciais nulos são usados apenas em contextos “marcados”, específicos, enquanto sujeitos expressos são a estratégia “não marcada”, mais frequente. Analisamos um corpus contemporâneo de PB falado e encontramos 1.252 ocorrências de sujeitos nulos. Em seguida, apresentamos quatro fatores que são tradicionalmente conhecidos por desempenhar algum papel na determinação dos contextos ótimos para sujeitos nulos em PB (e várias outras línguas). Argumentamos aqui que todos esses quatro fatores são necessários e suficientes para explicar todas as ocorrências de sujeito nulo em qualquer corpus de PB falado contemporâneo. Analisamos todas as 1.252 ocorrências de sujeitos nulos no corpus e conseguimos explicar 99,8% dos dados, o que nos leva a uma melhor compreensão do fenômeno do sujeito nulo no PB, pelo menos que tange à identificação de seus contextos de licenciamento.
RESUMO: Apresentamos, neste artigo, nosso trabalho de anotação morfológica automática de trechos de um corpus de língua falada – pertencentes ao projeto Varsul –, utilizando um etiquetador automático morfossintático gratuito, o Aelius, em 20 textos, perfazendo um total de 154.530 palavras. Basicamente, apresentamos a ferramenta de anotação automática, o processo de análise morfossintática automática efetuada pelo anotador, o trabalho de revisão manual da etiquetagem automática e as sugestões de melhorias para tratar especificamente de aspectos da oralidade. A partir dos erros do etiquetador, buscamos depreender certos padrões de anotação para superar limitações de desempenho apresentadas pelo programa, propondo algumas sugestões de implementações para que o Aelius etiquete de maneira ainda mais satisfatória um corpus de língua falada. Tratamos especialmente dos casos de interjeições, aféreses, onomatopeias e marcadores conversacionais.PALAVRAS-CHAVE: Etiquetagem Automática. Etiquetagem Morfossintática. Linguística de Corpus.ABSTRACT:In this paper, we present the results of our work with automatic morphological annotation of excerpts from a corpus of spoken language – belonging to the VARSUL project – using the free morphosyntatic tagger Aelius. We present 20 texts containing 154,530 words, annotated automatically and corrected manually. This paper presents the tagger Aelius and our work of manual review of the texts, as well as our suggestions for improvements of the tool, concerning aspects of oral texts. We verify the performance of morphosyntactic tagging a spoken language corpus, an unprecedented challenge for the tagger. Based on the errors of the tagger, we try to infer certain patterns of annotation to overcome limitations presented by the program, and we propose suggestions for implementations in order to allow Aelius to tag spoken language corpora in a more effective way, specially treating cases such as interjections, apheresis, onomatopeia and conversational markers.KEYWORDS: Tagger. Morphosyntactic Tagging. Corpus Linguistics.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.