Search citation statements
Paper Sections
Citation Types
Year Published
Publication Types
Relationship
Authors
Journals
Resumo: Este trabalho discute a importância da aplicação das técnicas de Aprendizado de Máquina -ligadas à Inteligência Artificial (IA) -como ferramentas de auxílio aos trabalhos dos linguistas, particularmente no que se refere à Linguística de Corpus. Para atingir essa proposta, o trabalho define a Linguística de Corpus, a Linguística Computacional e descreve utilizações atuais da IA enfatizando os problemas relacionados à Linguística e as estratégias modernas em busca de soluções. A partir daí, descreve a importância do uso de softwares de anotação em corpora eletrônicos e a decorrente necessidade de automatizar algumas dessas operações através do desenvolvimento do software eAssigner, apresentando as suas características, limitações e estágio de desenvolvimento. Para ilustrar a necessidade de uso do software são apresentados resultados de alguns testes realizados em amostra de documentos do Corpus DoViC.Palavras chave: Anotação. Aprendizado de Máquina. Corpora. Linguística Computacional. Linguística de Corpus. Abstract: This paper discusses the importance of the application of Machine Learning techniques -linked toArtificial Intelligence (AI) -as tools to aid the work of linguists, particularly with regard to Corpus Linguistics. In order to reach this proposal, the work defines Corpus Linguistics, Computational Linguistics and describes current uses of the IA emphasizing the problems related to Linguistics and the modern strategies in search of solutions. From there, it describes the importance of the use of electronic annotation software in corpora and the resulting need to automate some of these operations through the development of the eAssigner software, presenting its characteristics, limitations and stage of development. To illustrate the need to use the software are presented results of some tests performed in some DoViC Corpus documents.
Resumo: Este trabalho discute a importância da aplicação das técnicas de Aprendizado de Máquina -ligadas à Inteligência Artificial (IA) -como ferramentas de auxílio aos trabalhos dos linguistas, particularmente no que se refere à Linguística de Corpus. Para atingir essa proposta, o trabalho define a Linguística de Corpus, a Linguística Computacional e descreve utilizações atuais da IA enfatizando os problemas relacionados à Linguística e as estratégias modernas em busca de soluções. A partir daí, descreve a importância do uso de softwares de anotação em corpora eletrônicos e a decorrente necessidade de automatizar algumas dessas operações através do desenvolvimento do software eAssigner, apresentando as suas características, limitações e estágio de desenvolvimento. Para ilustrar a necessidade de uso do software são apresentados resultados de alguns testes realizados em amostra de documentos do Corpus DoViC.Palavras chave: Anotação. Aprendizado de Máquina. Corpora. Linguística Computacional. Linguística de Corpus. Abstract: This paper discusses the importance of the application of Machine Learning techniques -linked toArtificial Intelligence (AI) -as tools to aid the work of linguists, particularly with regard to Corpus Linguistics. In order to reach this proposal, the work defines Corpus Linguistics, Computational Linguistics and describes current uses of the IA emphasizing the problems related to Linguistics and the modern strategies in search of solutions. From there, it describes the importance of the use of electronic annotation software in corpora and the resulting need to automate some of these operations through the development of the eAssigner software, presenting its characteristics, limitations and stage of development. To illustrate the need to use the software are presented results of some tests performed in some DoViC Corpus documents.
Este trabalho descreve etapas da transposição de documentos manuscritos históricos para a formação de corpora linguísticos eletrônicos, através da Fotografia cientificamente controlada, dando ênfase na Fotografia enquanto linguagem técnica, conforme vem sendo desenvolvida e praticada no Laboratório de Pesquisa em Linguística de Corpus (LAPELINC), destacando o processo, o efeito e sua importância para estudos de Linguística, a exemplo da Semântica do Acontecimento. Caracteriza-se como uma pesquisa descritiva em que se destaca o percurso seguido pelo pesquisador considerando a estratégia denominada pesquisa-ação (cf. THIOLLENT, 1985). Procura-se responder à questão: de que maneira a transposição de documentos manuscritos históricos para formação de corpora linguísticos eletrônicos pode contribuir para estudos da Linguística, a exemplo da Semântica do Acontecimento? Para tanto, mobilizando pressupostos da Fotografia, aliados a alguns princípios da Linguística de Corpus, da Semântica e da Semântica do Acontecimento, demonstra-se através de um corpus de documentos extraído dos corpora DOViC Beta e DOViC Séc. XIX, a importância de se ter documentos digitais para pesquisas científicas, visando comprovar quatro hipóteses: a) a transposição através da Fotografia, desde que envolvendo um método científico controlado, tal como o desenvolvido e praticado no LAPELINC (cf. Santos, 2008; Santos, 2010a, 2010b; Namiuti, Santos e Leite, 2011; Santos, 2013a, 2013b; Namiuti-Temponi; Santos; Costa; Farias, 2013; Brito, Santos e Namiuti-Temponi, 2013) além de constituir uma das etapas essenciais na formação de corpora linguísticos eletrônicos, garante a fidedignidade aos textos originais;b) a transposição possibilita, junto com o registro do documento, o registro visual cientificamente controlado de suas características físicas (cf. SANTOS; BRITO, 2014), tornando-o cientificamente reprodutível e manipulável, na medida em que faz uso de equipamento e aparato técnico auxiliar específicos para tanto, a Mesa Cartesiana e os parâmetros fotográficos de controle que permitem ver e recuperar informações que independem do olho humano; c) a transposição enquanto passagem de um documento físico para um documento digital possibilita uma nova forma de acesso aos documentos, a visual fotográfica, que dentre algumas vantagenspermite o acesso a novos formatos do documento, como por exemplo, os arquivos em formato Raw e JPEG, e a visualização eletrônica do documento a partir de ferramentas como: ampliação, contraste, brilho, cor, bem como uso de máscaras, filtros, layers, dentre outras; e d) O documento digital originado da/na transposição permite a recuperação, preservação e divulgação de formas de enunciação materializadas linguisticamente nos documentos que só poderiam ser resgatadas através de um documento visual, assim como foi feito por Santos (2008) e durante o processo de constituição dos corpora DOViC Beta e DOViC Séc. XIX. Para finalizar, demonstramos através de exemplos algumas das contribuições da transposição para a Linguística, relacionados ao objeto (livros), ao processo (Fotografia), ao efeito (RAW e JPEG) e, por exemplo, para a Semântica do Acontecimento. Como citar: BRITO, Giovane Santos. Do texto ao documento digital: transposição fotográfica de documentos manuscritos históricos para formação de corpora lingüísticos eletrônicos. Orientador: orge Viana Santos. Coorientadora: Cristiane Namiuti. 2015. 93f. Dissertação (mestrado em Linguística) – Universidade Estadual do Sudoeste da Bahia, Programa de Pós-graduação em Linguística, Vitória da Conquista, 2015. DOI: https://doi.org/10.54221/rdtdppglinuesb.2015.v3i1.60. Acesso em: xxxxxxxx
Este trabalho pretende discutir e ajudar a resolver o problema das inconsistências geradas pela falta de eficiência do processo de edição filológica manual que podem causar ruídos na anotação linguística do corpus, podendo comprometer sua etiquetagem morfossintática e a anotação sintática, causando prejuízo para a pesquisa linguística. Para resolver esse problema, este trabalho discute a importância da utilização da Tecnologia da Informação como ferramenta de auxílio aos trabalhos dos linguistas, particularmente no que se refere à Linguística de Corpus. Assim, ao longo desse trabalho se define a Linguística de Corpus, a Linguística Computacional e são descritas utilizações atuais da Inteligência Artificial (IA) enfatizando os problemas relacionados à Linguística e as estratégias modernas em busca de soluções. A partir daí, descreve a importância do uso de softwares de anotação em corpora eletrônicos e a decorrente necessidade de automatizar algumas dessas operações através do projeto para desenvolvimento do software. Assim, também foi feita a concepção e modelagem da ferramenta eAssigner, apresentando as suas características, limitações e estágio de desenvolvimento. Para ilustrar a necessidade de uso do software são apresentados resultados de alguns testes realizados em amostra de documentos do Corpus DoViC.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.