Este trabalho analisa artigos de periódicos científicos brasileiros da área de Ciência da Informação sobre a mineração de textos e descoberta de conhecimento em textos. Os artigos analisados são indexados pela Brapci ou Scielo e contêm os termos compostos mineração de texto ou descoberta de conhecimento nos metadados, além de abordarem especificamente a aplicação de técnicas de mineração de textos. A metodologia da pesquisa é de natureza exploratória, bibliográfica, e quali-quantitativa, pautada nos procedimentos de estudo métrico e análise de conteúdo. Como resultados, discute-se a distribuição temporal dos trabalhos, as entidades de afiliação dos autores, além de caracterizar os procedimentos metodológicos e resultados dos trabalhos relativos à mineração de textos científicos. Conclui-se que ao longo de 18 anos, 28 trabalhos foram publicados sobre a extração de conhecimento por meio da mineração de textos. Dentre estes, 13 tratam da mineração de textos científicos, dos quais nove tem natureza aplicada, sendo esses analisados mais profundamente.
Objetivo: No contexto de desenvolvimento de estudos métricos da informação, este trabalho propõe e aplica um método para obtenção de indicadores temáticos sobre descritores representativos de temas, assuntos ou palavras-chave abordados em registros bibliográficos da área de Ciência da Informação. Método: Realizou-se uma pesquisa metodológica de natureza aplicada, utilizando procedimentos técnicos da indexação automática e dos estudos métricos da informação. Inicialmente, delimitou-se um corpus contemplando um conjunto de registros bibliográficos referentes a 60 artigos de periódicos brasileiros. Posteriormente, aplicou-se o software Maui como sistema de indexação automática na categorização das palavras-chave dos registros bibliográficos em conceitos de um tesauro de especialidade, contemplando descritores no idioma do texto dos metadados. Em seguida, aplicou-se o software Iramuteq, para gerar os indicadores temáticos a partir dos descritores obtidos pela indexação automática. Validou-se, por fim, o método proposto com base na análise dos resultados obtidos para o corpus. Resultado: São descritos os fluxogramas de validação da indexação automática e de validação do estudo métrico, visando identificar e descrever os processos do método proposto como etapas do processamento do corpus. Outrossim, apresentam-se as métricas de qualidade na indexação automática, bem como análises estatísticas de frequência e coocorrência de palavras, e de frequência de termos, onde apontam-se os principais indicadores temáticos do corpus. Conclusões: Conclui-se que os indicadores temáticos obtidos por meio da aplicação do método proposto representam os principais temas identificados no corpus, e que o método pode ser aplicado na obtenção de indicadores temáticos de outros conjuntos de registros bibliográficos.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.