[2][1] Instituto Tecnológico Superior de Poza Rica (México) / Universidad Nacional de Educación a Distancia. Departamento de Lenguajes y Sistemas (España) svallejo36@alumno.uned.es [2] Universidad de Guadalajara, México. vnava@teachers.orgResumen. Actualmente los documentos son el principal medio para representar información en varios dominios. Continuamente los usuarios almacenan documentos en discos duros o unidades de almacenamiento en línea siguiendo una organización personal basada en temas, pero los documentos pueden contener varios temas. Esto dificulta el acceso a los documentos cuando el tema deseado no corresponde con el almacenado. Básicamente los actuales motores de búsqueda de documentos se basan en el nombre del archivo o palabras clave del contenido, donde el término o términos a buscar debe coincidir exactamente con el nombre o contenido. En este artículo se propone un método para organizar documentos mediante grafos, teniendo en cuenta los temas que los documentos contienen. Para ello se genera un grafo por cada documento considerando los sinónimos, términos relacionados semánticamente, hipónimos e hiperónimos de los sustantivos y verbos que se encuentran en los documentos. La propuesta ha sido comparada contra las herramientas Google Desktop y LogicalDoc con buenos resultados.Palabras clave: Recuperación de información, organización de documentos, relaciones semánticas, grafos.Abstract. Nowadays documents are the main mean for representing information in several domains. Continuously users store documents on hard disks or online storage services according to some personal organization based on topics, but such documents can contain one or more topics. This situation makes hard to access documents when the desired topic does not match with the one stored. Basically current search engines search based on the filename or keywords from content, but the desired term or terms must match exactly as are in the filename or content. In this paper, a method for organizing documents by means of graphs is proposed, taking into account the topics of documents. For this a graph for each document is generated taking into account synonyms, semantic related terms, hyponyms, and hypernyms of nouns and verbs contained in documents. The proposal has been compared against Google Desktop and LogicalDoc tool with good results.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.