Resumen En la actualidad, pocos niegan el valor del contenido del periódico para comprender cuestiones relacionadas con la política, cultura y sociedad. De esta manera, la digitalización de los archivos de periódicos ha permitido rescatar artículos históricos y culturales relevantes. Sin embargo, aún no se ha sacado a la luz una infinidad de “datos menores” que se encuentran ocultos en estos periódicos. En este artículo se afrontan los desafíos para acceder y tratar los fondos de las hemerotecas nacionales de Colombia, Ecuador, México y Uruguay, que recogen noticias sobre eventos meteorológicos entre los siglos XIX-XX. Sobre estos periódicos se conforma un corpus de noticias que mediante lecturas técnicas y la aplicación de un proceso de bibliominería, utilizando diversas herramientas, permite iniciar la construcción de una red de ontologías. Esta red se compone de diferentes módulos (técnico, general y noticias), que son construidos utilizando diferentes enfoques (top-down y bottom-up) y metodologías (Methontology y NeOn), con el fin de proveer un entendimiento común y compartido de los eventos meteorológicos históricos en Latinoamérica. Por tanto, este trabajo supone un acercamiento de los fondos de las hemerotecas/bibliotecas a la Web Semántica.
El cambio climático ha despertado la curiosidad no solo de científicos, sino de todos los que habitamos el planeta tierra, esta es la motivación por la cual surge este proyecto que busca rescatar los eventos meteorológicos que ocurrieron en Latinoamérica entre los siglos XIX - XXI, registrados en medios escritos, particularmente por la prensa, en ediciones que hoy se encuentran conservadas en bibliotecas y hemerotecas nacionales. Con el fin de recoger y explotar dicho conocimiento se desarrolla una red de ontologías denominada OntoClima. En este trabajo se describe el proceso que se llevó a cabo para su construcción. Iniciando con la extracción de la información de la prensa digitalizada haciendo uso de técnicas de minería de texto y procesamiento de lenguaje natural con el fin de aplicar procesos de limpieza y análisis de datos. Pasando por un reconocimiento de entidades para obtener el vocabulario usado por la prensa con el que describen los eventos meteorológicos. Para finalmente bus-car en DBpedia conceptos relacionados y con estos insumos poder construir la red que integra diversas ontologías ya existentes y que representan el dominio de conocimiento mencionado. El desarrollo de la red fue guiado por la metodología NeOn con su enfoque basado en escenarios.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.