Az elmúlt években fejlődésnek induló digitalizálási módszerek lehetővé tették a digitális bölcsészet területén belül többek között az életrajzi lexikonokat feldolgozó projektek előtérbe kerülését. A biográfiai kutatások célja a már digitalizált lexikonok szövegeinek (pl. Österreichisches Biographisches Lexikon 1815–1950 – a továbbiakban ÖBL – részben strukturált, részben strukturálatlan, szöveges formában tárolt adatainak) átalakítása számítógép által feldolgozható formátumra, illetve az átalakított adatokon hálózati, statisztikai és számítógépes nyelvészeti kutatások elvégzése. Ebben a kontextusban kezdődtek el 2015-ben a kutatások az Osztrák Tudományos Akadémia Új- és Jelenkortörténeti Kutatási Intézetében [Institut für Neuzeit- und Zeitgeschichtsforschung] a Mapping historical networks: Building the new Austrian Prosopographical, Biographical Information System (APIS) projekt keretén belül. A projekt az ÖBL digitális feldolgozását és egy kutatási célokra kifejlesztett számítógépes környezet létrehozását célozza meg, mely a szintén az Osztrák Tudományos Akadémia keretében működő Austrian Centre for Digital Humanities (ACDH) [Osztrák Digitális Bölcsészeti Központ] valamint az Institut für Stadt- und Regionalforschung (ISR) [Város- és Régiókutatási Intézet] együttműködésével valósul meg. Cikkünkben bemutatjuk, hogy az APIS-projekt technikai megvalósítására fejlesztett webalkalmazás milyen technikai és nyelvtechnológiai megoldásokat használ a lexikon számítógépes feldolgozására és az adatok reprezentálására.
In this paper we present a semantic enrichment approach for linking two distinct data sets: the ÖBL (Austrian Biographical Dictionary) and the dbo@ema (Database of Bavarian Dialects in Austria electronically mapped). Although the data sets are different in their content and in the structuring of data, they contain similar common "entities" such as names of persons. Here we describe the semantic enrichment process of how these data sets can be inter-linked through URIs (Uniform Resource Identifiers) taking person names as a concrete example. Moreover, we also point to societal benefits of applying such semantic enrichment methods in order to open and connect our resources to various services.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.