La reproductibilité des résultats et la robustesse des outils constituent des enjeux critiques en traitement automatique des langues, en particulier parce que le TAL commence à fournir des méthodes et outils mûrs qui sont de plus en plus utilisés dans d'autres domaines, comme le domaine médical. L'objectif des compétitions en TAL est de fournir des corpus et les données de référence qui permettent aux chercheurs de développer des outils et de les tester ensuite. Un tel contexte permet également d'avoir une première comparaison entre les méthodes et approches utilisées par les participants du défi, dans des conditions expérimentales parfaitement identiques.L'édition 2019 du défi fouille de textes (DEFT 2019, https://deft.limsi.fr/2019/) a porté sur l'analyse de cas cliniques rédigés en français. Trois tâches ont été proposées autour de la recherche d'information et de l'extraction d'information, en s'inspirant de tâches réelles et utiles pour le domaine médical. La particularité de cette édition concerne ainsi le domaine traité (médical) et les documents utilisés (des cas cliniques). C'est la première fois qu'une compétition a lieu sur des textes cliniques en français. Les cas cliniques décrivent les situations cliniques de patients, réels ou fictifs. Ils sont publiés dans différentes sources de données (scientifique, didactique, associatif, juridique, etc.), de manière anonymisée. L'utilité des cas consiste à présenter des situations cliniques typiques ou rares, notamment à des fins pédagogiques. Le corpus de cas cliniques utilisé lors de la campagne DEFT 2019 se compose de cas librement accessibles en ligne.Lors du déroulement de la campagne, l'accès aux données d'entraînement a été possible dès le 18 février, tandis que la phase de test s'est déroulée du 9 au 15 mai, sur une période de trois jours définie par chacun des participants. Huit équipes se sont inscrites et ont participé jusqu'au bout. Nous comptons cinq équipes académiques (LGI2P
In this paper we present a complete framework for the annotation of negation in Italian, which accounts for both negation scope and negation focus, and also for language-specific phenomena such as negative concord. In our view, the annotation of negation complements more comprehensive Natural Language Processing tasks, such as temporal information processing and sentiment analysis. We applied the proposed framework and the guidelines built on top of it to the annotation of written texts, namely news articles and tweets, thus producing annotated data for a total of over 36,000 tokens.
Interpreting information in medical documents has become one of the most relevant application areas for language technologies. However, despite the fact that huge amounts of medical documents (e. g., medical examination reports, hospital discharge letters, digital medical records) are produced, their availability for research purposes is still limited, due to strict data protection regulations. Aiming at fostering advanced information extraction technologies for medical applications, we present E3C, a corpus of clinical case narratives fully based on freely licensed documents. E3C (European Clinical Case Corpus) contains a vast selection of clinical cases (i. e., narratives presenting a patient’s history) that cover different medical areas, are based on different styles and produced in different languages. A portion of the corpus has been manually annotated to be used for training and testing purposes, while a larger set of documents has been automatically tagged to serve as a baseline for future research in information extraction.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.