Background The high volume of research focusing on extracting patient information from electronic health records (EHRs) has led to an increase in the demand for annotated corpora, which are a precious resource for both the development and evaluation of natural language processing (NLP) algorithms. The absence of a multipurpose clinical corpus outside the scope of the English language, especially in Brazilian Portuguese, is glaring and severely impacts scientific progress in the biomedical NLP field. Methods In this study, a semantically annotated corpus was developed using clinical text from multiple medical specialties, document types, and institutions. In addition, we present, (1) a survey listing common aspects, differences, and lessons learned from previous research, (2) a fine-grained annotation schema that can be replicated to guide other annotation initiatives, (3) a web-based annotation tool focusing on an annotation suggestion feature, and (4) both intrinsic and extrinsic evaluation of the annotations. Results This study resulted in SemClinBr, a corpus that has 1000 clinical notes, labeled with 65,117 entities and 11,263 relations. In addition, both negation cues and medical abbreviation dictionaries were generated from the annotations. The average annotator agreement score varied from 0.71 (applying strict match) to 0.92 (considering a relaxed match) while accepting partial overlaps and hierarchically related semantic types. The extrinsic evaluation, when applying the corpus to two downstream NLP tasks, demonstrated the reliability and usefulness of annotations, with the systems achieving results that were consistent with the agreement scores. Conclusion The SemClinBr corpus and other resources produced in this work can support clinical NLP studies, providing a common development and evaluation resource for the research community, boosting the utilization of EHRs in both clinical practice and biomedical research. To the best of our knowledge, SemClinBr is the first available Portuguese clinical corpus.
RESUMOO cateterismo cardíaco é um método de diagnóstico invasivo, utilizado no tratamento precoce de pacientes com problemas cardíacos. Objetivou-se nesse estudo verificar as complicações ocorridas e os principais cuidados de enfermagem realizados antes, durante e após o cateterismo cardíaco, além de traçar o perfil dos pacientes submetidos ao procedimento.Trata-se de uma pesquisa retrospectiva, descritiva e com abordagem quantitativa, desenvolvida em um Hospital Filantrópico da cidade de Ponta Grossa/PR, em 2013, por meio de consultas em prontuários. Dos 240 pacientes incluídos no estudo, 131 (54,6%) eram do sexo masculino; a faixa etária predominante estava entre 51 e 60 anos (29,2%). Quanto às doenças preexistentes, salientam-se o diabetes mellitus (76;31,7%) e a hipertensão arterial sistêmica (206;85,8%). Em relação às complicações, as mais frequentes foram:equimose (0,8%), hematoma (0,8%), e hemorragia (0,8%). Sobre os cuidados de enfermagem destaca-se que 99,4% dos pacientes foram assistidos por esta equipe. Espera-se que os resultados apontados por esta pesquisa possam contribuir para a melhoria da assistência ao paciente que realiza cateterismo cardíaco, visto que os serviços de hemodinâmica estão em evolução contínua e são cada vez mais utilizados.Palavras-chave: Hemodinâmica. Assistência ao paciente. Cuidados de Enfermagem. INTRODUÇÃOAs principais causas de morte da população brasileira, desde o fim da primeira metade do século passado, eram decorrentes das doenças infectocontagiosas. Atualmente, o motivo principal passou a ser consequência das Doenças Crônicas Não Transmissíveis (DCNT), as quais possuem etiologia multifatorial. Entre as doenças classificadas como DCNT, estão as doenças cardiovasculares (DCV) e o Diabetes Mellitus (DM), sendo que o rápido aumento da mortalidade causada por elas afeta o desenvolvimento social e econômico de vários países, incluindo o Brasil, além de diminuir a qualidade de vida de milhões de pessoas (1)(2)
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.