Objective Automated clinical phenotyping is challenging because word-based features quickly turn it into a high-dimensional problem, in which the small, privacy-restricted, training datasets might lead to overfitting. Pretrained embeddings might solve this issue by reusing input representation schemes trained on a larger dataset. We sought to evaluate shallow and deep learning text classifiers and the impact of pretrained embeddings in a small clinical dataset. Materials and Methods We participated in the 2018 National NLP Clinical Challenges (n2c2) Shared Task on cohort selection and received an annotated dataset with medical narratives of 202 patients for multilabel binary text classification. We set our baseline to a majority classifier, to which we compared a rule-based classifier and orthogonal machine learning strategies: support vector machines, logistic regression, and long short-term memory neural networks. We evaluated logistic regression and long short-term memory using both self-trained and pretrained BioWordVec word embeddings as input representation schemes. Results Rule-based classifier showed the highest overall micro F1 score (0.9100), with which we finished first in the challenge. Shallow machine learning strategies showed lower overall micro F1 scores, but still higher than deep learning strategies and the baseline. We could not show a difference in classification efficiency between self-trained and pretrained embeddings. Discussion Clinical context, negation, and value-based criteria hindered shallow machine learning approaches, while deep learning strategies could not capture the term diversity due to the small training dataset. Conclusion Shallow methods for clinical phenotyping can still outperform deep learning methods in small imbalanced data, even when supported by pretrained embeddings.
Úvod: Bylo prokázáno, že chirurgické ablační procedury zajišťují účinnou léčbu fi brilace síní (FS), ovšem stále chybějí přesvědčivé důkazy o spojitosti mezi klinickými proměnnými, chirurgickou technikou a střednědobými až dlouhodobými výsledky. Provedli jsme tedy v našem centru retrospektivní databázovou studii s cílem identifi kovat prediktory udržení sinusového rytmu (SR) po 12 měsících od zákroku, a to s přihlédnutím ke standardní lékařské péči poskytované praktickými lékaři a/nebo ambulantními kardiology ve vztahu k této nově zavedené metodě. Metody: Byly shromážděny údaje o 376 konsekutivních pacientech, kteří v rozmezí od července 2006 do prosince 2010 podstoupili operaci srdce zahrnující chirurgickou ablaci levé síně (LS) pro FS. Primárním sledovaným ukazatelem bylo udržení SR po 12 měsících. K identifi kaci prediktorů dosažení primárního sledovaného ukazatele byla použita kroková zpětná víceproměnná logistická regresní analýza. Výsledky: U 210 pacientů byla provedena radiofrekvenční (RF) ablace a 166 pacientů podstoupilo kryoablaci. Údaje z kontroly po 12 měsících byly k dispozici u 273 osob. Úspěšnost udržení sinového rytmu po jednom roce od zákroku činila 48,9 % (63,1 % u kryoablace a 37,8 % u RF [p < 0,0001]). Během 12 měsíců sledování nebyla u žádného pacienta ablace opakována. Spojitost s primárním sledovaným ukazatelem byla prokázána u paroxysmální FS, u operace mitrální chlopně a u menšího průměru LS; kryoablace zajišťovala lepší výsledky než RF ablace. Četnost předepisování amiodaronu/propafenonu u pacientů, u nichž byl po 12 měsících doložen sinusový rytmus, ovšem dosáhla hodnoty 36,0 %. Závěry: Pomocí víceproměnné analýzy retrospektivních dat jsme identifi kovali klinické proměnné a technické aspekty spojené s lepšími výsledky chirurgické ablace FS.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.