Hastalık teşhisi, tıp alanında karşılaşılan en önemli problemlerden biridir. Belirli bir hastalığın farklı türlerinin ve diğer hastalıklarla benzer semptomlarının olması hastalığın teşhisini zorlaştırmaktadır. Tiroit hastalığı çeşitlerinden biri olan hipotiroidi de bu sebeplerle teşhisi geciken ve hastaların yaşam kalitesini düşüren bir hastalıktır. Bu çalışmanın amacı, tanı sürecinde hastalara sorulan soru ve uygulanan test sonuçlarını kullanarak hipotiroidi hastalığının doğru teşhis oranını arttıracak veri madenciliği temelli bir sistem önermektir. Diğer amaç ise dolaylı olarak teşhis için kullanılan girişimsel testlerden oluşabilecek komplikasyonları azaltmaktır. Bu amaçlar doğrultusunda UCI makine öğrenmesi veri tabanında yer alan ve 151 tanesi hipotiroidi geri kalanı hipotiroidi olmayan toplam 3163 örnekten oluşan veri seti kullanılarak yeni örneklerin hipotiroidi olup olmadığı tahmin edilmiştir. Veri setindeki dengesiz dağılımı ortadan kaldırmak için veri setine farklı örnekleme teknikleri uygulanarak Lojistik Regresyon, K En Yakın Komşu ve Destek Vektör Makinesi sınıflandırıcıları ile hipotiroidi hastalığını teşhis edecek modeller oluşturulmuştur. Bu yönüyle, çalışma örnekleme yöntemlerinin hipotiroidi hastalığı teşhisi üzerindeki etkisini göstermiştir. Geliştirilen modeller içinde en yüksek performansı, aşırı örnekleme teknikleri uygulanan veri seti ile eğitilen Lojistik Regresyon sınıflandırıcısı vermiştir. Bu sınıflandırıcı ile elde edilen en iyi sonuçlar; doğruluk oranı için %97.8, F-Skor değeri için %82.26, eğri altında kalan alan için %93.2 ve Matthews korelasyon katsayısı için de %81.8'dir.
Students' opinions are the most essential source to enhance the quality of education and educational services in Open and Distance education (ODE) Systems. How to access and analyze students' real opinions is a problem for ODE institutions. The purpose of the present study is to conduct a sentiment analysis (SA) on the collected Turkish tweets about an ODE system to monitor students' opinions and sentiments about the system. Firstly, the related 63699 tweets about the ODE system are gathered and analyzed. Later, preprocessing is applied to the dataset. Sentence-based SA is performed with the data provided. The dataset is vectorized using two vector space models to test four classifiers which are Support Vector Machines, K-Nearest Neighbor, Logistic Regression (LR), and Artificial Neural Networks. F-score values obtained with these classifiers are evaluated, and the results are discussed. LR classifier gives the best F-score values with %75 for each vector space model. Through the SA results, students' dissatisfaction, appreciation, and concerns will be learned quickly by the university administration to develop strategies that will increase the quality of education and educational services.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.