Özetçe-İki sınıflı verilerde sınıflara ait örnek sayılarındaki dengesizlik, üzerinde çalışılan önemli sorunlardan biridir. Eğitim veri setlerinde, bir sınıfa ait örneklerin sayısının diğer sınıfın örneklerinin sayısından büyük ölçüde fazla olduğu durumlarda standart makine öğrenme algoritmaları, büyük sınıflar tarafından boğulmuş olma eğilimindedir ve küçük sınıfların varlığı ortadan kaybolmaktadır. Sınıf dengesizliği sorununun ortadan kaldırılması için literatürde geliştirilmiş bazı algoritmalar bulunmaktadır. Bu çalışmada veri dengesizliğinin giderilmesinde kullanılan mevcut algoritmalar karşılaştırılmış ve en iyi başarıma sahip algoritma bulunmaya çalışılmıştır. Anahtar kelimeler-sınıf dengesizliği, ikili sınıflandırma, yeniden örnekleme, boosting.Abstract-The class imbalance problem in two-class data sets is one of the most important problems. When samples of one class in a training data set vastly outnumber samples of the other class, standard machine learning algorithms tend to be overwhelmed by the majority class and ignore the minority class. There are several algorithms to alleviate the problem of class imbalance in literature. In this paper experiments have been done comparing the existing algorithms with each other and the algorithm which has the best performance tried to be found.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.