Data tidak seimbang atau lebih sering disebut imbalanced data, adalah kondisi pada saat data memiliki rasio yang tidak seimbang antara satu kelas dengan kelas yang lain, sehingga terdapat kelas mayoritas dan kelas minoritas. Sulit untuk membuat prediksi pada dataset yang tidak seimbang karena pengklasifikasi cenderung mendeteksi kelas mayoritas daripada kelas minoritas. Teknik resampling menjadi salah satu yang paling efektif dalam menyelesaikan permasalahan imbalanced data ini. Salah satu kategori dari teknik resampling adalah oversampling. Metode oversampling diantaranya adalah SMOTE dan K-Means SMOTE. Penggunaan oversampling akan meningkatkan hasil measurement klasifikasi. Penelitian ini menggunakan data wine yang memiliki 11 fitur serta 1 atribut target dan bertujuan untuk membandingkan hasil measurement antara penggunaan data sintetis hasil SMOTE dan K-Means SMOTE dengan hasil measurement penggunaan data nyata dalam kondisi data seimbang. Pembuatan data imbalance dilakukan dengan menghapus secara random salah satu kelas dengan ambang 25%, 50%, 60% dan 75%. Hasil penelitian menunjukkan bahwa dibandingkan penggunaan data nyata, penggunaan K-Means SMOTE cenderung menghasilkan nilai lebih tinggi untuk akurasi, sensitivitas dan spesifisitas sedangkan SMOTE meskipun memperoleh nilai yang lebih baik dibandingkan K-Means SMOTE tetapi juga terdapat beberapa kondisi imbalance yang memiliki nilai lebih tinggi dibandingkan penggunaan data nyata.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.