2019
DOI: 10.31311/ji.v6i1.5448
|View full text |Cite
|
Sign up to set email alerts
|

Mengatasi Imbalanced Class Pada Software Defect Prediction Menggunakan Two-Step Clustering-Based Undersampling dan Bagging Tehcnique

Abstract: Ketidakseimbangan kelas seringkali menjadi masalah di berbagai set data dunia nyata, di mana satu kelas (yaitu kelas minoritas) berisi sejumlah kecil titik data dan yang lainnya (yaitu kelas mayoritas) berisi sejumlah besar titik data. Sangat sulit untuk mengembangkan model yang efektif dengan menggunakan data mining dan algoritma machine learning tanpa mempertimbangkan preprocessing data untuk menyeimbangkan set data yang tidak seimbang. Random undersampling dan oversampling telah digunakan dalam banyak penel… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2

Citation Types

0
0
0
2

Year Published

2020
2020
2024
2024

Publication Types

Select...
3
2

Relationship

0
5

Authors

Journals

citations
Cited by 5 publications
(2 citation statements)
references
References 21 publications
0
0
0
2
Order By: Relevance
“…Untuk mengurangi tingkat kekeliruan, algoritma yang dibangun mengklasifikasikan semua contoh ke dalam kelas mayoritas, yang menjadikan tingkat kesalahan 1%. Dalam hal ini, semua contoh milik kelas minoritas adalah yang terpenting dan harus diidentifikasi sebagai klasifikasi yang salah [16] [17]. Dalam penelitian ini kami mengusulkan sebuah metode untuk memprediksi kebakaran hutan menggunakan integrasi teknik pendekatan level data yaitu Random Under-Sampling (RUS).…”
Section: Pendahuluanunclassified
“…Untuk mengurangi tingkat kekeliruan, algoritma yang dibangun mengklasifikasikan semua contoh ke dalam kelas mayoritas, yang menjadikan tingkat kesalahan 1%. Dalam hal ini, semua contoh milik kelas minoritas adalah yang terpenting dan harus diidentifikasi sebagai klasifikasi yang salah [16] [17]. Dalam penelitian ini kami mengusulkan sebuah metode untuk memprediksi kebakaran hutan menggunakan integrasi teknik pendekatan level data yaitu Random Under-Sampling (RUS).…”
Section: Pendahuluanunclassified
“…Masalah utama dalam software defect prediction adalah redundant data, korelasi, fitur yang tidak relevan, missing samples dan masalah ini dapat membuat dataset tidak seimbang karena sulit untuk memastikan antara data cacat atau tidak cacat [6]. Selain itu dalam dataset software metrics juga terdapat masalah imbalance class yang membuat data menjadi tidak seimbang karena data yang cacat (kelas minoritas) jumlahnya lebih sedikit dibandingkan dengan data yang tidak cacat (kelas mayoritas), masalah ini dapat menurunkan kinerja klasifikasi [7] Terdapat dua pendekatan yang dapat menangani imbalance class yaitu pendekatan level data (sampling technique) dan pendekatan level algoritma dengan teknik ensemble learning [3]. Sedangkan klasifikasi adalah pendekatan yang paling populer untuk menangani software defect prediction [8].…”
Section: Pendahuluanunclassified