Data tidak seimbang terjadi karena jumlah data pada tiap kelas berbeda jauh dimana akan mempengaruhi hasil prediksi. Dalam penelitian ini menggunakan dataset prediksi diabetes, yang mengandung data yang tidak seimbang. Hasil prediksi ditunjukkan dengan nilai akurasi dan presisi. Tujuan penelitian ini adalah meningkatkan nilai akurasi dan presisi pada data yang tidak seimbang. Metode yang digunakan dalam penelitian ini adalah penentuan sampling dan pembelajaran ensemble. Penentuan sampling yang digunakan adalah dengan cara mengalikan data pada kelas minoritas atau oversampling. Teknik Oversampling yang digunakan adalah Synthetic Minority Oversampling Technique (SMOTE). Pembelajaran ensemble yang digunakan adalah algoritma random forest. Kombinasi algoritma SMOTE dan random forest dapat meningkatkan akurasi dan menyeimbangkan nilai presisi pada setiap kelas. Hasil penelitian ini adalah Kombinasi tersebut menghasilkan nilai akurasi sebesar 97,5% dan nilai presisi pada kelas non pasien sebesar 97% sedangkan nilai presisi pada kelas pasien sebesar 98%.