ABSTRAKIG-KNN merupakan gabungan dari algotitma pemilihan fitur information gain dengan algoritma klasifikasi KNN, kedua algoritma ini diharapkan dapat meningkatkan akurasi dalam memprediksi customer churn telekomunikasi. Prediksi customer churn telekomunikasi merupakan kebutuhan yang sangat penting bagi kelangsungan hidup perusahaan telekomunikasi, dimana dengan banyaknya pelanggang yang meninggalkan perusaan maka perusahaan berpeluang untuk merugi. Mendeteksi pelanggan yang berpeluang meninggalkan perusahaan sejak dini perusahaan akan mendapatkan keuntungan 10 kali, karena biaya untuk mempertahankan pelanggan lebih murah 10 kali lipat dibanding dengan mecari pelanggan baru. Berdasarkan hasil penelitian ini prediksi customer churn telekomunikasi dengan menggunakan IG-KNN menunjukkan akurasi yang lebih baik meski dengan nilai k yang berbedabeda bila dibandingkan dengan prediksi customer churn telekomunikasi dengan menggunkan KNN tanpa fitur seleksi Information Gain, adapun peningkatan akurasi dari k1 sampai dengan k11 sebesar 1,7%.Kata kunci: information gain, KNN, customer churn telekomunikasi.
ABSTRACT
IG-KNN is a combination of information gain feature selection algorithm with KNN classification algorithm, the second algorithm is expected to improve the accuracy of predicting customer churn in telecommunications. Telecommunication customer churn prediction is a very important requirement
PENDAHULUANCustomer Churn didefinisikan sebagai kecenderungan pelanggan untuk berhenti melakukan bisnis dengan sebuah perusahaan [1]. Hal ini telah menjadi isu penting yang merupakan salah satu tantangan utama oleh banyak perusahaan di era global ini dan harus dihadapinya.[2] mengatakan untuk memperoleh pelanggan baru memerlukan biaya hingga 10 kali lipat lebih mahal dibandingkan biaya untuk mempertahankan pelanggan yang ada. Mahalnya untuk memperoleh pelanggan baru tentunya perusahaan akan lebih memilih mempertahankan pelanggan. Berdasarkan fakta tersebut maka banyak perusahaan sekarang lebih beralih untuk mempertahankan pelanggan dan menghindari churn pelanggan.Prediksi customer churn telekomunikasi menggunakan KNN yang dilakukan [3] menghasilkan nilai akurasi 88% pada nilai K 5 keatas, dengan menggunakan algoritma fitur seleksi diharapkan akan meningkatkan akurasi prediksi selain itu dapat diketahui fitur apa saja yang tidak dibutuhkan dalam memprediksi customer churn telekomunikasi.Pemilihan Subset fitur, bersama dengan pengaturan parameter dalam prosedur pelatihan SVM secara signifikan mempengaruhi akurasi klasifikasi [4]. Jumlah fitur yang banyak (high dimensional) akan memberikan masukan yang berbeda-beda. Pada prakteknya, atribut yang berlebihan tidak akan memberikan hasil yang signifikan pada proses pelatihan tetapi justru akan menyebabkan over-fit atau irrelevan dan redundan atribut yang akan menyulitkan algoritma proses pelatihan. Masih sedikit penelitian yang berfokus pada pemilihan fitur untuk mempediksi customer churn telekomunikasi [5]. Untuk mencapai kinerja yang baik dan akurasi yang tinggi jumlah fitur yang...