The large number of online sales transactions has increased the number of service users. One of the companies engaged in the delivery service in Indonesia is Tiki Nugraha Ekakurir or more known JNE. Currently, JNE service users reach 14.000.000 per month. JNE has used many media communications with its customers one of them with Twitter. The number of followers of JNECare is 108,000 and the number of tweets is 375,000. The number of comments for people who can be used to see what they think of JNE is an inseparable comment is a negative, positive or neutral category. To simplify the grouping of comments, the data will be classified using the Naïve Bayes method present in Rstudio. that is changing all the letters into lowercase and other letters other than letters and spaces (case folding), tokenizing words, and the removal of the word common (stopword remove). After the data is cleared the data will be labeled manually one by one and new data can be used for the training process to get the probability model for each category. Probailitas obtained by using Naïve bayes algorithm. Models obtained from the training will be used using data testing. The categories obtained from the test will be used to process the data used by using the confusion matrix and will calculate the accuracy, precision and recall. From the results of the classification of JNE comments obtained that Naïve Bayes was able to classify the data well. This is evidenced by the average percentage accuracy of 85%, 78% precision and 67% recall.
AbstrakBanyaknya jumlah transaksi penjualan online membuat bertambahnya pengguna jasa pengiriman. Salah satu perusahaan yang bergerak di bidang jasa pengiriman di Indonesia adalah Tiki Jalur Nugraha Ekakurir atau lebih dikenal JNE. Saat ini, pengguna jasa JNE mencapai 14.000.000 perbulan. JNE telah memanfaatkan banyak media komunikasi dengan pelanggannya salah satunya dengan Twitter. Jumlah followers dari JNECare adalah 108.000 dan jumlah tweets sebanyak 375.000. Banyaknya komentar pelanggan dapat dimanfaatkan untuk melihat gambaran opini mereka tentang JNE apakah komentar dominan adalah kategori negatif, positif atau netral. Untuk mempermudah pengelompokan komentar, data akan diklasifikasi menggunakan metode Naïve Bayes yang ada pada Rstudio. Jumlah data yang digunakan dalam penelitian berjumlah 1725 tweets. Data akan dibagi duga 70% data training sebanyak 1208 data dan 30% data testing atau sebanyak 517 data. Sebelum data diklasifikasi data sebelumnya harus melalui proses preprocessing yaitu mengubah semua karakter huruf menjadi lowercase dan membuang karakter selain huruf dan spasi (case folding), pemotongan kata (tokenizing), dan penghapusan kata umum (stopword removing). Setelah data dibersihkan data akan dilabeli secara manual satu persatu dan baru data dapat digunakan untuk proses training untuk mendapatkan model probabilitas untuk setiap kategori. Probailitas diperoleh dengan menggunakan algoritma Naïve bayes. Model yang diperoleh dari tahap training akan diuji dengan menggunakan data testing. Kategori y...