AbstrakPesatnya perkembangan teknologi dan media sosial dapat memudahkan pengguna untuk menyampaikan informasi. Selain itu, media sosial juga memberikan dampak negatif dengan cara memposting tulisan kejam atau berkomentar semena-mena tanpa memikirkan akibat pada orang lain. Hal inilah yang menjadikan salah satu terjadinya tindak kekerasan dalam dunia maya (Cyberbullying). Tahapan awal yang dilakukan dalam penelitian ini adalah pengolahan bahasa atau yang disebut dengan text preprocessing meliputi tokenizing, casefolding, stopword removal dan stemming. Kemudian feature selection yaitu mengubah dokument teks menjadi matriks dengan tujuan untuk mendapatkan fitur pada setiap kata untuk dijadikan parameter atau kriteria klasifikasi. Untuk pengambilan keputusan apakah komentar mengandung makna bully atau nonbully menggunakan algoritma Naïve Bayes Classification dengan model multinomial naïve bayes. Perhitungan yang dilakukan adalah menghitung nilai probabilitas setiap kata yang muncul berdasarkan class dan nilai perkalian class conditional probability. Berdasarkan hasil eksperimen menggunakan dataset "cyberbullying comments" yang diambil dari Kaggle akurasi yang didapat sebesar 80%, precission 81% dan recall 80%.
AbstractThe rapid development of technology and social media can facilitate users to convey information. Besides, social media also has a negative impact by posting cruel posts or commenting arbitrarily without thinking about the consequences on others. This is what makes one of the acts of violence in cyberspace (Cyberbullying). The initial stages carried out in this research are language processing or what is called text preprocessing including tokenizing, case-folding, stopword removal and stemming. Then the feature selection is to change the text document into a matrix to get the features of each word to be used as a parameter or classification criteria. For decision making whether comments contain bully or non-bully meaning using the Naïve Bayes Classification algorithm with the multinomial naïve Bayes model. The calculation is done is to calculate the probability value of each word that appears based on the class and the value of the class conditional probability multiplication. Based on the results of experiments using the dataset "cyberbullying comments" taken from Kaggle obtained 80% accuracy, 81% precision and 80% recall.