1 asvarizal.filcha@students.amikom.ac.id 2 mardhiya_hayati@amikom.ac.idAbstrak-Perkembangan pada dunia teknologi informasi mengakibatkan perguruan tinggi mengurangi penggunaan kertas sehingga banyak tugas mahasiswa yang dikumpulkan dalam bentuk digital. Penggunaan digital menyebabkan semakin mudahnya mahasiswa untuk melakukan plagiarisme. Sehingga diperlukan sebuah sistem untuk melakukan pemeriksaan plagiarisme pada dokumen tugas antar mahasiswa dengan cepat dan tepat. Metode yang dapat digunakan adalah menggunakan algoritma Rabin-Karp. Algoritma Rabin-Karp memiliki keunggulan pencarian string dengan pola yang panjang. Algoritma Rabin-karp dalam sistem ini memiliki langkah -langkah text preprocessing yang terdiri case folding, tokenizing, punctuation removal, stopword removal dan stemming. Hasil dari text preprocessing inilah yang akan di proses menggunakan algoritma Rabin-karp. Hasil dari metode ini adalah nilai kemiripan dari tugastugas mahasiswa yang dihitung menggunakan dice coefficient. Perhitungan akurasi dengan melakukan 20 perbandingan antara sistem pendeteksi plagiarisme dan software Plagiarisme Checker X menggunakan confusion matrix menghasilkan tingkat keakuratan sebesar 90%.
Kata Kunci -Rabin-Karp,plagiarisme, text preprocessing, dice coefficient.
Abstract-The Information and technology development causes universities reduce paper usage so that the student's assignments can be collected in digital form. The digital form usage causes students can easily plagiarism the assignments. So, it is needed a system to check the plagiarism on assignment documents among students quickly and accurate. The method that can be used is Rabin-Karp algorithm. Rabin-Karp algorithm has excellence in searching strings with long pattern. Rabin-Karp algorithm in this system has text preprocessing steps that consist of case folding, tokenizing, punctuation removal, stopword removal and stemming. The result from the text preprocessing will be processed using Rabin-Karp algorithm. The outcome of this method is the similiarity percentage of student's assignments calculated using dice coefficient. The accuracy calculation by doing 20 comparisons between plagiarism checker system andPlagiarism Checker X software using confusion matrix is 90%.