Retrieval of source documents in a text reuse system

Haryanto, Nathaniel Clarence; Krisnawati, Lucia Dwi; Chrismanto, Antonius Rachmat

doi:10.14710/jtsiskom.8.2.2020.140-149

Cited by 3 publications

(2 citation statements)

References 7 publications

Supporting

Mentioning

Contrasting

Order By: Relevance

“…The meaningless words are commonly referred to as stopwords. Some examples of stopwords are "juga," "dan," "untuk," and "adalah" [21]. It is necessary to delete these stopwords because if conjunctions frequently appear in a sentence, the text similarity percentage is very high, and it interferes with the accuracy of the text similarity method [22].…”

Section: Preprocessingmentioning

confidence: 99%

Pengaruh Synonym Recognition dalam Deteksi Kemiripan Teks Menggunakan Winnowing dan Cosine Similarity

Santi Purwaningrum,

Agus Susanto,

Ari Kristiningsih

2023

JNTETI

View full text Add to dashboard Cite

Plagiarisme adalah tindakan meniru dan mengutip bahkan menyalin atau mengakui hasil karya orang lain sebagai hasil karya diri sendiri. Tugas akhir merupakan salah satu syarat wajib mahasiswa untuk menyelesaikan pembelajaran pada perguruan tinggi. Tugas akhir harus disusun mahasiswa berdasarkan ide sendiri. Akan tetapi, banyak terjadi plagiarisme karena mudahnya melakukan kegiatan tersebut, yaitu hanya dengan menyalin teks gagasan orang lain kemudian ditempelkan dalam lembar kerja dan diakui bahwa gagasan tersebut adalah ide sendiri. Selain itu, mengganti beberapa kata dalam kalimat gagasan orang lain dengan gaya bahasa sendiri tanpa menuliskan sumber aslinya juga termasuk plagiarisme. Pengecekan tugas akhir yang masih manual juga menjadi masalah bagi koordinator tugas akhir, yang membutuhkan ketelitian tinggi dan waktu yang cukup banyak untuk mengecek plagiarime pada dokumen tugas akhir. Maka, deteksi plagiarisme sangat dibutuhkan untuk mencegah tindakan plagiarisme makin berkembang. Menyikapi hal tersebut, penelitian ini bermaksud mengembangkan sistem yang dapat mendeteksi persamaan antardokumen teks yang berfokus pada kata yang mengandung sinonim pada suatu kalimat. Salah satu algoritma yang digunakan adalah synonym recognition, yang berfungsi untuk mendeteksi kata yang mengandung sinonim, dengan proses membandingkan setiap kata dengan kata yang terdapat pada kamus. Synonym recognition dikombinasikan dengan metode winnowing, yang berfungsi untuk pembobotan teks berbasis fingerprint. Setelah diperoleh bobot dari masing-masing dokumen, tingkat kemiripan antardokumen dihitung dengan algoritma cosine similarity. Hasil rata-rata nilai kemiripan untuk deteksi judul dan abstrak dengan menambahkan synonym recognition meningkat sebesar 3,11% daripada tanpa menggunakan synonym recognition yang dikombinasikan dengan metode pembobotan winnowing. Hasil pengujian menunjukkan bahwa algoritma-algoritma yang digunakan akurat dengan pengujian akurasi dan root mean squared error (RMSE).

show abstract

Section: Preprocessingmentioning

confidence: 99%

Pengaruh Synonym Recognition dalam Deteksi Kemiripan Teks Menggunakan Winnowing dan Cosine Similarity

Santi Purwaningrum,

Agus Susanto,

Ari Kristiningsih

2023

JNTETI

View full text Add to dashboard Cite

show abstract

“…The work process of IPD system is only based on the imitation of human expertise in recognizing parts of the text that experience a change in writing style as a sign of copy or paste text without comparing with other text[3]. EPD system process compares each document inputted with each document contained in the corpus to compare similarity [4]. Corpus must have several documents that have the same topic with the source of plagiarism to know the test of document similarity level.…”

Section: Introductionmentioning

confidence: 99%

Comparation of Dice Similarity and Jaccard Coefficience Against Winnowing Algorithm For Similarity Detection of Indonesian Text Documents

Purwaningrum¹,

Susanto²,

Prasetya³

2021

JAIS

View full text Add to dashboard Cite

Plagiarism is the act of imitating and quoting and even copying or acknowledging other people's work as one's own work. Plagiarism is currently growing rapidly, especially in the world of education. So that plagiarism detection is needed to prevent plagiarism from growing rapidly. In response to this, this paper intends to conduct research that compares the dice similarity and the jaccard coefficient to find the best document similarity value level against the Winnowing algorithm which functions to find the fingerprint value of each document. The test results show that the winnowing algorithm is quite good at using the dice similarity level with the results of an average similarity value of 71.17615% than testing using jaccard coefficient with the resulting value 35,58837%.

show abstract

Paper Recommendation for Research References in Data Mining using Content-Based Filtering

Hunna

Renaldi

Santikarama

2022

2022 International Conference on Science and Technology (ICOSTECH)

View full text Add to dashboard Cite

Retrieval of source documents in a text reuse system

Cited by 3 publications

References 7 publications

Pengaruh Synonym Recognition dalam Deteksi Kemiripan Teks Menggunakan Winnowing dan Cosine Similarity

Pengaruh Synonym Recognition dalam Deteksi Kemiripan Teks Menggunakan Winnowing dan Cosine Similarity

Comparation of Dice Similarity and Jaccard Coefficience Against Winnowing Algorithm For Similarity Detection of Indonesian Text Documents

Paper Recommendation for Research References in Data Mining using Content-Based Filtering

Contact Info

Product

Resources

About