Dokumen teks bahasa Indonesia sangat melimpah dan setiap waktu bertambah. Dalam proses pencarian, banyak dokumen yang dihasilkan menjadi kurang relevan jika tidak sesuai dengan keinginan pengguna. Stoplist merupakan kumpulan kata yang “tidak relevanâ€, namun sering muncul dalam dokumen. Kata umum juga sering digunakan pada bidang tertentu sehingga dimungkinkan untuk dokumen sebidang akan ada kata umum yang sering muncul. Pada sistem temu kembali informasi, asumsi yang ada adalah dengan menghapus stoplist, maka mengurangi jumlah kata yang akan diproses. Adanya kata umum bidang, memungkinkan adanya mengurangan jumlah kata yang akan diproses juga. Dalam penelitian ini dilakukan ekstraksi kata umum dari dokumen hasil klasifikasi dan melakukan perbandingan efektifitas antara aplikasi pencarian-1 menggunakan penghapusan stoplist dengan aplikasi pencarian-2 menggunakan penghapusan stoplist dan kata umum. Hal ini dilakukan untuk mengetahui model pencarian dengan tingkat relevansi dan waktu proses pencarian dokumen yang lebih tinggi. Hasil uji coba klasifikasi pretopology dengan 25 dokumen teknik, 25 ekonomi dan 25 pertanian diperoleh nilai rata-rata recall dan precision sebesar 90% dan 76%. Dan uji coba pencarian dengan 6 query terhadap 746 dokumen pada aplikasi pencarian-1 diperoleh nilai rata-rata f-measure dan waktu proses adalah 30.6% dan 0.239 detik. Sedangkan aplikasi pencarian-2 dengan threshold kata umum 1% adalah 76.5% dan 0.098 detik. Sehingga dapat dikatakan bahwa aplikasi pencarian-2 (dengan menggunakan penghapusan stoplist dan kata umum) lebih efektif dari pada aplikasi pencarian-1.Kata kunci: Sistem temu kembali informasi, Stoplist, Klasifikasi Pretopology, Kata Umum.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.