AbstrakFokus dari penelitian ini adalah untuk mengembangkan data dan sistem Question Answering (QA) Bahasa Indonesia untuk pertanyaan non-factoid. Penelitian ini merupakan penelitian QA non-factoid pertama untuk Bahasa Indonesia. Adapun sistem QA terdiri atas 3 komponen yaitu penganalisis pertanyaan, pengambil paragraf, dan pencari jawaban. Dalam komponen penganalisis pertanyaan, dengan asumsi bahwa pertanyaan yang diajukan merupakan pertanyaan sederhana, digunakan sistem yang berbasis aturan sederhana dengan mengandalkan kata pertanyaan yang digunakan ("apa", "mengapa", dan "bagaimana"). Paragraf diperoleh dengan menggunakan pencarian kata kunci baik dengan menggunakan stemming ataupun tidak. Untuk pencari jawaban, jawaban diperoleh dengan menggunakan pola kata-kata khusus yang ditetapkan sebelumnya untuk setiap jenis pertanyaan. Dalam komponen pencari jawaban ini, diperoleh kesimpulan bahwa penggunaan kata kunci nonstemmed bersamaan dengan kata kunci hasil stemming memberikan nilai akurasi jawaban yang lebih baik, jika dibandingkan dengan penggunaan kata kunci non-stemmed saja atau kata kunci stem saja. Dengan menggunakan 90 pertanyaan yang dikumpulkan dari 10 orang Indonesia dan 61 dokumen sumber, diperoleh nilai MRR 0.7689, 0.5925, dan 0.5704 untuk tipe pertanyaan definisi, alasan, dan metode secara berurutan. Kata Kunci: pertanyaan non-factoid, question answering AbstractFocus of this research is to develop QA data and system in Bahasa Indonesia for non-factoid questions. This research is the first non-factoid QA for Bahasa Indonesia. QA system consists of three components: question analyzer, paragraph taker, and answer seeker. In the component of question analyzer, by assuming that the question posed is a simple question, we used a simple rule-based system by relying on the question word used ("what", "why", and "how"). On the components of paragraph taker, the paragraph is obtained by using keyword, either by using stemming or not. For answer seeker, the answers obtained by using specific word patterns that previously defined for each type of question. In the component of answer seeker, the conclusion is the use of non-stemmed keywords in conjunction with the keyword stemming results give a better answer accuracy compared to non-use of the keyword or keywords are stemmed stem only. By using 90 questions, we collected from 10 people of Indonesia and the 61 source documents, obtained MRR values 0.7689, 0.5925, and 0.5704 for type definition question, reason, and methods respectively.
Research in the field of Natural Language Processing (NLP) is currently increasing especially with the arrival of a new term that is "big data". The needs of the programming library that ready-touse becomes very important to speed up the phases of research. Some libraries that have already been mature is available but generally for English language and its dependently. So, it can't be used for other languages. Stemming is one of the basic processes that exist in NLP. Indonesian stemming algorithm that often used is ECS (Enhanced Confix-Stripping). One of the libraries that already implemented the algorithm is Sastrawi 1. Results from the experiment show that the time of stemming processing by Sastrawi is still slow. Therefore, this research will optimize the speed of stemming processing using multiprocessing (MP). The data test are used in this research has manually taken from Wikipedia 2. The experiment results show that the MP technique can decrease the average time of stemming processing about 98.45%.
Sistem Informasi Desa (SID) adalah seperangkat alat dan proses pemanfaatan data dan informasi untuk mendukung pengelolaan sumber daya berbasis komunitas di tingkat desa. SID merupakan bagian dari implementasi Undang-Undang (UU) Desa. UU Desa Pasal 86 UU no. 6 Tahun 2014 tentang Sistem Informasi Pembangunan Desa dan Pembangunan Kawasan Perdesaan. Desa belum dapat mengimplementasikan SID karena kurangnya pemahaman perangkat desa tentang SID. Oleh karena itu, kebutuhan akan pelatihan SID menjadi sangat urgen bagi desa khususnya para perangkat desa. Untuk mengatasi masalah tersebut, Fakultas Ilmu Komputer, Universitas Sriwijaya, melakukan kegiatan pelatihan SID berbasis OpenSID melalui program Pengabdian Kepada Masyarakat (PkM). Hasil dari pelatihan diperoleh bahwa materi yang diberikan cukup dipahami oleh semua peserta pelatihan meskipun mereka belum pernah menggunakan aplikasi yang sejenis. Selain itu, mereka percaya bahwa SID dapat membantu administrasi desa dan meningkatkan layanan informasi desa.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.