E-government merupakan sebuah konsep pemerintahan yang menyelenggarakan layanan publik secara digital yang didukung oleh teknologi informasi, sehingga menjadi lebih prima. Salah satu bentuk layanan publik digital yang umum ada di berbagai sektor adalah helpdesk. Helpdesk memungkinkan pengguna dapat bertanya atau melaporkan sesuatu untuk kemudian dijawab oleh staf. Permasalahan yang ada adalah ketersediaan staf yang hanya dapat menjawab pada jam kerja, sedangkan pengguna bisa jadi menemukan permasalahan yang urgent di luar jam kerja. Oleh karena itu, solusi yang ditawarkan adalah penerapan chatbot, sehingga dapat melayani kapan pun, sekaligus meringankan kerja dari staf. Penelitian ini mencoba untuk merancang salah satu komponen pada chatbot, yaitu model klasifikasi intensi, dengan metode Long Short-Term Memory. Data yang digunakan merupakan 501 teks riwayat pertanyaan dari database Helpdesk TIK UB yang termasuk ke dalam 7 kelas intensi yang ditentukan. Data akan melalui beberapa tahap prapemrosesan sebelum kemudian dilakukan pemodelan dan beberapa pengujian. Tahap pengujian meliputi pemilihan embedding yang digunakan, pemilihan teknik augmentasi data, dan penyetelan hyperparameter. Hasil dari keseluruhan pengujian, didapatkan model terbaik yang mampu menghasilkan akurasi sempurna untuk data latih dan data uji, serta loss 0,004 untuk data latih dan 0,044 untuk data uji.
Abstract
E-government is a government concept that organizes digital public services supported by information technology, so that they become more excellent. One form of digital public service that is common in various sectors is the helpdesk. Helpdesk allows users to ask questions or report something to be answered by staff. The problem that exists is the availability of staff who can only answer during working hours, while users may find urgent problems outside of working hours. Therefore, the solution offered is the implementation of a chatbot, so that it can serve at any time, while easing the work of staff. This study attempts to design one of the components of the chatbot, namely the intention classification model, using the Long Short-Term Memory method. The data used are 501 question history texts from the Helpdesk TIK UB database which fall into the 7 specified intensity classes. The data will go through several pre-processing stages before then being modeled and tested. The testing phase includes selecting the embedding used, data augmentation techniques selection, and hyperparameter tuning. The best model is obtained which can produce perfect accuracy for training data and test data, as well as a loss of 0.004 for training data and 0.044 for test data.