The preparation of the research should be categorized in order to facilitate the search for the needy. To categorize the research required a method for text mining, one of them with the implementation of Support Vector Machines (SVM). The data used to recognize the characteristics of each category requires a collection of abstracts of research. The data will be preprocessing with several stages of case folding, stop words removing, tokenizing, and stemming. Further data that has undergone preprocessing will be converted into numerical form with for the term weighting stage. The results of term weighting then obtained data that can be used for data training and test data. The training process is done by providing input in the form of text data known category. Then by using Support Vector Machines, the input data is transformed into a knowledge model that can be used in the prediction process. From the research result, it is found that the categorization of research produced by SVM has been very good. This is evidenced by the results of the test that yields an accuracy of 90%.
Keywords: SVM, Text Mining, Preprocessing, Classification, Term Weighting
AbstrakPenyusunan penelitian hendaknya harus perkategori agar mempermudah pencarian bagi yang membutuhkan. Untuk mengkategorikan penelitian dibutuhkan sebuah metode untuk penambangan teks, salah satunya dengan implementasi Support Vector Machines (SVM). Data yang digunakan untuk mengenali ciri dari tiap kategori maka dibutuhkan kumpulan dari abstrak penelitian. Data tersebut akan dilakukan preprocessing dengan beberapa tahapan yaitu case folding, stopwords removing, tokenizing, dan stemming. Selanjutnya data yang sudah mengalami preprocessing akan diubah menjadi bentuk numerik dengan untuk tahap term weighting. Hasil term weighting maka diperoleh data yang bisa digunakan untuk data training dan data uji. Proses training dilakukan dengan memberikan masukan berupa data teks yang diketahui kategorinya. Kemudian dengan menggunakan Support Vector Machines, data hasil masukan tersebut ditransformasikan ke dalam suatu model pengetahuan yang nantinya dapat digunakan dalam proses prediksi. Dari hasil penelitian diperoleh bahwa pengkategorian penelitian yang dihasilkan oleh SVM sudah sangat baik. Hal ini dibuktikan oleh hasil pengujian yang menghasilkan tingkat akurasi 90%.Kata kunci: SVM, Penambangan Teks, Preprocessing, Klasifikasi, Term Weighting © 2017 Jurnal RESTI
PendahuluanSaat ini sudah banyak sekali kebijakan pemerintah yang ditujukan untuk meningkatkan penelitian. Semakin banyaknya penelitian maka semakin sulitnya penyimpanan penelitian. Kesulitan tersebut akan muncul ketika ada peneliti lain yang membutuhkan penelitian yang mendukung penelitiannya. Oleh sebab itu, sebaiknya penyimpanan penelitian dilakukan berdasarkan kategorinya. Pengkategorian penelitian dapat dilakukan secara manual dan otomatis. Untuk cara manual tentu akan membutuhkan waktu yang lebih banyak dibandingkan otomatis. Pengkategorian secara otomatis, dapat dilakukan dengan memanfaatkan classif...