2018
DOI: 10.31227/osf.io/vjc7k
|View full text |Cite
Preprint
|
Sign up to set email alerts
|

Pengaruh Tokenisasi Kata N-Grams Spam SMS Menggunakan Support Vector Machine

Abstract: Pesan singkat atau Short Message Service (SMS) merupakan fasilitas yang ada di telepon seluler. Dengan fasilitas pesan singkat ini banyak yang menyalah gunakan pesan singkat tersebut. Spam SMS adalah proses mengirimkan SMS secara terus menerus tanpa di kehendeaki oleh penerimanya baik berupa iklan, jasa maupun penipuan yang dilakukan lewat telepon seluler yang dapat merugikan pengguna. Banyak cara yang yang dilakukan untuk mencegah spam SMS ini. Salah satunya adalah dengan penyaringan spam SMS, penelitian ini … Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1

Citation Types

0
2
0
1

Year Published

2021
2021
2022
2022

Publication Types

Select...
3

Relationship

0
3

Authors

Journals

citations
Cited by 3 publications
(3 citation statements)
references
References 3 publications
0
2
0
1
Order By: Relevance
“…Pada tahap Preprocessing adalah proses perubahan bentuk data yang terstruktur sembarang menjadi data yang terstruktur sesuai kebutuhan untuk proses dalam text mining (Takdirillah, 2020). Tahapan Preprocessing yang digunakan antara lain: Case Folding yaitu tahap mengubah semua huruf dalam dokumen menjadi huruf kecil dan karakter non-huruf akan dihilangkan, Tokenizing yang merupakan tahap pemotongan string input berdasarkan tiap kata yang menyusunnya (Afuan, 2018) dan secara garis besar memecah sekumpulan karakter dalam suatu teks ke dalam satuan kata, Filtering dengan mengambil kata-kata penting dari hasil tahap tokenizing yang dapat dilakukan dengan menghilangkan stoplist atau stopword (Sugianto & Apandi, 2018), dan Stemming yang mentransformasi suatu kata menjadi kata dasarnya (root word) dengan menggunakan aturan-aturan tertentu (Senthikumar, Maheswari, 2019).…”
Section: Gambar 1 Alur Metode Penelitianunclassified
“…Pada tahap Preprocessing adalah proses perubahan bentuk data yang terstruktur sembarang menjadi data yang terstruktur sesuai kebutuhan untuk proses dalam text mining (Takdirillah, 2020). Tahapan Preprocessing yang digunakan antara lain: Case Folding yaitu tahap mengubah semua huruf dalam dokumen menjadi huruf kecil dan karakter non-huruf akan dihilangkan, Tokenizing yang merupakan tahap pemotongan string input berdasarkan tiap kata yang menyusunnya (Afuan, 2018) dan secara garis besar memecah sekumpulan karakter dalam suatu teks ke dalam satuan kata, Filtering dengan mengambil kata-kata penting dari hasil tahap tokenizing yang dapat dilakukan dengan menghilangkan stoplist atau stopword (Sugianto & Apandi, 2018), dan Stemming yang mentransformasi suatu kata menjadi kata dasarnya (root word) dengan menggunakan aturan-aturan tertentu (Senthikumar, Maheswari, 2019).…”
Section: Gambar 1 Alur Metode Penelitianunclassified
“…Text mining is a text processing to extract and find information from a text or unstructured data that is useful through recognizing and exploring a pattern in a text. (Somantri, Wiyono and Dairoh, 2016) Thus text mining needs to be done in classifying a text in order to get the information needed for the data classification process [16]- [18]. Before classifying the data, we need a preprocessing which is part of text mining.…”
Section: Text Processing In Text Miningmentioning
confidence: 99%
“…Several studies have been conducted in handling spam with various feature selection methods and classification algorithms. For instance, the research carried out by [7] integrated the Principal Component Analysis (PCA) feature selection method and the Correlated Naïve Bayes Classifier (CNBC) algorithm, while [8] used the ranking method, and [9] applied the Genetic Algorithm as feature selection to improve the accuracy of Naïve Bayes results. Furthermore, [10] compared three classification algorithms, namely Naïve Bayes (NB), Support Vector Machine (SVM), and Artificial Neural Network (ANN), as well as four feature selection algorithms, including information gain, chi-square, forward selection, and backward elimination for analysis of movie review sentiment.…”
Section: Introductionmentioning
confidence: 99%