2020
DOI: 10.23960/komputasi.v8i1.2517
|View full text |Cite
|
Sign up to set email alerts
|

Studi Ekstraksi Fitur Berbasis Vektor Word2Vec pada Pembentukan Fitur Berdimensi Rendah

Abstract: Klasifikasi teks adalah salah satu metode untuk mengelola dan mencari informasi penting yang terdapat pada format tekstual yang tidak terstruktur. Ekstraksi fitur merupakan proses penting pada klasifikasi teks untuk mengubah format tekstual yang tidak terstruktur menjadi terstruktur sehingga dapat diproses oleh algoritma machine learning untuk mengklasifikasikan ke class yang telah ditentukan. Salah satu teknik ekstraksi fitur yang umum digunakan adalah vector space representation. Teknik ini mudah digunakan t… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1
1

Citation Types

0
2
0
2

Year Published

2022
2022
2023
2023

Publication Types

Select...
3

Relationship

0
3

Authors

Journals

citations
Cited by 3 publications
(4 citation statements)
references
References 12 publications
0
2
0
2
Order By: Relevance
“…Proses merubah teks menjadi fitur dinamakan ekstraksi fitur, dimana teks yang sifatnya unstructured data tidak dapat langsung diproses oleh algoritma klasifikasi, sehingga perlu dilakukan proses mengubah data tidak terstruktur menjadi data terstruktur atau tabular [5]. Proses ekstraksi fitur sama seperti proses pemberian skor kata berdasarkan jumlah frekuensi kata yang muncul dalam teks disebut term frequency (TF).…”
Section: Pendahuluanunclassified
See 1 more Smart Citation
“…Proses merubah teks menjadi fitur dinamakan ekstraksi fitur, dimana teks yang sifatnya unstructured data tidak dapat langsung diproses oleh algoritma klasifikasi, sehingga perlu dilakukan proses mengubah data tidak terstruktur menjadi data terstruktur atau tabular [5]. Proses ekstraksi fitur sama seperti proses pemberian skor kata berdasarkan jumlah frekuensi kata yang muncul dalam teks disebut term frequency (TF).…”
Section: Pendahuluanunclassified
“…Suatu hal yang kurang tepat apabila menggunakan Random Forest untuk kasus klasifikasi teks yang umumnya menjadikan kata sebagai fitur atau kolom, karena apabila menggunakan Random Forest proses pembelajaran yang dibutuhkan akan semakin lama. Ekstraksi fitur merupakan tahapan wajib sebelum proses klasifikasi [5], sebagai tahapan untuk menjadikan teks sebagai fitur. Jumlah fitur yang rendah dapat mempercepat proses pembelajaran, istilahnya disebut dimensionality reduction, algoritma yang telah menerapkan dimensionality reduction adalah Word2vec.…”
Section: A Identifikasi Masalahunclassified
“…The input for word2vec is a text corpus, and the output is a set of vectors [21]. In this study, apply the word2vec method to determine each word's vector value and measure the closeness between words semantically in maximizing the possibility of predicting the word context or surrounding words.…”
Section: Figure 2 Cbow and Skip-gram Architecturementioning
confidence: 99%
“…Feature extraction is a process in text classification to convert unstructured textual formats into structured ones so that they can be processed by machine learning algorithms to be classified into predetermined classes [9]. The features used in this study are the type of work and the user's interest in information which is a representation of the attributes of the "Introvert/Extrovert" and "Sensor/Intuitive" classes in the Myers-Briggs Type Indicator (MBTI) model [8].…”
Section: Feature Extractionmentioning
confidence: 99%