2018
DOI: 10.5614/itbj.ict.res.appl.2018.12.2.2
|View full text |Cite
|
Sign up to set email alerts
|

Optimization of Spaced K-mer Frequency Feature Extraction using Genetic Algorithms for Metagenome Fragment Classification

Abstract: K-mer frequencies are commonly used in extracting features from metagenome fragments. In spite of this, researchers have found that their use is still inefficient. In this research, a genetic algorithm was employed to find optimally spaced k-mers. These were obtained by generating the possible combinations of match positions and don't care positions (written as *). This approach was adopted from the concept of spaced seeds in PatternHunter. The use of spaced k-mers could reduce the size of the k-mer frequency … Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
0
0
5

Year Published

2020
2020
2022
2022

Publication Types

Select...
4

Relationship

1
3

Authors

Journals

citations
Cited by 4 publications
(5 citation statements)
references
References 21 publications
0
0
0
5
Order By: Relevance
“…Proses selanjutnya kedua jenis data diproses ke grayscale dan lanjut diekstraksi menggunakan ekstraksi GLCM dan mendapatkan pola latih dan pola uji. Proses selanjutnya yaitu dilanjutkan dengan proses ekstraksi Naïve Bayes Classifier dan mendapatkan nilai akurasinya [10].…”
Section: Gambar 1 Alur Penelitianunclassified
“…Proses selanjutnya kedua jenis data diproses ke grayscale dan lanjut diekstraksi menggunakan ekstraksi GLCM dan mendapatkan pola latih dan pola uji. Proses selanjutnya yaitu dilanjutkan dengan proses ekstraksi Naïve Bayes Classifier dan mendapatkan nilai akurasinya [10].…”
Section: Gambar 1 Alur Penelitianunclassified
“…Pekuwali dkk. [10] melakukan penelitian mencari kombinasi fitur terbaik dari fragmen menggunakan algoritme genetika. Ektraksi fitur kajian tersebut menggunakan spaced k-mers yang menghasilkan pola 111 1111 10001 dengan 1 adalah match dan 0 adalah don't care sehingga menghasilkan 336 fitur.…”
Section: Pendahuluanunclassified
“…Pada penelitian ini, arsitektur classifier DNN dibandingkan dengan arsitektur classifier CNN [13] dan classifier naïve Bayes [10]. Hasil akurasi dari klasifikasi data dinyatakan pada Gambar 4.…”
Section: Perbandingan Classifierunclassified
“…Binning berbasis komposisi mengelompokan fragmenfragmen dari berbagai organisme berdasarkan tingkat taksonominya menggunakan teknik-teknik dalam machine learning, yaitu ekstraksi fitur dan pengklasifikasian atau pengklusteran. Pekuwali (2018) telah melakukan penelitian dengan menggunakan spaced k-mers frekuensi sebagai metode pengekstraksi fitur dan Naive Bayesian Classifier (NBC). Penggunaan metode spaced k-mers frekuensi menghasilkan model posisi match (1) dan don't care (0).…”
Section: Pendahuluanunclassified
“…Sedangkan saat menggunakan fitur 38 sampai 43 menghasilkan akurasi sebesar 79,67%. Pada Gambar 10 dapat dilihat bahwa dengan menggunakan 6 fitur menghasilkan akurasi yang tidak jauh berbeda dengan yang melibatkan 336 fitur (Pekuwali, 2018).…”
Section: Hasil Dan Pembahasanunclassified