2020
DOI: 10.14710/jtsiskom.2020.13625
|View full text |Cite
|
Sign up to set email alerts
|

A proposed method for handling an imbalance data in classification of blood type based on Myers-Briggs type indicator

Abstract: Blood type still leads to an assumption about its relation to some personality aspects. This study observes preprocessing methods for improving the classification accuracy of MBTI data to determine blood type. The training and testing data use 250 data from the MBTI questionnaire answers given by 250 respondents. The classification uses the k-Nearest Neighbor (k-NN) algorithm. Without preprocessing, k-NN results in about 32 % accuracy, so it needs some preprocessing to handle data imbalance before the classifi… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1

Citation Types

0
2
0
5

Year Published

2021
2021
2025
2025

Publication Types

Select...
7
1

Relationship

1
7

Authors

Journals

citations
Cited by 8 publications
(7 citation statements)
references
References 16 publications
0
2
0
5
Order By: Relevance
“…Ini menunjukkan pada beberapa kondisi, seleksi fitur kurang signifikan dalam memperbaiki akurasi klasifikasi dibanding dengan modifikasi data melalui resampling untuk menyeimbangkan data training sehingga performa klasifikasi meningkat. Penelitian oleh Akbar et al juga mengenai klasifikasi pima diabetes menggunakan preprocessing supervised resample dan unsupervised resample, kemudian diklasifikasikan dengan k-NN menghasilkan akurasi mencapai 92,8% melalui 10 fold x validation [13].…”
Section: Pendahuluanunclassified
“…Ini menunjukkan pada beberapa kondisi, seleksi fitur kurang signifikan dalam memperbaiki akurasi klasifikasi dibanding dengan modifikasi data melalui resampling untuk menyeimbangkan data training sehingga performa klasifikasi meningkat. Penelitian oleh Akbar et al juga mengenai klasifikasi pima diabetes menggunakan preprocessing supervised resample dan unsupervised resample, kemudian diklasifikasikan dengan k-NN menghasilkan akurasi mencapai 92,8% melalui 10 fold x validation [13].…”
Section: Pendahuluanunclassified
“…Data balancing is carried out at this stage using the Synthetic Minority Oversampling Technique (SMOTE) method [16]. SMOTE is one of the most popular methods for dealing with data distribution imbalances [17].…”
Section: A Preprocessing Datamentioning
confidence: 99%
“…Pada tahap ini dilakukan penyeimbangan data dengan menggunakan algoritme Synthetic Minority Oversampling Technique (SMOTE) (Akbar et al, 2020). SMOTE adalah salah satu algoritme atau metode yang paling populer digunakan untuk menangani ketidakseimbangan distribusi data (Kasanah at al 2019).…”
Section: Preprocessing Dataunclassified