Discriminant analysis is used for the purpose of classifying an object based on certain criteria and predicting groups for new objects. This study will classify pregnant women affected by GDM and not who are evaluated using stratified k-fold cross validation. In the analysis, several assumptions are needed that must be met, including independent variables must be multivariate normal distributed, homogeneous covariance matrices, and there are average vector differences. The stages of analysis are data exploration, testing discriminant analysis assumptions, determining the number of k-folds, randomizing into training data and testing data gradually (stratified), conducting experiments as many as k times, estimating the discriminant model of each experiment, testing the accuracy of classification and determining the best model. The results of this study the best model was found in the first experiment with the model with a cut off value of 0.0001739. That is, if there is a new object with a value of ≥ 0.0001739 then the pregnant woman falls into the category of not affected by GDM, and vice versa if < 0.0001739 then pregnant women fall into the category affected by GDM.
Abstrak: Analisis diskriminan digunakan untuk tujuan mengklasifikasikan sebuah objek berdasarkan kriteria tertentu dan memprediksi kelompok untuk objek baru. Penelitian ini akan mengklasifikasikan ibu hamil yang terkena GDM dan tidak yang dievaluasi menggunakan stratified k-fold cross validation. Dalam analisisnya, diperlukan beberapa asumsi yang harus dipenuhi diantaranya variabel independen harus berdistribusi normal multivariat, matriks varians kovarian yang homogen, dan ada perbedaan vektor rata-rata. Tahapan analisisnya yaitu eksplorasi data, menguji asumsi analisis diskriminan, menentukan banyaknya k-fold, melakukan pengacakan menjadi data latih dan data uji secara bertahap (stratified), melakukan eksperimen sebanyak k kali, mengestimasi model diskriminan dari masing-masing eksperimen, menguji ketepatan klasifikasi dan menentukan model terbaiknya. Hasil dari penelitian ini model terbaik terdapat pada eksperimen pertama dengan model dengan nilai cut off sebesar 0.0001739. Artinya, jika ada objek baru dengan nilai 0.0001739 maka ibu hamil tersebut masuk ke dalam kategori tidak terkena GDM, dan sebaliknya apabila 0.0001739 maka ibu hamil masuk ke dalam kategori terkena GDM.