“…Dalam konteks ini, penggunaan teknik-teknik analisis data dan machine learning dapat memberikan kontribusi besar dalam identifikasi dan klasifikasi kasus diabetes. Metode klasifikasi, seperti K-Nearest Neighbor (KNN), Naive Bayes, dan Logistic Regression, dapat digunakan untuk memproses data dan memberikan prediksi yang berguna dalam pengelolaan penyakit ini [1], [2], [3], [4], [5], [6], [7], [8], [9], [10], [11], [12], [13], [14], [15], [16], [17], [18], [19], [20], [21], [22], [23], [24], [26], [27] Penelitian ini dilatarbelakangi oleh kebutuhan untuk memahami dan membandingkan efektivitas KNN, Naive Bayes, dan Logistic Regression dalam mengklasifikasikan data diabetes. Dengan melibatkan ekstraksi fitur menggunakan Principal Component Analysis (PCA), penelitian ini bertujuan untuk mengidentifikasi metode klasifikasi mana yang paling optimal dan dapat memberikan kontribusi signifikan dalam mendukung diagnosis dini serta pengelolaan penyakit diabetes.…”