Face identification has been widely applied this time, such as security on gadgets, smart home security, and others. Face dominates as a biometric which is most increase in the next few years. Face is used for biometric identification which is considered successful among several other types of biometrics and accurate results. Face recognition utilizes facial features for security purposes. The classification method in this paper is K-nearest Neighbor (KNN). The K-Nearest Neighbor algorithm uses neighborhood classification as the predictive value of a good instance value. K-NN includes an instance-based learning group. This paper developed face identification using Principal Component Analysis (PCA) or eigenface extraction methods. The stages of face identification research using the KNN method are pre-processing in the input image. Preprocessing used in this research are contrass stretching, grayscale, and segmentation used haar cascade. This research is registered 30 people, each person had 3 images used for training and 2 images used for testing. The results obtained from several trials of k values are as follows. Experiments with a value of k=1 get the best accuracy, namely 81%, k=2 get 53% accuracy, and k=3 get 45% accuracy.
Sejumlah besar data memiliki beberapa masalah yang sering ditemui seperti duplikasi data, ketidakkonsistenan data, dan ketidaklengkapan data. Variasi data yang dikumpulkan dari berbagai sumber akan mempengaruhi keakuratan hasil prediksi. Semakin banyak jumlah data yang dikumpulkan, pembersihan data manual hampir tidak mungkin karena memakan waktu dan rentan terhadap kesalahan. Untuk mempersingkat waktu dan mengurangi rentan kesalahan, diperlukan sebuah sistem yang dapat melakukan proses data cleaning secara otomatis. Tujuan dari proses data cleaning adalah menawarkan kualitas data yang lebih baik yang sangat membantu untuk memastikan data siap untuk tahap analisis. Salah satu tools pengolahan data yang dapat digunakan adalah Snowflake. Snowflake adalah tools pengolahan dengan basis query SQL yang dirancang untuk cloud. Data yang digunakan adalah tweet objek wisata di Bali melalui proses crawling data menggunakan Twitter API. Data yang dikumpulkan akan dibersihkan melalui dua tahap yaitu pembersihan Retweet dan kata noise, yang dilanjutkan dengan pembersihan untuk mencari tweet spesifik yang mengarah ke pariwisata Bali. Hasil proses cleaning objek wisata Bali pada 4 objek wisata yaitu Uluwatu, Sanur, Nusa Penida, dan Garuda Wisnu Kencana menunjukkan bahwa Nusa Penida merupakan objek wisata dengan jumlah penurunan yang signifikan dengan jumlah raw data yaitu 8087, cleaning tahap pertama yaitu 4770 data, dan cleaning tahap kedua adalah 2608 data.
Perpustakaan sebagai tempat koleksi buku yang besar tentu akan menemui kesulitan pelayanan pencarian buku jika masih menggunakan teknologi konvensional. Dalam ilmu Information Retrieval terdapat beberapa metode dalam pencarian dokumen yang relevan, salah satunya Generalized Vector Space Model (GVSM). Metode ini merupakan perkembangan dari Vector Space Model yang menggunakan model aljabar. GVSM menggunakan pertimbangan kedekatan antar kata yang dinyatakan dalam vector dua dimensi. Dalam Aplikasi pencarian buku, judul, pengarang, dan sinopsis buku dimasukkan ke dalam database dan dilakukan preprocessing diantaranya tokenisasi, stopword removal, dan stemming. Hal yang sama untuk kata kunci (query) pencarian yang diinputkan user juga dilakukan proses preprocessing. Dalam GVSM, dokumen dan query pencarian akan diubah kedalam bentuk vector dan dicari similaritasnya berdasarkan perkalian vector. Hasil dari implementasi metode GVSM dalam aplikasi pencarian buku di perpustakaan didapatkan hasil perbandingan nilai precision dan recall sebesar 0.703 dan 0.910 yang artinya hasil pencarian yang ditampilkan masih mendekati keinginan user. Kata Kunci: Pencarian Dokumen, Generalized Vector Space Model, Similaritas, Query
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.