Pada era digital ini, Teknologi semakin pesat termasuk di bidang Machine Learning, bekerja pada Machine Learning (ML) telah dipercepat dalam beberapa tahun terakhir. Klasifikasi dapat dilakukan dengan banyak metode, salah satunya yaitu menggunakan Deep Learning. Deep Learning merupakanbagian dari Machine Learning yang dapatmempelajari metode komputasinya sendiri. Deep Learning yang saat ini memilikihasil paling signifikan dalam pengenalan citra adalah Convolutional Neural Network (CNN) salah satunya sistem identifikasi menjadi hal yang penting untuk dapat mengenali seseorang berdasarkan ciri yang dimilikinya. Pada umumnya sistem identifikasi seseorang masih dilakukan menggunakan teknik konvensional, seperti menggunakan ID card yang mudah ruak dan hilang, kata sandi atau PIN yang mudah dilupakan. Saat ini, biometrik banyak digunakan untuk verifikasi dan identifikasi. Keunikan dan ketersediaan data biometrik membuatnya ideal untuk tujuan ini. Informasi biometrik biasanya mencakup fitur wajah, sidik jari, iris mata, tanda tangan, suara, dan DNA. Dalam hal ini erat kaitannya dengan sistem otentikasi biometrik multimodal yang terbukti menjadi pendekatan yang menjanjikan untuk mengidentifikasi seseorang menggunakan fitur fisiologis dan/atau perilaku seperti wajah, sidik jari, sidik jari, geometri tangan, iris, retina, vena, serta ucapan. Biometrik multimodal wajah, telapak tangan, telapak tangan dan audio memiliki beberapa keunggulan termasuk pemanfaatan akuisisi gambar non-invasif dan berbiaya rendah. Selain itu, gambar wajah dan sidik jari dapat dengan mudah diperoleh secara bersamaan menggunakan dua sensor tanpa sentuhan. Pada penelitian ini dalam klasifikasinya menggunakan jaringan Hierarki Attention sehingga memperoleh Hasil dari evaluasi matrik dari implementasi jaringan hierarki attention untuk klasifikasi basis data multimodal biometrik diperoleh akurasi sebesar 100%