Mengemudi dalam keadaan tidak sadar atau mengantuk merupakan salah satu penyebab utama terjadinya kecelakaan lalu lintas. Meskipun demikian, penumpang biasanya tidak akan menyadari jika pengemudi kendaraan yang mereka kendarai dalam keadaan mengantuk. Untuk mendeteksi kantuk pengemudi pada umumnya adalah dengan menggunakan model pembelajaran mesin. Akan tetapi model pembelajaran mesin biasanya hanya dapat mengenali pola dari sebuah data tanpa memperhatikan deret waktu pada data sekuensial atau time series. Metode yang digunakan adalah Convolutional Long Short Term Memory. Convolutional Long Short Term Memory adalah salah satu bentuk Recurrent Neural Network yang dapat digunakan untuk mengatasi masalah korelasi deret waktu baik dalam waktu singkat maupun lama pada data spatial time series. Data yang digunakan adalah data yang berupa video dari seseorang yang sedang mengemudi. Data video merupakan data berurutan yang terdiri atas banyak frame yang berupa citra. Pada penelitian ini setiap frame tersebut dilakukan deteksi wajah untuk mendapatkan citra wajah pengemudi, sedangkan Convolutional Long Short Term Memory digunakan untuk mempelajari pola perubahan ekspresi wajah pengemudi seiring waktu. Hasil menunjukkan model memiliki akurasi sebesar 75% yang menunjukkan bahwa model memiliki kemampuan yang signifikan dalam memprediki kantuk pengemudi.