Di era revolusi industri 4.0 saat ini, penggunaan media sosial sangat berkembang pesat dengan terjadinya interaksi dan komunikasi antarmanusia dalam dunia maya. Namun, terkadang ditemui adanya pengguna media sosial yang menyalahgunakan untuk kepentingan tertentu, salah satunya ceramah agama yang mengandung kata-kata kasar dan ujaran kebencian. Semakin banyak kekeliruan dalam memahami agama dikarenakan apa yang disampaikan oleh penceramah bukanlah tentang agama itu sendiri, tetapi justru menghasut, menghina dan memprovokasi para pendengarnya untuk tujuan tertentu. Oleh karena itu, penelitian ini mengusulkan analisis speech-to-text pada video yang mengandung kata-kata kasar dan ujaran kebencian dalam ceramah agama islam menggunakan interpretasi audiens dan visualisasi word cloud. Hasil penelitian menunjukkan bahwa sebanyak 3 penceramah agama dan total terdapat 9 video di mana masing-masing video berdurasi 3 menit mengandung kata-kata kasar dan ujaran kebencian.