VAQA: Visual Arabic Question Answering

kamel, Sarah M.; Hassan, Shimaa I.; Elrefaei, Lamiaa A.

doi:10.1007/s13369-023-07687-y

Cited by 4 publications

(2 citation statements)

References 43 publications

Supporting

Mentioning

Contrasting

Order By: Relevance

“…Dataset ini merupakan kumpulan data keluaran microsoft yang berisi foto dari 91 jenis objek yang mudah dikenali oleh anak berusia 4 tahun dalam bahasa inggris [7]. Pengembangan VQA dalam domain umum dilakukan pada bahasa Arab oleh Kamel et al [8]. Dataset yang dibangun berjumlah 138.000 yang berisi gambar sehari-hari.…”

unclassified

See 1 more Smart Citation

Visual Question Answering Bahasa Indonesia Berbasis Deep Learning untuk Pembelajaran Visual Anak TK

Hanifah,

Sholikah,

Ginardi

2024

View full text Add to dashboard Cite

Indonesia semakin gencar melakukan persiapan transformasi digital dalam berbagai sektor, termasuk dalam bidang pendidikan. Salah satu upaya yang dilakukan pemerintah adalah dengan mengimplementasikan platform e-learning dalam kegiatan belajar mengajar hingga ke jenjang taman kanak-kanak. Metode pembelajaran visual pada taman kanak-kanak dapat diimplementasikan ke dalam e-learning yang lebih interaktif dan menarik dengan sistem Visual Question Answering (VQA). Sistem VQA dapat memberikan pertanyaan terkait dengan gambar yang ditampilkan dan mengecek kesesuaian jawaban dari siswa secara otomatis. Pada penelitian ini dibangun sistem VQA yang dapat menerima pertanyaan berbahasa Indonesia dan mengoreksi jawaban dalam bahasa Indonesia. Sistem dibangun dengan menggunakan model Bootstrapping Language-Image Pre-training (BLIP) untuk VQA dan model No Language Left Behind (NLLB) untuk penerjemahan. Uji coba dilakukan pada enam jenis jawaban yaitu ya/tidak, kata benda, kata kerja, kata sifat, kata keterangan, dan numeral. Hasil pengujian menunjukkan bahwa sistem dapat menjawab dengan nilai ketepatan 100 untuk jawaban ya/tidak, kata benda, kata kerja, dan numeral. Sementara untuk kata sifat dan kata keterangan masing-masing memiliki nilai ketepatan 62,5 dan 87,5.

show abstract

unclassified

“…Selanjutnya sistem VQA dikembangkan dengan arsitektur VGG-16 untuk pengolahan gambar dan LSTM untuk pengolahan teks. Hasil uji coba menunjukkan akurasi tertinggi dari VQA yang dibangun mencapai 84,9% [8].…”

unclassified