2023
DOI: 10.1007/s13369-023-07687-y
|View full text |Cite
|
Sign up to set email alerts
|

VAQA: Visual Arabic Question Answering

Abstract: Visual Question Answering (VQA) is the problem of automatically answering a natural language question about a given image or video. Standard Arabic is the sixth most spoken language around the world. However, to the best of our knowledge, there are neither research attempts nor datasets for VQA in Arabic. In this paper, we generate the first Visual Arabic Question Answering (VAQA) dataset, which is fully automatically generated. The dataset consists of almost 138k Image-Question-Answer (IQA) triplets and is sp… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...

Citation Types

0
0
0

Year Published

2023
2023
2024
2024

Publication Types

Select...
3
1

Relationship

0
4

Authors

Journals

citations
Cited by 4 publications
(2 citation statements)
references
References 43 publications
0
0
0
Order By: Relevance
“…Dataset ini merupakan kumpulan data keluaran microsoft yang berisi foto dari 91 jenis objek yang mudah dikenali oleh anak berusia 4 tahun dalam bahasa inggris [7]. Pengembangan VQA dalam domain umum dilakukan pada bahasa Arab oleh Kamel et al [8]. Dataset yang dibangun berjumlah 138.000 yang berisi gambar sehari-hari.…”
unclassified
See 1 more Smart Citation
“…Dataset ini merupakan kumpulan data keluaran microsoft yang berisi foto dari 91 jenis objek yang mudah dikenali oleh anak berusia 4 tahun dalam bahasa inggris [7]. Pengembangan VQA dalam domain umum dilakukan pada bahasa Arab oleh Kamel et al [8]. Dataset yang dibangun berjumlah 138.000 yang berisi gambar sehari-hari.…”
unclassified
“…Selanjutnya sistem VQA dikembangkan dengan arsitektur VGG-16 untuk pengolahan gambar dan LSTM untuk pengolahan teks. Hasil uji coba menunjukkan akurasi tertinggi dari VQA yang dibangun mencapai 84,9% [8].…”
unclassified