2018
DOI: 10.3390/jimaging4020043
|View full text |Cite
|
Sign up to set email alerts
|

Benchmarking of Document Image Analysis Tasks for Palm Leaf Manuscripts from Southeast Asia

Abstract: This paper presents a comprehensive test of the principal tasks in document image analysis (DIA), starting with binarization, text line segmentation, and isolated character/glyph recognition, and continuing on to word recognition and transliteration for a new and challenging collection of palm leaf manuscripts from Southeast Asia. This research presents and is performed on a complete dataset collection of Southeast Asian palm leaf manuscripts. It contains three different scripts: Khmer script from Cambodia, an… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1

Citation Types

0
8
0
2

Year Published

2018
2018
2022
2022

Publication Types

Select...
5
3
1

Relationship

2
7

Authors

Journals

citations
Cited by 35 publications
(10 citation statements)
references
References 43 publications
0
8
0
2
Order By: Relevance
“…Sistem tidak akan mampu melakukan rekognisi teks pada teks kata baru yang sebelumnya tidak ada pada dataset klasifikasi. Upaya pembangunan mesin transliterasi teks Lontar Bali juga telah dilakukan dalam [10] yang menggunakan framework pengenal teks OCRopy [11]. Pada penelitian tesebut, uji performansi transliterasi tidak hanya dilakukan dengan dataset Lontar Bali, tetapi juga dengan dataset Lontar Sunda [12] dan Kamboja [3].…”
Section: Pendahuluanunclassified
See 1 more Smart Citation
“…Sistem tidak akan mampu melakukan rekognisi teks pada teks kata baru yang sebelumnya tidak ada pada dataset klasifikasi. Upaya pembangunan mesin transliterasi teks Lontar Bali juga telah dilakukan dalam [10] yang menggunakan framework pengenal teks OCRopy [11]. Pada penelitian tesebut, uji performansi transliterasi tidak hanya dilakukan dengan dataset Lontar Bali, tetapi juga dengan dataset Lontar Sunda [12] dan Kamboja [3].…”
Section: Pendahuluanunclassified
“…Tantangan kompleksitas aksara dan keragaman kondisi kerusakan citra Lontar Bali sebagai bagian dari tantangan teknis di penelitian ini memang cukup tinggi Error: Reference source not found. Di samping itu, kuantitas data latih dan proporsi jumlah masing-masing sampel bentuk aksara Bali beserta kombinasi bentuk aksara dalam penulisannya yang terdapat dalam data latih juga turut mempengaruhi performansi hasil pembelajaran model LSTM [9], [10]. Hasil yang dicapai sampai saat ini merupakan hasil tahap uji yang sudah cukup baik, dan sudah mampu menunjukkan bahwa sistem bisa mentransliterasi citra digital aksara Bali.…”
Section: A Hasil Evaluasi Performansi Transliterasiunclassified
“…The main contribution of this work lies in the fact that this system is supported through our in-depth study results on various components of the document image analysis (DIA) system for lontar collections [1][2][3][4][5][6][7].…”
Section: Introductionmentioning
confidence: 99%
“…To deal with those problems, a preliminary project to digitize the collections of Lontar and to build an automatic transliteration machine to convert the Balinese script of Lontar into Roman script has been done [1], [2]. These previous works were proposed to support and to complete the final goal of building an automatic indexing system for Lontar collections.…”
Section: Introductionmentioning
confidence: 99%