Effect of pre-processing on binarization

Smith, Elisa H. Barney; Likforman-Sulem, Laurence; Darbon, Jérôme

doi:10.1117/12.840606

Cited by 18 publications

(9 citation statements)

References 11 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…The binarization algorithms are (1) Otsu -a global thresholding algorithm [6], (2) Niblack -a common adaptive thresholding algorithm [4], (3) Sauvola -another adaptive binarization algorithm [8], (4) Gatos -An algorithm that is particularly suited to documents with uneven background from bleed through and stains [3] and (5) Background Estimation and Subtraction (BES) -an algorithm developed by the author that uses the Total Variation framework for image regularization [1].…”

Section: Experiments and Resultsmentioning

confidence: 99%

An analysis of binarization ground truthing

Smith

2010

Proceedings of the 9th IAPR International Workshop on Document Analysis Systems

View full text Add to dashboard Cite

The accuracy of a binarization algorithm is often calculated relative to a ground truth image. Except for synthetically generated images, no ground truth image exists. Evaluating binarization on real images is preferred. The ground truthing between and among different operators is compared. Four direct metrics were used. The variability of the results of five different automatic binarization algorithms were compared to that of manual ground truth results. Significant variability in the ground truth results was found.

show abstract

Section: Experiments and Resultsmentioning

confidence: 99%

An analysis of binarization ground truthing

Smith

2010

Proceedings of the 9th IAPR International Workshop on Document Analysis Systems

View full text Add to dashboard Cite

show abstract

“…Finally, one may compare the binarized image with ground truth data at the pixel-level [12,13]. The main advantage of this approach is that one may add or 2.2.…”

Section: Discussionmentioning

confidence: 99%

Cluster-Based Sample Selection for Document Image Binarization

Krantz

Westphal

2019

2019 International Conference on Document Analysis and Recognition Workshops (ICDARW)

View full text Add to dashboard Cite

The current state-of-the-art, in terms of performance, for solving document image binarization is training artificial neural networks on pre-labelled ground truth data. As such, it faces the same issues as other, more conventional, classification problems; requiring a large amount of training data. However, unlike those conventional classification problems, document image binarization involves having to either manually craft or estimate the binarized ground truth data, which can be error-prone and time-consuming. This is where sample selection, the act of selecting training samples based on some method or metric, might help. By reducing the size of the training dataset in such a way that the binarization performance is not impacted, the required time spent creating the ground truth is also reduced. This thesis proposes a clusterbased sample selection method, based on previous work, that uses image similarity metrics and the relative neighbourhood graph to reduce the underlying redundancy of the dataset. The method is implemented with different clustering methods and similarity metrics for comparison, with the best implementation being based on affinity propagation and the structural similarity index. This implementation manages to reduce the training dataset by 46% while maintaining a performance that is equal to that of the complete dataset. The performance of this method is shown to not be significantly different from randomly selecting the same number of samples. However, due to limitations in the random method, such as unpredictable performance and uncertainty in how many samples to select, the use of sample selection in document image binarization still shows great promise.

show abstract

“…Οι διαγωνισμοί, διαμέσου των εικόνων ground-truth και των μετρικών που χρησιμοποιήθηκαν, αποτέλεσαν αντικείμενο μελέτης τόσο από εμάς όσο και από άλλες ερευνητικές ομάδες [109]- [110], [157]. Τα δυαδικά αποτελέσματα των συμμετεχόντων αξιοποιήθηκαν μέσω της σχολαστικής οπτικής εξέτασης αυτών και της προσπάθειας συσχέτισή τους με τις μετρικές αξιολόγησης.…”

Section: εξελικτική πορείαunclassified

“…έγγραφα δεν αποφέρει ικανοποιητικά αποτελέσματα[39],[56],[107]-[108]. Παρόλο που η χρήση του OCR στη διαδικασία αξιολόγησης κρίνεται σημαντική, η απόδοση του OCR δεν εξαρτάται μόνο από την αποτελεσματικότητα της δυαδικής μετατροπής αλλά και από την αποτελεσματικότητα αρκετών επόμενων σταδίων[109]-[111].…”

unclassified

“…Αξίζει να αναφερθεί ότι στην επεξεργασία εικόνων κειμένου, οι συνθετικές εικόνες έχουν στενά συνδεθεί με την μοντελοποίηση του θορύβου ποιοτικής υποβάθμισης (degradation models) που συναντάται κατά την ψηφιοποίηση των εγγράφων διαμέσου της σάρωσης/εκτύπωσης[119]-[121] και έχουν χρησιμοποιηθεί για την ανάπτυξη και βελτίωση των συστημάτων οπτικής αναγνώρισης χαρακτήρων OCR[122]-[123]. Ωστόσο, όπως έχει δειχτεί στην εργασία[116], τα προαναφερθέντα μοντέλα δεν είναι επαρκή για τη μοντελοποίηση πραγματικών ιστορικών τυπωμένων εγγράφων και γενικά έχει αναφερθεί[109]-[110] ότι οι συνθετικές εικόνες δεν αντιπροσωπεύουν σε επαρκή βαθμό τις δυσκολίες των πραγματικών εικόνων, τις οποίες οι αλγόριθμοι δυαδικής μετατροπής καλούνται στην πράξη να αντιμετωπίσουν.…”

unclassified

See 1 more Smart Citation

Δυαδική Μετατροπή Εικόνων Κειμένου

Ntirogiannis¹,

Ντιρογιάννης²

View full text Add to dashboard Cite

Η ανάλυση και οπτική αναγνώριση του κειμένου των ψηφιακών εγγράφων αποτελείται από μια πληθώρα σταδίων. Πρωταρχικό στάδιο της συνολικής αυτής διαδικασίας είναι η δυαδική μετατροπή ή κατωφλίωση, σύμφωνα με την οποία τα εικονοστοιχεία της εικόνας διαχωρίζονται σε κείμενο και υπόβαθρο. Αποτελεί σημαντικό στάδιο που δύναται να επηρεάσει τόσο τα μετέπειτα στάδια επεξεργασίας όσο και το τελικό στάδιο της αναγνώρισης των χαρακτήρων. Η παρούσα διδακτορική διατριβή πραγματεύεται τόσο τεχνικές δυαδικής μετατροπής όσο και μεθοδολογίες αξιολόγησης των τεχνικών αυτών. Κύρια βαρύτητα δόθηκε σε εικόνες που προέρχονται από ιστορικά κείμενα λόγω της αυξημένης ποσότητας θορύβου που περιέχουν. Συγκεκριμένα, αναπτύχθηκε μια μέθοδος αξιολόγησης των τεχνικών δυαδικής μετατροπής που βασίζεται στη χρήση του σκελετού των χαρακτήρων. Ο σκελετός χρησιμοποιείται για την ημιαυτόματη δημιουργία των πρότυπων εικόνων σύγκρισης και συμμετέχει στην τελική αξιολόγηση του δυαδικού αποτελέσματος. Στη συνέχεια, βελτιώθηκε η προαναφερθείσα μέθοδος επιτρέποντας τη δημιουργία πιο αξιόπιστων πρότυπων εικόνων σύγκρισης χάρη στο μειωμένο βαθμό υποκειμενικότητάς τους και στο πλαίσιο ανάπτυξης νέων μετρικών μελετήθηκαν διάφορες μετρικές αξιολόγησης. Οι νέες προτεινόμενες μετρικές χρησιμοποιούν (α) βάρη που ξεκινούν από το περίγραμμα των χαρακτήρων και (β) το τοπικό πλάτος των χαρακτήρων για την κανονικοποίηση και τον περιορισμό των βαρών γύρω από τους χαρακτήρες. Τα αποτελέσματα αναδεικνύουν τις νέες μετρικές ως πλέον κατάλληλες για την αποτίμηση της δυαδικής μετατροπής εικόνων κειμένου, σε σύγκριση με άλλες μετρικές που αφορούν την επεξεργασία εικόνας και σήματος γενικότερα. Όσον αφορά στις τεχνικές δυαδικής μετατροπής, αρχικά έγιναν βελτιώσεις σε μια υπάρχουσα τεχνική, ώστε να έχει καλύτερα αποτελέσματα σε εικόνες με αχνούς χαρακτήρες και χαρακτήρες ποικίλου μεγέθους. Κατόπιν, αναπτύχθηκε μια νέα τεχνική δυαδικοποίησης με σκοπό την αντιμετώπιση μεγαλύτερης ποικιλίας θορύβου. Τα κυριότερα στάδια αυτής της τεχνικής είναι η εκτίμηση του υποβάθρου και ο συνδυασμός επιλεγμένων τεχνικών καθολικής και τοπικής κατωφλίωσης. Η εν λόγω τεχνική αναπτύχθηκε για χειρόγραφα κείμενα και ανταπεξέρχεται με μεγάλη επιτυχία σε διάφορα είδη θορύβου, όπως είναι οι χαρακτήρες της πίσω σελίδας, το ανομοιόμορφο υπόβαθρο και οι αχνοί χαρακτήρες· μάλιστα, έπειτα από κατάλληλη τροποποίηση αποδίδει εξίσου καλά και σε εικόνες τυπωμένου κειμένου. Τέλος, αναπτύχθηκε μια τεχνική δυαδικής μετατροπής για περιοχές κειμένου όπως αυτές εντοπίζονται έπειτα από κατάλληλη επεξεργασία εικόνων από βίντεο. Η τεχνική αυτή βασίζεται στη βαθμιαία οριοθέτηση της περιοχής του κειμένου. Στο αρχικό στάδιο η οριοθέτηση βασίζεται στις γραμμές αναφοράς που αντιστοιχούν στις γραμμές του κειμένου ενώ στο τελικό στάδιο βασίζεται στα κυρτά κελύφη γειτονικών χαρακτήρων. Σε κάθε στάδιο χρησιμοποιείται η ίδια τεχνική δυαδικοποίησης με διαφορετική παραμετροποίηση για τις εντός και εκτός περιοχές κειμένου. Επίσης, μέσω της εκ μέρους μας διοργάνωσης διεθνών διαγωνισμών δυαδικοποίησης, δημιουργήσαμε μια βάση αναφοράς όπου ερευνητικές ομάδες μπορούν ελεύθερα να χρησιμοποιούν και να εξελίσσουν τις μεθόδους τους

show abstract

Effect of pre-processing on binarization

Cited by 18 publications

References 11 publications

An analysis of binarization ground truthing

An analysis of binarization ground truthing

Cluster-Based Sample Selection for Document Image Binarization

Δυαδική Μετατροπή Εικόνων Κειμένου

Contact Info

Product

Resources

About