Search citation statements
Paper Sections
Citation Types
Year Published
Publication Types
Relationship
Authors
Journals
Thresholding algorithms segment an image into two parts (foreground and background) by producing a binary version of our initial input. It is a complex procedure (due to the distinctive characteristics of each image) which often constitutes the initial step of other image processing or computer vision applications. Global techniques calculate a single threshold for the whole image while local techniques calculate a different threshold for each pixel based on specific attributes of its local area. In some of our previous work, we introduced some specific fuzzy inclusion and entropy measures which we efficiently managed to use on both global and local thresholding. The general method which we presented was an open and adaptable procedure, it was free of sensitivity or bias parameters and it involved image classification, mathematical functions, a fuzzy symmetrical triangular number and some criteria of choosing between two possible thresholds. Here, we continue this research and try to avoid all these by automatically connecting our measures with the wanted threshold using some Artificial Neural Network (ANN). Using an ANN in image segmentation is not uncommon especially in the domain of medical images. However, our proposition involves the use of an Adaptive Neuro-Fuzzy Inference System (ANFIS) which means that all we need is a proper database. It is a simple and immediate method which could provide researchers with an alternative approach to the thresholding problem considering that they probably have at their disposal some appropriate and specialized data.
Thresholding algorithms segment an image into two parts (foreground and background) by producing a binary version of our initial input. It is a complex procedure (due to the distinctive characteristics of each image) which often constitutes the initial step of other image processing or computer vision applications. Global techniques calculate a single threshold for the whole image while local techniques calculate a different threshold for each pixel based on specific attributes of its local area. In some of our previous work, we introduced some specific fuzzy inclusion and entropy measures which we efficiently managed to use on both global and local thresholding. The general method which we presented was an open and adaptable procedure, it was free of sensitivity or bias parameters and it involved image classification, mathematical functions, a fuzzy symmetrical triangular number and some criteria of choosing between two possible thresholds. Here, we continue this research and try to avoid all these by automatically connecting our measures with the wanted threshold using some Artificial Neural Network (ANN). Using an ANN in image segmentation is not uncommon especially in the domain of medical images. However, our proposition involves the use of an Adaptive Neuro-Fuzzy Inference System (ANFIS) which means that all we need is a proper database. It is a simple and immediate method which could provide researchers with an alternative approach to the thresholding problem considering that they probably have at their disposal some appropriate and specialized data.
Η παρούσα έρευνα σχετίζεται με τις συναρτήσεις μέτρησης της ασαφούς υποσυνολότητας και εντροπίας και την χρήση τους σε προβλήματα κατωφλίωσης εικόνας (image thresholding). Αποτελείται από δύο κυρίως μέρη τα οποία περιλαμβάνουν την θεωρητική μας έρευνα πάνω στα μέτρα υποσυνολότητας και εντροπίας (πρώτο μέρος) και τους πειραματισμούς μας σχετικά με την χρήση τους σε προβλήματα δυαδικοποίησης εικόνων (δεύτερο μέρος). Οι μετρήσεις υποσυνολότητας και εντροπίας των ασαφών συνόλων είναι σημαντικές για το πεδίο της ασαφούς λογικής και χρησιμοποιούνται σε ένα ευρύ φάσμα εφαρμογών που μπορεί να περιλαμβάνουν ασάφεια (π.χ. ασαφείς ελεγκτές – fuzzy controllers, επιλογή χαρακτηριστικών – feature selection, ασαφής ομαδοποίηση – fuzzy clustering, επεξεργασία εικόνας – image processing). Διάφοροι συγγραφείς και ερευνητές έχουν ασχοληθεί με τα μέτρα αυτά. Κάποιοι από αυτούς επιχειρήσαν να εντάξουν τα μέτρα αυτά σε ένα πιθανό αξιωματικό πλαίσιο ενώ άλλοι εισήγαγαν ανάλογα μέτρα βασιζόμενοι σε συγκεκριμένες επιθυμητές ιδιότητες. Όλη αυτή η έρευνα απέφερε σημαντικά αποτελέσματα τα οποία οδήγησαν σε αρκετές εναλλακτικές προσεγγίσεις και λύσεις μιας ποικιλίας προβλημάτων. Πέρα όμως από αυτές τις ενδιαφέρουσες και καινοτόμες ιδέες, σε αυτές τις εργασίες προέκυψαν και πολλά ζητήματα ανοιχτά για περαιτέρω συζήτηση και έρευνα. Σε ότι αφορά το θεωρητικό κομμάτι της έρευνας μας, προσπαθήσαμε να κατασκευάσουμε νέους πιθανούς δείκτες της ασαφούς υποσυνολότητας με βάση έναν συγκεκριμένο τύπο – φόρμουλα. Ο δείκτες αυτοί σχηματίζονται χρησιμοποιώντας στον τύπο αυτό δυαδικές πράξεις του διαστήματος [0,1] και περιλαμβάνουν ακόμα και κάποια ήδη γνωστά και χρησιμοποιούμενα μέτρα. Ταυτόχρονα όμως προσπαθήσαμε να εντάξουμε τις συναρτήσεις αυτές και σε ένα ευρύτερο θεωρητικό πλαίσιο ορίζοντας συγκεκριμένες συνθήκες προκειμένου να ικανοποιούν μια βάση αξιωμάτων. Η αξιωματική λογική που ακολουθήσαμε, σε ότι αφορά την ασαφή υποσυνολότητα, είναι αυτή της Young (1996) η οποία αντιμετώπισε με σκεπτικισμό τα αξιώματα των Sihna and Dougherty (1993) και προσπάθησε να εντάξει τους δείκτες αυτούς στα πλαίσια της γενικότερης έρευνας του Kosko (1986, 1990, 1992, 1993). Οι ιδιότητες – αξιώματα που έθεσε επελέγησαν προκειμένου να ικανοποιείται ένα συγκεκριμένο θεώρημα σύνδεσης των μέτρων ασαφούς υποσυνολότητας με τα μέτρα ασαφούς εντοπίας. Με βάση το θεώρημα αυτό, τα δεύτερα παράγονται απ’ ευθείας από τα πρώτα με χρήση μιας συγκεκριμένης μαθηματικής φόρμουλας. Οι δυαδικές πράξεις που χρησιμοποιήσαμε στον γενικό μας τύπο είναι οι βασικές ασαφείς τομές (fuzzy intersections ή t – norms) και οι συνήθεις ασαφείς συνεπαγωγές (fuzzy implications). Αυτό έγινε, σε πρώτη φάση, επιχειρώντας μια σύνδεση και μια «συνέπεια» με την κλασσική λογική. Δεν σημαίνει όμως ότι κάτι τέτοιο είναι και δεσμευτικό αφού όπως είδαμε ο τύπος μας «λειτουργεί» και με άλλες δυαδικές πράξεις του [0,1] γενικότερα. Επιστρέφοντας στις ασαφείς τομές και συνεπαγωγές, η δυσκολία που αντιμετωπίσαμε αρχικά βρισκόταν στην εύρεση κατάλληλων τέτοιων ζευγών (τομή – συνεπαγωγή) που θα μας επέστρεφαν καινούργια μέτρα υποσυνολότητας που ικανοποιούν τα αξιώματα Young. Ουσιαστικά μπορέσαμε να πάρουμε ως αποτέλεσμα μόνο τον δείκτη Kosko. Παρατηρώντας όμως ότι αυτό συμβαίνει λόγω ενός μέρους του τρίτου αξιώματος Young το οποίο ήταν περισσότερο δεσμευτικό από ότι χρειάζεται ώστε να ισχύει η λογική με την οποία αυτό συντάχθηκε, καταφέραμε μετά την χαλάρωση του (σε δύο φάσεις) και την επαναδιατύπωση των προτάσεων μας να παραγάγουμε αρκετούς νέους πιθανούς δείκτες ασαφούς υποσυνολότητας. Η παρέμβαση αυτή δεν ακύρωσε το θεώρημα Young και αυτό σημαίνει ότι αυτοί επιστρέψαν και τα αντίστοιχα μέτρα εντροπίας. Μελετώντας τα μέτρα αυτά και την συμπεριφορά τους στις ασαφείς μετρήσεις, παρατηρήσαμε ότι παρουσιάζουν – έστω κάποια από αυτά – μερικές ενδιαφέρουσες (ή και μοναδικές) ιδιότητες. Το επόμενο μας βήμα αφορούσε τον έλεγχο της αξιοπιστίας των μέτρων αυτών καθώς και την καταλληλότητα τους για χρήση σε συγκεκριμένες εφαρμογές. Πιστεύουμε ότι οι δείκτες αυτοί μπορούν να χρησιμοποιηθούν στην επίλυση προβλημάτων που απαιτούν ή εκμεταλλεύονται κατάλληλα μετρήσεις ασαφούς υποσυνολότητας και εντροπίας. Πεποίθηση μας είναι ακόμα ότι θα μπορούσαν να προσφέρουν περισσότερη και κατάλληλη «πληροφορία» και να οδηγήσουν σε εναλλακτικές μεθόδους αντιμετώπισης προβλημάτων αυτού του ερευνητικού πεδίου. Προκειμένου να στηρίξουμε την πίστη μας και αυτά μας τα επιχειρήματα, στο δεύτερο κομμάτι της παρούσας έρευνας (το «πρακτικό») εισάγουμε μια γενική, ανοιχτή και προσαρμοστική μέθοδο κατωφλίωσης εικόνων τόσο σε καθολικό όσο και σε τοπικό επίπεδο, η οποία χρησιμοποιεί αποτελεσματικά κάποια από τα μέτρα μας. Η κατωφλίωση ή δυαδικοποίηση εικόνας αφορά τον διαχωρισμό προσκηνίου – παρασκηνίου μιας εικόνας με την μετατροπή της σε δυαδική και αποτελεί το εισαγωγικό βήμα πολλών άλλων πιο εξειδικευμένων τεχνικών στον χώρο της επεξεργασίας εικόνας ή της μηχανικής οπτικής (computer vision). Παρότι φαντάζει ως μια απλή διαδικασία, στην πραγματικότητα είναι ένα δύσκολο πρόβλημα – αν αναλογιστούμε την τεράστια ποικιλία εικόνων διαφορετικών χαρακτηριστικών που υπάρχει – το οποίο είναι ακόμα ανοιχτό στην έρευνα παρά το πλήθος των τεχνικών που έχουν κατά καιρούς προταθεί. Η πρόταση μας διαφέρει σημαντικά από τις γνωστές μεθόδους κατωφλίωσης και στηρίζεται ουσιαστικά και πάντα (ανεξαρτήτως της εικόνας που «δουλεύουμε») σε συγκεκριμένες μετρήσεις των μέτρων μας ασαφούς υποσυνολότητας και εντροπίας. Σχετικά με την καθολική κατωφλίωση (κατά την οποία όλη η εικόνα δυαδικοποιείται με βάση ένα συγκεκριμένο κατώφλι), η μέθοδος μας δεν χρησιμοποιεί την μορφή του ιστογράμματος της εικόνας ούτε στηρίζεται στην βελτιστοποίηση στατιστικών μέτρων (π.χ. ελαχιστοποίηση της διακύμανσης) της ασπρόμαυρης (gray – level) πληροφορίας. Απαιτεί μόνο την γνώση συγκεκριμένων ιδιοτήτων της εικόνας μετρημένων από κάποια από τα μέτρα μας, οι οποίες μπορούν να συνδεθούν με το κατάλληλο σημείο κατωφλίωσης είτε μαθηματικά (π.χ. με κάποια συνάρτηση) είτε αυτοματοποιημένα (π.χ. με κάποιο νεύρο – ασαφές δίκτυο). Πρόκειται περισσότερο για μια ανοιχτή και προσαρμόσιμη διαδικασία παρά για μια αυστηρή μαθηματική μέθοδο, η οποία μπορεί εύκολα να τροποποιηθεί ή να παραλλαχθεί ώστε να ικανοποιήσει τις ανάγκες και απαιτήσεις διαφορετικών πεδίων ή ερευνητικών κλάδων. Μετά από αυτό, η μετάβαση μας στο πεδίο της τοπικής κατωφλίωσης είναι «φυσική» και άμεση. Η τοπική κατωφλίωση υπολογίζει ένα διαφορετικό κατώφλι για κάθε εικονοστοιχείο (pixel) της εικόνας ξεχωριστά με βάση την πληροφορία από τα γειτονικά του εικονοστοιχεία και χρησιμοποιείται σε περιπτώσεις «δύσκολων» εικόνων όπου η καθολική κατωφλίωση δεν επαρκεί. Είναι σίγουρα πιο περίπλοκη και απαιτεί πολύ περισσότερη προσοχή κατά την ανάπτυξη αλλά και τον έλεγχο των ανάλογων τεχνικών της. Το κύριο πεδίο της έρευνας μας στην τοπική κατωφλίωση ήταν «υποβαθμισμένες» ή ανομοιογενώς φωτισμένες εικόνες εγγράφων. Η αναγνώριση του περιεχομένου τέτοιων εικόνων επιτυγχάνεται σε μεγάλο βαθμό μέσω της δυαδικοποίησης τους και είναι σημαντική για τα συστήματα ανάλυσης εγγράφων ή για τις διαδικασίες οπτικής αναγνώρισης χαρακτήρων. Αυτό δεν σημαίνει ότι δεν πειραματιστήκαμε και σε άλλου είδους εικόνες αφού μας το επιτρέπει εύκολα η ευελιξία της μεθόδου μας. Καθ’ όλη την διάρκεια των πειραματισμών μας προσπαθήσαμε η τεχνική μας να παραμείνει αυτοματοποιημένη και απαλλαγμένη από την χρήση μεταβλητών ευαισθησίας ή μεροληψίας. Τα αποτελέσματα των αλγορίθμων μας τόσο στην καθολική όσο και στην τοπική κατωφλίωση ήταν πολύ ενθαρρυντικά και μας οδήγησαν στο συμπέρασμα ότι πράγματι υφίσταται η σύνδεση μεταξύ μετρήσεων υποσυνολότητας – εντροπίας και κατωφλίου. Αυτό μας οδήγησε στο τελευταίο και πιο πρόσφατο κομμάτι της έρευνας μας το οποίο περιλαμβάνει την αυτοματικοποιημένη δυαδικοποίηση εικόνας με χρήση ενός αντίστοιχου ANFIS (Adaptive Neuro – Fuzzy Inference System). Η εκπαίδευση των σχετικών ANFIS γίνεται με την βοήθεια των μετρήσεων από τους δείκτες μας και κατά την αξιολόγηση τους στην καθολική και τοπική κατωφλίωση πήραμε πολλά καλά και ενθαρρυντικά αποτελέσματα. Έτσι, η όλη μας δουλειά οδηγείται σε ένα νέο επίπεδο και πιστεύουμε ότι σε βάθος χρόνου και μετά από επιπλέον έρευνα και πειραματισμό, θα έχουμε κάποιες πολύ ασφαλείς και αδιαμφισβήτητες προτάσεις οι οποίες θα γίνουν βασικό και χρήσιμο κομμάτι της όλης σχετικής έρευνας. Όλα αυτά θα ήταν πολύ πιο εύκολα αν υπήρχαν σχετικές, εξειδικευμένες βάσεις δεδομένων του τύπου εικόνα – κατάλληλο σημείο κατωφλίωσης, παρόλα αυτά στη φάση αυτή είμαστε αναγκασμένοι να συγκεντρώνουμε μόνοι μας τα απαραίτητα στοιχεία προκειμένου να προβούμε στους ανάλογους πειραματισμούς. Όλο αυτό απαιτεί πολύ χρόνο και αναζήτηση. Η διατριβή αυτή λοιπόν αποτελείται από εννέα κεφάλαια και η έρευνα μας χωρίζεται σε δύο βασικά μέρη. Τα πρώτα τέσσερα κεφάλαια είναι εισαγωγικά και περιλαμβάνουν πληροφορίες και προαπαιτούμενα από τον χώρο της ασαφούς λογικής και των ασαφών συστημάτων καθώς και από τον χώρο της δυαδικοποίησης εικόνας. Το κεφάλαιο 5 σχετίζεται με την προαναφερθείσα θεωρητική μας έρευνα ενώ τα κεφάλαια 6, 7, 8 περιλαμβάνουν τους αλγορίθμους και τα αποτελέσματα μας από τους πειραματισμούς μας πάνω στην κατωφλίωση. Τα κεφάλαια 6 και 7 αφορούν την έρευνα μέσω αναζήτησης κατάλληλων μαθηματικών συναρτήσεων σύνδεσης των μέτρων μας με το κατάλληλο κατώφλι ενώ το κεφάλαιο 8 περιλαμβάνει τα συμπεράσματα μας από την αυτοματοποιημένη σύνδεση μέσω ANFIS. Στο κεφάλαιο 9, το οποίο αποτελεί τον επίλογο μας, πέρα από την ανακεφαλαίωση της διατριβής αυτής περιλαμβάνονται και οι κυριότεροι άξονες της μελλοντικής μας αναζήτησης και έρευνας τόσο στην κατωφλίωση εικόνας όσο και στα μέτρα ασαφούς υποσυνολότητας και εντροπίας. Τέλος, εκεί αναφέρουμε και άλλες εφαρμογές στις οποίες θα μπορούσαν να χρησιμοποιηθούν αλλά και διάφορες έρευνες οι οποίες θα μπορούσαν να συνδεθούν ή ακόμα και να ενσωματωθούν με τη δική μας.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.