Στόχος της παρούσας διατριβής αποτελεί η μελέτη τεχνικών μεθόδων που αφορούν την επεξεργασία πληροφορίας που σχετίζεται με την δια του προσώπου οπτικοακουστική επικοινωνία.Κατόπιν μελέτης των διαφορετικών προσεγγίσεων, οι οποίες αναφέρονται σε ανατομικούς, νευρολογικούς, σημειολογικούς, συναισθηματικούς και συστημικούς παράγοντες επιρροής, το ακριβές αντικείμενο προσδιορίστηκε στο επίπεδο του αμιγώς γλωσσικού περιεχομένου. Σε σχέση με το τελευταίο, προδιαγράφηκαν λεπτομερώς τα χαρακτηριστικά ενός δείγματος ελέγχου φυσικών ομιλητών κατάλληλου για ανάλυση της γραπτής απεικόνισης καθώς και των ακουστικού και οπτικού ερεθίσματος. Αρχικά, για τη γραπτή απεικόνιση προτείνεται μια καινοτομική αναπαράσταση φωνητικής μεταγραφής από έναν ακρυλικό κατευθυντικό γράφο αντί της κλασσικής σειριακής ακολουθίας φωνητικών συμβολών. Η προτεινόμενη μεθοδολογία εφαρμόστηκε για την περίπτωση της νέας ελληνικής γλώσσας για την οποία δημιουργήθηκε ένα σύστημα βασισμένο σε κανόνες μεταγραφής.Στη συνέχεια, για το ακουστικό ερέθισμα προτείνονται δύο μέθοδοι ασαφούς κατάτμησης του αντίστοιχου ηχητικού σήματος. Η σχεδίαση αυτών βασίζεται αφενός στην αποτύπωση των μηχανικών χαρακτηριστικών του φωνητικού σωλήνα στο πεδίο των ηχητικών χαρακτηριστικών και αφετέρου στο γεγονός της επανάληψης ομοίων ακουστικών προτύπων κατά μήκος της εκφώνησης ενός αυτοτελούς γλωσσικού μηνύματος. Ιδιαίτερο χαρακτηριστικό των μεθόδων αυτών αποτελεί η απουσία φάσης εκπαίδευσης καθώς και η δυνατότητα αξιοποίησης της πιθανώς υπάρχουσας πληροφορίας φωνητικής μεταγραφής με τη χρήση φωνολογικών διακριτικών χαρακτηριστικών.Επιπλέον, για το οπτικό ερέθισμα προτείνεται μια μεθοδολογία για την εξαγωγή κανονικοποιημένων απεικονίσεων της περιοχής των ορατών αρθρωτών κατά την ομιλία μέσω τεχνικών επεξεργασίας εικόνας. Η πρόταση περιλαμβάνει την παραγοντοποίηση του αφινικού μετασχηματισμού με τη χρήση τετραδονίων σε συνδυασμό με την τεχνική ενός βασικού πλαισίου. Στην υποδομή αυτή προτείνεται μια σειρά μεθόδων που στοχεύουν στην ανάσχεση του προσθετικού σφάλματος εντοπισμού και την εκτίμηση τρισδιάστατου βάθους ενός πλήθους χαρακτηριστικών σημείων, αποσκοπώντας στην εκτίμηση των παραμέτρων θέσης κεφαλιού για σε κάθε καρέ. Το σύνολο της μεθοδολογίας ολοκληρώνεται με την αξιοποίηση των τελευταίων από έναν αλγόριθμο απομόνωσης της απεικόνισης των ορατών αρθρωτών.Ακολούθως, παρουσιάζονται αποτελέσματα αξιολόγησης των προτάσεων με τη χρήση δείγματος οπτικοακουστικών καταγραφών φυσικών ομιλητών από DVB-T μεταδόσεις εκφωνήσεων νυχτερινών δελτίων ειδήσεων. Παρουσιάζεται επίσης μια πρωτότυπη διεπαφή υλοποίησης, η οποία αναπτύχθηκε με στόχο την ικανοποίηση των τρεχόντων αλλά και μελλοντικών αναγκών φιλοξενίας δείγματος, χαρακτηρισμού των αποσπασμάτων καθώς και της απαιτούμενης διαλειτουργικότητας των μεθόδων. Τέλος, γίνεται μνεία στη δυνατότητα σύνθεσης του συνόλου των προτάσεων ενώ περιγράφεται η πορεία προς τη δημιουργία ενός μοντέλου εκτίμησης κίνησης ορατών αρθρωτών κατά την εκφορά γλωσσικών μηνυμάτων.