Η παρούσα διδακτορική διατριβή αφορά τη μελέτη, ανάπτυξη και εφαρμογή, μεθόδων Μηχανικής Μάθησης μέσω Παρατήρησης (Learning from Demonstration) με στόχο την ρομποτική αναπαραγωγή δράσεων χειρισμού. Η μεθοδολογία αυτή στηρίζεται στην δημιουργία μιας αντιστοίχισης (mapping) μεταξύ της κινηματικής του ανθρώπινου χεριού και ενός ρομποτικού βραχίονα, ή πιο συγκεκριμένα μεταξύ του πολυδιάστατου χώρου των κινήσεων του ανθρώπου (human actor) με τον επίσης πολυδιάστατο χώρο δράσης του ρομπότ. Η συσχέτιση των ανθρώπινων ενεργειών με αντίστοιχες ρομποτικές, επιτυγχάνεται μέσω μιας άδηλης αναπαράστασης, που ονομάζεται λανθάνουσα απεικόνιση χώρου (latent space). Πιο συγκεκριμένα, μελετάμε την αμοιβαία αλληλεπίδραση της αντίληψης και της δράσης, προκειμένου να διδάξουμε τα ρομπότ μια ποικιλία από νέες κινήσεις χειρός. Ως εκ τούτου, υλοποιήθηκε ένα μεθοδολογικό πλαίσιο μάθησης μέσω παρατήρησης, το οποίο ονομάζεται IMFO (Imitation Framework by Observation), που διευκολύνει την αναπαραγωγή μαθημένων και νέων κινήσεων χειρισμού από ένα ρομπότ (manipulation tasks) και, παράλληλα, έχει ευρεία εφαρμογή σε σενάρια αλληλεπίδρασης ανθρώπου-ρομπότ (HRI) σε καθημερινά περιβάλλοντα.Επιπλέον, σε αυτή τη διατριβή, εξετάζουμε το ρόλο της χρονικής διάρκειας εκτέλεσης μιας κίνησης μέσα από τη διαδικασία μάθησης από παρατήρηση, ενισχύοντας το διαμορφωμένο πλαίσιο IMFO με την δυνατότητα αναπαράστασης και αναπαραγωγής τόσο των χωρικών όσο και των χρονικών χαρακτηριστικών των ανθρώπινων κινήσεων. Σε αντίθεση με άλλες μεθόδους μάθησης μέσω παρατήρησης (LfD) που περιγράφουν την εκτελούμενη δράση μόνο με βάση τα χωρικά χαρακτηριστικά της, η προτεινόμενη μεθοδολογία ενισχύει την αναπαραγωγή των χωροχρονικών πτυχών μιας κίνησης επιτρέποντας την αποτελεσματική εφαρμογή της σε πιο σύνθετα σενάρια HRI, όπου η χρονική αλληλουχία των δράσεων είναι σημαντική. Επιπρόσθετα, εισάγεται ένα σύνολο καλά καθορισμένων μετρικών αξιολόγησης (evaluation metrics) για να αποτιμηθεί η εγκυρότητα της προτεινόμενης προσέγγισης λαμβάνοντας υπόψη τη χρονική και χωρική συνέπεια των αναπαραγόμενων συμπεριφορών. Μια αξιοσημείωτη επέκταση του προαναφερθέντος πλαισίου αναφέρεται στην εκμάθηση της δύναμης που επιβάλλεται από τον χρήστη για την επιτυχημένη εκτέλεση λεπτών χειρισμών. Αυτή η διαδικασία παρουσιάζεται επίσης στην παρούσα διατριβή μέσω ενός νέου πλαισίου εποπτευόμενης μάθησης, το οποίο ονομάζεται SLF (Supervised Learning scheme for Force-based manipulation). Το SLF διατυπώνεται ως μία διαδικασία τριών σταδίων: (α) επιβλεπόμενη διαδικασία εκτέλεσης κινήσεων χειρισμού σε προσομοίωση για την απόκτηση επαρκών δεδομένων, (β) διαδικασία εκπαίδευσης (training) για τη διευκόλυνση της μάθησης κινήσεων χειρισμού με την κατάλληλη προσαρμογή του καρπού και της δύναμη πιασίματος και μεταφοράς και (γ) εκτέλεση της κίνησης από ρομποτικό βραχίονα σε προσομοίωση. Στη συνέχεια, με τη χρήση της μεθόδου sim-to-real transfer, επιτυγχάνεται αναπαραγωγή των μαθημένων δράσεων σε πραγματικά περιβάλλοντα γενικεύοντας την εφαρμογή του πλαισίου μάθησης σε επιπλέον συνθήκες χειρισμού εύθραυστων αντικειμένων. Τα αποτελέσματα με τη χρήση του ρομποτικού βραχίονα YuMi, σε πειράματα με διαφορετικά αντικείμενα με παρόμοιους συντελεστές τριβής, και εναλλακτικές πόζες πιασίματος, αποδεικνύουν ότι το ρομπότ είναι σε θέση να αναπαράγει αποτελεσματικά απαιτητικές κινήσεις μεταφοράς και χειρισμού μετά την ολοκλήρωση της διαδικασίας μάθησης. Συνοπτικά, η παρούσα διατριβή μελετά την διαδικασία μάθησης μέσω παρατήρησης συνεισφέροντας με μια νέα προσέγγιση που εισάγει την μελέτη δράσεων χειρισμού αντικειμένων μέσα από έναν χώρο μειωμένων διαστάσεων, για την εύκολη και συμπαγή κωδικοποίηση των επιμέρους χαρακτηριστικών των δράσεων. Ταυτόχρονα μελετώνται τα χρονικά χαρακτηριστικά των κινήσεων ώστε να ενισχυθεί η εφαρμογή της μεθόδου σε σύνθετες, πραγματικές συνθήκες που απαιτούν χρονική ακρίβεια αναπαραγωγής. Τέλος, η διαμόρφωση μιας γενικευμένης διαδικασίας εποπτευόμενης μάθησης για τον χειρισμό εύθραυστων αντικείμενων αναβαθμίζει περαιτέρω το αρχικό πλαίσιο μάθησης.