Η στατιστική είναι άρρηκτα συνδεδεμένη με τις βιολογικές επιστήμες, όπου χρησιμοποιείται σαν εργαλείο για να βοηθήσει στην εξαγωγή συμπερασμάτων αλλά και στην κατανόηση ασθενειών και γενικά βιολογικών λειτουργιών. Ως μέθοδοι βιοστατιστικής χαρακτηρίζονται συνήθως οι κλινικές δοκιμές και τα μοντέλα επιβίωσης. Εδώ και πολλά χρόνια όμως, μια πληθώρα στατιστικών μεθόδων εφαρμόζεται σε ιατρικά και βιολογικά δεδομένα.Το γενικό πεδίο έρευνας της παρούσας διατριβής είναι η εφαρμογή στατιστικών μεθόδων σε βιολογικά δεδομένα. Πιο συγκεκριμένα, προσπαθήσαμε να αξιοποιήσουμε μεθόδους που δεν είχαν χρησιμοποιηθεί ευρέως σε παρόμοια δεδομένα με σκοπό την ανακάλυψη ομοιογενών ομάδων δεδομένων, την μελέτη δομών συσχέτισης διαφορετικών ομάδων αλλά και την πρόβλεψη. Τα δεδομένα που χρησιμοποιήθηκαν μπορούν να ομαδοποιηθούν σε τρεις κατηγορίες: α) εκφράσεις γονιδίων που αφορούν γονίδια που εμπλέκονται σε κάποια ασθένεια, β) ηλεκτροεγκεφαλικά σήματα που αφορούν την απόκριση του ανθρώπινου εγκεφάλου σε ερέθισμα και γ) μετρήσεις αισθητήρων, οι οποίοι καταγράφουν τις κινήσεις ανθρώπων με σκοπό την αναγνώριση δραστηριότητας. Οι στατιστικές μέθοδοι που αποτέλεσαν το βασικό αντικείμενο μελέτης αυτής της διατριβής είναι η Αρχετυπική Ανάλυση, τα Μοντέλα Δομικών Εξισώσεων και οι συγκρίσεις συσχετίσεων. Η Αρχετυπική Ανάλυση είναι μια μέθοδος που δεν έχει λάβει την πρέπουσα προσοχή και ομαδοποιεί παρατηρήσεις με βάση τη σχέση τους με τα αρχέτυπα. Τα αρχέτυπα είναι κάποιες ακραίες περιπτώσεις που μπορεί να είναι και πραγματικές παρατηρήσεις. Τα Μοντέλα Δομικών Εξισώσεων και η σύγκριση συντελεστών συσχέτισης μελετούν δομές συσχέτισης ή συνδιακύμανσης. Τα Μοντέλα Δομικών Εξισώσεων ανήκουν στον κλάδο της πολυμεταβλητής ανάλυσης και έχουν τη δυνατότητα να επεξεργάζονται ταυτόχρονα πολλές εξισώσεις. Με αυτό τον τρόπο μπορούν να αντιμετωπίζουν μια μεταβλητή σαν ανεξάρτητη σε μια εξίσωση και σαν εξαρτημένη σε άλλη εξίσωση. Η σύγκριση συσχετίσεων αφορά κάποιους ελέγχους που εξετάζουν τη στατιστικά σημαντική διαφορά ανάμεσα σε δύο συντελεστές συσχέτισης. Είναι μια μέθοδος που δεν χρησιμοποιείται συχνά, χρησιμεύει όμως πολύ στη μελέτη ετερογενών δομών συσχέτισης.Η Αρχετυπική Ανάλυση εφαρμόστηκε σε νευρολογικές αποκρίσεις που περιγράφουν την εγκεφαλική διέγερση ατόμων που εκτίθενται σε κάποιο ερέθισμα, με σκοπό την ομαδοποίηση τους σε ομογενείς ομάδες και σε κλινικά και βιολογικά δεδομένα ασθενών που υποβλήθηκαν σε υποβοηθούμενη αναπαραγωγή, για να εντοπίσει ποιες ορμόνες συνέβαλλαν στην επιτυχία της θεραπείας. Τα Μοντέλα Δομικών Εξισώσεων χρησιμοποιήθηκαν για να ανακαλυφθούν μονοπάτια γονιδιακής σηματοδότησης ασθενών με Χρόνια Λεμφοκυτταρική Λευχαιμία. Το συγκεκριμένο σύνολο ασθενών αποτελούνταν από δύο ομάδες ασθενών με διαφορετική κλινική εικόνα. Με τη χρήση των Μοντέλων Δομικών Εξισώσεων μοντελοποιήθηκαν οι περισσότερες σχέσεις ανάμεσα στα γονίδια και εντοπίστηκαν διαφορές στα μοντέλα σηματοδότησης των δύο ομάδων ασθενών. Η μελέτη των δομών συσχετίσεων χρησιμοποιήθηκε και σε εκφράσεις γονιδίων αλλά και σε μετρήσεις φορετών αισθητήρων με σκοπό την αναγνώριση δραστηριότητας. Με βάση τη σύγκριση συσχετίσεων προτείναμε μια καινούργια μέθοδο επιλογής μεταβλητών για αλγορίθμους ταξινόμησης.Η διατριβή χωρίζεται νοητά σε δύο μέρη. Το πρώτο μέρος αφορά την ομαδοποίηση δεδομένων και περιλαμβάνει τα Κεφάλαια 1 ως 3. Σε αυτά αναπτύσσεται η μέθοδος της Αρχετυπικής Ανάλυσης και περιγράφονται οι δύο εφαρμογές της. Το δεύτερο μέρος αφορά τη μελέτη δομών συσχέτισης και συνδιακύμανσης, που αποτέλεσε και το κύριο μέρος της έρευνας και αποτελείται από τα Κεφάλαια 4 ως 9. Δύο κεφάλαια περιγράφουν τη θεωρία για τα Μοντέλα Δομικών Εξισώσεων και τις μεθόδους σύγκρισης συντελεστών συσχέτισης και τα υπόλοιπα αφορούν εφαρμογές αυτών των μεθόδων.Θα μπορούσαμε να συνοψίσουμε τα κύρια σημεία της συνεισφοράς της διατριβής στα παρακάτω: α) την ανακάλυψη σχέσεων ανάμεσα σε γονίδια ετερογενών ομάδων ασθενών με Χρόνια Λεμφοκυτταρική Λευχαιμία, με τη χρήση των Μοντέλων Δομικών Εξισώσεων β) προτάθηκε ένας εναλλακτικός τρόπος ομαδοποίησης εγκεφαλικών αποκρίσεων με χρήση της Αρχετυπικής Ανάλυσης, γ) προτάθηκε μια καινούργια μέθοδος επιλογής μεταβλητών που βασίζεται στη σύγκριση συσχετίσεων διαφορετικών ομάδων παρατηρήσεων.