Η πρόσφατη μαζική ανάπτυξη των κινητών συσκευών μαζί με τις προόδους στον τομέα των κινητών δικτύων έχουν οδηγήσει στην ανάπτυξη των Συστημάτων Εξόρυξης Δεδομένων από Χρήστες Κινητών Συσκευών (Mobile Crowdsourcing Systems). Σε αυτά τα συστήματα οι πανταχού παρόντες ανθρώπινοι χρήστες συμμετέχουν ενεργά στη συλλογή και την ανταλλαγή δεδομένων, προκειμένου να προσδιοριστούν διάφορα γεγονότα σε πραγματικό χρόνο. Τα δεδομένα που συνεισφέρουν οι συμμετέχοντες σε αυτά τα συστήματα μπορεί είτε να προέρχονται από τους αισθητήρες που είναι ενσωματωμένοι στις κινητές συσκευές τους ή να λαμβάνονται μέσω ερωτήσεων προς τους πανταχού παρόντες ανθρώπινους χρήστες. Οι πληροφορίες αυτές στη συνέχεια μπορούν να χρησιμοποιηθούν για να προσδιοριστούν διάφορα γεγονότα σε πραγματικό χρόνο σε ένα αρκετά ευρύ φάσμα εφαρμογών όπως σε εφαρμογές ψυχαγωγίας, συγκοινωνιών και παρακολούθησης του περιβάλλοντος. Τα συστήματα εξόρυξης δεδομένων από χρήστες κινητών συσκευών αποτελούν ένα νέο πρότυπο εφαρμογών που προσφέρουν κάποια πολύ σημαντικά πλεονεκτήματα εξ' αιτίας: (i) της πανταχού παρουσίας των χρηστών, (ii) το χαμηλό κόστος και την εύκολη εγκατάσταση, (iii) τη δυναμική φύση των ερωτημάτων και (iv) τα διάφορα μέσα συνδεσιμότητας όπως τα 3G, 4G, και WiFi. Ωστόσο, υπάρχουν αρκετές σημαντικές προκλήσεις που πρέπει να αντιμετωπιστούν, προκειμένου να χρησιμοποιηθούν τα συστήματα αυτά στο μέγιστο των δυνατοτήτων τους. Οι προκλήσεις αυτές περιλαμβάνουν, χωρίς να περιορίζονται σε αυτές, την εξαγωγή δεδομένων από κατάλληλους χρήστες ώστε να μεγιστοποιηθεί το όφελος από τα δεδομένα που εξάγονται από τους χρήστες, την προστασία της ιδιωτικής ζωής των συμμετεχόντων, την αντιμετώπιση των προκλήσεων που σχετίζονται με ζητήματα εκτέλεσης σε πραγματικό χρόνο και τις καθυστερήσεις απόκρισης, την αξιολόγηση της ποιότητας των δεδομένων που συλλέγονται, την πιθανότητα μη διαθεσιμότητας των δεδομένων και την αποτελεσματική παροχή κινήτρων για τους χρήστες ώστε να συμμετέχουν. Ο σκοπός αυτής της διατριβής είναι να προτείνει πρακτικές μεθόδους για την αντιμετώπιση ορισμένων από αυτά τα ζητήματα έτσι ώστε να βελτιωθούν τα συστήματα εξόρυξης δεδομένων από χρήστες κινητών συσκευών. Το πρώτο μέρος της διατριβής βελτιώνει τα συστήματα εξόρυξης δεδομένων από χρήστες κινητών συσκευών με την αντιμετώπιση του προβλήματος της ανάθεσης εργασιών στους πιο κατάλληλους χρήστες ώστε να μεγιστοποιηθεί το όφελος του αιτούντα των δεδομένων. Το πρόβλημα είναι δύσκολο δεδομένου ότι οι χρήστες έχουν διαφορετικές ικανότητες και συμπεριφορές που εξαρτώνται από τον ανθρώπινο παράγοντα, τα οποία είναι δύσκολο να εκτιμηθούν εκ των προτέρων. Ως εκ τούτου, η επιλογή των καταλληλότερων χρηστών για κάθε εργασία σε πραγματικό χρόνο είναι ένα δύσκολο πρόβλημα. Αυτή η διατριβή συμβάλλει σε αυτό το πρόβλημα, παρέχοντας μια προσέγγιση η οποία αναθέτει κάθε εισερχόμενη εργασία στην πιο κατάλληλη ομάδα χρηστών, λαμβάνοντας υπόψη την αξιοπιστία τους και τον χρόνο απόκρισης. Το προτεινόμενο σύστημα ερευνά συστηματικά το χώρο των εφικτών λύσεων αναζητώντας τις βέλτιστες λύσεις (Pareto optimal) σε σχέση με τους καθορισμένους στόχους. Ο αλγόριθμος εκτελείται σε πολυωνυμικό χρόνο και βελτιώνει τον αριθμό των εργασιών που εκτελούνται στο πλαίσιο των καθορισμένων περιορισμών πάνω από 71% σε σύγκριση με τις υπάρχουσες προσεγγίσεις. Στη συνέχεια, έχουμε επικεντρωθεί στο πρόβλημα της εκμετάλλευσης των συστημάτων εξόρυξης δεδομένων από χρήστες κινητών συσκευών για τον εντοπισμό εν εξελίξει γεγονότων αποτελεσματικά και σε πραγματικό χρόνο. Το πρόβλημα είναι ότι το να ζητήσουμε πληροφορίες από κάθε διαθέσιμο χρήστη είναι ανέφικτο λόγω του όγκου των χρηστών και του χρηματικού κόστους για το σύστημα. Έτσι, θα πρέπει να είμαστε σε θέση να ζητήσουμε πληροφορίες από το βέλτιστο δείγμα διαθέσιμων χρηστών. Αυτή η διατριβή συμβάλλει στα συστήματα εξόρυξης δεδομένων από χρήστες κινητών συσκευών με ένα σύνολο τεχνικών για την ανίχνευση συμβάντων. Η πρώτη μας προσέγγιση χρησιμοποιεί ένα νέο αλγόριθμο δειγματοληψίας που επιλέγει ένα υποσύνολο των χρηστών για να συνεισφέρουν με πληροφορίες σε πραγματικό χρόνο, έτσι ώστε να προσδιορίσει η κατάσταση για ένα γεγονός έκτακτης ανάγκης. Η προτεινόμενη προσέγγιση αναγνωρίζει καταστάσεις έκτακτης ανάγκης σε μεγάλες γεωγραφικές περιοχές και λαμβάνει υπόψη τα ατομικά χαρακτηριστικά των ανθρώπινων χρηστών για να μεγιστοποιήσει την πιθανότητα να εξάγει ακριβείς απαντήσεις σε εύθετο χρόνο. Η δεύτερη προσέγγιση μας εκμεταλλεύεται τους αισθητήρες των κινητών συσκευών των χρηστών ώστε να εξάγει τα σημαντικά γεγονότα με ελάχιστο κόστος. Η προτεινόμενη προσέγγιση καθορίζει συστάδες χρηστών δυναμικά για να εντοπίσει τα σημεία όπου λαμβάνουν χώρα σημαντικά γεγονότα και στη συνέχεια εκτελεί δειγματοληψία για να ανακτήσει τα πιο αντιπροσωπευτικά ρεύματα δεδομένων σε κάθε συστάδα έτσι ώστε να εξάγει πρόσθετες πληροφορίες για κάθε γεγονός. Το δεύτερο μέρος της διατριβής συμβάλλει στο πρόβλημα της διατήρησης της ιδιωτικής ζωής των χρηστών. Το πρόβλημα έγκειται στο γεγονός ότι τα συστήματα εξόρυξης δεδομένων από χρήστες κινητών συσκευών συχνά απαιτούν από τους χρήστες να μοιράζονται με την κοινότητα πληροφορία που ενσωματώνει την γεωγραφική τοποθεσία τους, το οποίο μπορεί να οδηγήσει στην έκθεση της ιδιωτικής τους ζωής. Ως εκ τούτου, συγκεκριμένες επιθέσεις μπορεί να εκθέσουν ευαίσθητες πληροφορίες, όπως η ταυτότητα του χρήστη και οι γεωγραφικές τοποθεσίες που ο χρήστης επισκέπτεται συχνά. Η διατριβή αρχικά συμβάλει με μία κατανεμημένη προσέγγιση ανταλλαγής δεδομένων που έχει ως στόχο την προστασία των ευαίσθητων δεδομένων του χρήστη, κάνοντας τον εισβολέα να θεωρήσει όλες τις διαδρομές των χρηστών ως ισοπίθανες να περιέχουν ευαίσθητα δεδομένα, έτσι ώστε να εμποδιστεί η διαρροή ευαίσθητων δεδομένων. Δεύτερον, εξετάζουμε την πιθανότητα έκθεσης της ιδιωτικής ζωής των χρηστών που προκύπτει όταν οι ανώνυμες διαδρομές μπορούν να συσχετιστούν με δημόσια διαθέσιμα δεδομένα, αποκαλύπτοντας προσωπικές πληροφορίες των χρηστών που δεν ήταν διαθέσιμες εκ των προτέρων. Για το πρόβλημα αυτό παρουσιάζουμε μια προσέγγιση που βασίζεται στην τεχνική ανάλυση για τον προσδιορισμό δεδομένων με κοινή ταυτότητα και αντιδρά ώστε να διατηρήσει της ιδιωτικότητα των χρηστών. Τέλος, ένα άλλο πρόβλημα της ιδιωτικής ζωής προκύπτει όταν οι χρήστες μοιράζονται δημοσίως πληροφορίες συσχετισμένες με τη γεωγραφική τους θέση μέσω διάφορων εφαρμογών. Το θέμα είναι ότι η πλειοψηφία των πληροφοριών βρίσκονται στις διαδρομές που οι χρήστες επισκέπτονται συχνά. Ως εκ τούτου, καθώς η ποσότητα των δεδομένων για κάθε χρήστη αυξάνεται, σταδιακά αρχίζει να εκθέτει την κινητικότητα του χρήστη. Σε αυτή τη διατριβή έχουμε αντιμετωπίσει αυτό το πρόβλημα με μια ιδιαίτερα αποδοτική προσέγγιση που τρέχει τοπικά σε κινητές συσκευές. Η προσέγγιση στηρίζεται στη γεωμετρική λύση των coresets για να διατηρήσει την ιδιωτική ζωή των χρηστών, αξιολογώντας την έκθεση των προσωπικών δεδομένων τους πριν από την δημοσίευση των πληροφοριών. Καθ' όλη την διατριβή, οι μεθοδολογίες που αναπτύχθηκαν έχουν αξιολογηθεί σε πραγματικά δεδομένα και σενάρια. Τα πειραματικά αποτελέσματα έδειξαν ότι οι προτεινόμενοι αλγόριθμοι ξεπερνούν συστηματικά τις υπάρχουσες προσεγγίσεις και αποτελούν πρακτικές τεχνικές που μπορούν να χρησιμοποιηθούν σε πραγματικά συστήματα.