Thesis

Θέματα πτυχιακών εργασιών 2012-2013

Θέμα 1: Συλλογή και κατηγοριοποίηση δεδομένων κίνησης, μέσω κινητών τηλεφώνων, με στόχο την ανίχνευση δραστηριότητας

Επιβλέποντες: Ηρακλής Βαρλάμης, Κων/νος Τσερπές, Γεώργιος Δημητρακόπουλος

Θεωρητικό υπόβαθρο: Στις μέρες μας οι χρήστες έξυπνων κινητών τηλεφώνων χρησιμοποιούν εφαρμογές οι οποίες καταγράφουν διαρκώς δεδομένα (κίνησης, θέσης, χρήσης, προτιμήσεων κλπ.) τα οποία μπορούν να αξιοποιηθούν με πολλούς τρόπους εφόσον αναλυθούν. Ένα από τα πολλά παραδείγματα είναι η εφαρμογή My Tracks για Android η οποία καταγράφει τα δεδομένα θέσης με χρήση του GPS και εμφανίζει γραφήματα για τη μεταβολή της ταχύτητας και της αλλαγής υψομέτρου σε προκαθορισμένες διαδρομές.

Στόχος της εργασίας είναι να αναπτύξει μια εφαρμογή για κινητά τηλέφωνα η οποία θα είναι διαρκώς ανοικτή, θα καταγράφει μέσω GPS τα δεδομένα θέσης του χρήση, θα τα αναλύει και θα τα συνδυάζει με δεδομένα συγκοινωνιακού δικτύου. Ο στόχος της εφαρμογής είναι ο εξής: κάνοντας χρήση τεχνικών κατηγοριοποίησης να προσδιορίζει τον τύπο κίνησης του χρήστη μέσα στην ημέρα (π.χ. 00:00-8:00 ακίνητος, 8:00-8:05 περπάτημα, 8:05-10:10 αυτοκίνητο, 10:10-10:30 μετρό κλπ)

Τεχνικές λεπτομέρειες: Η εφαρμογή που θα πρέπει να λειτορυγεί σε κινητά με android, να συλλέγει τα δεδομένα και να τα επεξεργάζεται τοπικά. Επιπλέον να προβλέπει για την προώθηση των δεδομένων σε κεντρικό server όπου θα συλλέγονται και θα αναλύονται τα δεδομένα πολλών χρηστών.

Βιβλιογραφία:

Θέμα 2: Βελτίωση της απόδοσης ταξινομητών με χρήση δευτερογενών τεχνικών

Επιβλέπων: Ηρακλής Βαρλάμης

Τα δεδομένα που συγκεντρώνονται σε ιατρικές βάσεις δεδομένων και περιλαμβάνουν δημογραφικά στοιχεία, συνήθειες, ιατρικό ιστορικό κλπ των ασθενών, μπορούν να αποτελέσουν μια σημαντική πηγή γνώσης αν αξιοποιηθούν αποτελεσματικά. Μια από τις βασικές τεχνικές εξόρυξης γνώσης που χρησιμοποιείται στο χώρο αυτό είναι η ταξινόμηση των δειγμάτων σε δύο ή περισσότερες κατηγορίες (classification).

Στόχος της εργασίας είναι να συνδυάσει υπάρχοντες αλγορίθμους ταξινόμησης σε ταξινομητές δεύτερης γενιάς (π.χ. μεθόδους ομάδας/ensemble methods ή μεθόδους συσσώρευσης/bagging and boosting) και να αξιολογήσει τις επιδόσεις τους. Για το σκοπό αυτό, αρχικά θα μελετηθούν και θα παρουσιαστούν αρχικά οι υπάρχουσες δευτερογενείς τεχνικές και στη συνέχεια θα χρησιμοποιηθούν οι πιο σημαντικές από αυτές, θα προσαρμοστούν στις ανάγκες των δεδομένων και θα αξιολογηθούν.

Τεχνικές λεπτομέρειες: Η εργασία βασίζεται σε προηγούμενη πτυχιακή εργασία και αξιοποιεί δεδομένα από τη βάση δεδομένων ασθενών καρκίνου SEER dataset.

Θέμα 3: Εξαγωγή γνώσης από χρονικά μεταβαλλόμενους κοινωνικούς γράφους

Επιβλέπων: Ηρακλής Βαρλάμης

Στις εφαρμογές κοινωνικής δικτύωσης, αλλά και γενικότερα στα social media, οι χρήστες συνάπτουν σχέσεις έμμεσα ή άμεσα οι οποίες μεταφέρουν πέρα από τον τύπο τους (π.χ. σχέσεις φιλίας, σχέσης παρακολούθησης κλπ), θετική ή αρνητική στάση, μια χρονική πληροφορία που υποδηλώνει πόσο πρόσφατες είναι ή πόσο πρόσφατα ανανεώθηκαν κλπ. Αυτή η πληροφορία μπορεί να αξιοποιηθεί με πολλούς τρόπους, όπως για παράδειγμα για να εντοπίσει σημαντικούς κόμβους μέσα στο κοινωνικό δίκτυο, να προτείνει τη δημιουργία νέων ακμών κλπ.

Στόχος της εργασίας είναι να υλοποιήσει αλγορίθμους που προτείνουν τη δημιουργία ακμών σε κοινωνικούς γράφους και να τους συγκρίνει σε όσο το δυνατόν περισσότερους κοινωνικούς γράφους, με διαφορετικά χαρακτηριστικά (κατευθυνόμενοι ή μη, διπλής ή μονής κατεύθυνσης, με ή χωρίς χρονική πληροφορία, με ή χωρίς πόλωση ακμών).

Θέμα 4: Δημιουργία εφαρμογής για τη διαχείριση και αυτόματη κατηγοριοποίηση επιστημονικών δημοσιεύσεων

Επιβλέπων: Ηρακλής Βαρλάμης

Μια από τις δυσκολίες που αντιμετωπίζουν συχνά οι βάσεις δεδομένων επιστημονικών δημοσιεύσεων είναι τα ελλιπή στοιχεία που καταχωρούνται από τους ίδιους τους συγγραφείς και αφορούν το όνομα του περιοδικού ή συνεδρίου, το έτος δημοσίευσης, τον εκδότη κλπ. αλλά και τη σειρά με την οποιά αυτά δηλώνονται στην περιγραφή της δημοσίευσης. Για το σκοπό αυτό έχουν υιοθετηθεί διεθνώς πολλά πρότυπα για την περιγραφή των επιστημονικών δημοσιεύσεων (π.χ. bibtex) που απαιτούν από τους συγγραφείς τη συμπλήρωση συγκεκριμένων πεδίων. Ακόμη και σε αυτή την περίπτωση τα προβλήματα που αφορούν τα ονόματα των περιοδικών και συνεδρίων παραμένουν. Άλλοι συγγραφείς χρησιμοποιούν συντομεύσεις, άλλοι περικόπτουν ή προσθέτουν το φορέα που τα εποπτεύει κλπ.

Στόχος της εργασίας είναι να αναπτύξει μια εφαρμογή που θα λαμβάνει ως είσοδο μια λίστα δημοσιεύσεων (π.χ. σε bibtex μορφή) και θα προσπαθεί να προσδιορίσει με ακρίβεια το όνομα του περιοδικού ή συνεδρίου στο οποίο δημοσιεύτηκε. Για το σκοπό αυτό θα χρησιμοποιήσει μια ΒΔ συνεδρίων και περιοδικών για τα οποια θα γνωρίζει τον περιγραφικό τίτλο και τη συντόμευση, καθώς επίσης και το γνωστικό αντικείμενο στο οποίο εντάσσεται το καθένα και μια διάκριση σε κατηγορίες με βάση τον βαθμό προβολής και σημαντικότητας. Στη συνέχεια, χρησιμοποιώντας τεχνικές λεκτικού ταιριάσματος (string matching) θα προτείνει για κάθε δημοσίευση τον επικρατέστερο τίτλο συνεδρίου ή περιοδικού και αν υπάρχει ασάφεια θα ζητά από το χρήστη επίλυσή της. Μετά την επίλυση της ασάφειας θα προσθέτει στις πληροφορίες της λίστας την επιπλέον πληροφορία που αφορά τη δημοσίευση.

Προτείνεται η εφαρμογή να έχει web interface ώστε να προσφερθεί στο ευρύ κοινό. Επίσης, θα πρέπει η εφαρμογή να παράγει και μια συγκεντρωτική αναφορά που να παρουσιάζει αθροιστικά τον αριθμό των δημοσιεύσεων ανά κατηγορία και ανά γνωστικό πεδίο.

Θέμα 5: Βελτίωση συστημάτων συστάσεων (recommender systems) με ανακάλυψη κοινοτήτων έμπιστων χρηστών

Επιβλέπων: Ηρακλής Βαρλάμης

Τα συστήματα συστάσεων (ΣΣ) χρησιμοποιούνται ευρέως προκειμένου να βοηθήσουν τους χρήστες να βρουν χρήσιμες πληροφορίες μέσα από ένα κυκεώνα δεδομένων. Ένα τέτοιο σύστημα συνήθως προτείνει στο χρήστη κάποιες πληροφορίες που πιθανότατα τον ενδιαφέρουν. Η λειτουργία τους βασίζεται στην ιστορία αλληλεπίδρασης του χρήστη αλλά και στην ομοιότητα του χρήστη με άλλους χρήστες. Ανακύπτει όμως ένα προβλήματα που αφορά σε καινούργιους χρήστες, για τους οποίους δεν υπάρχουν επαρκείς πληροφορίες προκειμένου να γίνουν συστάσεις (cold start problem). Εν μέρει αυτό το θέμα μπορεί να αντιμετωπιστεί μέσω της δημιουργίας κοινότητας εμπίστων χρηστών.

Στόχος της εργασίας είναι να επεκτείνει ένα υπάρχον σύστημα που παρέχει συστάσεις ώστε να προσφέρει στον χρήστη επεξήγηση του τρόπου δημιουργίας μιας σύστασης. Αυτό βοηθά σημαντικά στην οικοδόμηση εμπιστοσύνης από το χρήστη στο σύστημα. H πειραματική ανάπτυξη του συστήματος θα γίνει σε συνεργασία με το Software and Knowledge Engineering Laboratory (SKEL) του ΕΚΕΦΕ Δημόκριτος.

Design downloaded from free website templates.