Thesis
Θέματα διπλωματικών εργασιών (ΠΜΣ)
Τίτλος: Ανίχνευση συνηθειών χρήστη με χρήση κινητών τηλεφώνων
Επιβλέποντες: Βαρλάμης Ηρακλής, Τσερπές Κωνσταντίνος, Δημητρακόπουλος Γεώργιος
Σύντομη περιγραφή: Η παρούσα εργασία θα επεκτείνει την εφαρμογή GPSTracker που αναπτύχθηκε στα πλαίσια πτυχιακής εργασίας και η οποία καταγράφει μέσω GPS τα δεδομένα θέσης του χρήση, και κατηγοριοποιεί σε πραγματικό χρόνο την κίνησή του. Στόχος της εργασίας είναι να επεξεργάζεται σε δεύτερο επίπεδο τα κατηγοριοποιημένα δεδομένα κίνησης και να τα συνδυάζει με γεωχωρικά δεδομένα, έτσι ώστε: α) να εντοπίζει μεγαλύτερα τμήματα κίνησης (trajectories) στα οποία ο χρήστης έχει τον ίδιο τύπο κίνησης, β) να εντοπίζει σημεία ενδιαφέροντος στα οποία ο χρήστης περνά αρκετό χρόνο, γ) να εξάγει από τα παραπάνω γνώση για τα γενικότερα ενδιαφέροντα και τις καθημερινές συνήθειες του χρήστη.
Η εφαρμογή θα λειτουργεί σε android smartphones, θα διαθέτει κατηγοριοποιημένα σημεία ενδιαφέροντος σε τοπική βάση δεδομένων (SQLite) και θα επεξεργάζεται τα δεδομένα κίνησης στη συσκευή (χρήση Weka). Θα επεκτείνει επίσης την υπάρχουσα λειτουργικότητα μεταφόρτωσης δεδομένων σε προσωπικό δικτυακό φάκελο (dropbox) με τη δυνατότητα μεταφόρτωσης σε κεντρικό server όπου θα συλλέγονται και θα αναλύονται τα δεδομένα πολλών χρηστών.
Βιβλιογραφία:
- Dhaval Patel, Chang Sheng, Wynne Hsu, Mong-Li Lee: Incorporating Duration Information for Trajectory Classification. ICDE 2012: 1132-1143
- Guesgen, H., Marsland, S.: Spatio-temporal reasoning and context awareness. Handbook of Ambient Intelligence and Smart Environments (2010) 609-634
- Gerasimos Marketos, Elias Frentzos, Irene Ntoutsi, Nikos Pelekis, Alessandra Raffaeta, and Yannis Theodoridis. 2008. Building real-world trajectory warehouses. In Proceedings of the Seventh ACM International Workshop on Data Engineering for Wireless and Mobile Access (MobiDE '08). ACM, New York, NY, USA, 8-15.
- Department of Computer Science, Univ of Illinois, Lecture on "Trajectory Data Mining".
- Christine Parent, Stefano Spaccapietra, Chiara Renso, Gennady L. Andrienko, Natalia V. Andrienko, Vania Bogorny, Maria Luisa Damiani, Aris Gkoulalas-Divanis, José Antônio Fernandes de Macêdo, Nikos Pelekis, Yannis Theodoridis, Zhixian Yan: Semantic trajectories modeling and analysis. ACM Comput. Surv. 45(4): 42 (2013)
Τίτλος: Εξόρυξη γνώσης από οικονομικά δεδομένα και δεδομένα οίκων αξιολόγησης
Επιβλέποντες: Βαρλάμης Ηρακλής, Δημητρακόπουλος Γεώργιος, Μιχαλακέλης Χρήστος
Σύντομη περιγραφή: Στόχος της εργασίας είναι η δημιουργία μοντέλων πρόβλεψης της συμπεριφοράς διεθνών οίκων αξιολόγησης σε σχέση με τα οικονομικά δεδομένα που ανακοινώνονται για τις εθνικές οικονομίες. Στόχος της εργασίας είναι να αναλύσει τη σχετική βιβλιογραφία, και να αναπτύξει ένα πρότυπο μοντέλο που αξιοποιεί οικονομικά μεγέθη σαν κι αυτά που δημοσιεύει η Παγκόσμια Τράπεζα (http://data.worldbank.org/) και ιστορικά δεδομένα αξιολογήσεων.
Βιβλιογραφία:
- Moody’s, “Sovereign Default and Recovery Rates, 1983-2007”. March 2008.
- Gaillard, N. (2012). Fitch, Moody’s, and S&P Sovereign Ratings and EMBI Global Spreads: Lessons from 1993–2007. In A Century of Sovereign Ratings (pp. 149-170). Springer New York.
- Daly, K., & Cavanaugh, M. (2006). Sovereign Ratings History Since 1975. Website: http://www2.standardandpoors.com/servlet/ContentServer.
Τίτλος: Δημιουργία συστάσεων σε σύνθετους κοινωνικούς γράφους
Επιβλέποντες: Βαρλάμης Ηρακλής, Μιχαήλ Δημήτριος, Τσερπές Κωνσταντίνος
Σύντομη περιγραφή: Στόχος της εργασίας είναι να σχεδιάσει και να υλοποιήσει αλγορίθμους που θα αναλύουν σύνθετους κοινωνικούς γράφους οι οποίοι συνδέουν χρήστες με χρήστες, χρήστες με προϊόντα, χρήστες με κατηγορίες κλπ και θα παράγουν συστάσεις για δημιουργία επιπλέον ακμών, κάθε μορφής.
Βιβλιογραφία:
- Κonstas, I., Stathopoulos, V., & Jose, J. M. (2009, July). On social networks and collaborative recommendation. In Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval(pp. 195-202). ACM.
- Wang, Z., Zhang, M., Tan, Y., Wang, W., Zhang, Y., & Chen, L. (2011, January). Recommendation algorithm based on graph-model considering user background information. In Creating, Connecting and Collaborating through Computing (C5), 2011 Ninth International Conference on (pp. 32-39). IEEE.
- Ma, H., King, I., & Lyu, M. R. (2009, July). Learning to recommend with social trust ensemble. In Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval (pp. 203-210). ACM.
Τίτλος: Ανάλυση συναισθήματος από κείμενα, για οντότητες και χαρακτηριστικά αυτών
Επιβλέποντες: Βαρλάμης Ηρακλής, Τσερπές Κωνσταντίνος, Δημητρακόπουλος Γιώργος
Σύντομη περιγραφή: Στόχος της εργασίας είναι να σχεδιάσει και να υλοποιήσει τεχνικές εξαγωγής συναισθήματος από κείμενα και συσχέτισής του με τις οντότητες που εμφανίζονται στα κείμενα και τα χαρακτηριστικά των οντοτήτων αυτών. Χαρακτηριστικό παράδειγμα αποτελούν οι διαγωνισμοί Semeval (2015, task 12) http://alt.qcri.org/semeval2015/task12/.
Βιβλιογραφία:
- B. Liu, Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies. Morgan & Claypool, 2012.
- X. Glorot, A. Bordes, and Y. Bengio. Domain Adaptation for LargeScale Sentiment Classification: A Deep Learning Approach. ICML, 2011.
- S. Moghaddam and M. Ester, “Opinion digger: an unsupervised opinion miner from unstructured product reviews”. Proceedings of the 19th CIKM, pp. 1825–1828, Toronto, ON, 2010.
Τίτλος: Δημιουργία συστάσεων σε ετερογενή δίκτυα πληροφορίας
Επιβλέποντες: Βαρλάμης Ηρακλής, Τσερπές Κωνσταντίνος, Δημητρακόπουλος Γιώργος
Σύντομη περιγραφή: Στόχος της εργασίας είναι να σχεδιάσει και να υλοποιήσει τεχνικές εξαγωγής συναισθήματος από κείμενα και συσχέτισής του με τις οντότητες που εμφανίζονται στα κείμενα και τα χαρακτηριστικά των οντοτήτων αυτών.
Βιβλιογραφία:
- V. Suresh, S. Roohi, M. Eirinaki, I. Varlamis, "Using Social Data for Personalizing Review Rankings", In 6th ACM RecSys Workshop on Recommender Systems & The Social Web (RSWeb@RecSys), Foster City, Silicon Valley, USA, 6 October 2014.
- Yelp dataset challenge, http://www.yelp.com/dataset_challenge
- Xiao Yu, Xiang Ren, Yizhou Sun, Bradley Sturt, Urvashi Khandelwal, Quanquan Gu, Brandon Norick, and Jiawei Han. 2013. Recommendation in heterogeneous information networks with implicit user feedback. In Proceedings of the 7th ACM conference on Recommender systems (RecSys '13). ACM, New York, NY, USA, 347-350.
- M. Eirinaki, S. Pisal, J. Singh, Feature-based Opinion Mining and Ranking, J. of Computer and System Sciences (JCSS), 78(4), pp.1175-1184, July 2012
- A. Ghose, P. Ipeirotis, Designing Novel Review Ranking Systems:Predicting the Usefulness and Impact of Reviews, in Proc. of ICEC ‘07
Θέματα πτυχιακών εργασιών
Τίτλος: Τεχνικές αναγνώρισης κοινοτήτων χρηστών σε κοινωνικά δίκτυα
Επιβλέποντες: Βαρλάμης Ηρακλής, Μιχαήλ Δημήτρης, Τσερπές Κωνσταντίνος
Σύντομη περιγραφή: Οι γράφοι που διαμορφώνονται πίσω από εφαρμογές κοινωνικής δικτύωσης τροποποιούνται διαρκώς ανάλογα με τη συμπεριφορά των χρηστών. Εφαρμογές που παρέχουν εξατομικευμένες
προτάσεις στους χρήστες βασίζονται στον εντοπισμό επιμέρους κοινοτήτων χρηστών με κοινά ενδιαφέροντα και συμπεριφορές για να βελτιώσουν τις προτάσεις τους. Σε αυτό το περιβάλλον των διαρκώς μεταβαλλόμενων γράφων είναι απαραίτητος ο σχεδιασμός τεχνικών που θα αναγνωρίζουν κοινότητες χρηστών αλλά και ο ανασχεδιασμός των αλγορίθμων που θα τις αξιοποιούν για την παραγωγή προτάσεων.
Βιβλιογραφία:
- Xie, J., Kelley, S., & Szymanski, B. K. (2013). Overlapping community detection in networks: The state-of-the-art and comparative study. ACM Computing Surveys (CSUR), 45(4), 43.
- Papadopoulos, S., Kompatsiaris, Y., Vakali, A., & Spyridonos, P. (2012). Community detection in social media. Data Mining and Knowledge Discovery, 24(3), 515-554.
- Tang, L., Wang, X., & Liu, H. (2012). Community detection via heterogeneous interaction analysis. Data Mining and Knowledge Discovery, 25(1), 1-33.
- P-Server project: http://www.pserver-project.org/
Τίτλος: Υλοποίηση αλγορίθμων συστάσεων σε κατανεμημένες αρχιτεκτονικές
Επιβλέποντες: Βαρλάμης Ηρακλής, Μιχαήλ Δημήτρης, Νικολαϊδη Μάρα
Σύντομη περιγραφή: Αντικείμενο ης εργασίας είναι να υλοποιήσει αλγορίθμους που βελτιώνουν την εξαγωγή συστάσεων με χρήση γειτόνων (neighborhood-based collabortive filtering) στην πλατφόρμα Spark [8] που έχει σχεδιαστεί για την εκτέλεση υπολογισμών στο cloud και η οποία ενδείκνυται για την εκτέλεση επαναλαμβανόμενων διεργασιών με πολλαπλά βήματα.
Στόχος είναι να υλοποιήσει τον αλγόριθμο SVD++ (singular value decomposition) που επιλύει το πρόβλημα του collaborative filtering με χρήση πινάκων.
Βιβλιογραφία:
Τίτλος: Μοντέλα αναπαράστασης κειμένων με χρήση γράφων και εφαρμογές
Επιβλέποντες: Βαρλάμης Ηρακλής, Μιχαήλ Δημήτρης, Χατζή Ουρανία
Σύντομη περιγραφή: Στόχος της εργασίας είναι να μελετήσει υπάρχοντα γραφο-θεωρητικά μοντέλα αναπαράστασης κειμένων και να τα εφαρμόσει κυρίως σε δυναμικές συλλογές κειμένων. Ενδεικτικές εφαρμογές εκτός άλλων μπορεί να ειναί: εξαγωγή βασικών οντοτήτων, συσταδοποίηση κειμένων, δημιουργία περιλήψεων κ.ά
Βιβλιογραφία:
- Rousseau, F., & Vazirgiannis, M. (2013, October). Graph-of-word and TW-IDF: new approach to ad hoc IR. In Proceedings of the 22nd ACM international conference on Conference on information & knowledge management (pp. 59-68). ACM.
- Jin, W., & Srihari, R. K. (2007, March). Graph-based text representation and knowledge discovery. In Proceedings of the 2007 ACM symposium on Applied computing (pp. 807-811). ACM.
- Aggarwal, C. C., & Zhao, P. (2013). Towards graphical models for text processing. Knowledge and information systems, 36(1), 1-21.
Τίτλος: Εξαγωγή γνώμης από κείμενα με αξιοποιηση της συντακτικής πληροφορίας
Επιβλέποντες: Βαρλάμης Ηρακλής, Χατζή Ουρανία, Δημητρακόπουλος Γιώργος
Σύντομη περιγραφή: Αντικείμενο της εργασίας είναι να βελτιώσει υπάρχουσες τεχνικές εξόρυξης γνώμης από κείμενα, αξιοποιώντας τη συντακτική πληροφορία της πρότασης καθώς και πληροφορία που αφορά σε λέξεις με σαφώς αρνητική ή θετική γνώμη. Η εργασία θα επεκτείνει υπάρχουσες τεχνικές και αλγόριθμο κατηγοριοποίησης γνώμης γραμμένα σε Java.
Βιβλιογραφία:
- Katakis, I. M., Varlamis, I., & Tsatsaronis, G. (2014). PYTHIA: Employing Lexical and Semantic Features for Sentiment Analysis. In Machine Learning and Knowledge Discovery in Databases (pp. 448-451). Springer Berlin Heidelberg.
- Wu, L., Zhou, Y., Tan, F., Yang, F., & Li, J. (2011). Generating syntactic tree templates for feature-based opinion mining. In Advanced Data Mining and Applications (pp. 1-12). Springer Berlin Heidelberg.
- Olsher, D. J. (2012, December). Full spectrum opinion mining: Integrating domain, syntactic and lexical knowledge. In Data Mining Workshops (ICDMW), 2012 IEEE 12th International Conference on (pp. 693-700). IEEE.
- Johansson, R., & Moschitti, A. (2010, July). Syntactic and semantic structure for opinion expression detection. In Proceedings of the Fourteenth Conference on Computational Natural Language Learning (pp. 67-76). Association for Computational Linguistics.