Υποστήριξη διδακτορικής διατριβής κ. Νικηφόρου Πιτταρά

30/08/2021

Η δημόσια υποστήριξη της διδακτορικής διατριβής του κ. Νικηφόρου Πιτταρά θα πραγματοποιηθεί διαδικτυακά την Τρίτη, 31/8/2021, ώρα 13:00.

Τα στοιχεία της εικονικής αίθουσας είναι:

https://uoa.webex.com/uoa/j.php?MTID=m6b3adae7836ea01524937901292c3594
Meeting number (access code): 188 675 2545
Meeting password: BcJnwCmF488

Εξεταστική επιτροπή:
Ι. Ανδρουτσόπουλος, Καθηγητής ΟΠΑ
Ν. Βασιλειάδης, Καθηγητής ΑΠΘ
Δ. Γουνόπουλος, Καθηγητής ΕΚΠΑ
Γ. Ιωαννίδης, Καθηγητής ΕΚΠΑ
Ε. Καρκαλέτσης, Διευθυντής Ερευνών ΕΚΕΦΕ "Δημόκριτος"
Μ. Κουμπαράκης, Καθηγητής ΕΚΠΑ
Π. Σταματόπουλος, Επίκουρος Καθηγητής ΕΚΠΑ (επιβλέπων)

Ο τίτλος και η περίληψη της διατριβής του κ. Πιτταρά ακολουθούν.

----------------------------------------------------------------------------

Beyond Deep Learning: Enriching Data Representations for Machine Learning Tasks

This thesis conducts an investigation on data representation approaches for Machine Learning problems, focused on representation enrichment methods from knowledge resources. The study begins with a literature review on representations for classification over text, image and audio data, where methods were grouped according to richness of information encompassed in the produced representation to a) low-level and template-matching approaches, b) aggregation-based methods and c) deep representation learning systems. Directions of potential improvements and extensions were identified, towards enhancing the richness of encapsulated information in the representation. We moved on to specific proposals / extensions of representations to various learning problems, data and domains, evaluated under novel applications and experimental evaluations. Specifically, different representations for text were evaluated for the Hate Speech Detection task on social media posts, the Automatic Summarization task to multiple domains (online articles, game reviews and social media texts), the Clustering / Event Detection task over articles and Social Media posts and the video classification task under a multimodal (image and audio) setting over a variety of video datasets labeling and domain setting. The totality of study of data representations verified the motivation of this thesis, namely that introduction of existing knowledge into representations is both under-utilized and a viable way of arriving at semantically rich features for multiple representation extraction techniques. Given this, a literature review of i) knowledge resources and ii) representation enrichment methods was conducted, under a classification setting of text, images or audio data. We grouped enrichment approaches into three comparative groups: a) input modification b) knowledge-guided representation refinement and c) end-to-end knowledge-aware systems. The literature overview highlighted the under-investigated approach of enriching deep neural content-based features with the input modification methods, which is pursued for the remainder of the thesis. Thus, two novel representation enrichment methods were proposed, with a focus on text machine learning tasks. First, we implemented a word embedding enrichment approach with semantic information mined from the Wordnet knowledge resource, investigating different data combination techniques, semantics extraction and spread. We performed a large-scale experimental evaluation over multiple datasets and domains, along with statistical significance testing and a comparison to existing competing approaches. Subsequently, the system was extended with different neural and conventional embeddings as well as proposed dimensionality reduction and clustering capabilities, all evaluated in automatic summarization on web encyclopedic articles. Finally, we realize the findings of this study with the construction of a semantically enriched Hate Speech Detection system to be used in the Industry. The thesis is concluded by a summary of the totality of research work conducted, along with proposed directions of future study.

----------------------------------------------------------------------------

Πέρα από τη Βαθιά Μάθηση: Εμπλουτίζοντας Αναπαραστάσεις Δεδομένων για Προβλήματα Μηχανικής Μάθησης

Στην παρούσα μελέτη εξετάζονται αναπαραστάσεις δεδομένων για προβλήματα Mηχανικής Mάθησης, με έμφαση τον εμπλουτισμό τους με πληροφορία από πηγές γνώσεων. Αρχικά, εκπονήθηκε βιβλιογραφική μελέτη για αναπαραστάσεις δεδομένων κειμένου, εικόνας και ήχου στο πρόβλημα της κατηγοριοποίησης. Έγινε συγκριτική καταγραφή και κατάταξη των μεθόδων σε α) αναπαραστάσεις χαμηλού επιπέδου και τοπικής εφαρμογής προτύπων β) συνδυασμός τοπικών χαρακτηριστικών με μεθόδους συνένωσης, συνδυασμού και μετασχηματισμού και γ) μοντέλα βαθιάς εκμάθησης αναπαραστάσεων. Εντοπίστηκαν περιοχές βελτίωσης / επέκτασης τέτοιων τεχνικών, για βελτίωση του σημασιολογικού περιεχομένου της παραγόμενης αναπαράστασης. Στη συνέχεια, έγιναν ερευνητικές προτάσεις / επεκτάσεις μεθόδων αναπαράστασης σε διαφορετικά προβλήματα μηχανικής μάθησης και ποικίλων δεδομένων εισόδου σε στοχευμένες μελέτες και πειραματικές αξιολογήσεις. Συγκεκριμένα μελετήθηκαν διαφορετικές αναπαραστάσεις κειμένου για πρόβληματα όπως η Ανίχνευση Ρητορικής Μίσους σε δεδομένα από κοινωνικά δίκτυα και η Αυτόματη Εξαγωγή Περιλήψεων σε ποικιλία τύπου κειμένων (δημοσιογραφικά / εγκυκλοπαιδικά άρθρα, αξιολογήσεις ηλεκτρονικών παιχνιδιών, κείμενα σε ιστοσελίδες κοινωνικής δικτύωσης). Επιπλέον, έγινε μελέτη αναπαραστάσεων για Συσταδοποίηση / Εντοπισμό Γεγονότων σε κείμενο, καθώς και για για κατηγοριοποίηση βίντεο με αξιοποίηση αναπαράστασης εικόνας και ήχου. Το σύνολο της βιβλιογραφικής / ερευνητικής μελέτης ανέδειξε κατευθύνσεις βελτίωσης μεθόδων αναπαραστάσεων με τη χρήση υπάρχουσας πληροφορίας από δομημένες και υψηλής ποιότητας πηγές γνώσεων – τεχνική που είναι απούσα ή ελλιπής στη βιβλιογραφία. Στη βάση αυτή εκπονήθηκε περαιτέρω βιβλιογραφική μελέτη με έμφαση μεθόδους εμπλουτισμού αναπαραστάσεων για διαφορετικούς τύπους δεδομένων (κείμενο, εικόνα και ήχος) και πηγών γνώσεων (οντολογίες, λεξικά, οπτικοακουστικές ιεραρχίες, κ.α.). Επιπλέον, με έμφαση στο πρόβλημα της κατηγοριοποίησης, καταγράφηκαν λεπτομερώς υπάρχουσες μέθοδοι εμπλουτισμού και κατατάχθηκαν σε τρείς κατηγορίες: α) μέθοδοι εμπλουτισμού εισόδου με δεδομένα γνώσης β) μετασχηματισμός αναπαράστασης καθοδηγούμενος από γνώση και γ) συστήματα γνώσης βαθιάς μάθησης. Η μελέτη ανέδειξε μία τεχνική (εμπλουτισμός εισόδου σε συνδυασμό με βαθιές αναπαραστάσεις) ως περιοχή με ελλιπή αξιοποίηση / αξιολόγηση, και ως αποτέλεσμα αποφασίστηκε η περαιτέρω διερεύνησή της. Με γνώμονα τα παραπάνω, προτάθηκαν δύο νέοι τρόποι εμπλουτισμού αναπαραστάσεων, δίνοντας έμφαση σε δεδομένα κειμένου. Αρχικά, αναπτύχθηκε ένα σύστημα νευρωνικών αναπαραστάσεων λέξεων, εμπλουτισμένων με σημασιολογική πληροφορία από την ιεραρχική οντολογία Wordnet. Ερευνήθηκαν διαφορετικοί τρόποι εμπλουτισμού της εισόδου, τρόποι εξαγωγής σημασιολογίας από την οντολογία και τεχνικών διάχυσης βάρους στα δεδομένα γνώσης. Έγινε πειραματική αξιολόγηση μεγάλης κλίμακας, ανάλυση στατιστικής σημαντικότητας και σύγκριση με άλλα συστήματα κατηγοριοποίησης και εμπλουτισμού, με χρήση μεγάλων συλλογών κειμένων ποικίλης θεματολογίας και χαρακτηριστικών. Στη συνέχεια, το παραπάνω σύστημα εκεκτάθηκε με επιπλέον τεχνικές νευρωνικών και άλλων αναπαραστάσεων, μεθόδους μείωσης διάστασης και τεχνικών συσταδοποίησης. Έγινε αξιολόγηση σε κατηγοριοποίηση για εξαγωγή περιλήψεων σε επίπεδο παραγωγής σημαντικότητας και επιλογής πρότασης πάνω σε άρθρα στο διαδίκτυο. Τέλος, το σύνολο των ευρημάτων της μελέτης χρησιμοποιήθηκε για την κατασκευή ενός συστήματος εντοπισμού ρητορικής μίσους για αξιοποίηση στην βιομηχανία. Η παρούσα διατριβή κλείνει συνοψίζοντας το συνολικού ερευνητικό έργο και προσφέροντας κατευθύνσεις μελλοντικής επέκτασης της μελέτης που εκπονήθηκε.
 

Κατηγορία