Μηχανές αναζήτησης με εκτεταμένη χρήση ταξινομιών (Master thesis)

Αξιός, Θεόδωρος


This diploma thesis examines the implementation of the web-based search engine that receives text questions in "natural language", process them based on NLP techniques (Natural Language Processing) and then attempts to answer the question of the user. A mechanism was developed where it takes as input, in natural language texts and uses the Google NLP API to analyze the text syntactically, semantically, morphologically, emotionally and grammatically, sentimentally. It then extracts metadata for parts of Speech POS, sentiment magnitude, recognizes and extracts the entities contained in them. Then it uses the analysis and metadata generated to match the query to a predefined template and sends a query request to the search engine. The search engine that is implemented in Elasticsearch, searches its index, consisting data on movies and actors based on the IMDB dataset, and presents the results through a web interface. In this phase, the following search techniques are applied to predefined taxonomies, faceted search, fielded search, spelling correction
Institution and School/Department of submitter: Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής
Keywords: επεξεργασία φυσικής γλώσσας;μηχανές αναζήτησης;ανάκτηση πληροφοριών;εξαγωγή οντοτήτων;Google NLP API;natural language processing;search engine;information retrieval;entity extraction
Description: Μεταπτυχιακή εργασία--ΣΤΕΦ-Τμήμα Μηχανικών Πληροφορικής, 2018—10034
URI: http://195.251.240.227/jspui/handle/123456789/11910
Item type: masterThesis
Name(s) of contributor(s): Αξιός, Θεόδωρος
Item language: el
Item access scheme: account
Institution and School/Department of submitter: Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής
Publication date: 2018-09-18
Bibliographic citation: Αξιός, Θ. (2018). Μηχανές αναζήτησης με εκτεταμένη χρήση ταξινομιών (Μεταπτυχιακή εργασία). Αλεξάνδρειο ΤΕΙ, Θεσσαλονίκη.
Abstract: Η παρούσα διπλωματική εργασία εξετάζει την υλοποίηση διαδικτυακής μηχανής αναζήτησης η οποία δέχεται ερωτήματα που δίνονται σε ‘φυσική γλώσσα’ τα οποία επεξεργάζεται βασιζόμενη σε τεχνικές NLP (Natural Language Processing) και στην συνέχεια προσπαθεί να απαντήσει στο ερώτημα του χρήστη. Αναπτύχθηκε ένας μηχανισμός όπου παίρνει ως είσοδο, κείμενα φυσικής γλώσσας και χρησιμοποιώντας το Google NLP API αναλύει συντακτικά, σημασιολογικά, μορφολογικά, συναισθηματικά και γραμματικά, συναισθηματικά τα κείμενα. Στην συνέχεια εξάγει μεταδεδομένα για τα κείμενα αυτά Part of Speech POS, sentiment magnitude, αναγνωρίζει και εξάγει τις οντότητες που εμπεριέχονται σε αυτά. Κατόπιν κάνει χρήση της ανάλυσης και των μεταδεδομένων αυτών αντιστοιχίζει το ερώτημα σε κάποιο προκαθορισμένο πρότυπο και αποστέλλει ερώτημα στη μηχανή αναζήτησης. Η μηχανή αναζήτησης που είναι υλοποιημένη σε Elasticsearch αναζητά στον index της, ο οποίος βασίζεται σε δεδομένα που αφορούν ταινίες και ηθοποιούς με βάση του dataset της IMDB, και παρουσιάζει τα αποτελέσματα μέσω διαδικτυακής διεπαφής. Σε αυτή την φάση γίνεται χρήση τεχνικών αναζήτησης σε προκαθορισμένες οντότητες, faceted search, fielded search, spelling correction
This diploma thesis examines the implementation of the web-based search engine that receives text questions in "natural language", process them based on NLP techniques (Natural Language Processing) and then attempts to answer the question of the user. A mechanism was developed where it takes as input, in natural language texts and uses the Google NLP API to analyze the text syntactically, semantically, morphologically, emotionally and grammatically, sentimentally. It then extracts metadata for parts of Speech POS, sentiment magnitude, recognizes and extracts the entities contained in them. Then it uses the analysis and metadata generated to match the query to a predefined template and sends a query request to the search engine. The search engine that is implemented in Elasticsearch, searches its index, consisting data on movies and actors based on the IMDB dataset, and presents the results through a web interface. In this phase, the following search techniques are applied to predefined taxonomies, faceted search, fielded search, spelling correction
Advisor name: Σαλαμπάσης, Μιχαήλ
Examining committee: Σαλαμπάσης, Μιχαήλ
Publishing department/division: Τμήμα Μηχανικών Πληροφορικής
Publishing institution: teithe
Number of pages: 128
Appears in Collections:Μεταπτυχιακές Διατριβές

Files in This Item:
File Description SizeFormat 
Aksios.pdf2.69 MBAdobe PDFView/Open



 Please use this identifier to cite or link to this item:
http://195.251.240.227/jspui/handle/123456789/11910
  This item is a favorite for 0 people.

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.