Εξόρυξη πληροφορίας από χρονοσειρές: Προγραμματιστική υλοποίηση μέτρων ομοιότητας

Καραμητόπουλος, Λεωνίδας/ Κάτσιανου, Μαριλένα


Institution and School/Department of submitter: ΤΕΙ Θεσσαλονίκης
Keywords: Προγραμματισμός ηλεκτρονικού υπολογιστή;Εξόρυξη πληροφοριών;Βάσεις δεδομένων;Αλγόριθμοι;Χρονοσειρές
Issue Date: 28-Nov-2013
Abstract: Η παρούσα εργασία παρουσιάζει διάφορες τεχνικές που χρησιμοποιούνται για την αποτελεσματική και αξιόπιστη εξόρυξη πληροφορίας από χρονοσειρές. Οι κύριες ενέργειες που πραγματοποιούνται με την εφαρμογή τεχνικών αυτών είναι η συσταδιοποίηση, η κατηγοριοποίηση, η ανακάλυψη κανόνων συσχέτισης και η ανάκτηση όμοιων εγγράφων. Στο επίκεντρο των ενεργειών αυτών βρίσκεται η έννοια της ομοιότητας και της μέτρησης της. Η χρονική διάσταση των δεδομένων όμως θέτει δύο βασικά ζητήματα τα οποία θα πρέπει να λαμβάνονται σοβαρά υπόψη κατά την αναζήτηση ομοιοτήτων. Το πρώτο ζήτημα είναι η επιλογή ενός κατάλληλου μέτρου ομοιότητας το οποίο θα επιτρέπει τον εντοπισμό όμοιων χρονοσειρών , οι οποίες δεν ταυτίζονται απαραιτήτως. Το δεύτερο ζήτημα αφορά στην αναπαράσταση των χρονοσειρών με στόχο τη μείωση της υψηλής διαστατικότητας τους (dimensionality). Η εργασία εστιάζεται κυρίως στη μέτρηση της ομοιότητας μεταξύ των χρονοσειρών με την εφαρμογή ενός μέτρου ομοιότητας, όπως είναι η Ευκλείδια απόσταση , το Dynamic Time Warping (DTW) με ή χωρίς τους περιορισμούς Sakoe/Chiba και Itakura. Με τη χρήση της βιβλιοθήκης ελεύθερου λογισμικού java-ml και στο περιβάλλον ανάπτυξης λογισμικού Eclipse τροποποιήθηκε ο αλγόριθμος DTW, υλοποιήθηκαν τα φίλτρα Sakoe/Chiba και Itatura και ενσωματώθηκαν στην βιβλιοθήκη java-ml. Επίσης πραγματοποιήθηκαν πολλά πειράματα για να αξιολογηθεί η αποδοτικότητα και η αξιοπιστία αυτών των τεχνικών αναζήτησης ομοιότητας χρησιμοποιώντας αλγόριθμο του Εγγύτερου Γείτονα (1-Nearest Neighbor) της java-ml. Η πειραματική αξιολόγηση αφορά τους αλγόριθμους της Ευκλείδιας απόστασης , του Dynamic Time Warping , του Sakoe/Chiba και του Itakura, ώστε να εντοπιστούν οι διαφορές και οι ομοιότητες τους σε σχέση με τα ποσοστά εσφαλμένης κατηγοριοποίησης και τους χρόνους απόκρισης τους κατά τη διάρκεια της αναζήτησης όμοιων χρονοσειρών.
Description: Πτυχιακή εργασία -- Σχολή Τεχνολογικών Εφαρμογών -- Τμήμα Πληροφορικής, 2011-- αα1705
URI: http://195.251.240.227/jspui/handle/123456789/11022
Appears in Collections:Πτυχιακές Εργασίες

Files in This Item:
File Description SizeFormat 
Katsianou_Marilena.pdf2.94 MBAdobe PDFView/Open



 Please use this identifier to cite or link to this item:
http://195.251.240.227/jspui/handle/123456789/11022
  This item is a favorite for 0 people.

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.