S-Index Implementation and Performance for Textbases

Nitsos, Ilias/ Dervos, Dimitrios/ Evangelidis, Georgios/ Δέρβος, Δημήτριος/ Νίτσος, Ηλίας/ Ευαγγελίδης, Γεώργιος


Institution and School/Department of submitter: ΤΕΙ Θεσσαλονίκης
Issue Date: Nov-2001
Citation: Panhellenic Conference on Informatics with international participation, Nicosia, 2001
Nitsos, I., Dervos, D., Evangelidis, G. (2001). S-Index Implementation and Performance for Textbases. Πρακτικά συνεδρίου από 8ο Panhellenic Conference on Informatics with international participation που διεξήχθη σε Nicosia, Cyprus.
Abstract: Στην εργασία αυτή παρουσιάζουμε την υλοποίηση μιας βελτιωμένης, συμπιεσμένης παραλλαγής του S-Index και μελετούμε την απόδοσή της στην ευρετηριοποίηση μιας βάσης ελεύθερου κειμένου. Η S-Index, όπου το ‘S’ σημαίνει signature (υπογραφή) και το ‘Ι’ inverted file (ανεστραμμένο αρχείο), είναι ένα υβριδικό σχήμα ευρετηριοποίησης που συνδυάζει προτερήματα από δυο δημοφιλείς μεθόδους ευρετηριοποίησης: το ανεστραμμένο αρχείο και το αρχείο υπογραφών ή bitmap. Παρουσιάζουμε τη δομή της μεθόδου καθώς και λεπτομέρειες της υλοποίησης της συμπιεσμένης παραλλαγής της S-Index. Τα αποτελέσματα μας συγκρίνονται με αυτά της συμπιεσμένης παραλλαγής του ευρετηρίου ανεστραμμένου αρχείου. Με ελάχιστη προσπάθεια όσον αφορά στη ρύθμιση των παραμέτρων της, η S-Index καταλαμβάνει λιγότερο από το 5% της προς ευρετηριοποίηση βάσης κειμένου. Το αποτέλεσμα αυτό είναι συγκρίσιμο με την απόδοση του ανεστραμμένου αρχείου.
In this paper is presented the implementation of an improved, compressed variation of S-Index and studied its imputation in indexing a free text database. S-Index, where 'S' stands for signature and 'I' for inverted file, is a hybrid indexing form that combines the merits from two popular indexing methods: the inverted file and the signature file, or bitmap. There is also presented the structure of the method used, as well as the details of materialising the compressed variation of S-Index. The results of the research are compared to the ones from the compressed variation of indexing inverted files. With a little effort in adjusting its parameters, S-Index occupies less that 5% from the database that is indexed. This result is comparable to the inverted file's attribution.
Description: Δημοσιεύσεις μελών--ΣΔΟ--Τμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης, 2001
URI: http://195.251.240.227/jspui/handle/123456789/4348
Other Identifiers: http://iml.it.uom.gr/el/node/92
Appears in Collections:Δημοσιεύσεις σε Περιοδικά

Files in This Item:
There are no files associated with this item.



 Please use this identifier to cite or link to this item:
http://195.251.240.227/jspui/handle/123456789/4348
  This item is a favorite for 0 people.

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.