Περιγραφή English Version
Σκεπτικό
Τα Συστήματα Ανάκτησης Πληροφοριών (Information Retrieval systems) επιτρέπουν την πρόσβαση σε μεγάλους όγκους πληροφοριών αποθηκευμένων με τη μορφή κειμένου, φωνής, video, ή σε σύνθετη μορφή όπως Ιστοσελίδες. Σκοπός των συστημάτων αυτών είναι η ανάκτηση μόνο εκείνων των εγγράφων που είναι συναφή με αυτό που αναζητεί ο χρήστης. Για να το επιτύχουν πρέπει να αντιμετωπίσουν την αβεβαιότητα ως προς το τι πραγματικά αναζητεί ο χρήστης και ποιο το θέμα ενός εγγράφου.

Σκοπός του μαθήματος
Σκοπός του μαθήματος είναι η εισαγωγή στην περιοχή των συστημάτων ανάκτησης πληροφοριών και η εξέταση των θεωρητικών και πρακτικών ζητημάτων που σχετίζονται με την σχεδίαση, υλοποίηση και αξιολόγηση τέτοιων συστημάτων..

Στόχοι του μαθήματος
Το μάθημα θα επιτρέψει στους φοιτητές:
  • να κατανοήσουν τη θεωρητική βάση των καθιερωμένων μοντέλων ανάκτησης (Boolean, Vector-space, Probabilistic, Logical models),
  • να κατανοήσουν τη δυσκολία παράστασης και ανάκτησης εγγράφων, εικόνων, ομιλίας, κλπ.,
  • να μάθουν να υλοποιούν και να αξιολογούν IR συστήματα,
  • να κατανοήσουν τους καθιερωμένους τρόπους ευρετηρίασης και ανάκτησης του Παγκόσμιου Ιστού,
  • να κατανοήσουν πως άλλες τεχνικές από το χώρο της επεξεργασία φυσικής γλώσσας, τεχνητής νοημοσύνης και αλληλεπίδρασης ανθρώπου-μηχανής, σχετίζονται με την Ανάκτηση Πληροφοριών,
  • να γνωρίσουν διάφορους αλγόριθμους και συστήματα.

Μεθοδολογία
Κατά πρώτο λόγο διαλέξεις και συζητήσεις Η προσωπική μελέτη και η επίλυση των ασκήσεων και εργασιών είναι εξίσου σημαντικά για την επίτευξη των στόχων του μαθήματος. Ένα έργο υλοποίησης θα ανατεθεί κατά τη διάρκεια του μαθήματος..

Οργάνωση περιεχομένου
Οργάνωση περιεχομένου
  • Εισαγωγή
    • Τι είναι η Ανάκτηση Πληροφοριών / Βασικές έννοιες
    • Ιστορική αναδρομή
  • Μοντέλα Ανάκτησης Πληροφοριών
    • Boolean
    • Διανυσματικό
    • Πιθανοκρατικό
    • Εναλλακτικά μοντέλα
  • Αξιολόγηση Αποτελεσματικότητας Συστημάτων Ανάκτησης Πληροφορίας
    • Ακρίβεια και Ανάκληση
    • Εναλλακτικά μέτρα
    • Συλλογές αναφοράς και αξιολόγηση συστημάτων
  • Γλώσσες Επερώτησης για Ανάκτηση Πληροφοριών
    • Λέξεις κλειδιά
    • Λογικές επερωτήσεις
    • Επερωτήσεις συμφραζομένων
    • Επερωτήσεις φυσικής γλώσσας
    • Δομημένες επερωτήσεις
  • Προχωρημένες Λειτουργίες Επερώτησης
    • Ανάδραση συνάφειας
    • Επέκταση επερώτησης
    • Αυτόματη τοπική/καθολική ανάλυση
  • Ευρετηριασμός, Προεπεξεργασία και Οργάνωση Αρχείων Κειμένου
    • Λέξεις αποκλεισμού (stopwοrds), stemming (στελέχωση κειμένου) , θησαυροί όρων
    • Οργάνωση αρχείων (ανεστραμμένα αρχεία, δένδρα καταλήξεων, αρχεία υπογραφών)
    • Στατιστικά κειμένου
    • Συμπίεση κειμένου
  • Αναζήτηση σε Κείμενα
    • Knuth-Morris-Pratt
    • Boyer-Moore
    • Αυτόματο καταλήξεων (suffix automaton)
    • Φράσεις και εγγύτητα
  • Ομαδοποίηση Εγγράφων (Clustering)
  • Ανάκτηση Πολυμέσων
    • Επερωτήσεις Ομοιότητας
    • Ευρετηρίαση και Αναζήτηση βάσει Χαρακτηριστικών (Features)
    • Χωρικές Δομές Πρόσβασης και Αναζήτηση σε Πολυδιάστατους Χώρους
  • Παράλληλη και Κατανεμημένη Ανάκτηση Πληροφοριών
    • Αρχιτεκτονικές MIMD και SIMD
    • Διαμερισμός συλλογών
    • Επιλογή πηγής
    • Επεξεργασία επερωτήσεων
    • Αρχιτεκτονικές Peer-2-Peer
  • Τεχνικές μετα-Διάταξης (meta-ranking)
    • Ενοποιημένες και απομονωμένες μέθοδοι
    • Παρεμβολή, Ψηφοφορία
  • Αναζήτηση στον Παγκόσμιο Ιστό
    • Ιστορική αναδρομή
    • Ευρετηριασμός ιστοσελίδων
    • Διάσχιση του ιστού (crawling)
    • Τεχνικές ανάλυσης συνδέσμων (link analysis)
  • Διεπαφές Χρήσης και Οπτικοποίηση