Ο σημασιολογικός εμπλουτισμός των πολιτιστικών δεδομένων του SearchCulture.gr σε webinar της Europeana

Το webinar παρακολούθησαν εκπρόσωποι εθνικών και μεγάλων διαθεματικών συσσωρευτών που συμμετέχουν στο έργο Common Culture.

Οι προκλήσεις που αντιμετωπίζουν οι εθνικοί και διαθεματικοί συσσωρευτές πολιτιστικού περιεχομένου στην προσπάθειά τους να προσφέρουν τη βέλτιστη δυνατότητα αναζήτησης και πλοήγησης στον μεγάλο ετερογενή όγκο δεδομένων που συλλέγουν, βρέθηκαν στο επίκεντρο του webinar που διοργάνωσε το Εθνικό Κέντρο Τεκμηρίωσης και Ηλεκτρονικού Περιεχομένου (ΕΚΤ) με την ευρωπαϊκή πλατφόρμα Europeana.

Οι συσσωρευτές πολιτιστικού περιεχομένου συγκεντρώνουν συλλογές που προέρχονται από μουσεία, βιβλιοθήκες, αρχεία, εφορείες και, εν γένει, πολιτιστικούς οργανισμούς, και οι οποίες διαφέρουν σε μεγάλο βαθμό ως προς τον τρόπο που περιγράφουν τις χρονολογίες και τις ιστορικές περιόδους, τους τύπους των τεκμηρίων και τα θέματα, τους γεωγραφικούς προσδιορισμούς και τις τοποθεσίες, τα πρόσωπα και τους οργανισμούς, ανάμεσα στα άλλα. 

Ο μεγάλος ετερογενής όγκος δεδομένων είναι ένα προνόμιο, γιατί σημαίνει ότι οι χρήστες έχουν πολλές πιθανότητες να βρουν απαντήσεις στα ερωτήματά τους. Αποτελεί όμως και “πονοκέφαλο” για τους συσσωρευτές, καθώς απαιτεί να σχεδιαστούν και να υλοποιηθούν τρόποι που θα καθιστούν απλή και εύκολη την αναζήτηση και την πλοήγηση για τους χρήστες. Σε αυτή τη διαδικασία, οι συσσωρευτές ακολουθούν διαφορετικές στρατηγικές. Σε ορισμένες από τις πλέον ομιλούμενες γλώσσες, όπως είναι τα αγγλικά, τα γερμανικά και τα γαλλικά, υπάρχουν έτοιμοι πλούσιοι θησαυροί και δομημένα λεξιλόγια τα οποία μπορούν να αξιοποιήσουν με αυτόματο τρόπο για να ομογενοποιήσουν και να εμπλουτίσουν τα δεδομένα τους.

Ο δρ. Χάρης Γεωργιάδης, τεχνικός υπεύθυνος ανάπτυξης της εθνικής πλατφόρμας συσσώρευσης πολιτιστικών δεδομένων SearchCulture.gr του ΕΚΤ και η Αγάθη Παπανότη, αρχαιολόγος, υπεύθυνη των σημασιολογικών εμπλουτισμών της πλατφόρμας, παρουσίασαν τη στρατηγική που έχει σχεδιαστεί και υλοποιηθεί στο SearchCulture.gr για τον εμπλουτισμό των ψηφιακών συλλογών της ελληνικής πολιτιστικής κληρονομιάς.

Στο SearchCulture.gr ακολουθείται μία μικτή διαδικασία εμπλουτισμού των δεδομένων, η οποία συνδυάζει τη συστηματική επιστημονική επιμέλεια, με την αξιοποίηση εργαλείων αυτοματισμού για τον σημασιολογικό εμπλουτισμό των συλλογών προς τους τύπους των τεκμηρίων, τις χρονολογίες και τις ιστορικές περιόδους, καθώς και τα θέματα. Για τα θέματα, π.χ. αξιοποιήθηκε ένα μεγάλο αναγνωρισμένο λεξιλόγιο, όπως το λεξιλόγιο όρων της UNESCO, το οποίο εμπλουτίστηκε με νέους όρους που ανταποκρίνονται στο εύρος, την ποικιλία και την ιδιαιτερότητα των ελληνικών συλλογών. To παράγωγο δίγλωσσο, ιεραρχικό λεξιλόγιο των 1.900 όρων χρησιμοποιείται για τον εμπλουτισμό του συνόλου των τεκμηρίων του SearchCulture.gr.

Ο σημασιολογικός εμπλουτισμός διενεργείται μέσα από το εργαλείο Semantics.gr που έχει επίσης αναπτύξει το ΕΚΤ, στο οποίο επίσης φιλοξενούνται τα λεξιλόγια ως Διασυνδεδεμένα Δεδομένα. Το εργαλείο είναι έτσι σχεδιασμένο ώστε να θυμάται νέες αντιστοιχίσεις όρων που δημιουργούνται, και άρα συνεχώς “εκπαιδεύεται” και βελτιώνεται.

Τα λεξιλόγια που αναπτύχθηκαν είναι δίγλωσσα, γεγονός που επιτρέπει στο ΕΚΤ να προσφέρει τις ίδιες δυνατότητες αναζήτησης και πλοήγησης στο σύνολο του υλικού του SearchCulture.gr, τόσο για το ελληνόφωνο όσο και για το αγγλόφωνο κοινό. Διατηρώντας αυτούσια την πρωτότυπη τεκμηρίωση από τους φορείς που διαθέτουν τις συλλογές τους, δημιουργούνται οι διαδικασίες ομογενοποίησης και σημασιολογικού εμπλουτισμού ένα επίπεδο προστιθέμενης αξίας που παρέχει στους χρήστες επιπλέον δυνατότητες αναζήτησης και πλοήγησης με βάση τους τύπους, τις χρονολογίες, τις ιστορικές περιόδους και τα θέματα.

Ο σημασιολογικός εμπλουτισμός επιτρέπει ακόμη τη διενέργεια σύνθετων αναζητήσεων, όπως, π.χ. “αγγεία” (τύπος τεκμηρίου) και “κλασική αρχαιότητα” (ιστορική περίοδος), καθώς και τη δημιουργία θεματικών εκθέσεων στο SearchCulture.gr. Η στρατηγική που ακολουθεί το ΕΚΤ διασφαλίζει μεγαλύτερη επιστημονική ακρίβεια, ορθότητα και πληρότητα ως προς τους εμπλουτισμούς.   

Το webinar παρακολούθησαν περίπου 35 εκπρόσωποι εθνικών και μεγάλων διαθεματικών συσσωρευτών που συμμετέχουν στο έργο Common Culture, στο πλαίσιο του οποίου διενεργήθηκε το webinar. Το έργο έχει ως στόχο την ανταλλαγή τεχνογνωσίας και καλών πρακτικών μεταξύ εθνικών συσσωρευτών της Europeana και την αύξηση του περιεχομένου που διατίθεται σε αυτή.

Η βιντεοσκοπημένη παρουσίαση βρίσκεται εδώ.

Η αναβάθμιση και επέκταση του SearchCulture.gr με νέες λειτουργικότητες, πραγματοποιείται από το ΕΚΤ στο πλαίσιο της πράξης “Εθνικό Πληροφοριακό Σύστημα Έρευνας και Τεχνολογίας: Υποδομή Συσσώρευσης, Τεκμηρίωσης και Διάθεσης Ψηφιακού Περιεχομένου με διασφάλιση διαλειτουργικότητας, μακροχρόνιας διατήρησης και ανοικτής πρόσβασης”. Η πράξη υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος “Μεταρρύθμιση του Δημόσιου Τομέα” (ΕΣΠΑ 2014-2020) και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση - Ευρωπαϊκό Ταμείο Περιφερειακής Ανάπτυξης και εθνικούς πόρους.

* Εισαγωγική φωτογραφία | Ψαράς με τη βάρκα του στη λίμνη Μικρή Πρέσπα. Σ. Μηλιώνης. Ελληνικό Κέντρο Βιοτόπων – Υγροτόπων (ΕΚΒΥ) - (Άδεια χρήσης CC BY 4.0).