OpenArchives.gr: Εμπλουτισμένο περιεχόμενο και νέες προδιαγραφές διαλειτουργικότητας για τη μεγαλύτερη ελληνική πύλη αναζήτησης επιστημονικού περιεχομένου

Νέες λειτουργικές βελτιώσεις για αποτελεσματικότερη αναζήτηση στη διαδικτυακή πύλη του ΕΚΤ που συγκεντρώνει 770.000 τεκμήρια, αξιοποιώντας και τα συμπεράσματα έρευνας χρηστών.

Η πρότυπη συσσώρευση ψηφιακού περιεχομένου και η ανάπτυξη έξυπνων τρόπων αναζήτησης αποτελούν διαρκή πρόκληση για το OpenArchives.gr, τη μεγαλύτερη ελληνική διαδικτυακή πύλη αναζήτησης έγκριτου επιστημονικού περιεχόμενου, που αναπτύσσει το Εθνικό Κέντρο Τεκμηρίωσης και Ηλεκτρονικού Περιεχομένου (ΕΚΤ). Με γνώμονα τη βέλτιστη ανάδειξη του περιεχομένου που συγκεντρώνεται στην υποδομή, το ΕΚΤ υλοποιεί δράσεις εμπλουτισμού και ταξινόμησης του διαθέσιμου περιεχομένου, αξιοποιώντας καθιερωμένα λεξιλόγια και θησαυρούς όρων.

Επίσης, αποσκοπώντας στην αύξηση του επιστημονικού περιεχομένου του OpenArchives.gr, δημοσιεύθηκε πρόσφατα από το ΕΚΤ ο Οδηγός «Προδιαγραφές διαλειτουργικότητας για την προτυποποιημένη δημοσίευση επιστημονικών ψηφιακών πόρων και την ένταξή τους στο OpenArchives.gr». Προκειμένου δε να κατανοήσει καλύτερα το προφίλ και τις ανάγκες των χρηστών του ΟpenΑrchives.gr, το ΕΚΤ ολοκλήρωσε πρόσφατα σχετική διαδικτυακή έρευνα χρηστών. Τα ενδιαφέροντα συμπεράσματα της έρευνας θα αξιοποιηθούν στον σχεδιασμό των επεκτάσεων και των βελτιώσεων της πύλης.

Λίγα λόγια για το OpenArchives.gr

Σήμερα, στο OpenArchives.gr ο χρήστης μπορεί να αναζητήσει 770.000 τεκμήρια από 78 φορείς από την Ελλάδα και την Κύπρο, όπως πανεπιστήμια, ερευνητικά κέντρα, επιστημονικές εταιρείες, δημόσιες βιβλιοθήκες και ιδρύματα. Το περιεχόμενο του ανανεώνεται σε τακτά διαστήματα, ώστε να συγχρονίζεται με τις απομακρυσμένες βάσεις δεδομένων και τα αποθετήρια των φορέων διάθεσής τους.

Ο χρήστης, ανατρέχοντας στις συλλογές του OpenArhives.gr μπορεί να εντοπίσει: γκρίζα βιβλιογραφία (διδακτορικά, μεταπτυχιακές εργασίες, εκπαιδευτικό υλικό, κ.ά.), άρθρα επιστημονικών περιοδικών Ανοικτής Πρόσβασης καθώς και μονογραφίες, πρακτικά συνεδρίων, σύνολα επιστημονικών δεδομένων και αρχεία, που καλύπτουν ένα ευρύ φάσμα θεματικών ενοτήτων από τις φυσικές επιστήμες, την τεχνολογία, τις κοινωνικές επιστήμες και τις επιστήμες του ανθρώπου. Με τον τρόπο αυτό, το ΕΚΤ αίρει για τον χρήστη τους περιορισμούς αναζήτησης και πρόσβασης σε περιεχόμενο που βρίσκεται κατανεμημένο σε επιμέρους ψηφιακές βιβλιοθήκες, ιδρυματικά αποθετήρια και συλλογές στο διαδίκτυο.

Το περιεχόμενο των συλλογών καλύπτει μια τεράστια ποικιλία επιστημονικών θεματικών περιοχών και παρουσιάζει μεγάλη ποικιλομορφία και ετερογένεια. Με γνώμονα τη βέλτιστη ανάδειξη του περιεχομένου, καθώς και τη διευκόλυνση των χρηστών στην αναζήτηση και ανακάλυψη του υλικού, το ΕΚΤ προβαίνει σε συστηματικές προσπάθειες εμπλουτισμού και ταξινόμησής του, αξιοποιώντας καθιερωμένα λεξιλόγια και θησαυρούς όρων.

Nέες λειτουργικές αναβαθμίσεις για αποτελεσματικότερη αναζήτηση

Το ΕΚΤ εμπλούτισε τo σύνολο των τεκμηρίων με δύο νέα πεδία: “ΕΚΤ Τύπος” και “ΕΚΤ Χρονολογία”. Το πρώτο περιλαμβάνει τις αναφορές στους όρους ενός δίγλωσσου ιεραρχικού λεξιλογίου τύπων που δημιούργησε η ομάδα επιστημόνων πληροφόρησης του ΕΚΤ και το οποίο είναι διασυνδεδεμένο με τον Θησαυρό για τις Τέχνες και την Αρχιτεκτονική (Art & Architecture Thesaurus) - AAT του Ιδρύματος Getty και τον σημασιολογικό θησαυρό DBpedia της Wikipedia. Επιπλέον, το ΕΚΤ κανονικοποιεί τις ημερομηνίες και τις χρονολογίες των τεκμηρίων και εμπλουτίζει τα τεκμηρία που συσσωρεύει με ομογενοποιημένη χρονολόγηση, προσθέτοντας το νέο χρονικό πεδίο, «EKT Χρονολογία».

Αξιοποιώντας τις παραπάνω λειτουργικότητες, ο χρήστης μπορεί πλέον να πραγματοποιήσει αναζητήσεις στο σύνολο του περιεχομένου, αλλά και να φιλτράρει τα αποτελέσματα με βάση τον τύπο του περιεχομένου και χρησιμοποιώντας χρονικά κριτήρια. Τα παραπάνω επιτυγχάνονται με την αξιοποίηση από το επιστημονικό προσωπικό του ΕΚΤ του Συστήματος Λεξιλογίων και Σημασιολογικού Εμπλουτισμού Semantics.gr, το οποίο περιλαμβάνει ένα πρωτότυπο και ιδιαίτερα φιλικό εργαλείο για μαζικό ημιαυτόματο σημασιολογικό εμπλουτισμό και ομογενοποίηση περιεχομένου. Ακόμη, προστέθηκε η δυνατότητα αναζήτησης εντός των συλλογών ενός ή περισσότερων συλλογών που επιλέγει ο χρήστης, δίνοντας έτσι τη δυνατότητα επιμερισμού των αποτελεσμάτων, π.χ. στο αποθετήριο της σχολής που τον ενδιαφέρει.

Έχουν, τέλος, δρομολογηθεί εργασίες σημασιολογικού εμπλουτισμού των δεδομένων ως προς τα επιστημονικά πεδία που καλύπτουν, προκειμένου να βελτιωθεί η ταξινόμηση του υλικού και η διαδικασία αναζήτησης περιεχομένου. Η νέα αυτή λειτουργικότητα αναμένεται να αξιοποιήσει και τεχνολογίες τεχνητής νοημοσύνης με σκοπό να βελτιωθεί σημαντικά η εμπειρία του χρήστη.

Κατανοώντας το κοινό που επισκέπτεται το OpenArchives.gr

Με 20.000 επισκέψεις τον μήνα, το OpenArchives.gr είναι μία από τις πλέον δημοφιλείς υποδομές του ΕΚΤ, γεγονός που καταδεικνύει την ανάγκη του κοινού για απομακρυσμένη πρόσβαση σε έγκριτο επιστημονικό περιεχόμενο. Ποιό είναι όμως αυτό το κοινό, για ποιό λόγο επισκέπτεται το OpenArchives; Είναι ικανοποιημένο;

Με σκοπό να κατανοήσουμε καλύτερα το προφίλ και τις ανάγκες των χρηστών του ΟpenΑrchives, "τρέξαμε" το περασμένο εξάμηνο μία σύντομη διαδικτυακή έρευνα, μέσω ερωτηματολογίου που είχε ενσωματωθεί στην πύλη. Απώτερος στόχος ήταν να εξαχθούν συμπεράσματα με βάση τα οποία θα σχεδιαστούν οι μελλοντικές επεκτάσεις της πύλης. Τα αποτελέσματα της έρευνας, στην οποία συμμετείχαν 340 χρήστες, ήταν εξαιρετικά ενδιαφέροντα.

Όπως αναμενόταν, η συντριπτική πλειοψηφία προέρχεται από τον ακαδημαϊκό χώρο και είναι καθηγητές, ερευνητές και φοιτητές που αναζητούν επιστημονικά άρθρα, μονογραφίες και διδακτορικές διατριβές για την έρευνά τους ή την εκπόνηση κάποιας εργασίας. Ένα μικρό ποσοστό είναι άνεργοι, συνταξιούχοι, επιχειρηματίες και υπάλληλοι που διενεργούν έρευνα από προσωπικό ή επαγγελματικό ενδιαφέρον.

Το ΟpenArchives.gr έχει αρκετούς σταθερούς χρήστες, καθότι το 82% το επισκέπτονται τουλάχιστον 2-3 φορές τον χρόνο, από τους οποίους, το 48,7% πάνω από 4 φορές το χρόνο. Το 42% έρχεται μέσω αναζήτησης στην Google, το 26% γιατί του το πρότειναν, το 14% μέσω απευθείας αναζήτηση και το 13% μέσω ανάρτησης σε κάποιον άλλο ιστοτοπο του ΕΚΤ.

Το ενδιαφέρον των χρηστών εστιάζει σε πολύ μεγάλο ποσοστό στις θεματικές ενότητες που άπτονται των ανθρωπιστικών και κοινωνικών επιστημών και των τεχνών ενώ το ενδιαφέρον για τις θετικές επιστήμες, το τις επιστήμες υγείας, την κτηνιατρική και τη γεωπονία κινείται σε ποσοστά κάτω του 15%. Η συντριπτική πλειοψηφία (88%) αναζητά κάτι συγκεκριμένο και μόλις ένα 11% επισκέπτεται την πύλη για να πλοηγηθεί γενικά στο περιεχόμενο.

Ένα 40% χρησιμοποιεί εκτός της απλής αναζήτησης, και τα προηγμένα φίλτρα αναζήτησης στην έρευνά του. Οι χρήστες δεν χρησιμοποιούν βοήθεια, αλλά δηλώνουν από αρκετά έως πολύ ευχαριστημένοι με τα αποτελέσματα της αναζήτησης (81%) και το 98% δήλωσε ότι θα το σύστηνε και σε άλλους.

Τα θετικά σχόλια και τα συγχαρητήρια ξεπέρασαν τις προσδοκίες μας “εξαιρετικά χρήσιμο, έχει λύσει τα χέρια στους ερευνητές”, “για τις εργασίες μου πάνω στον Ευγένιο Βούλγαρη, τον Αδαμάνδιο Κοραή και τον Ρίγα Βελεστινλή, έχω βρει πολυτιμότατα υλικά, που θα ήταν αδύνατο να τα βρω εδώ στη μακρυνή Χιλή”, "Έχει πλούσιο υλικό κι είναι πολύ καλά ενημερωμένο".

Με ενδιαφέρον αναλύουμε τις συστάσεις που έγιναν για τη βελτίωση της πύλης. Η έννοια του συσσωρευτή φαίνεται να μην είναι ακριβώς αντιληπτή από τους χρήστες, που σε μεγάλο ποσοστό θεωρούν ότι το ΟpenArchives.gr είναι ένα ψηφιακό αποθετήριο, γι' αυτό και η πιο τακτική σύσταση από τους χρήστες ήταν ότι θα ήθελαν να μπορούν να επιμερήσουν τα αποτελέσματα της έρευνας σε αυτά μόνο που έχουν ψηφιακό τεκμήριο και, ει δυνατόν, να έχουν απευθείας πρόσβαση στο ίδιο το ψηφιακό τεκμήριο.

Δήλωσαν ακόμη ότι θα ήθελαν πρόσβαση σε περισσότερο περιεχόμενο, πρόσβαση σε open datasets για data mining, να μπορούν να δουν τις δημοσιεύσεις ενός ερευνητή και να πλοηγηθούν με βάση τα θέματα, όπως και να γνωρίζουν "τί μένει απ' έξω” από τις διαθέσιμες επιστημονικές συλλογές. Ενδιαφέρον είχε τέλος, ότι 100 άτομα παραχώρησαν τα στοιχεία επικοινωνίας τους για να συμμετάσχουν σε πιο αναλυτική έρευνα, όπως μέσω κάποιου focus group.

Προδιαγραφές Διαλειτουργικότητας με το OpenArchives.gr

Καθότι ένας από τους κύριους στόχους είναι η συνεχής αύξηση του επιστημονικού περιεχομένου που εντάσσεται και καθίσταται αναζητήσιμο από το OpenArchives.gr, δημοσιεύθηκε πρόσφατα από το ΕΚΤ ο Οδηγός “Προδιαγραφές διαλειτουργικότητας για την προτυποποιημένη δημοσίευση επιστημονικών ψηφιακών πόρων και την ένταξή τους στο OpenArchives.gr”.

Ο Οδηγός απευθύνεται σε επιστημονικούς και ερευνητικούς φορείς, που επιθυμούν να εντάξουν το περιεχόμενο τους στο OpenArchives.gr. Ο Οδηγός περιλαμβάνει τις βασικές προδιαγραφές διαλειτουργικότητας και τεκμηρίωσης ψηφιακού περιεχομένου - μεταδεδομένων και ψηφιακών αρχείων - που οφείλουν να πληρούν τα ψηφιακά αποθετήρια, προκειμένου να επιτρέπουν την προτυποποιημένη διάθεση των συλλογών τους στην υποδομή συσσώρευσης OpenArchives.gr και το καθιστούν συμβατό με άλλους συσσωρευτές, όπως την ευρωπαϊκή υποδομή OpenAIRE, καθώς και τρίτα συστήματα και εφαρμογές που αξιοποιούν το ψηφιακό επιστημονικό περιεχόμενο για την παραγωγή νέας γνώσης.

Ο Οδηγός καλύπτει τις πλέον σύγχρονες καλές πρακτικές σε θέματα τεκμηρίωσης και διαλειτουργικότητας, όπως τους μοναδικούς προσδιοριστές, τα Διασυνδεδεμένα Δεδομένα και τη χρήση Ανοικτών Αδειών. Μέσα από την τήρηση ενιαίων προδιαγραφών διαλειτουργικότητας από τους φορείς διάθεσης του επιστημονικού περιεχομένου, επιτυγχάνεται η τεκμηρίωση και η διάθεση των αποτελεσμάτων της έρευνας σε εθνικό επίπεδο με πρότυπο τρόπο, γεγονός που αυξάνει την ευρεσιμότητα του περιεχομένου και την προβολή του διεθνώς, τη διαφάνεια στην επιστημονική διαδικασία, την επαληθευσιμότητα και την εγκυρότητα της έρευνας.

Συσσώρευση και διασύνδεση δεδομένων

Το ΕΚΤ διαθέτει μία ολοκληρωμένη υποδομή συσσώρευσης μεταδεδομένων μέσω της οποίας συλλέγει τα μεταδεδομένα των ψηφιακών επιστημονικών πόρων από τους ιστότοπους και τις πληροφοριακές υποδομές των φορέων που συμμετέχουν, και εφαρμόζει διαδικασίες μετασχηματισμού, κανονικοποίησης και σημασιολογικού εμπλουτισμού στα μεταδεδομένα. Στη συνέχεια, αυτά δημοσιεύονται στην πύλη OpenArchives.gr, η οποία προσφέρει στους χρήστες κεντρική πρόσβαση και προηγμένες λειτουργίες ενιαίας αναζήτησης και πλοήγησης στις ψηφιακές συλλογές που φιλοξενεί. Οι σελίδες τεκμηρίων του OpenArchives.gr προβάλλουν βασικά περιγραφικά μεταδεδομένα και παραπέμπουν τον χρήστη, μέσω υπερσυνδέσμων, στις αντίστοιχες σελίδες τεκμηρίων στους ιστοτόπους των φορέων, για πρόσβαση σε περισσότερες πληροφορίες, αλλά και για προβολή ή μεταφόρτωση των ψηφιακών αρχείων.

Το OpenArchives.gr διαθέτει δύο επιπρόσθετους τρόπους δημοσίευσης δεδομένων: μέσω Web API, το οποίο επιτρέπει σε τρίτες εφαρμογές να αναζητήσουν και να προβάλλουν τεκμήρια που φιλοξενούνται στο Συσσωρευτή, και ως Διασυνδεδεμένα Δεδομένα (Linked Data), συνεισφέροντας έτσι στον Παγκόσμιο Σημασιολογικό Ιστό. Η παρουσία των φορέων και των συλλογών τους, σε ένα κοινό σημείο προβολής και αναζήτησης, συμβάλλει στην ανάδειξη του περιεχομένου τους, αυξάνει τη πρόσβαση των χρηστών στις υποδομές τους και διευκολύνει τη διάδοση του έργου τους.

Προς έναν ψηφιακό δημόσιο χώρο για επιστημονικό περιεχόμενο

Η επέκταση του περιεχομένου και των λειτουργιών του OpenArchives.gr εντάσσεται αφενός στο πλαίσιο του θεσμικού ρόλου του ΕΚΤ, αλλά είναι και μέρος της πολύχρονης δράσης του που άπτεται της προώθησης της Ανοικτής Επιστήμης στη χώρα, στο πλαίσιο και των ευρωπαϊκών πολιτικών και της υποστήριξης της συγκρότησης του Ευρωπαϊκού Νέφους της Επιστήμης (European Open Science Cloud) μέσω του οποίου επιχειρείται η διασύνδεση και η διαλειτουργικότητα των υποδομών έρευνας όλων των κρατών μελών με την παράλληλη διαμόρφωση κουλτούρας ανοικτότητας στην έρευνα και την ενίσχυση των ψηφιακών δεξιοτήτων των ερευνητών.

Υλοποιώντας το όραμα για την Ανοικτή Επιστήμη, και μέσα από την ανάπτυξη ορισμένων εμβληματικών υποδομών, όπως το Εθνικό Αρχείο Διδακτορικών Διατριβών, τον Εθνικό Συλλογικό Κατάλογο Επιστημονικών Περιοδικών και τους συσσωρευτές επιστημονικού και πολιτιστικού περιεχομένου OpenArchives.gr και SearchCulture.gr αντίστοιχα, το ΕΚΤ, σε συνάφεια και με τους στόχους του Υπουργείου Ψηφιακής Διακυβέρνησης από το οποίο εποπτεύεται, αποσκοπεί στη δημιουργία ενός Ψηφιακού Δημόσιου Χώρου όπου το σύνολο του εθνικού ψηφιακού πολιτιστικού και επιστημονικού περιεχομένου διατίθεται με τους ελάχιστους δυνατούς περιορισμούς προς χρήση για παραγωγή νέας γνώσης από την ερευνητική, ακαδημαϊκή και εκπαιδευτική κοινότητα.

Η αναβάθμιση και επέκταση του OpenArchives.gr με νέες λειτουργικότητες, χρηματοδοτείται από την Πράξη “Εθνικό Πληροφοριακό Σύστημα Έρευνας και Τεχνολογίας: Εθνική Υποδομή Συσσώρευσης, Τεκμηρίωσης και Διάθεσης Ψηφιακού Περιεχομένου με διασφάλιση διαλειτουργικότητας, μακροχρόνιας διατήρησης και ανοικτής πρόσβασης” του Ε.Π. “Μεταρρύθμιση του Δημόσιου Τομέα”, η οποίο ολοκληρώνεται τον Ιούλιο του 2023.