Η αξία των διασυνδεδεμένων δεδομένων έγκειται ακριβώς στις λογικές συσχετίσεις που μπορούν να προκύψουν μεταξύ διαφορετικών πηγών πληροφορίας που διατίθενται ανοικτά στο διαδίκτυο

Philip Archer

Σύμβουλος, World Wide Web Consortium (W3C)

Τεύχος 95 | Μάρ.-Μάιος 2014

Συνέντευξη

Ομιλητής του διεθνούς συνεδρίου του ΕΚΤ για την Ανοικτή Πρόσβαση ήταν ο Philip Archer, Σύμβουλο για την Ηλεκτρονική Διακυβέρνηση στο World Wide Web Consortium (W3C), ο οποίος πραγματοποίησε ομιλία με θέμα 'Linked Data - What' s the Point?'. Στη συνέντευξη που παραχώρησε στο ΕΚΤ, ο κ. Philip Archer μιλά για τα Ανοικτά Διασυνδεδεμένα Δεδομένα και αναλύει τη σημασία τους.

Τι είναι τα Ανοικτά Διασυνδεδεμένα Δεδομένα;

Πρόκειται για μία νέα μορφή του Παγκόσμιου Ιστού η οποία αντί για την ανταλλαγή αρχείων βασίζεται στη χρήση των δεδομένων και στην αξιοποίηση των λογικών συνδέσεων που μπορούν να γίνουν μεταξύ διαφορετικών συνόλων δεδομένων που διατίθενται ανοικτά στο διαδίκτυο. Με αυτό τον τρόπο και με τη χρήση σταθερών προσδιοριστών για τα δεδομένα, προσδίδεται μία "στρώση" ευφυΐας πάνω από τον Παγκόσμιο Ιστό, και μία σειρά από εργασίες που βασίζονται στη διασύνδεση των δεδομένων από πολλαπλές πηγές γίνεται πιο εύκολα, γρήγορα, αποτελεσματικά και με πιο δυναμικό τρόπο.

Γιατί είναι σημαντικό αυτό;

Φανταστείτε ότι η κυβέρνηση δημοσιεύει τη λίστα με όλες τις εταιρίες που δραστηριοποιούνται στην Ελλάδα ή τη λίστα με όλα τα άγρια είδη ζώων- αυτά είναι έγκριτες πηγές πληροφορίας. Δημοσιεύοντας τα δεδομένα ως διασυνδεδεμένα δεδομένα, οποιοσδήποτε μπορεί να τα αξιοποιήσει σε διαφορετικά περιβάλλοντα και σε εφαρμογές που προσδίδουν αξία στα δεδομένα. Η αξία των διασυνδεδεμένων δεδομένων έγκειται ακριβώς στις λογικές συσχετίσεις που μπορούν να προκύψουν μεταξύ διαφορετικών πηγών πληροφορίας που διατίθενται ανοικτά στο διαδίκτυο.

Πού βρισκόμαστε με τα Διασυνδεδεμένα Δεδομένα;

Ο ιδρυτής του Παγκόσμιου Ιστού Sir Tim Berners-Lee προτείνει ένα βαθμιδωτό μοντέλο 5 αστέρων για την πιστοποίηση των διασυνδεδεμένων δεδομένων-όσο πιο πολλά τα αστέρια τόσο πιο πολύ τα δεδομένα ανταποκρίνονται στις δυνατότητες του σημασιολογικού ιστού, της νέας "έξυπνης" εκδοχής του Παγκόσμιου Ιστού.

Τα δεδομένα παίρνουν ένα αστέρι εφόσον διατίθενται με μία ανοικτή άδεια στο διαδίκτυο, δύο αστέρια εφόσον διατίθενται ανοικτά και σε κάποια δομημένη μορφή, τρία αστέρια εφόσον η μορφή του αρχείου είναι ανοικτή, τέσσερα εφόσον τα δεδομένα αποτυπώνονται με τη χρήση της σημασιολογικής γλώσσας RDF (Resource Description Framework) και 5 αστέρια παίρνουν τα δεδομένα που διατίθενται ανοικτά, σε δομημένη μορφή και τα οποία διασυνδέονται με άλλα δεδομένα ή πηγές από το διαδίκτυο. Προϋπόθεση, ακόμη, είναι η διάθεση των δεδομένων με μία ανοικτή και τυποποιημένη άδεια χρήσης που επιτρέπει την απρόσκοπτη επανάχρηση των δεδομένων από τρίτες υπηρεσίες.

Το μοντέλο αυτό είναι ένας οδηγός για όποιον ενδιαφερόμενο επιθυμεί να βελτιώσει τον τρόπο που διαθέτει τα δεδομένα του στο διαδίκτυο ώστε να μπορέσει ο ίδιος και τρίτοι που χρησιμοποιούν τα δεδομένα, να αξιοποιήσουν πλήρως τις δυνατότητες του λεγόμενου σημασιολογικού ιστού.

Όσον αφορά την αξιοποίηση των Ανοικτών Διασυνδεδεμένων Δεδομένων, όπως προκύπτει από σχετική έρευνα που διεξήγαμε για λογαριασμό της Ευρωπαϊκής Επιτροπής προκύπτει ότι η αξιοποίηση των διασυνδεδεμένων δεδομένων έχει δημιουργήσει μία νέα σημαντική επιχειρηματική δραστηριότητα, βρισκόμαστε όμως μακριά από τη δήλωση της Επιτρόπου Neelie Kroes ότι τα ανοικτά διαθέσιμα δεδομένα είναι το πετρέλαιο της οικονομίας. Υπάρχουν φυσικά εταιρίες που στηρίζουν την οικονομική τους δραστηριότητα στην αξιοποίηση των δεδομένων. Στις περισσότερες περιπτώσεις, όμως, που εξετάσαμε, τα διασυνδεδεμένα δεδομένα φαίνεται να χρησιμοποιούνται για να γίνουν καλύτερα και ευκολότερα κάποιες από τις κυρίως δραστηριότητες ενός οργανισμού.

Πάρτε για παράδειγμα το legislation.gov.uk το οποίο δημοσιεύει ως ανοικτά διασυνδεδεμένα δεδομένα όλους τους νόμους του Ηνωμένου Βασιλείου από το 1967 και μετά. Κάθε νόμος δημοσιεύεται σε XML, δηλαδή σε ανοικτή και δομημένη μορφή. Τα μεταδεδομένα, ομοίως, είναι τεκμηριωμένα σε RDF γλώσσα. Μέσω ενός API (application programming interface) τα μεταδεδομένα και οι νόμοι διατίθεται σε τρίτες υπηρεσίες για χρήση.

Ερωτώμενος ο υπεύθυνος της υπηρεσίας απάντησε ότι επιλέχθηκε αυτός ο τρόπος δημοσίευσης γιατί είναι η μόνη τεχνολογία η οποία ανταποκρίνεται στους στόχους τους. Ανάγκη της υπηρεσίας είναι να μπορεί να συνδέει ένα μέρος μίας νομοθεσίας με κάποια τροπολογία η οποία την αντικαθιστά ή την ακυρώνει, και ο καλύτερος τρόπος να γίνει αυτό είναι με τα Διασυνδεδεμένα Δεδομένα.

Με τον ίδιο τρόπο το BBC, η Εθνική Βιβλιοθήκη της Γερμανίας ή ο Διεθνής Οργανισμός Τροφίμων και Γεωργίας χρησιμοποιεί τα Ανοικτά Διασυνδεδεμένα Δεδομένα, καταρχάς για να βελτιώσει τον τρόπο με τον οποίο δουλεύει ο ίδιος ο οργανισμός.

http://kainotomia.ekt.gr/issue/2014/95/#/30/