Τεχνολογία|13.04.2020 11:41

Πανεπιστήμιο Αιγαίου: Νέο λογισμικό συμβάλλει στην προσπάθεια αντιμετώπισης του Covid-19

Βίκη Κουτρή

Το Τμήμα Μηχανικών, Οικονομίας και Διοίκησης (FME) του Πανεπιστημίου Αιγαίου δημιούργησε μια σειρά από διαδικτυακές υπηρεσίες με στόχο την καταγραφή της συνεχούς αυξανόμενης βιβλιογραφίας που αφορά μελέτες για τον ιό SARS-COV-2, στα πλαίσια της διε-επιστημονικής προσπάθειας που γίνεται διεθνώς για την αντιμετώπιση της πανδημίας COVID-19.

Το Εργαστήριο Intelligent Data Exploration and Analysis Laboratory-IDEAL (Εργαστήριο Ευφυούς Εξερεύνησης Δεδομένων και Ανάλυσης Δεδομένων-IDEAL) που αποτελεί τμήμα του ελληνικού περιφερειακού Πανεπιστημίου της χώρας μας επεξεργάστηκε και υλοποίησε την ηλεκτρονική εφαρμογή COVID-19 Open Data Set Challenge (CORD-19) συγκεντρώνοντας δημοσιεύσεις έγκυρων επιστημονικών περιοδικών καθώς και επίσημων ιατρικών μελετών αναπτύσσοντας, μία οργανωμένη βάση δεδομένων για τον παγκόσμιο ιστό. Το λειτουργικό της προαναφερόμενης εφαρμογής καθημερινά ανανεώνεται αυτόματα, με νέους αλγόριθμους που εμπλουτίζουν συνεχώς το εύρος της σχετικής θεματολογίας και μελέτης του COVID-19 παγκοσμίως και αποτελεί μία επιστημονική ηλεκτρονική τράπεζα πληροφοριών, οι υπηρεσίες της οποίας μπορούν ταχύτατα να δώσουν απαντήσεις σε πολλά ερωτήματα καθιστώντας την ένα δυνατό εργαλείο. Απευθύνεται σε γιατρούς, ερευνητές ή άλλους επιστήμονες-μελετητές σε όλο τον πλανήτη, περιορίζοντας -μέσω της καταγεγραμμένης βιβλιογραφίας- την παραπληροφόρηση η οποία είναι αναπόφευκτη σε τέτοιου είδους επείγουσες καταστάσεις και έχει σχέση με συμπτώματα, θεραπείες, εμβόλια κλπ.

Ο Νίκος Αμπαζής, Αναπληρωτής Καθηγητής του Πανεπιστημίου Αιγαίου και επικεφαλής του Εργαστηρίου Ευφυούς Εξερεύνησης Δεδομένων και Ανάλυσης Δεδομένων-IDEAL του Τμήματος Μηχανικών, Οικονομίας και Διοίκησης (FME) που φέρει την ευθύνη για την ανάπτυξη της εφαρμογής COVID-19 Open Data Set Challenge (CORD-19), μιλά στο ethnos.gr για τις δυνατότητες του λογισμικού που επεξεργάστηκε και υλοποίησε το ελληνικό περιφερειακό Πανεπιστήμιο της Χώρας μας για την αντιμετώπιση της πανδημίας COVID-19.

Πρόσφατα έγινε δημόσια διαθέσιμο στην επιστημονική κοινότητα ένα μεγάλο μέρος από την δημοσιευμένη βιβλιογραφία (σύνολο δεδομένων CORD-19) γύρω από τον νέο κοροναϊό COVID-19. Ποιο είναι το σκεπτικό της δημιουργίας του συγκεκριμένου συνόλου δεδομένων; Ποιος είναι περαιτέρω ο στόχος του και σε τι διαφέρει με κάποιο άλλο αντίστοιχο;

Στα πλαίσια της διε-επιστημονικής προσπάθειας που γίνεται διεθνώς για την αντιμετώπιση της πανδημίας ο Λευκός Οίκος και ένας συνασπισμός σημαντικών ερευνητικών ομάδων των ΗΠΑ, διέθεσαν στην επιστημονική κοινότητα το σύνολο δεδομένων COVID-19 Open Data Set (CORD-19). Το CORD-19 αποτελείται από περισσότερες από 47.000 επιστημονικές δημοσιεύσεις (συμπεριλαμβανομένων πάνω από 36.000 με διαθέσιμο το πλήρες κείμενο τους) σχετικά με την ασθένεια COVID-19, τον ιό SARS-CoV-2 και τους συναφείς κοροναϊούς. Αυτό το ελεύθερα διαθέσιμο σύνολο δεδομένων παρέχεται στην παγκόσμια ερευνητική κοινότητα για να εφαρμόσει τις πρόσφατες εξελίξεις στην επεξεργασία φυσικής γλώσσας και άλλες τεχνικές της τεχνητής νοημοσύνης (AI) ώστε να εξάγει, όσο το δυνατό συντομότερα και μέσω των δημοσιεύσεων αυτών, εμπεριστατωμένες νέες γνώσεις για την αντιμετώπιση της ασθένειας. Λόγω του τεράστιου όγκου των επιστημονικών δημοσιεύσεων σχετικά με την COVID-19, οι οποίες εμφανίζονται πλέον σε καθημερινή βάση, υπάρχει όλο και μεγαλύτερη ανάγκη για τέτοιου είδους προσεγγίσεις, καθώς διαφορετικά καθίσταται σχεδόν αδύνατη η συνεπής εξέλιξη της σχετικής έρευνας από την ιατρική κοινότητα.

Η διάθεση του CORD-19 γίνεται μέσω της πλατφόρμας Kaggle στα πλαίσια του COVID-19 Open Research Dataset Challenge. Στην πλατφόρμα Kaggle αναρτώνται ανοιχτοί διαγωνισμοί, όπου φορείς και εταιρείες θεσπίζουν χρηματικά βραβεία ώστε να αξιοποιήσουν τις γνώσεις των ερευνητών από όλο τον κόσμο, κυρίως γύρω από τον τομέα της ανάλυσης δεδομένων με σύγχρονες τεχνικές AI για την επίλυση κάποιου προβλήματος τους. Ένα πολύ ιδιαίτερο χαρακτηριστικό της πλατφόρμας Kaggle είναι ότι σε κάθε διαγωνισμό οι συμμετέχοντες μπορούν να διαθέτουν ελεύθερα τις προσεγγίσεις τους ώστε αυτές να αξιοποιηθούν συλλογικά και από άλλους συμμετέχοντες ώστε να βελτιωθούν περαιτέρω. Μάλιστα οι κώδικες των προτεινόμενων μεθόδων μπορούν να "τρέξουν” απευθείας στην πλατφόρμα του Kaggle. Στα πλαίσια του COVID-19 Open Research Dataset Challenge αυτή η ανοιχτή ανταλλαγή ιδεών είναι ακόμα πιο έκδηλη και αναγκαία σε αντίθεση με άλλους αντίστοιχους μεγάλους διαγωνισμούς όπου τα βραβεία που έχουν θεσπιστεί είναι συμβολικά.

Μελετώντας τους στόχους του COVID-19 Open Research Dataset Challenge διαπιστώνουμε την ύπαρξη 9 ενοτήτων/στόχων για τις οποίες αναζητούνται απαντήσεις. Τι ακριβώς περιλαμβάνουν οι ενότητες αυτές;

Τα κρίσιμα ερωτήματα του Challenge, όπως έχουν τεθεί από τον WHO και τους φορείς NASEM’s SCIED (National Academies of Sciences, Engineering, and Medicine’s Standing Committee on Emerging Infectious Diseases and 21st Century Health) έχουν διαχωριστεί στις εξής 9 ενότητες:

1) Τι γνωρίζουμε για τους τρόπους μετάδοσης, την επώαση και την περιβαλλοντική σταθερότητα του SARS-CoV-2; 2) Τι γνωρίζουμε για τους παράγοντες κινδύνου των ασθενών με COVID-19; 3) Τι γνωρίζουμε για τη γενετική του ιού, την προέλευση του και την εξέλιξη του; 4) Τι γνωρίζουμε σχετικά με τα εμβόλια και άλλες θεραπευτικές προσεγγίσεις; 5) Τι γνωρίζουμε σχετικά με τις μη φαρμακευτικές παρεμβάσεις; 6) Τι γνωρίζουμε για τη διάγνωση και την επιτήρηση της εξάπλωσης του κοροναϊού; 7) Τι έχει δημοσιευτεί για την ιατρική περίθαλψη; 8) Τι έχει δημοσιευτεί σχετικά με την δεοντολογία και την σύνδεση της διαχείρισης με τις κοινωνικές επιστήμες; 9) Τι έχει δημοσιευτεί σχετικά με την ανταλλαγή πληροφοριών και τις διεπιστημονικές συνεργασίες;

Κάθε ενότητα περιλαμβάνει ένα μεγάλο πλήθος από εξειδικευμένα ερωτήματα που σχετίζονται με τη θεματική περιοχή της.

Ποια είναι τα διαδραστικά εργαλεία που δημιούργησε το εργαστήριο σας με βάση το σύνολο δεδομένων CORD-19; Κάντε μας μια μικρή ανάλυση.

Αυτή τη στιγμή για να μπορέσει κάποιος να αξιοποιήσει άμεσα τις λύσεις που προτείνονται καθημερινά στο Kaggle ώστε να εξάγει γνώση από την βιβλιογραφία του SARS-CoV-2, θα πρέπει αφενός να είναι ειδικός στον τομέα της ανάλυσης δεδομένων και των αντίστοιχων μεθοδολογιών, αφετέρου θα πρέπει να είναι εξοικειωμένος με τον προγραμματισμό και την ανάπτυξη κώδικα. Το εργαστήριο μας, Intelligent Data Exploration and Analysis Laboratory (IDEAL), του Τμήματος Μηχανικών Οικονομίας και Διοίκησης, του Πανεπιστημίου Αιγαίου δραστηριοποιήθηκε άμεσα στην αξιοποίηση του συνόλου δεδομένων CORD-19 με τους εξής βασικούς στόχους: Πρώτον, να αξιολογεί σε τακτική βάση ποιές είναι οι περισσότερα υποσχόμενες προσεγγίσεις που προτείνονται σχεδόν καθημερινά στα πλαίσια του COVID-19 Open Research Dataset Challenge και να τις συνδυάσει με την δική του πολύχρονη εμπειρία στον τομέα της υπολογιστικής νοημοσύνης με στόχο να τις βελτιώσει περαιτέρω. Δεύτερον, με βάση αυτές τις προσεγγίσεις, να δημιουργήσει μια σειρά από διαδικτυακές υπηρεσίες για την διευκόλυνση της μελέτης και την εξαγωγή γνώσης από το σύνολο δεδομένων CORD-19 ώστε να τις θέσει άμεσα στη διάθεση οποιουδήποτε ενδιαφερόμενου.

Προς το παρόν έχουμε αναπτύξει τις εξής τρεις εφαρμογές:

α) Μια μηχανή ερωτήσεων/απαντήσεων όπου ο χρήστης μπορεί να θέσει οποιοδήποτε ερώτημα (σε φυσική γλώσσα) και να λάβει εμπεριστατωμένες απαντήσεις με βάση ενότητες από δημοσιευμένες εργασίες που ανταποκρίνονται στο ερώτημά του.

Μάλιστα στην τελευταία έκδοση της υπηρεσίας εντοπίζεται αυτόματα από το κείμενο και η μεθοδολογία που ακολουθεί η κάθε εργασία, με βάση συγκεκριμένα κριτήρια LOE (Epidemiology Level of Evidence) δηλαδή αν τα συμπεράσματα της προέρχονται από σωστά σχεδιασμένα πειράματα τυχαίων δειγμάτων, από μικρά δείγματα, κοκ

Η υπηρεσία αυτή είναι διαθέσιμη στη διεύθυνση: http://ideal.aegean.gr/covid19/discovery/qa.php

β) Ένα reporting tool που ανά τακτά χρονικά διαστήματα εξάγει αυτόματα μέσα από την βιβλιογραφία απαντήσεις σε όλα τα εξειδικευμένα ερωτήματα των 9 ενοτήτων. Αυτά τα reports είναι διαθέσιμα στη διεύθυνση: http://ideal.aegean.gr/covid19/#reports

γ) Μια υπηρεσία δυναμικής εξερεύνησης της έως τώρα δημοσιευμένης βιβλιογραφίας για τον SARS-CoV-2 και την ασθένεια COVID-19. Οι εργασίες έχουν ομαδοποιηθεί αυτόματα με βάση το περιεχόμενο τους για κάθε εργασία που επιλέγει ο χρήστης και το σύστημα αυτόματα του προτείνει άλλες σημασιολογικά παρόμοιες εργασίες. Περιλαμβάνει επίσης μια κλασική μηχανή αναζήτησης με βάση keywords αλλά και μια προηγμένη αναζήτηση η οποία ανακαλεί ολόκληρες εργασίες που σχετίζονται σημασιολογικά με ερωτήματα που θέτει ο χρήστης σε φυσική γλώσσα.

Η υπηρεσία αυτή βρίσκεται στη διεύθυνση: http://ideal.aegean.gr/covid19/discovery/

Κατά την προσωπική σας άποψη, θα μπορούσαμε να πούμε ότι οι εφαρμογές αυτές αποτελούν «εγχειρίδιο»; Λέτε ότι ένα «reporting tool» εξάγει αυτόματα απαντήσεις σε ερωτήσεις σχετικά με τον Sars-coV2 και τον COVIT-19. Αν και ακόμα βρισκόμαστε σε ερευνητικό στάδιο σχετικά με τη εξέλιξη της νόσου πως γνωρίζουμε ότι οι απαντήσεις δεν είναι fake news; Υπάρχει στις καταχωρήσεις επιστημονική αξιολόγηση;

Κύριος στόχος της ανάλυσης του CORD-19 είναι να εξαχθούν πολύ σύντομα απαντήσεις από τις επιστημονικές δημοσιεύσεις σε μια σειρά από κρίσιμα ερωτήματα όπως αυτά έχουν τεθεί από τον WHO και τους φορείς που ήδη αναφέραμε. Δεδομένου ότι οι απαντήσεις παράγονται αλγοριθμικά με βάση την δημοσιευμένη επιστημονική βιβλιογραφία αυτό σημαίνει πως δεν είναι αυθαίρετες αλλά υποστηρίζονται από τα ευρήματα των δημοσιεύσεων. Κατ΄ αυτόν τον τρόπο οι εμπεριστατωμένες -με βάση την βιβλιογραφία- απαντήσεις μπορούν να βοηθήσουν στο να περιοριστεί η παραπληροφόρηση, π.χ. για συμπτώματα, θεραπείες, εμβόλια κλπ, τα οποία είναι αναπόφευκτο να κυκλοφορούν σε τέτοιες επείγουσες καταστάσεις. Πρέπει βέβαια να σημειωθεί ότι πολλές από τις δημοσιεύσεις που περιλαμβάνονται στο σύνολο CORD-19 είναι προ-δημοσιεύσεις, δηλαδή δεν έχουν περάσει ακόμη από την τυπική διαδικασία της επιστημονικής κρίσης και αξιολόγησης που είναι ο ενδεδειγμένος τρόπος με βάση τον οποίο δημοσιεύονται οι επιστημονικές εργασίες υπό κανονικές συνθήκες.

Με ποιον τρόπο γίνεται η καταγραφή της βιβλιογραφίας και κάθε πότε ανανεώνεται;

Η καταγραφή των δεδομένων για το CORD-19 γίνεται από τους ιστοτόπους και υπηρεσίες "PubMed's PMC open access corpus", "BioRxiv and MedRxiv pre-prints" και "COVID-19 research articles maintained by the WHO". Είναι σημαντικό να τονιστεί ότι το σύνολο των δεδομένων CORD-19 δεν είναι στατικό αλλά ενημερώνεται εβδομαδιαίως καθώς νέες έρευνες η αναθεωρημένες εργασίες δημοσιεύονται σε μόνιμη βάση στους συγκεκριμένους ιστοτόπους. Ταυτόχρονα οι δικές μας εφαρμογές ανανεώνονται επίσης κάθε φορά που ενημερώνεται το σύνολο δεδομένων CORD-19, αλλά ως ερευνητικό έργο που βρίσκεται υπό εξέλιξη, καθημερινά δοκιμάζουμε νέες αλγοριθμικές προσεγγίσεις που βελτιώνουν την ποιότητα των αποτελεσμάτων.

Σε ποιους απευθύνονται αυτές οι υπηρεσίες / ποιοι μπορούν να καταθέσουν ερωτήσεις;

Οι υπηρεσίες απευθύνονται σε οποιονδήποτε ενδιαφέρεται να ενημερωθεί γύρω από θέματα (ιατρικά κατά βάση) που αφορούν στον κοροναϊό τα οποία έχουν αποτυπωθεί στη βιβλιογραφία και μας απασχολούν όλους, π.χ. ποια είναι τα συμπτώματα της ασθένειας, αν ασυμπτωματικοί ασθενείς μπορούν να την μεταδώσουν, πόσο διάστημα παραμένει ο ιός στις διάφορες επιφάνειες κλπ. Κυρίως όμως είναι σχεδιασμένες για χρήση από επαγγελματίες του χώρου της ιατρικής, της βιολογίας και άλλους ειδικούς που βρίσκονται στην πρώτη γραμμή της μελέτης της ασθένειας και της φροντίδας των ασθενών και οι οποίοι ενδιαφέρονται για απαντήσεις σε εξειδικευμένα επιστημονικά ερωτήματα που έχουν ως ειδικοί.

Pixabay

Ενδέχεται οι 9 ενότητες να εμπλουτιστούν στην πορεία με νέα ερωτήματα;

Το COVID-19 Open Research Dataset Challenge ως διαγωνισμός του Kaggle έχει ένα πολύ συγκεκριμένο στόχο βάσει του οποίου θα κριθούν οι προτεινόμενες λύσεις δηλαδή να εξαχθούν από την δημοσιευμένη βιβλιογραφία απαντήσεις μόνο στα ερωτήματα των συγκεκριμένων 9 ενοτήτων. Ο διαγωνισμός θα ολοκληρωθεί τον Ιούνιο και αυτή την στιγμή δεν υπάρχει πρόβλεψη οι προτεινόμενες λύσεις να κριθούν με βάση περαιτέρω ερωτήματα. Όμως όπως είναι εμφανές, παραδείγματος χάριν από την μηχανή ερωτήσεων/απαντήσεων που έχουμε αναπτύξει, οι προηγμένες τεχνικές ανάλυσης δεδομένων στην εξερεύνηση της σχετικής επιστημονικής βιβλιογραφίας της COVID-19, μπορούν να μας δώσουν απαντήσεις σε οποιοδήποτε ερώτημα απασχολεί ή θα απασχολήσει στο μέλλον την επιστημονική έρευνα δεδομένου ότι θα υπάρχουν δημοσιευμένα στοιχεία σχετικά με αυτό.

Υπάρχει εργαλείο που ενημερώνει επιτυχείς ή δοκιμασμένες θεραπείες για την ασθένεια COVID-19;

Το αν υπάρχουν επιτυχείς ή δοκιμασμένες θεραπείες για την ασθένεια COVID-19 προκύπτει μόνο με βάση όσων αναφέρονται στη σχετική βιβλιογραφία και τα στοιχεία αυτά μπορούν να αξιολογηθούν μόνο από τους ειδικούς οι οποίοι είναι σε θέση να κατανοήσουν την αξιοπιστία των ευρημάτων. Τα συστήματα που εμείς αναπτύσσουμε απλώς υποβοηθούν το έργο τους ώστε να μπορούν να εντοπίσουν άμεσα εργασίες που δυνητικά θα μπορούσαν να απαντήσουν στα ερωτήματα τους.

Θα υπάρξει σχετικό πεδίο με ποσοστά κρουσμάτων, ιάσεων ή θανάτων;

Αυτή τη στιγμή υπάρχει πληθώρα εργαλείων στο διαδίκτυο για την ανάκτηση και αποτύπωση σε πραγματικό χρόνο των στοιχείων αυτών όπως δίνονται από τις επίσημες αρχές και επομένως δεν απαιτείται η εξαγωγή αυτών των δεδομένων από τη δημοσιευμένη βιβλιογραφία του SARS-CoV-2.

Τι σημαίνει για ένα ελληνικό περιφερειακό Πανεπιστήμιο να έχει καταχωρήσει ηλεκτρονικά το δικό του «στίγμα» σε αυτή την προσπάθεια;

Η επιστημονική έρευνα αποτελεί ούτως ή άλλως έναν βασικό πυλώνα δραστηριότητας για όλα τα εκπαιδευτικά ιδρύματα του κόσμου, είτε είναι περιφερειακά είτε όχι και έχει πάντα ως βασικό κίνητρο την εξέλιξη της επιστημονικής γνώσης. Πόσο δε μάλλον όταν αφορά ένα παγκόσμιο πρόβλημα που έχει κοστίσει ανθρώπινες ζωές και έχει δημιουργήσει μια σειρά από πρωτοφανείς κρίσεις σε όλους τους τομείς των δραστηριοτήτων μας. Είναι ενθαρρυντικό ότι ο τομέας της εξειδίκευσης μας, δηλαδή αυτό που ονομάζουμε ευρύτερα AI, φαίνεται να μπορεί να συμβάλλει στην προσπάθεια που γίνεται παγκοσμίως αυτή τη στιγμή και ελπίζουμε ότι τα εργαλεία που αναπτύσσουμε και θα συνεχίσουμε να αναπτύξουμε στο μέλλον να μπορέσουν να αξιοποιηθούν στον μέγιστο βαθμό.

Πανεπιστήμιο ΑιγαίουCovid-19Κορονοϊός