Πέμπτη 27 Σεπτεμβρίου 2012

Υπό ψηφιακή εξαφάνιση η ελληνική γλώσσα




Τουλάχιστον 21 ευρωπαϊκές γλώσσες, ανάμεσά τους και η ελληνική, αντιμετωπίζουν τον κίνδυνο της «ψηφιακής» εξαφάνισης, σύμφωνα με μελέτη Ευρωπαίων ειδικών της γλωσσικής τεχνολογίας. Πράγματι, η αυτόματη μετάφραση στα ελληνικά είναι τουλάχιστον διασκεδαστική και όταν μιλάμε στο Siri απαντά «It sounds Greek to me».

Περισσότεροι από 200 ειδικοί αξιολόγησαν για κάθε γλώσσα το επίπεδο ανάπτυξης της γλωσσικής τεχνολογίας σε τέσσερις διαφορετικές περιοχές: αυτόματη μετάφραση, φωνητική αλληλεπίδραση, ανάλυση κειμένου και διαθεσιμότητα γλωσσικών πόρων.
  • Γλώσσες όπως τα ελληνικά, αλλά και τα βασκικά, τα βουλγαρικά, τα καταλανικά, τα ουγγρικά και τα πολωνικά έχουν ‘αποσπασματική υποστήριξη’ και ως εκ τούτου ανήκουν στις γλώσσες υψηλού κινδύνου.
  • Στο άλλο άκρο της κατάταξης, μόνο η αγγλική αξιολογήθηκε ότι έχει «καλή υποστήριξη», ενώ δεν υπάρχει καμία γλώσσα με «άριστη υποστήριξη».
  • Ακολουθούν τα γαλλικά, τα γερμανικά, τα ιταλικά, τα ισπανικά και τα ολλανδικά με «μέτρια υποστήριξη».
Όπως σημειώνουν οι συγγραφείς της ελληνικής μελέτης Μαρία Γαβριλήδου, Μαρία Κουτσομπόγερα, Αναστάσιος Πατρικάκος και Στέλιος Πιπερίδης, «Τα ελληνικά είναι μία από τις γλώσσες με μικρό αριθμό ομιλητών και μικρό όγκο ψηφιακών γλωσσικών πόρων και τεχνολογιών. Η κρισιμότητα της ανάπτυξης της γλωσσικής τεχνολογίας για τα ελληνικά προβάλλει έντονα μόλις κανείς εξετάσει τι ακριβώς είναι και τι προσφέρει η γλωσσική τεχνολογία, τους τρέχοντες περιορισμούς της αλλά και τις τεράστιες δυνατότητες καινοτομίας.»

Τι είναι η γλωσσική τεχνολογία;

Η γλωσσική τεχνολογία παράγει λογισμικό που επεξεργάζεται τον προφορικό και τον γραπτό λόγο. Χαρακτηριστικά παραδείγματα λογισμικού γλωσσικής τεχνολογίας είναι οι ορθογραφικοί και συντακτικοί διορθωτές, οι διαδραστικοί προσωπικοί βοηθοί στα έξυπνα τηλέφωνα (όπως η Siri στο iPhone) τα διαλογικά συστήματα μέσω τηλεφώνου, τα συστήματα αυτόματης μετάφρασης, οι μηχανές αναζήτησης στο διαδίκτυο και η συνθετική φωνή σε συστήματα πλοήγησης στα αυτοκίνητα.

Η γλωσσική τεχνολογία μάς υποστηρίζει ήδη σε καθημερινές δραστηριότητες, όπως η συγγραφή ηλεκτρονικών μηνυμάτων ή η αγορά εισιτηρίων. Τα οφέλη της γλωσσικής τεχνολογίας είναι προφανή σε περιπτώσεις εφαρμογών με τις οποίες π.χ. αναζητούμε ή θέλουμε να μεταφράσουμε ιστοσελίδες, διορθώνουμε ορθογραφικά ένα κείμενό μας, χρησιμοποιούμε το σύστημα ψυχαγωγίας του αυτοκινήτου ή το κινητό μας τηλέφωνο με προφορικές εντολές, ή παίρνουμε οδηγίες που εκφωνούνται από μια εφαρμογή πλοήγησης. Στο άμεσο μέλλον θα είμαστε σε θέση να συνομιλούμε με υπολογιστικά προγράμματα, καθώς και με μηχανές και συσκευές, όπως τα πολυαναμενόμενα ρομπότ με τα οποία σύντομα θα συνυπάρχουμε καθημερινά στο σπίτι ή στη δουλειά. Όπου και να είμαστε, όποτε και να χρειαστούμε πληροφορίες ή άλλου είδους βοήθεια, απλώς  θα τις ζητούμε με τον πιο απλό τρόπο: τη γλώσσα μας.  Η κατάργηση των επικοινωνιακών φραγμών μεταξύ των ανθρώπων και της τεχνολογίας θα αλλάξει τον κόσμο μας.

Η γλωσσική τεχνολογία αναγνωρίζεται ευρέως στις μέρες μας ως σημαντικός χώρος ανάπτυξης των τεχνολογιών της πληροφορίας. Μεγάλες πολυεθνικές εταιρίες όπως η Google, η Microsoft, η IBM και η Nuance έχουν επενδύσει σημαντικά στον χώρο αυτό. Εκατοντάδες μικρομεσαίες επιχειρήσεις στην Ευρώπη εξειδικεύονται σε εφαρμογές ή υπηρεσίες γλωσσικής τεχνολογίας. Η γλωσσική τεχνολογία βοηθά τους ανθρώπους να συνεργάζονται, να μαθαίνουν, να οργανώνουν την επιχείρησή τους και να μοιράζονται τη γνώση πέρα από τα γλωσσικά σύνορα και ανεξάρτητα από την τεχνολογική κατάρτισή τους.

Τι συμβαίνει;

Τα σύγχρονα συστήματα γλωσσικής τεχνολογίας βασίζονται κυρίως σε στατιστικές μεθόδους που απαιτούν πολύ μεγάλες ποσότητες προφορικών και γραπτών δεδομένων. Ο απαραίτητος όγκος δεδομένων είναι πολύ δύσκολο να βρεθεί ή να δημιουργηθεί όταν πρόκειται για γλώσσες με σχετικά λίγους ομιλητές (η ελληνική ανήκει σε αυτές).

Επιπλέον, τα στατιστικά συστήματα γλωσσικής τεχνολογίας έχουν εγγενείς περιορισμούς ως προς την ποιότητά τους, κάτι που είναι εμφανές π.χ. στις –συχνά διασκεδαστικές– λανθασμένες μεταφράσεις που παράγονται από συστήματα μηχανικής μετάφρασης.

Σύμφωνα με τους Hans Uszkoreit και Georg Rehm, επιμελητές της μελέτης, «Τα αποτελέσματα της μελέτης μας είναι πολύ ανησυχητικά. Οι περισσότερες ευρωπαϊκές γλώσσες παρουσιάζουν μεγάλες ελλείψεις σε γλωσσικούς πόρους ενώ κάποιες από αυτές είναι τελείως παραμελημένες. Από αυτή την άποψη, είναι δύσκολο να διασφαλιστεί το ψηφιακό τους μέλλον. Υπάρχουν δραματικές διαφορές στην υποστήριξη της γλωσσικής τεχνολογίας ανάμεσα στις διάφορες ευρωπαϊκές γλώσσες και τεχνολογικές περιοχές. Το χάσμα μεταξύ ‘μικρών’ και ‘μεγάλων’ γλωσσών ολοένα και διευρύνεται. Πρέπει να εξασφαλίσουμε τον εφοδιασμό των μικρότερων και λιγότερο πλούσιων σε ψηφιακούς πόρους γλωσσών με τις απαραίτητες βασικές τεχνολογίες, αλλιώς οι γλώσσες αυτές είναι καταδικασμένες σε ψηφιακή εξαφάνιση.»

Η Ευρώπη έχει καταφέρει να άρει σχεδόν όλα τα σύνορα μεταξύ των χωρών της. Υπάρχει όμως ακόμη ένα σύνορο το οποίο φαίνεται αδιαπέραστο: οι γλωσσικοί φραγμοί εμποδίζουν την ελεύθερη ροή της γνώσης και της πληροφορίας. Καθυστερούν επίσης τον μακροπρόθεσμο στόχο μιας ενιαίας ψηφιακής αγοράς, καθώς παρακωλύουν την ελεύθερη διακίνηση των αγαθών, των προϊόντων και των υπηρεσιών.

Τι πρέπει να γίνει;

Αν και η γλωσσική τεχνολογία μπορεί να άρει τους γλωσσικούς φραγμούς μέσω των σύγχρονων συστημάτων μηχανικής μετάφρασης, τα αποτελέσματα της μελέτης του ΜΕΤΑ-ΝΕΤ δείχνουν ξεκάθαρα ότι πολλές από τις ευρωπαϊκές γλώσσες δεν είναι ακόμα έτοιμες. Υπάρχουν σημαντικά τεχνολογικά κενά που οφείλονται κυρίως στην εστίαση της έρευνας και της ανάπτυξης στην αγγλική γλώσσα, στην έλλειψη πολιτικής δέσμευσης και οικονομικών πόρων, αλλά και στην απουσία συγκεκριμένου ερευνητικού και τεχνολογικού οράματος.

Χρειάζεται μια συντονισμένη και μεγάλης κλίμακας ευρωπαϊκή προσπάθεια ώστε να καλυφθούν τα διαπιστωμένα κενά και να δρομολογηθεί η μεταφορά τεχνολογίας στις περισσότερες γλώσσες. Η πρόκληση είναι τεράστια και πρέπει να αντιμετωπιστεί συλλογικά, με τη συμμετοχή της ΕΕ, των κρατών μελών, των συνδεδεμένων χωρών και της βιομηχανίας. Στοιχεία της πρόκλησης είναι το μεγάλο κατά κεφαλή οικονομικό φορτίο για τις μικρότερες γλωσσικές κοινότητες, η απαιτούμενη μεταφορά τεχνολογίας μεταξύ των γλωσσών, η έλλειψη διαλειτουργικότητας των γλωσσικών πόρων, εργαλείων και υπηρεσιών, καθώς και το γεγονός ότι συχνά τα γλωσσικά σύνορα δεν συμπίπτουν με τα πολιτικά.

Η Ευρώπη πρέπει να αναλάβει δράση έτσι ώστε να υποστηρίξει τις γλώσσες της στο ψηφιακό περιβάλλον. Οι γλώσσες αποτελούν πολύτιμο συστατικό της πολιτιστικής μας κληρονομιάς και συνεπώς αξίζει να διασφαλίσουμε το μέλλον τους.

Η 26η Σεπτεμβρίου έχει καθιερωθεί από το Συμβούλιο της Ευρώπης ως η Ευρωπαϊκή Ημέρα Γλωσσών, ανάμεσα στους στόχους της οποίας είναι και η προώθηση της γλωσσικής και πολιτιστικής κληρονομιάς της Ευρώπης. Οι δράσεις του ΜΕΤΑ-ΝΕΤ στοιχίζονται απόλυτα με τις προκλήσεις και τις προοπτικές που αντιμετωπίζει η πολιτιστική μας κληρονομιά στην εποχή της πληροφορίας.

Η σειρά των Λευκών Βίβλων του META-NET

Η σειρά των Λευκών Βίβλων του META-NET «Γλώσσες στην Ευρωπαϊκή Κοινωνία της Πληροφορίας», καταγράφει το επίπεδο της γλωσσικής τεχνολογίας σε 30 ευρωπαϊκές γλώσσες και παρουσιάζει τις προοπτικές αλλά και τους άμεσους κινδύνους. Η σειρά καλύπτει όλες τις επίσημες γλώσσες των ευρωπαϊκών κρατών μελών και αρκετές άλλες γλώσσες που μιλιούνται στην Ευρώπη.

Διαβάστε την Λευκή Βίβλο για την Ελληνική Γλώσσα στην Ψηφιακή Εποχή

Αν και κατά καιρούς έχουν υπάρξει αρκετές αξιόλογες και περιεκτικές επιστημονικές μελέτες σε θέματα γλώσσας και τεχνολογίας, εντούτοις δεν έχει καταρτιστεί μέχρι στιγμής μια ευρέως κατανοητή παρουσίαση των κύριων ευρημάτων κάθε γλώσσας και των προκλήσεων που καλούνται να αντιμετωπίσουν σε σχέση με μια τεχνολογικά ενήμερη πολύγλωσση Ευρώπη. Η σειρά των Λευκών Βίβλων του META-NET έρχεται να καλύψει αυτό το κενό, καθώς εξηγεί γιατί οι περισσότερες γλώσσες αντιμετωπίζουν σημαντικά προβλήματα και επισημαίνει τις πιο κρίσιμες ελλείψεις.

Στην κατάρτιση των Λευκών Βίβλων συνεισέφεραν συνολικά πάνω από 200 ειδικοί.
Λευκές Βίβλοι έχουν καταρτιστεί για τις ακόλουθες ευρωπαϊκές γλώσσες: αγγλικά, βασκικά, βουλγαρικά, γαλικιανά, γαλλικά, γερμανικά, δανικά, ελληνικά, εσθονικά, ιρλανδικά, ισλανδικά, ισπανικά, ιταλικά, καταλανικά, κροατικά, λεττονικά, λιθουανικά, μαλτέζικα, νορβηγικά (μπουκμόλ και νινόρσκ), ολλανδικά, ουγγρικά, πολωνικά, πορτογαλικά, ρουμανικά, σερβικά, σλοβακικά, σλοβενικά, σουηδικά, τσεχικά και φινλανδικά. Κάθε Λευκή Βίβλος είναι γραμμένη στη γλώσσα στην οποία αναφέρεται και είναι μεταφρασμένη στα αγγλικά.

Σχετικά με το META-NET και το META

Το META-NET, ένα Δίκτυο Αριστείας που απαρτίζεται από 60 ερευνητικά κέντρα σε 34 ευρωπαϊκές χώρες, έχει ως στόχο να προάγει τα τεχνολογικά θεμέλια μιας πολύγλωσσης ευρωπαϊκής κοινωνίας της πληροφορίας. Συγχρηματοδοτείται από την Ευρωπαϊκή Επιτροπή μέσω τεσσάρων ερευνητικών έργων.

Το META-NET ίδρυσε την Σύμπραξη Τεχνολογίας για την Πολύγλωσση Ευρώπη (Multilingual Europe Technology Alliance – META). Περισσότεροι από 600 οργανισμοί (ερευνητικά κέντρα, πανεπιστήμια, μικρομεσαίες και μεγάλες επιχειρήσεις) από 55 χώρες έχουν ήδη γίνει μέλη της σύμπραξης αυτής.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου