Riusciranno le lingue europee a superare l’era digitale?
Nell’articolo L’Islanda va alla guerra, abbiamo parlato del rischio d’estinzione che corre la lingua dell’isola nordica; ma è, purtroppo, in buona e numerosa compagnia. Infatti, un nuovo studio condotto dagli esperti di tecnologia linguistica leader in Europa avvisa che “la maggior parte delle lingue europee difficilmente sopravvivranno nell’era digitale”
Valutando il livello di supporto attraverso la tecnologia del linguaggio per 30 delle circa 80 lingue europee, gli esperti concludono che, nella migliore delle ipotesi, il supporto digitale per 21 delle 30 lingue esaminate è “inesistente” o “debole”. Per cui per 21 idiomi europei sono a rischio di estinzione digitale.
Lo studio Lingue europee nell’era digitale è stato realizzato da META-NET, una rete europea di eccellenza, composta da 60 centri di ricerca in 34 paesi, che lavorano sulle basi tecnologiche dell’Europa multilingue.
Lingue senza supporto tecnologico
Preparato da oltre 200 esperti e documentato in 30 volumi della collana di Libri Bianchi META-NET (disponibile sia online che in versione cartacea), lo studio valuta il supporto delle tecnologie linguistiche per ogni lingua in quattro aree diverse: la traduzione automatica, l’interazione vocale, l’analisi del testo e la disponibilità di risorse linguistiche. Il 70% delle lingue analizzate (21 su 30) si colloca al livello più basso, con “supporto debole o assente” per almeno una delle aree considerate. L’islandese, il lituano, il lettone e il maltese ottengono questo voto per tutte le aree. All’estremo opposto si trova l’inglese (“supporto buono”), seguito da olandese, francese, tedesco, italiano e spagnolo, con “supporto modesto”. Nessuna lingua ha un “supporto eccellente”. Lingue come basco, bulgaro, catalano, greco, ungherese e polacco mostrano un “supporto frammentario”, collocandosi nell’insieme delle lingue ad alto rischio.
I limiti della tecnologia linguistica
Il campo della tecnologia del linguaggio produce software in grado di elaborare il linguaggio umano parlato o scritto. Esempi ben noti di software di tecnologia linguistica includono correttori ortografici e grammaticali, assistenti personali interattivi su smartphone (come Siri su iPhone), sistemi di dialogo che funzionano al telefono, sistemi di traduzione automatica, motori di ricerca web e voci sintetiche utilizzate in auto sistemi di navigazione. Oggi i sistemi di tecnologia linguistica si basano principalmente su metodi statistici che richiedono una quantità enorme di dati scritti o parlati. Soprattutto per le lingue con relativamente poco diffuse è difficile acquisire la massa di dati necessaria. Inoltre, i sistemi di tecnologia del linguaggio statistico hanno limiti intrinseci nella loro qualità, come si può vedere, ad esempio, dalle traduzioni, scorrette spesso al limite del comico, prodotte dai sistemi di traduzione automatica online.
La barriera impenetrabile
L’Europa è riuscita a rimuovere quasi tutti i confini tra i suoi paesi, ma quello ancora esistente sembra impenetrabile: è il confine invisibile delle barriere linguistiche, quello che ostacola il libero flusso di conoscenza e informazione. Inoltre danneggia l’obiettivo a lungo termine di creare un mercato digitale unico perché ostacola il libero flusso di merci, prodotti e servizi. Mentre la tecnologia linguistica ha il potenziale per sbarazzarsi delle barriere linguistiche attraverso i moderni sistemi di traduzione automatica, i risultati dello studio META-NET mostrano chiaramente che molte lingue europee non sono ancora pronte. Ci sono delle lacune tecnologiche enormi, dovute al fatto che la maggior parte della ricerca e dello sviluppo si concentra sull’inglese e mancano impegno, risorse finanziarie e una chiara visione di ricerca e di sviluppo tecnologico.
Perché l’Unione Europea e l’industria lo devono fare
In Europa è necessario uno sforzo coordinato su larga scala per creare le tecnologie mancanti e trasferire la tecnologia alla maggior parte delle lingue. Vi sono forti ragioni per affrontare questa immensa sfida in uno sforzo comunitario che coinvolga l’UE, i suoi Stati membri e i paesi associati, nonché l’industria: l’elevato onere finanziario pro-capite per le comunità linguistiche più piccole; il necessario trasferimento di tecnologie tra le lingue; la mancanza di interoperabilità di risorse, strumenti e servizi; e il fatto che i confini linguistici spesso non coincidono con i confini politici.
Tecnologia linguistica: background
La tecnologia linguistica ci supporta già nelle attività quotidiane, come scrivere e-mail o acquistare biglietti; Approfittiamo della tecnologia del linguaggio durante la ricerca e la traduzione di pagine Web, utilizzando le funzioni di controllo ortografico e grammaticale del word processor, il sistema di intrattenimento della nostra auto o il nostro telefono cellulare con comandi vocali, consigli in un negozio online o seguendo le istruzioni pronunciate da un app di navigazione mobile. Nel prossimo futuro, saremo in grado di parlare con i programmi per computer e con macchine ed elettrodomestici, compresi i robot di servizio tanto attesi che presto entreranno nelle nostre case e nei posti di lavoro. Ovunque siamo, quando abbiamo bisogno di informazioni o aiuto, lo chiederemo semplicemente. La rimozione della barriera di comunicazione tra le persone e la tecnologia cambierà il nostro mondo.
La tecnologia linguistica rappresenta oggi una delle aree di crescita chiave nella tecnologia dell’informazione. Grandi società internazionali come Google, Microsoft, IBM e Nuance hanno investito sostanzialmente in questo settore. In Europa, centinaia di piccole e medie imprese si sono specializzate in determinate applicazioni o servizi di tecnologia linguistica. La tecnologia linguistica consente alle persone di collaborare, imparare, fare affari e condividere le conoscenze attraverso i confini linguistici, indipendentemente dalle loro competenze informatiche.
La Collana Libri Bianchi
La Collana Libri Bianchi META-NET “Le lingue dell’Europa nell’era digitale” fa il punto dello stato di 30 lingue europee rispetto alla tecnologia linguistica e spiega i rischi e le opportunità più urgenti. La collana copre tutte le lingue ufficiali degli Stati membri dell’UE e diverse altre lingue parlate in Europa. Sebbene ci siano stati una serie di studi scientifici validi e completi su alcuni aspetti delle lingue e della tecnologia, mancava un compendio, comprensibile a tutti, che presenti le principali scoperte e le sfide per ogni lingua rispetto a un’Europa multilingue supportata dalla tecnologia. La Collana dei Libri Bianchi colma questa lacuna. META-NET mostra perché la maggior parte delle lingue affronta problemi seri e individua le lacune tecnologiche più minacciose.
I Libri Bianchi, sono stati scritti per le seguenti lingue: basco, bulgaro, catalano, croato, ceco, danese, estone, finlandese, francese, galiziano, greco, inglese, islandese, italiano, lettone, lituano, maltese, norvegese (bokmål e nynorsk), olandese, polacco, portoghese, rumeno, serbo, slovacco, sloveno, spagnolo, svedese, tedesco e ungherese. Ogni Libro Bianco è scritto nella lingua di cui tratta e comprende una traduzione inglese completa.
A proposito di META-NET e META
META-NET è una rete di eccellenza composta da 60 centri di ricerca in 34 paesi, rivolta a costruire le basi tecnologiche di una società dell’informazione europea multilingue. META-NET è co-finanziata dalla Commissione Europea attraverso quattro progetti.
META-NET sta costruendo META, Multilingual Europe Technology Alliance. Più di 600 organizzazioni in 55 paesi (centri di ricerca, università, piccole e medie imprese, grandi industrie) si sono già unite a questa alleanza tecnologica.