16 ottobre 2012

Italiano e altre lingue europee sono a rischio di estinzione digitale. Studio del CNR e della Fondazione Bruno Kessler.

Due terzi degli idiomi dell’Ue potrebbero scomparire dalla rete, dove domina l’inglese. Lo rivela un’indagine dell’Ilc-Cnr nell’ambito della ricerca Meta-Net a cui hanno lavorato più di 200 esperti
L’italiano, come la maggioranza delle lingue europee, rischia di scomparire da Internet, anche se la sua presenza in rete è tutt’altro che marginale. A dirlo è il rapporto ‘La lingua italiana nell’era digitale’ dell’Istituto di linguistica computazionale del Consiglio nazionale delle ricerche di Pisa (Ilc-Cnr), parte della ricerca Meta-Net cui hanno lavorato più di 200 esperti.
«La percentuale di pagine web in italiano a livello mondiale - spiega Nicoletta Calzolari dell’Ilc-Cnr - è raddoppiata passando dall’1,5% nel 1998 al 3,05% nel 2005. È stato stimato che nel 2004 in tutto il mondo ci fossero 30,4 milioni di parlanti italiani online. Al di fuori dei confini dell’Unione Europea, parlano italiano 520.000 americani, 200.000 svizzeri e 100.000 australiani. Il numero di navigatori italiani negli ultimi cinque anni è però rimasto stabile, contrariamente il numero di quelli dei paesi in via di sviluppo aumenta notevolmente, cosicché la proporzione di coloro che parlano la nostra lingua subirà una forte diminuzione e potremmo andare incontro a un rischio di sotto-rappresentazione, specialmente in confronto all’inglese».
Secondo i dati raccolti dai ricercatori, la penetrazione del web in Italia si attesta al 51,7%, con 30 milioni di internauti (circa il 6,3% di quelli dell’Ue) su 58 milioni di cittadini: la loro crescita è stata del 127,5% tra il 2000 e il 2010.
Se questo è il quadro per la nostra lingua, possiamo immaginare quale sia per quelle che hanno un numero di parlanti molto inferiore. «Il dato è preoccupante - sottolinea Claudia Soria dell’Ilc-Cnr - perché dal momento che le tecnologie linguistiche usate in Internet si basano su approcci statistici, se i dati messi a disposizione in una lingua sono pochi, si innesta un circolo vizioso: pochi dati, tecnologie di bassa qualità, ulteriore limitazione dell’uso di quella lingua».
Lo studio condotto dall’Istituto Cnr e dalla Fondazione Bruno Kessler (Bernardo Magnini e Manuela Speranza) fa parte della ricerca Meta-Net cui hanno lavorato più di 200 esperti e documentata in 30 volumi della Collana di libri bianchi di Meta-Net (disponibile a stampa da Springer META-NET White Paper Series): «21 lingue su 30 analizzate si collocano al livello più basso, con un supporto digitale ‘debole o assente’ in almeno una delle aree tecnologiche prese in esame (correttori ortografici e grammaticali, assistenti personali interattivi su smartphones, sistemi di traduzione automatica, motori di ricerca, etc.)», spiega Soria. «L’islandese, il lituano, il lettone e il maltese ottengono questo voto per tutte le aree. Anche basco, bulgaro, catalano, greco, ungherese e polacco, con ‘supporto frammentario’, si collocano tra le lingue ad alto rischio. All’estremo opposto si trova l’inglese, seguito da olandese, francese, tedesco, italiano e spagnolo, con ‘supporto modesto’. Nessuna lingua, però, ottiene ‘supporto eccellente’».
«Sono risultati allarmanti - conclude Hans Uszkoreit, coordinatore di Meta-Net - e la maggior parte delle lingue europee non dispone di risorse sufficienti e alcune sono quasi completamente ignorate. Molte di esse non hanno futuro».
[Fonte: Ufficio Stampa CNR. Roma, 16 Ottobre 2012]




Nessun commento: