Personal tools
A Network of Excellence forging the
Multilingual Europe Technology Alliance

META-NET White Paper Series: Press Release

Ne mažiau nei 21 Europos kalbai gresia išnykimas skaitmeninėje erdvėje

Europos kalbos technologijų garsiausių ekspertų atliktas tyrimas perspėja – daugelis Europos kalbų greičiausiai neišgyvens skaitmeniniame amžiuje

Daugumai Europos kalbų tikriausiai yra lemta išnykti skaitmeninėje erdvėje – tokie yra naujausio Europos kalbos technologijų žymiausių ekspertų atlikto tyrimo rezultatai. Vertindami kalbos technologijų palaikymo, skirto 30 iš maždaug 80 Europos kalbų lygį, ekspertai padarė išvadą, kad 21 iš 30 šių kalbų skirtas skaitmeninių technologijų palaikymas „iš viso neegzistuoja“ arba, geriausiu atveju, jis yra „prastas“. Šį tyrimą atliko Europos meistriškumo tinklas META-NET, kurį sudaro 60 mokslinių tyrimų centrų, veikiančių 34 šalyse.

Tyrimo, kurį rengė daugiau nei 200 ekspertų ir kurio rezultatai buvo aprašyti trisdešimtyje META-NET tinklo baltųjų knygų serijos tomų (su šios serijos leidiniais galima susipažinti tiek internete, tiek popieriuje), metu buvo įvertintas kiekvienai kalbai skirtų kalbos technologijų lygis keturių aspektų – automatinio vertimo, šnekamosios kalbos sąveikos, teksto analizės ir turimų kalbos išteklių – požiūriu. Žemiausiai kategorijai, kurioje ekspertai bent vieną aspektą įvertino kaip „prastą arba neegzistuojantį“ buvo priskirta 21 iš 30 kalbų (70 proc.). Keleto kalbų, tokių kaip islandų, latvių, lietuvių ir maltiečių įvertinimas buvo prasčiausias visų aspektų požiūriu. Kitame skalės gale, nors, ekspertų nuomone, nė vienai kalbai nebuvo skirtas „puikus palaikymas“, tik vienintelė anglų kalba buvo įvertinta kaip turinti „gerą“ palaikymą kalbos technologijų prasme, na, o kalbos technologijų palaikymas tokių kalbų kaip olandų, prancūzų, vokiečių, italų ir ispanų buvo įvertintas kaip „vidutinis“. Su tokiomis kalbomis kaip baskų, bulgarų, katalonų, graikų, vengrų ir lenkų susijusių kalbos technologijų palaikymo lygis įvertintas kaip „fragmentiškas“ ir dėl to šios kalbos taip pat priskirtos itin didelę riziką patiriančių kalbų grupei.

„Mūsų tyrimo rezultatai kelia didžiulį nerimą. Daugumai Europos kalbų ženkliai trūksta išteklių, o kai kurios iš jų yra visiškai apleistos. Šiuo požiūriu daugelis kalbų nėra apsaugotos nuo jų ateityje laukiančių iššūkių“ ,– pareiškė prof. Hansas Uszkoreitis, META-NET tinklo koordinatorius, Vokietijos dirbtinio intelekto mokslinių tyrimų centro (DFKI) mokslinis direktorius ir vienas iš šio tyrimo redaktorių. Kitas redaktorius, dr. Georgas Rehmas (DFKI), pridūrė: „Skirtingoms Europos kalboms ir technologijų sritims skirto kalbos technologijų palaikymo lygis neįtikėtinai skiriasi. Spraga tarp „didelių“ ir „mažų“ kalbų ir toliau didėja. Turime užtikrinti, kad visoms mažesnėms ir nepakankamai išteklių turinčioms kalboms būtų sukurta joms reikalingų bazinių technologijų tam, kad jos neišnyktų skaitmeninėje erdvėje.“

Kalbos technologijų srityje kuriama programinė įranga, galinti paversti šnekamąją kalbą rašytine. Visiems gerai žinomi tokie kalbos technologijų programinės įrangos pavyzdžiai kaip rašybos ir gramatikos kontrolės programos, išmaniuosiuose telefonuose diegiamos interaktyvios pagalbinės programos (pavyzdžiui, telefone „iPhone“ įdiegta programa „Siri“), dialogo sistemos, veikiančios naudojantis telefonu, automatinio vertimo sistemos, internetinės paieškos sistemos ir sintetinio balso programos, diegiamos automobilių navigacijos sistemose. Šiandien kalbos technologijų sistemos visų pirma grindžiamos statistiniais metodais, kuriuos norint pritaikyti yra reikalingi neįtikėtinai dideli rašytinės arba šnekamosios kalbos duomenų kiekiai. Ypač sunku sukaupti reikalingą palyginti nedaug vartotojų turinčių kalbų duomenų kiekį. Be to, dėl statistinėms kalbos technologijų sistemoms būdingų savybių jų kokybė ne visuomet būna labai gera. Tai rodo dažnai pasitaikančios internetinių automatinio vertimo sistemų daromos juokingos klaidos.

Europa praktiškai panaikino visas ribas, skiriančias jos šalis. Tačiau vis dar egzistuoja vienas barjeras, kurio, atrodo, neįmanoma įveikti – tai nematomas kalbų barjeras, trukdantis laisvai keistis žiniomis ir informacija. Be to, jis kliudo siekti ir ilgalaikio tikslo sukurti vieningą skaitmeninę rinką, apsunkindamas laisvą prekių, produktų ir paslaugų judėjimą. Nors kalbos technologijos ir gali padėti panaikinti egzistuojančius kalbų barjerus (tam yra skirtos šiuolaikinės automatinio vertimo sistemos), META-NET tinklo atlikto tyrimo rezultatai aiškiai rodo, kad daugelis Europos kalbų tam dar nėra pasirengusios. Dėl to, kad didžioji dalis mokslinių tyrimų ir plėtros yra orientuota į anglų kalbą, dėl atsidėjimo ir finansinių išteklių trūkumo ir dėl to, kad nėra aiškios tyrimų ir technologijų vizijos.

Europa turi dėti koordinuotas, plataus masto pastangas, siekdama sukurti trūkstamas technologijas ir pritaikyti esamas technologijas daugumai kalbų. Egzistuoja svarių priežasčių pradėti spręsti šiuos klausimus visoje bendrijoje, visos Europos Sąjungos, valstybių narių, su jomis susijusių šalių ir pramonės mastu. Šios priežastys – tai didžiulė finansinė našta, tenkanti vienam gyventojui mažesnes kalbines bendruomenes turinčiose šalyse, būtinybė pritaikyti vienai kalbai skirtas technologijas kitoms kalboms, išteklių, įrankių ir paslaugų nesuderinamumas ir tai, kad kalbų barjerai nesutampa su politinėmis šalių sienomis. Europa turi imtis veiksmų, norėdama parengti savo kalbas skaitmeniniam amžiui. Kalbos – brangi mūsų kultūrinio paveldo dalis ir dėl to nusipelno būti išsaugotos ateičiai. Rugsėjo 26-ąją Europos Taryba pažymi Europos kalbų dieną, kuria pabrėžiama, kaip svarbu puoselėti ir plėtoti mūsų žemyno gausų kalbinį ir kultūrinį paveldą. META-NET tinklo atliekamas darbas primena visuomenei apie sunkumus ir galimybes, su kuriomis mūsų kalbinis paveldas susiduria informaciniame amžiuje.

Kalbos technologijos: bendrieji faktai

Jau šiandien kalbos technologijos padeda mums atlikti kasdienes užduotis, pavyzdžiui, rašyti elektroninius laiškus arba pirkti bilietus. Kalbos technologijomis naudojamės ieškodami tinklalapių arba juos versdami, tikrindami elektroninių dokumentų rašybą, balsu valdydami automobilio garso sistemą arba savo mobilųjį telefoną, skaitydami rekomendacijas internetiniame knygyne arba klausydami mobiliosios navigacinės programos nurodymų. Artimiausioje ateityje sugebėsime kalbėtis su kompiuteriais, aparatais ir prietaisais, tarp kurių bus ir ilgai lauktųjų robotų – tarnų, kurie anksčiau ar vėliau pasirodys mūsų namuose ir darbovietėse. Kad ir kur būsime, prireikus informacijos jos tiesiog paprašysime, prireikus pagalbos – pareikalausime jos žodžiu. Pašalinę žmones ir technologijas skiriantį bendravimo barjerą, pakeisime pasaulį.

Šiuo metu manoma, kad kalbos technologijos yra viena svarbiausių informacinių technologijų plėtros sričių. Didelės tarptautinės korporacijos – „Google“, „Microsoft“, IBM, „Nuance“ – į šią sritį yra investavusios nemažai lėšų. Šimtai Europos mažų ir vidutinių įmonių specializuojasi tam tikrose kalbos technologijų sferose, teikia atitinkamas paslaugas. Kalbos technologijos suteikia žmonėms galimybę bendradarbiauti, mokytis, dirbti ir dalytis žiniomis nepaisant kalbinių barjerų ir nepriklausomai nuo darbo kompiuteriu įgūdžių.

META-NET tinklo baltųjų knygų serija

META-NET tinklo baltųjų knygų serijoje „Kalbos Europos informacinėje visuomenėje“ pristatoma 30 Europos kalbų būklė kalbos technologijų požiūriu ir nurodoma aktualiausia rizika ir galimybės. Ši serija apima visas oficialiąsias valstybių narių kalbas ir keletą kitų kalbų, kuriomis kalbama Europoje. Nors yra atlikta tam tikrų kalbų ir technologijų aspektų vertingų ir išsamių mokslinių tyrimų, ligi šiol nebuvo parengta visiems suprantamo tekstų rinkinio, kuriame būtų pristatyti pagrindinės tokių tyrimų išvados ir sunkumai, su kuriais kalbos susiduria daugiakalbėje technologiškoje Europoje. Šią spragą ir užpildo META-NET tinklo baltųjų knygų serija. Dabar META-NET gali pademonstruoti, kodėl daugelis kalbų susiduria su rimtomis problemomis ir nurodyti didžiausią grėsmę keliančias spragas. Kalboms skirtas baltąsias knygas kurti padėjo daugiau nei 200 autorių ir bendradarbių.

Baltosios knygos yra skirtos šioms Europos kalboms: airių, anglų, baskų, bulgarų, čekų, danų, estų, galisų, graikų, islandų, ispanų, italų, katalonų, kroatų, latvių, lenkų, lietuvių, maltiečių, norvegų, olandų, portugalų, prancūzų, rumunų, serbų, slovakų, slovėnų, suomių, švedų, vengrų ir vokiečių. Kiekvienos kalbos Baltoji knyga parašyta ta kalba, kuriai ji yra skirta, be to, pristatomas viso knygos teksto vertimas į anglų kalbą.

Apie META-NET tinklą ir META aljansą

Meistriškumo tinklas META-NET, kurį sudaro 60 mokslinių tyrimų centrų, veikiančių 34 šalyse, yra skirtas kloti technologinius pamatus daugiakalbei Europos informacinei visuomenei kurti. Be kitų rėmėjų, META-NET tinklą keturių projektų kontekste finansuoja ir Europos Komisija.

META-NET kuria daugiakalbės Europos technologinį aljansą META. Prie šio atviro technologinio aljanso jau prisijungė daugiau nei 600 organizacijų iš 55 šalių, įskaitant mokslinių tyrimų centrus, universitetus, mažas ir vidutinio dydžio bendroves ir keletą didelių įmonių.