Personal tools
A Network of Excellence forging the
Multilingual Europe Technology Alliance

META-NET White Paper Series: Press Release

Barem 21 europski jezik na rubu digitalnoga izumiranja

Istraživanje europskih vodećih stručnjaka iz jezičnih tehnologija upozorava kako većina europskih jezika najvjerojatnije neće preživjeti u digitalnome dobu

Većina je europskih jezika sučeljena s digitalnim izumiranjem – potvrđuje novo istraživanje europskih vodećih stručnjaka s područja jezičnih tehnologija. Proučavajući razinu potpore u jezičnim tehnologijama za 30 najvažnijih od otprilike ukupno 80 europskih jezika, stručnjaci su zaključili kako je digitalna potpora za 21 od 30 proučavanih jezika ili "nepostojeća" ili u najboljem slučaju "slaba i nedostatna". Proučavanje je provela META-NET, europska mreža izvrsnosti koja se sastoji od 60 istraživačkih središta u 34 zemlje.

Istraživanje je provelo više od 200 stručnjaka, a predstavljeno je u 30 svezaka u nizu Jezične bijele knjige META-NET-a (dostupne on-line i u tiskanome obliku). Istraženo je kolika potpora za jezične tehnologije u svakome od istraživanih jezika postoji u četiri različita područja: strojno prevođenje, govorna interakcija, analiza teksta i raspoloživost jezičnih resursa. Ukupno je 21 od 30 jezika (dakle, 70%) smješten u najnižu kategoriju: "slaba potpora ili njezina posvemašnja odsutnost" u bar jednome od navedena četiri područja. Nekoliko je jezika, npr. islandski, letonski, litavski i maltski, dobilo ovako nisku ocjenu u sva četiri istraživana područja. S druge strane skale, niti jedan jezik nije dobio ocjenu "izvrsna potpora", a jedino je za engleski dodijeljena ocjena "dobra potpora", a za njim su slijedili nizozemski, francuski, njemački, talijanski i španjolski s ocjenom "umjerena potpora". Jezici kao što su npr. baskijski, bugarski, katalanski, grčki, madžarski i poljski ocijenjeni su ocjenom "slaba potpora", a ona ih je smjestila među jezike s visokim rizikom digitalnoga izumiranja.

"Rezultati ovoga istraživanja iznimno su upozoravajući. Većina je europskih jezika u stanju ozbiljnoga nedostatka jezičnih resursa, a neki su gotovo u cijelosti zanemareni. U tome smislu, mnogi od naših jezika nisu spremni za budućnost.", rekao je prof. dr. Hans Uszkoreit, koordinator META-NET-a, znanstveni ravnatelj DFKI (Njemačko istraživačko središte za umjetnu inteligenciju) i suurednik niza bijelih knjiga koji donosi rezultate ovoga istraživanja. Drugi suurednik, dr. Georg Rehm dodaje: "Postoje dramatične razlike u potpori jezičnim tehnologijama za pojedine europske jezike kao i u tehnološkim područjima koja su za te jezike razvijena. Razdjelnica između 'velikih' i 'malih' jezika još se više produbljuje. Moramo osigurati da se za sve male i nedovoljno resursima poduprte jezike razviju neophodne temeljne jezične tehnologije. U protivnome tim jezicima prijeti digitalno izumiranje."

Na području jezičnih tehnologija stvaraju se računalni sustavi koji su kadri obrađivati govoreni ili pisani ljudski jezik. Općepoznati primjeri jezičnotehnoloških sustava su pravopisni i gramatički provjernici (spelling & grammar checkers), sustavi za govornu interakciju s mobitelima, sustavi za strojno prevođenje, www-tražilice, kao i sustavi za sintezu govora koji se pojavljuje pri navigaciji u vozilima. Današnje jezične tehnologije ponajprije počivaju na statističkim pristupima, a oni zahtijevaju nevjerojatno velike količine pisanoga ili govorenoga teksta. Osobito je teško pronaći potrebnu masu podataka za jezike s malim brojem govornika. Nadalje, statistički utemeljeni jezičnotehnološki sustavi ograničeni su u svojoj kvaliteti ukoliko nemaju dostatnu količinu ulaznih podataka – svima su poznati nerijetko zabavni primjeri loših prijevoda koje nude on-line sustavi za strojno prevođenje.

Europa je uspjela ukloniti gotovo sve granice između svojih zemalja, međutim, jedna vrsta granica još uvijek postoji i čini se kako će postojati i dalje. Naime, nevidljive granice između jezika ometaju slobodne tijekove znanja i obavijesti. One također štete dugoročnome cilju uspostavljanja zajedničkoga digitalnoga tržišta jer ometaju slobodni protok dobara, proizvoda i usluga. Dok jezične tehnologije pružaju mogućnost nadilaženja jezičnih prepreka kroz suvremene sustave za strojno prevođenje, rezultati META-NET-ove studije jasno govore kako mnogi europski jezici za to još nisu spremni. Uočeni su značajni nedostatci u tehnologiji, ponajprije zahvaljujući tome što se većina istraživanja do sada usredotočivala na engleski jezik, ali i zbog manjka tehnološke vizije, odluka relevantnih tijela u nekoj jezičnoj zajednici za podupiranje razvoja jezičnih tehnologija za svoj jezik, kao i same konkretne financijske potpore tome razvoju.

Na razini čitave Europe potreban je koordiniran i široko obuhvatan napor kako bi se izgradile nedostajuće tehnologije, ali i prenijela postojeća tehnološka znanja na druge jezike. Postoje ozbiljni razlozi da se pristupi tome ogromnome izazovu u obliku angažmana čitave zajednice, a on uključuje i Europsku uniju, njezine zemlje članice i pridružene zemlje, ali i industrijske partnere. Ti ozbiljni razlozi uključuju visoko financijsko opterećenje per capita za manje jezike; nedostatak međusobne uporabivosti jezičnih resursa, alata i servisa; ali i činjenicu kako se jezične granice ne podudaraju uvijek s političkima.

Europa mora poduzeti akcije kako bi pripremila svoje jezike za digitalno doba. Oni su vrijedna sastavnica našega kulturnoga naslijeđa i, već kao takvi, zaslužuju sigurnu budućnost. Svake godine 26. rujna Vijeće Europe obilježava Europski dan jezika, dan koji prepoznaje važnost skrbi o europskim jezicima i razvoju bogatoga jezičnoga i kulturnoga naslijeđa našega kontinenta. META-NET-ovo djelovanje pruža ozbiljno upozorenje o izazovima i mogućnostima s kojima će se naše jezično naslijeđe sučeliti u informacijskome dobu.

Podloga jezičnih tehnologija

Jezične nam tehnologije već pomažu u svakodnevnome životu pri npr. pisanju poruka e-pošte ili pri kupnji ulaznica. Jezične nam tehnologije pomažu i pri pretragama ili prevođenju www-stranica, pri uporabi pravopisnih i gramatičkih provjernika kod pisanja teksta, pri upravljanju automobilom ili mobitelom uporabom govora, pri dobivanju preporuka u on-line knjižarama ili pri praćenju govornih uputa u navigacijskim sustavima. U bliskoj ćemo budućnosti moći razgovarati sa svojim računalima kao i ostalim strojevima ili uređajima, uključujući i dugo očekivane uslužne robote čiji se ulazak u naše domove ili na radna mjesta predviđa. Gdje se god nalazili i kad god trebali neku obavijest, jednostavno ćemo za nju pitati služeći se svojim materinskim jezikom i nama najprirodnijim oblikom komunikacije – govorom. Kad budemo trebali pomoć, jednostavno ćemo ju glasno zatražiti. Uklanjanje komunikacijskih prepreka između ljudi i uređaja promijenit će naš svijet.

Jezične su tehnologije danas općenito priznate kao jedno od ključnih razvojnih područja informacijskih tehnologija. Velike međunarodne korporacije kao što su Google, Microsoft, IBM ili Nuance mnogo ulažu u ovo područje. U Europi postoji stotine malih ili srednjih poduzeća koja su se specijalizirala za neku izradu neke određene jezičnotehnološku aplikaciju ili pružanje kakve jezičnotehnološke usluge. Jezične tehnologije omogućuju ljudima da surađuju, uče, posluju ili dijele znanje nadilazeći jezične prepreke neovisno o svojim računalnim vještinama.

META-NET-ov Niz bijelih knjiga

META-NET-ov Niz bijelih knjiga »Jezici u europskome informacijskome društvu« izvješćuju o stanju jezičnih tehnologija za 30 europskih jezika i objašnjavaju neposredne rizike, ali i prilike. Niz pokriva sve službene jezike zemalja članica Europske unije i još nekoliko europskih službenih jezika, među kojima je i hrvatski. Premda je do nedavna bilo mnogo vrijednih i obuhvatnim znanstvenih proučavanja nekih vidova jezičnih tehnologija, nikad još do sada nije bilo ovakvoga vodiča razumljivoga svima koji predstavlja glavna postignuća i izazove za svaki pojedini jezik u nadolazećoj, tehnološki poduprtoj višejezičnoj Europi. META-NET-ov Niz bijelih knjiga popunjava tu prazninu. META-NET može kompetentno pokazati zašto se većina jezika sučeljava s ozbiljnim problemima i može ukazati na njihove najozbiljnije nedostatke. U priređivanju ovoga Niza bijelih knjiga o jezicima Europe ukupno je surađivalo preko 200 autora.

Ove bijele knjige su objavljene za sljedeće europske jezike: baskijski, bugarski, češki, danski, engleski, estonski, finski, francuski, galicijski, grčki, hrvatski, irski, islandski, katalanski, letonski, litavski, madžarski, maltski, nizozemski, norveški (bokmål i nynorsk), njemački, poljski, portugalski, rumunjski, slovački, slovenski, srpski, španjolski, švedski i talijanski. Svaka je bijela knjiga napisana na jeziku o kojem govori, a uključuje i potpuni prijevod na engleski.

O META-NETA-u i META-i

META-NET je mreža izvrsnosti, koja se sastoji od 60 istraživačkih ustanova iz 34 zemlje, a cilj joj je izgradnja tehnoloških temelja za europsko višejezično društvo. META-NET podupire Europska komisije putem četiriju projekata, a u jednome od njih sudjeluje i hrvatski partner Filozofski fakultet Sveučilišta u Zagrebu.

META-NET je pokrenula META-u (Multilingual Europe Technology Alliance) tj. višejezični europski tehnološki savez s članstvom koje se sastoji od više od 600 organizacija iz 55 zemalja, a uključuje istraživačke institute i centre, sveučilišta i fakultete, mala i srednja poduzeća kao i velika poduzeća i multinacionalne korporacije.