Personal tools
A Network of Excellence forging the
Multilingual Europe Technology Alliance

META-NET White Paper Series: Press Release

Vähemalt 21 Euroopa keelt on digihääbumise ohus

Euroopa juhtivate keeletehnoloogia ekspertide uuring hoiatab meid, et enamus Euroopa keeltest ei pruugi digiajastul ellu jääda.

Euroopa juhtivate keeletehnoloogia ekspertide läbi viidud vastne uuring näitab, et enamikku Euroopa keeltest ootab eest digitaalne hääbumine. Hinnates umbes 80 Euroopas kõneldavast keelest kolmekümne keeletehnoloogilise toe taset, jõudsid eksperdid järeldusele, et 30 uuritud keelest 21 digitaalne tugi on “olematu” või paremal juhul “kehv”. Uurimuse viis läbi META-NET, 34 riigi 60 teaduskeskusest koosnev Euroopa tippteadmiste võrgustik.

Uurimuse koostamises osales üle 200 eksperdi ning tulemused on üllitatud META-NETi Valge Raamatu sarja 30 köites, mis on saadaval nii veebis kui trükituna. Sarja raportites hinnati iga keele keeletehnoloogilist tuge neljas valdkonnas: masintõlge, kõnetöötlus, tekstianalüüs ja keeleressursside olemasolu. Kolmekümnest keelest 21 (70%) puhul asetasid eksperdid vähemalt ühe valdkonna madalaimasse, “puuduliku toe” kategooriasse. Mitmed keeled, näiteks islandi, leedu, läti ja malta keel on saanud madalaima hinnangu kõigis neljas valdkonnas. Kuigi spektri teises otsas ei hinnatud ühtki keelt kõrgeimasse kategooriasse (“suurepärane tugi”) ja üksnes inglise keel loeti hinnangu “hea tugi” vääriliseks, järgnesid sellele “rahuldava toega” hispaania, hollandi, itaalia, prantsuse, saksa, jms keeled. Seevastu nii eesti keel kui näiteks baski, bulgaaria, katalaani, kreeka, poola ja ungari keeled omavad “osalist tuge”, mis asetab ka need ohustatud keelte hulka. Eesti keele suhtelist paremust võrreldes meie Baltimaadest naabritega võib seletada keeletehnoloogilise toe vajaduse teadvustamisega riiklikus eesti keele arengukavas, mille mõjul on juba alates 2006. aastast keeletehnoloogia riiklike programmide kaudu rahastatud valdkondlikku teadus- ja arendustegevust.

“Meie uuringu tulemused on äärmiselt murettekitavad. Enamusel Euroopa keeltest napib tõsiselt ressursse ja osad on peaaegu täiesti tähelepanuta jäänud. Selles mõttes pole paljud meie keeled veel oma tulevikku kindlustanud,” nendib professor Hans Uszkoreit, META-NETi koordinaator, DFKI (Saksa Tehisintellekti Teaduskeskuse) teadusdirektor ja üks Valge Raamatu sarja toimetajatest. Keeleraportite sarja teine toimetaja, dr. Georg Rehm (DFKI) lisab: “Erinevate Euroopa keelte ja tehnoloogiliste valdkondade lõikes on keeletehnoloogilise toe osas hämmastavaid erinevusi. Vahe “suurte” ja “väikeste” keelte vahel üha kasvab. Me peame tagama väiksematele ja vähemate ressurssidega keeltele esmatähtsad baastehnoloogiad, kuna muidu surevad need keeled digitaalsetena lihtsalt välja.”

Keeletehnoloogia valdkonnas luuakse tarkvara, mis suudab töödelda suulist ja kirjalikku inimkeelt. Teada-tuntud näited keeletehnoloogilistest rakendustest on õigekirja- ja grammatikakorrektorid, nutitelefonide interaktiivsed assistendid (näiteks iPhone’i Siri), telefoni teel kasutatavad dialoogiagendid, masintõlkesüs-teemid, otsingumootorid ja navigatsiooniseadmetes kasutatavad masinhääled. Kaasaegsed keeletehnoloogiasüsteemid toetuvad pigem statistilistele meetoditele, mis vajavad uskumatult suurtes kogustes teksti- ja heliandmeid. Vajalikku andmehulka on iseäranis väiksema kõnelejate arvuga keelte jaoks raske koguda. Statistiliste keeletehnoloogiasüsteemidega kaasnevad aga olemuslikud piirangud, mida näitlikustavad kenasti veebis kasutatavate masintõlkesüsteemide tihtipeale naljakadki väärtõlked.

Euroopal on õnnestunud kaotada pea kõik piirid oma liikmesriikide vahel. Üks piir on siiski jäänud ja see paistab olevat läbimatu: nähtamatu keelebarjäär tõkestab teadmiste ja info vaba levikut. Keelebarjäär takistab ka ühtse digitaalse turu teket, tuues raskusi kaupade, toodete ja teenuste vabale levikule. Kuigi keeletehnoloogial on potentsiaali ületada keelebarjääri kaasaegsete masintõlkesüsteemide abiga, näitavad META-NETi uurimuse tulemused selgelt, et paljud Euroopa keeled pole selleks veel valmis. Olulised puudujäägid tehnoloogias tulenevad valdava osa teadus- ja arendustegevuse keskendumisest inglise keelele, rahaliste vahendite vähesusest ning selge teadus- ja tehnoloogilise visiooni puudumisest.

Euroopal on vaja ühist suuremahulist pingutust, et luua enamiku keelte jaoks nii puuduolevad kui ka siirdetehnoloogiad. On mõjuvaid põhjusi, miks võtta see suur väljakutse ette kogu Euroopa Liitu, selle liikmesriike, liitunud riike ning ettevõtlust hõlmava ühiskondliku ettevõtmisena. Nende põhjustena võib mainida kulumahukust väiksema kõnelejate arvuga keelte puhul; keeltevahelise tehnoloogiasiirde vajadust; ressursside, rakenduste ja teenuste koostalitlusvõimetust; asjaolu, et sageli ei kattu keelepiirid poliitiliste piiridega. Euroopa peab midagi ette võtma, et valmistada oma keeled ette digiajastuks. Meie keeled on väärtuslik osa meie kultuuripärandist ja väärivad sellena tuleviku suhtes kindlustamist.

Keeletehnoloogia: taustaks

Keeletehnoloogia on juba osake meie igapäevaelust näiteks meilide kirjutamisel ja piletite ostmisel. Keeletehnoloogiast on abi veebist info otsimisel ja tõlkimisel, tekstiredaktori õigekirja- ja grammatikakontrollis, auto meelelahutusseadmete kasutamisel ja mobiiltelefonile häälkäskluste andmisel, veebiraamatupoe soovitusi või navigatsiooniseadme hääljuhiseid järgides. Lähitulevikus on võimalik kõnelda nii arvutiprogrammide kui masinatega, loomulikult ka kauaoodatud teenindusrobotitega, mis meie kodudesse ja tööpaikadesse jõuavad. Kus iganes me ka poleks, kui on vaja midagi teada saada, pruugib seda vaid küsida, ning kui abi vajame, võib seda häälekalt nõuda. Inimeste ja masinate vahelise suhtlusbarjääri eemaldamine muudab meie maailma.

Tänapäeval tunnustatakse keeletehnoloogiat laialdaselt ühe infotehnoloogia peamise kasvuvaldkonnana. Suured rahvusvahelised ettevõtted – Google, Microsoft, IBM ja Nuance on sellesse valdkonda teinud suuri investeeringuid. Euroopas on sajad väikese ja keskmise suurusega ettevõtted spetsialiseerunud kindlatele keeletehnoloogilistele rakendustele ja teenustele. Keeletehnoloogia võimaldab meil teha koostööd ja äri, õppida ja jagada teadmisi keelepiiridest ja arvutioskustest sõltumatult.

META-NETi Valge Raamatu sari

META-NETi Valge Raamatu sari “Keeled Euroopa infoühiskonnas” annab ülevaate 30 Euroopa keele olukorrast keeletehnoloogia vaatepunktist ning selgitab kõige olulisemaid ohte ja võimalusi. Sari hõlmab kõiki Euroopa Liidu ametlikke liikmesriikide keeli ja lisaks mõningaid muid Euroopas kõneldavaid keeli. Varem on küll ilmunud mitmeid väärtuslikke teadusuurimusi keelte ja tehnoloogia eri aspektidest, kuid siiani pole veel ühtegi ühtset avalikkusele arusaadavat ülevaadet iga keele olukorrast ning tehnoloogilise toe peamistest vajadustest mitmekeelse Euroopa vaatepunktist. META-NETi Valge Raamatu sari on mõeldud just selle lünga täitmiseks. Tänu üle-euroopalisele sarjale saab META-NET selgeks teha, miks on enamusel keeltest tõsiseid probleeme ja tuua välja kõige suuremad kitsaskohad. Keeleraportite sarja aitas koostada üle 200 autori ja kaastöötaja.

Valge Raamatu sari hõlmab järgmisi Euroopa keeli: baski, bulgaaria, eesti, galiitsia, hispaania, hollandi, horvaatia, iiri, inglise, islandi, itaalia, katalaani, kreeka, leedu, läti, malta, norra (nii bokmål kui nynorsk) saksa, soome, poola, portugali, prantsuse, rootsi, rumeenia, serbia, slovakkia, sloveenia, taani, tšehhi ja ungari. Iga keeleraport on kirjutatud keeles, mille kohta ta käib, ning sisaldab täiemahulist ingliskeelset tõlget.

Mis on META-NET ja META

META-NET on 34 riigis asuvast 60 teaduskeskusest koosnev tippteadmiste võrgustik, mille eesmärgiks on mitmekeelse Euroopa infoühiskonna tehnoloogiliste alustalade püstitamine. META-NETi kuulub neli Euroopa Komisjoni rahastatavat projekti.

META-NET edendab METAt - mitmekeelse Euroopa tehnoloogiaühendust, kuhu kuulub üle 600 asutuse 55 eri riigist. Selle avatud tehnoloogiaühendusega on juba ühinenud nii teaduskeskusi, ülikoole kui ka erineva suurusega ettevõtteid.