Personal tools
A Network of Excellence forging the
Multilingual Europe Technology Alliance

META-NET Strategic Research Agenda for Multilingual Europe 2020

Porozumenie bez hraníc: Európa bez jazykových bariér

Európska výskumná stratégia prekoná komunikačné bariéry, aby pripravila Európu na ďalšiu IT revolúciu

Európa čelí vážnej komunikačnej kríze. Informatórium META-NET-u Európske jazyky v digitálnom veku publikované v roku 2012 v 31 zväzkoch pre 31 európskych jazykov ukazuje, že väčšine týchto jazykov hrozí „digitálne vyhynutie“. Jazyky nie sú dostatočne technologicky podporované, aby prežili v digitálnom svete. Veľká jazyková rozmanitosť v Európe predstavuje dôležitú súčasť nášho kultúrneho dedičstva, no zároveň je prekážkou pri obchodovaní a ďalšej európskej integrácii. Napriek obrovským nákladom na prekladateľov je v súčasnosti vo všetkých európskych jazykoch dostupný len zlomok cenných informácií a občania nemôžu voľne diskutovať o zásadných otázkach kvôli jazykovým hraniciam. Príkladom môže byť komunikácia medzi Grékmi a Nemcami o finančnej kríze, ktorá sa uskutočňuje prostredníctvom miestnych médií a národných politikov, teda cez kanály, ktoré nie vždy vedú k vzájomnému porozumeniu. V čase, keď sociálne siete a internet ovplyvňuje politické rozhodovanie, by mohli nové komunikačné kanály priniesť EÚ viac osohu. Dáni nediskutujú s francúzskymi občanmi o výhodách a nevýhodách nukleárnych a fosílnych energetických zdrojov a ani občania EÚ v Stredomorí nevedú medzinárodný dialóg o možných dôsledkoch vzájomnej imigračnej politiky, do ktorého by sa mali zapojiť aj ich severní susedia.

Voľný tok informácií, myšlienok a obchodu pri zachovaní kultúrneho a jazykového bohatstva a rozmanitosti by v Európe mohla umožniť navrhovaná „bezbariérová“ komunikácia. Sieť excelentnosti META-NET pozostávajúca zo 60 výskumných centier z 34 krajín vytvorila Strategický výskumný program (Strategic Research Agenda – SRA), z ktorého vyplýva, že investície do jazykových technológií predstavujú značný ekonomický zisk zďaleka prevyšujúci prvotné náklady. V priebehu dvoch rokov tvorby prispeli k tomuto programu stovky jazykových a technologických odborníkov i iných zainteresovaných strán. Tento dokument bol sprístupnený a oficiálne prezentovaný zástupcom Európskej komisie, výskumu a priemyslu na technologickom sympóziu 25. januára 2013 v Berlíne v Nemecku.

SRA poukazuje na to, ako by mohla Európa svoju jazykovú a kultúrnu rozmanitosť využiť v svoj prospech. Komunita tvorcov jazykových technológií v Európe má na akademickej pôde i v priemyselnej sfére silné zastúpenie aj v oblasti multilingválnych technológií a je pripravená na vedenie nasledujúcej IT revolúcie zahŕňajúcej zmysluplné a plynulé sprostredkovanie ľudského jazyka, poznatkov a emócií. Hlasové vyhľadávanie Siri od firmy Apple alebo spoločnosti Google je len prvým krokom. Ľudský jazyk bude preferovaným prostriedkom komunikácie medzi ľuďmi a technológiami. Na uskutočnenie tejto vízie je potrebný softvér, ktorý by dokázal rozpoznať rôzne jazyky, služby a prostriedky, čím by sa vytvoril obrovský trh. Jazykové technológie napomáhajú digitalizovať ľudské poznanie nachádzajúce sa na webe a to obrovské množstvo textových dát (Big Data) bude sémanticky možné prehľadávať, analyzovať a využiť na tvorbu nových aplikácií.

SRA odporúča, aby sa v navrhovanom celoeurópskom výskumnom programe výskum a vývoj v akademickom a priemyselnom prostredí sústredil na tri prioritné oblasti:

  1. Prekladový cloud zabezpečí všeobecné a špecializované prekladateľské služby všetkým obyvateľom Európy, spoločnostiam a organizáciám. Tieto služby budú zahŕňať vysokokvalitné, presné a spoľahlivé technológie automatického prekladu pre hovorený i písaný jazyk, ako aj zaangažovaných prekladateľov a tlmočníkov pre tie úlohy, ktoré stroje samotné zvládnuť nedokážu.
  2. Oblasť sociálnej inteligencie a e-účasti (Social Intelligence and e-Participation) sa zameriava na rozvoj zdrojov a nástrojov na podporu porozumenia a dialógu vnútri jednotlivých komunít obyvateľov i medzi nimi navzájom, medzi zákazníkmi, klientmi a spotrebiteľmi. Umožňuje zapájanie sa prostredníctvom elektronických médií a zavádza efektívnejšie procesy na prípravu, selektovanie a vyhodnocovanie kolektívnych rozhodnutí.
  3. Oblasť sociálne uvedomelých interaktívnych asistentov (Socially Aware Interactive Assistants) sa sústreďuje na rozvoj všadeprenikajúcich digitálnych asistentov, ktorí sa učia, prispôsobujú a poskytujú proaktívnu a interaktívnu podporu podľa špecifických situácií, potrieb a cieľov používateľa prostredníctvom hovorenej jazykovej interakcie.

META-NET podporuje aj návrh a rozvoj Európskej servisnej platformy s cieľom poskytnúť používateľom a zákazníkom bezproblémové jazykové technológie.

„Európa nevyhnutne potrebuje na prekonanie jazykových bariér vysoko kvalitný softvér na strojový preklad pre všetky európske a hlavné neeurópske jazyky. Jazykové bariéry ohrozujú dlhodobý cieľ EÚ vytvoriť jednotný digitálny trh, pretože brzdia voľný tok poznania, informácií, tovaru, produktov a služieb,“ hovorí profesor Hans Uszkoreit, koordinátor META-NET-u a vedecký riaditeľ DFKI (Nemecké výskumné centrum pre umelú inteligenciu). Dr. Georg Rehm (DFKI), spoluautor Strategického výskumného programu a sieťový manažér META-NET-u k tomu dodáva: „Po nehode vo Fukušime v marci 2011 celá Európa diskutovala o výhodách a nevýhodách nukleárnej energie, avšak iba v rámci menších jazykových komunít: nikdy nedošlo k spoločnému celoeurópskemu rozhovoru! Technológie, ktoré podporujeme, umožnia Európe viesť podobné rozhovory napriek jazykovým hraniciam a dospieť tak k novej úrovni európskej identity medzi jej obyvateľmi.“

Vďaka koordinovanému, širokospektrálnemu úsiliu plánovanému až do roku 2020 sa môžu tieto technológie rozvíjať, chrániť budúcnosť európskych jazykov, poskytovať nové aplikácie a služby obyvateľom a vytvárať množstvo nových príležitostí pre európske informačné technológie a jazykový priemysel. Je zrejmé, že jednotlivé štáty nemôžu týmto výzvam čeliť samostatne, a to kvôli vysokému finančnému zaťaženiu jednotlivcov v menších jazykových komunitách, požadovanému prenosu technológií medzi jazykmi, nedostatoku vzájomného prepojenia zdrojov, nástrojov a služieb, a skutočnosti, že jazykové hranice sa často nezhodujú s politickými hranicami. Preto je potrebné, aby sa tejto výzve venovala Európska únia, jej členské štáty a pridružené krajiny v spolupráci s priemyselným sektorom. SRA poskytuje detailný plán, ako odpovedať na tieto výzvy tak, aby to bolo prínosné pre všetkých európskych občanov a zabezpečilo Európe prevzatie hlavnej úlohy vo svetovej ekonomike a na technologickom trhu.

Prehľad jazykových technológií

Jazykové technológie sú súčasťou nášho každodenného života. Využívame ich napr. pri písaní e-mailov alebo rezervovaní leteniek. Využívajú softvér, ktorý dokáže spracovať hovorenú aj písanú ľudskú reč. Sú užitočné pri hľadaní a prekladoch webových stránok, pri ovládaní zábavného systému v autách alebo mobilných telefónov hlasovými príkazmi, pri objednávaní tovaru online a pod. V blízkej budúcnosti budeme môcť pravdepodobne sami komunikovať s počítačovými programami a podobnými prístrojmi vrátane dlho očakávaných robotov, ktoré sa čoskoro objavia v našich domovoch a na pracoviskách. Ak potrebujeme získať informáciu, opýtame sa na ňu. Ak odstránime komunikačnú bariéru medzi ľuďmi a technológiami, môžeme zmeniť svet. Jazykové technológie umožňujú ľuďom spolupracovať, učiť sa, obchodovať a vymieňať poznatky napriek jazykových bariéram nezávisle od ich počítačových zručností.

Dnešné jazykové technologické systémy sa spoliehajú predovšetkým na štatistické metódy. Na ich trénovanie sú nevyhnutné neuveriteľne veľké objemy dát písanej a/alebo hovorenej reči. Zvlášť pre jazyk s relatívne málo hovoriacimi je ťažké zhromaždiť dostatočné množstvo dát. Navyše kvalita štatistických jazykových systémov nie je dostačujúca, čoho dôkazom sú aj často zábavné nesprávne strojové preklady. Avšak vďaka posledným vývojovým trendom sa tieto obmedzenia stanú minulosťou a jazykové technológie budú jednou z kľúčových IT oblastí. Veľké medzinárodné spoločnosti, ako napr. Google, Microsoft, IBM a Nuance, investovali do ich rozvoja nemalé financie. Európa disponuje bohatými technologickými, kultúrnymi a jazykovými skúsenosťami a existujú tu preto stovky malých a stredných podnikov, ktoré sa špecializujú na jazykové aplikácie alebo služby.

Napr. na Slovensku sa textové dáta a jazykové informácie spracúvajú v databázach Slovenského národného korpusu Jazykovedného ústavu Ľ. Štúra SAV (http://korpus.juls.savba.sk), kde je aktuálne k dispozícii vyše 2,5 miliardy textových jednotiek v rôznych písaných korpusoch (súčasný jednojazyčný, paralelné, historický), v Slovenskom hovorenom korpuse a v databázach jazykových zdrojov (slovníky, databáza morfologických tvarov).

O META-NET-e a META

Sieť excelentnosti META-NET tvorí v súčastnosti 60 výskumných centier z 34 krajín. Sieť je zapojená do niekoľkých projektov Európskej komisie a zároveň podporuje budovanie technologických základov multilingválnej európskej informačnej spoločnosti.

META-NET buduje META – Multilingválnu európsku technologickú alianciu, ktorá spojila viac ako 600 organizácií – výskumných centier, univerzít a súkromných firiem – z 55 krajín.