Personal tools
A Network of Excellence forging the
Multilingual Europe Technology Alliance

META-NET White Paper Series: Press Release

Nejméně jednadvaceti evropským jazykům hrozí „digitální zánik“

Přední evropští experti v oboru jazykových technologií uveřejnili unikátní studii, ve které došli k závěru, že většina evropských jazyků pravděpodobně nepřežije nástup digitálního věku

Nová studie provedená předními evropskými experty na jazykové technologie varuje před zánikem většiny evropských jazyků v nastupujícím "digitálním věku". Vědci srovnali třicet z přibližně osmdesáti evropských jazyků podle úrovně podpory jazykových technologií, které se jim dostává. Měřítkem byla vyspělost jazykových technologií dostupných pro daný jazyk. Experti dospěli k závěru, že jednadvaceti z oněch třiceti jazyků se dostává přinejlepším rudimentární, spíše však vůbec žádné podpory jazykových technologií. Studie proběhla v rámci projektu META-NET. META-NET je evropské centrum excelence, které sdružuje 60 výzkumných center ve čtyřiatřiceti zemích.

Studie provedená více než dvěma sty expertů a dokumentovaná ve třiceti svazcích ediční řady Bílé knihy META-NET (dostupných jak v tištěné podobě, tak online) hodnotila úroveň podpory jazykových technologií pro každý jazyk ve čtyřech různých oblastech: strojový překlad, hlasové ovládání, analýza textu a dostupnost jazykových zdrojů. Celkem 21 z třiceti srovnávaných jazyků (tj. 70%) se propadlo do nejnižší kategorie, jež znamená slabou nebo nulovou podporu alespoň v jedné z kategorií. Několik jazyků, mezi nimi islandština, lotyština, litevština a maltština, dostaly nejnižší ohodnocení ve všech čtyřech kategoriích. Na druhém konci spektra se nachází angličtina v kategorii "dobrá úroveň podpory", následovaná nizozemštinou, francouzštinou, němčinou, italštinou a španělštinou, které mají "střední úroveň podpory". Žádný jazyk se ovšem nedostal do nejvyšší kategorie, "výborná podpora". Jazykům jako baskičtina, bulharština, katalánština, řečtina, maďarština a polština se dostává "fragmentární" podpory, což je řadí mezi vážně ohrožené jazyky. Čeština je na tom jen o málo lépe.

"Výsledky naší studie jsou nanejvýš alarmující. Většině evropských jazyků se nedostává dostatečné podpory a některé z nich jsou téměř systematicky zanedbávány. V tomto smyslu mnohé naše jazyky dosud nejsou způsobilé obstát v budoucnosti," říká profesor Hans Uszkoreit, koordinátor META-NETu, vedoucí výzkumu v DFKI (Německé výzkumné centrum pro umělou inteligenci) a spolueditor studie. Další spolueditor, doktor Georg Rehm (DFKI), dodává: "Co se týká podpory jazykových technologií, úroveň jednotlivých evropských jazyků a technologických oblastí se dramaticky liší. Přitom se neustále prohlubuje propast mezi 'velkými' a 'malými' jazyky. Musíme dosáhnout toho, aby všechny menší jazyky a jazyky s nedostatečnými zdroji byly vybaveny potřebnými základními technologiemi. Jinak budou tyto jazyky odsouzeny k digitálnímu zániku."

Oblast jazykových technologií produkuje software, který umí zpracovat psanou nebo mluvenou lidskou řeč. Jazykové technologie se používají například v dobře známých aplikacích, jako jsou automatická kontrola pravopisu a gramatiky, interaktivní osobní asistenti v chytrých telefonech (třeba Siri v iPhonu), dialogové systémy na telefonních linkách, automatické překladové systémy, webové prohledávače a syntetické hlasy používané v automobilových navigačních systémech. Dnešní jazykové technologie jsou založeny hlavně na statistických metodách. Ty vyžadují ohromné množství psaných nebo mluvených dat. Získat potřebné množství dat je velmi obtížné u jazyků s relativně malým počtem mluvčích. Kromě toho je kvalita dosaženého výsledku limitována už samotnou podstatou statistických metod, což je výborně vidět například na často komických překladech, které produkují automatické překladové systémy dostupné online.

Evropa úspěšně odstranila všechny hranice mezi svými zeměmi. Jedna hranice však dosud stojí a zdá se být neproniknutelnou: tou je neviditelná hranice jazykových bariér, která překáží volnému pohybu znalostí a informací. Ohrožuje také dlouhodobý cíl vytvoření jednotného digitálního trhu, protože brání volnému pohybu zboží, výrobků a služeb. I když jazykové technologie mají potenciál odstranit jazykové bariéry pomocí moderních automatických překladových systémů, výsledky studie META-NET jasně ukazují, že mnohé evropské jazyky na to ještě nejsou připravené. Jazykové technologie v mnoha jazycích pokulhávají zejména kvůli tomu, že většina výzkumu a vývoje se soustředí na angličtinu, kvůli nedostatku úsilí a finančních prostředků, a v neposlední řadě také kvůli nedostatku srozumitelné vize jak ve výzkumu, tak v aplikacích.

Evropa musí vyvinout koordinované a celoplošné úsilí k vytvoření chybějících technologií a jejich transferu do většiny jazyků. Je mnoho rozumných důvodů, abychom této zásadní výzvě čelili společným úsilím celé komunity, která zahrnuje jak Evropskou Unii, její členské státy a přidružené země, tak průmysl. Těmito důvody jsou především vysoká finanční zátěž per capita v případě menších jazykových společenství, potřebný technologický transfer mezi jazyky, nedostatečná interoperabilita zdrojů, nástrojů a služeb, jakož i skutečnost, že hranice jazykových společenství někdy nekopírují hranice politické. Evropa musí podniknout rozhodné kroky k vybavení svých jazyků pro nadcházející digitální věk. Naše jazyky jsou cennou součástí našeho kulturního dědictví, a zaslouží tedy být zachovány pro budoucnost, na kterou se teď musí adaptovat. Datum 26. září bylo vybráno Radou Evropy jako Evropský den jazyků, aby nám každoročně připomínalo důležitost národních jazyků jak z hlediska kulturního a jazykového dědictví, tak z hlediska dalšího rozvoje. Výsledek analýzy provedené konsorciem META-NET ukazuje jak nebezpečí, tak i možnosti plynoucí ze současného stavu pro evropské jazyky v době dominujících informačních technologií.

Jazykové technologie: základní přehled

Jazykové technologie nám už dnes pomáhají v každodenních úkolech, například při psaní e-mailů nebo nákupu jízdenek. Jazykových technologií využíváme, kdykoli hledáme nebo překládáme webové stránky, kdykoli použijeme automatickou kontrolu pravopisu nebo gramatiky v textovém editoru, kdykoli svým hlasem ovládáme přehrávač médií v autě nebo mobilní telefon, když si čteme doporučení dalších nákupů v internetových obchodech nebo nasloucháme instrukcím, které nám dává navigační systém. V blízké budoucnosti budeme schopni hovořit s počítačovými programy i stroji a zařízeními, jako například s toužebně očekávanými robotickými služebníky, kteří brzy vstoupí do našich domů a pracovišť. Ať budeme kdekoli, když budeme potřebovat nějakou informaci, prostě si ji vyžádáme, a když budeme potřebovat pomoc, zavoláme si o ni. Odstranění komunikační bariéry mezi lidmi a technikou změní náš svět.

Jazykové technologie jsou všeobecně uznávány jako jedna z klíčových oblastí růstu v informačních technologiích. Velké nadnárodní společnosti jako Google, Microsoft, IBM a Nuance do této oblasti rozsáhle investují. V Evropě se stovky malých a středních podniků specializují na různé aplikace a služby. Jazykové technologie lidem umožňují spolupracovat, poznávat, uzavírat obchody a sdílet znalosti přes hranice jazykových společenství a nezávisle na jejich počítačových dovednostech.

Série Bílé knihy META-NET

Série Bílých knih META-NET „Jazyky v evropské informační společnosti“ mapuje stav třiceti evropských jazyků s ohledem na jazykové technologie a pojmenovává nejnaléhavější rizika a témata k řešení. Série pokrývá všechny oficiální jazyky členských států EU a navíc několik dalších jazyků, kterými se v Evropě mluví. Třebaže už existuje velký počet hodnotných a vyčerpávajících vědeckých studií o různých aspektech problematiky jazyků a jazykových technologií, dosud zde nebylo žádné všeobecně srozumitelné shrnutí, které by prezentovalo nejdůležitější zjištění o současném stavu věcí a výzvách pro budoucnost technického zajištění mnohojazyčné Evropy. Právě tuto mezeru vyplňuje série Bílých knih META-NET. META-NET nyní ukazuje, proč má většina jazyků vážné problémy, a identifikuje nejzávažnější hrozby. Na vzniku Bílých knih jazyků se podílelo více než 200 autorů a přispěvatelů.

Bílé knihy byly napsány pro tyto jazyky: baskičtina, bulharština, katalánština, chorvatština, čeština, dánština, nizozemština, angličtina, estonština, finština, francouzština, galicijština, němčina, řečtina, maďarština, islandština, irština, italština, lotyština, litevština, maltština, norština (bokmål i nynorsk), polština, portugalština, rumunština, srbština, slovenština, slovinština, španělština a švédština. Každá Bílá kniha je psána v jazyce, o kterém pojednává, a obsahuje kompletní anglický překlad.

META-NET a META

META-NET, centrum excelence sdružující 60 výzkumných center z 34 zemí, se věnuje budování technologických základů mnohojazyčné evropské informační společnosti. META-NET je spolufinancován Evropskou Komisí v celkem čtyřech projektech.

META-NET vytváří instituci META (Multilingual Europe Technology Alliance). Do této otevřené technologické aliance se zapojilo více než 600 organizací z 55 zemí, včetně výzkumných center, univerzit, malých a středních společností i několika velkých podniků.