Personal tools
A Network of Excellence forging the
Multilingual Europe Technology Alliance

Norsk i den digitale tidsalderen (nynorskversjon) — Samandrag

Informasjonsteknologi påverkar kvardagen vår. Vi brukar datamaskiner når vi skriv, redigerer, reknar ut, søkjer etter informasjon, og i aukande grad også når vi les, høyrer på musikk, kikkar på bilete og ser på film. Vi har med oss små datamaskiner i lomma og brukar desse til å ringe, skrive e-post, innhente informasjon og til å underhalde oss sjølve kvar vi enn er. Men på kva måte verkar denne utstrakte digitaliseringa av informasjon, kunnskap og dagleg kommunikasjon inn på språket vårt? Vil språket vårt endre seg eller til og med forsvinne? Kva er sjansane for at norsk språk vil bestå?

Mange av dei 6000 språka som finst i verda i dag vil ikkje overleve i det globaliserte digitale informasjonssamfunnet. Ein reknar med at minst 2000 språk kjem til å forsvinne dei kommande tiåra. Andre vil framleis spele ei rolle i privatsfæren og lokalsamfunnet, men ikkje i det breiare offentlege liv som næringsliv og akademia. Statusen til eit språk avheng ikkje berre av talet på brukarar eller kor mange bøker, filmar og TV-stasjonar som nyttar språket, men også av i kor stor grad språket gjer seg gjeldande i den digitale verkelegheita og blir brukt i programvareapplikasjonar.

I denne samanhengen slit norsk framleis med veksesmerter. I byrjinga av det tjueførste hundreåret eksisterte norsk språkteknologi berre i svært liten skala. Det fanst eit relativt godt system for omsetjing frå bokmål og nynorsk, der var stavekontroll, og det fanst også eit lite dialogsystem som svarer på spørsmål, medan folk flest lo av den dårlege kvaliteten til dei første talegjenkjenningsprogramma. Eit ambisiøst industrielt initiativ til utvikling av språkteknologi på Voss mislykkast. Innan høgare utdanning fanst det program for språkteknologi og datalingvistikk, og det eksisterte forsking på desse felta, men det mangla språkressursar og språkverktøy.

Biletet endra seg då Forskingsrådet tok initiativ til eit språkteknologiprogram i 2002, med sikte på å utvikle ny kunnskap og nødvendige verktøy. Programmet resulterte i fleire prosjekt som skapte ny kompetanse og eit betre grunnlag for norsk språkteknologi. Dei største prosjekta i dette språkteknologiprogrammet leverte eit tekst-til-tale-system og ein demonstrator for omsetjing av høg kvalitet frå norsk til engelsk.

Etter Stortingsmeldinga frå 2008, og vedtaket av denne meldinga i Stortinget, vart ei fritt tilgjengeleg samling av norske språkteknologiske ressursar, Språkbanken, etablert i 2010. Språkbanken er no i gong med å byggje opp og distribuere norske språkdata, ei oppgåve som lenge har vore etterspurd innan forsking og utvikling. Dersom dette arbeidet blir halde ved like, vil det utgjere ei uvurderleg investering i framtida til det norske språket.

Trass ei betydeleg utvikling innan norsk språkteknologi det siste tiåret viser denne rapporten at det enno berre er for basisverktøy og -ressursar at situasjonen er nokolunde tilfredsstillande. Når det gjeld meir avanserte applikasjonar, finst det framleis svært få verktøy og ressursar for norsk, og vi har framleis langt igjen før norsk språk er sikra ei framtid som fullverdig aktør i det moderne – og framtidige – europeiske språksamfunnet.

Informasjons- og kommunikasjonsteknologien førebur seg no til neste teknologirevolusjon. I kjølvatnet av personlege datamaskiner, nettverk, stadig mindre og lettare komponentar, multimedia, mobile einingar og databehandling i digitale skyer, vil den neste generasjonen teknologi bestå av programvare som ikkje berre forstår talte og skrivne bokstavar og lydar, men også heile ord og setningar, og som støttar brukaren betre enn dagens teknologi, fordi han snakkar, kjenner og forstår språket deira. Forløparar i denne utviklinga er IBM si superdatamaskin Watson, som sigra over USA-meisteren i kunnskapsspelet “Jeopardy”, og Apple sin mobilassistent Siri for iPhone, som responderer på språkkommandoar og kan svare på spørsmål på engelsk, tysk, fransk og japansk. Eit norsk taleattkjenningssystem for iPhone er tilgjengeleg, men det er framleis mykje mindre påliteleg enn det tilsvarande engelske systemet.

Språkbrukarar kommuniserer allereie ved hjelp av teknologien som er utvikla for deira språk. Etter kvart vil teknologiske innretningar, som respons på enkle talekommandoar, vere i stand til å hente dei viktigaste nyhenda og informasjonen frå den globale digitale kunnskapsbasen. Språkbasert teknologi vil kunne omsetje automatisk eller fungere som støtte for tolkar, lage samandrag av samtaler og dokument og vere eit hjelpemiddel i læringssituasjonar. Språkteknologi vil til dømes kunne hjelpe innvandrarar med å lære norsk, og dermed også med integrering i det norske samfunnet. Informasjons- og kommunikasjonsteknologi vil gjere industrielle robotar og tenesterobotar (som i dag er under utvikling i forskingslaboratoria) i stand til å forstå kva brukaren ønskjer at dei skal gjere og til å rapportere om oppgåvene dei har utført. Eit slikt prestasjonsnivå strekkjer seg langt ut over enkle bokstavlister og leksika, stavekontrollar og uttalereglar. Skal språkteknologi kunne tolke spørsmål og levere utfyllande og relevante svar, må han bevege seg frå basale tilnærmingar til eit meir altomfattande perspektiv, der språkmodelleringa tek omsyn til syntaks så vel som semantikk.

Ikkje alle europeiske språk er like godt førebudde til ei slik framtid. Denne rapporten presenterer ei evaluering av graden av språkteknologistøtte for 30 europeiske språk, basert på fire kjerneområde: maskinomsetjing, taleprosessering, tekstanalyse og, til sist, basisressursar som er naudsynte for å kunne byggje språkteknologiske applikasjonar. Språka vart delte inn i fem klynger etter nivå, og ikkje overraskande hamna norsk i botnklynga, og i enkelte tilfelle i klynga over, for alle typar verktøy og ressursar. Norsk ligg langt etter større språk som til dømes tysk og fransk. Men ikkje ein gong desse språka klarer å nå opp til kvaliteten og dekningsgraden til samanliknbare ressursar og verktøy for engelsk, som er det klart leiande språket på nesten alle felt innan språkteknologi.

I St.meld. nr. 48 konstaterer ein at språkteknologifeltet kan verte “ein av dei fremste arenaene der kampen om norsk språk og kultur vil utspela seg i tida framover” (kap. 12.9, s. 196). Kva må vi så gjere for å sikre norsk språk ei framtid i informasjonssamfunnet? I 2002 anslo ei ekspertgruppe skipa av myndigheitene at det vil krevje ei investering på 20 millionar kroner kvart år dei første fem åra. Sjølv om Språkbanken no er etablert og verksam, er det eit faktum at dei årlege investeringane så langt har utgjort berre ein brøkdel av estimert behov. Det skulle difor ikkje komme som noka overrasking at norsk språkteknologi framleis heng att i tidleg barndom. Kommersielt er fem millionar språkbrukarar for få til aleine å forsvare ei kostbar utvikling av nye produkt. Norsk IT-industri, og spesielt store og mellomstore bedrifter, kan ikkje sjølve ta kostnadene ved å byggje opp store språkressursar og verktøy for norsk. Framleis offentleg støtte er nødvendig for å sikre at eksisterande verktøy og opparbeidd kunnskap og erfaring hos forskarar og bedrifter skal bli utnytta til fulle.

Norsk språk er ikkje umiddelbart trua av den engelske dominansen innan språkteknologi. Dette kan likevel endre seg drastisk når den nye generasjonen teknologiar tek til å meistre menneskeleg språk mykje betre, og meir effektivt, enn det dagens teknologi klarer. Gjennom utvikling innan maskinomsetjing vil språkteknologien på sikt medverke til å bryte ned språkbarrierar, men dette vil berre gjelde dei språka som er med på overgangen til eit digitalisert samfunn. Tilstrekkeleg og god nok språketeknologi kan sikre at språk med relativt små brukargrupper overlever. Som ein konsekvens er ei investering i språkteknologi ein essensiell del av språkpolitikken også i framtida.

META-NET sin visjon er å leggje til rette for språkteknologi av høg kvalitet for alle språk. Teknologien vil såleis støtte politisk og økonomisk fellesskap gjennom kulturelt mangfald. Den vil vidare bryte ned eksisterande barrierar og byggje bruer mellom europeiske språk. Dette inneber at alle interessentar – i politikk, forsking, næringsliv og samfunn – må foreine krefter for framtida.

Denne språkrapporten utgjer ein viktig del av META-NET sin strategiske handlingsplan. Oppdatert informasjon, som til dømes den siste versjonen av META-NET sitt visjonsskriv eller plan for forskingsstrategi (Strategic Research Agenda, SRA), er begge å finne på META-NET si nettside: http://www.meta-net.eu.