Personal tools
A Network of Excellence forging the
Multilingual Europe Technology Alliance

Die Deutsche Sprache im Digitalen Zeitalter — Vorwort

Die Sprache ist ein zentraler Bestandteil unserer Kultur und unserer individuellen Identität. Sie ist einem ständigen Wandel unterworfen, der ganz besonders von Entwicklungen der Kulturtechniken und dem Kontakt mit anderen Sprachen bestimmt wird. Noch nie in der Geschichte der Menschheit haben sich Technologien des täglichen Lebens und der Austausch zwischen den Völkern so radikal verändert wie in unserer Zeit. Wir sind die erste Generation, die Computer ganz normal im Alltag zum Schreiben, zum Lesen, zum Rechnen und zur Informationssuche einsetzt, aber auch zum Musikhören und zum Betrachten von Fotos und Filmen. In der Tasche tragen wir kleine Computer mit uns herum, mit denen wir telefonieren und korrespondieren, uns informieren und amüsieren, und das an jedem beliebigen Ort. Welche Bedeutung hat die Digitalisierung von Informationen, Wissen und Kommunikation für unsere Sprache? Wird sie sich ändern, wird sie irgendwann verschwinden?

Unsere Computer sind miteinander verbunden, ihr weltumspannendes Netz wird immer dichter und mächtiger. Das Girl in Ipanema, der Zöllner in Lindau und die Ingenieurin in Katmandu treffen ihre Freunde auf Facebook und dennoch werden sie sich in den Communitys und Foren untereinander nie begegnen. Wenn sie ein Ohrenschmerz beunruhigt, suchen sie in der Wikipedia nach möglichen Ursachen und lesen dennoch nicht denselben Artikel. Wenn die europäischen Netzbürger in Foren und Chaträumen die Konsequenzen des Fukushima-Unglücks auf die europäische Energiepolitik diskutieren, dann nach Sprachgemeinschaften getrennt. Was das Netz verbindet, trennen immer noch die Sprachen seiner Benutzer. Muss das so bleiben?

Die deutsche Sprache ist mit ihren fast 100 Millionen Sprechern im internationalen Vergleich gar nicht so schlecht aufgestellt. Es gibt eine große Zahl öffentlich-rechtlicher Fernsehsender mit deutschsprachigem Programm (Deutschland: 23, Österreich: 6, Schweiz: 4) sowie mehr als 50 private Free-TV-Sender. Die meisten internationalen Spielfilme werden nach wie vor für das Deutsche synchronisiert. Auch der lange schon totgesagte Buch- und Zeitschriftenmarkt ist auf hohem Niveau stabil.

Trotz eines international starken Rückgangs der Rolle des Deutschen ist die Sprache in Europa immer noch die am zweithäufigsten erlernte Fremdsprache. Auf Grund der besonderen Vorgeschichte der europäischen Integration im 20. Jahrhundert haben Deutschland und Österreich bisher nicht konsequent den Status für die deutsche Sprache in der Politik und Verwaltung der EU eingefordert, der ihr gemäß der Zahl ihrer Sprecher und der Unionsverträge zustehen würde. Diese Zurückhaltung brachte den deutschsprachigen Ländern nicht etwa Nachteile, sondern hat zu der seit Jahren beobachteten Imageverbesserung beigetragen.

Vielfach wird aber in den deutschsprachigen Ländern die schleichende Anglisierung des Deutschen prophezeit und beklagt. Hier gibt unsere Studie Entwarnung. Die deutsche Sprache hat die Unterwanderung durch die lateinischen und griechischen Begriffe der Wissenschaftssprachen überlebt wie auch die Französisierung im 18. und frühen 19. Jahrhundert. Dem Opfern schöner Wörter und Wendungen des Deutschen tritt man am besten durch deren häufige und bewusste Verwendung entgegen und nicht durch Polemik und Verordnungen. Unsere Hauptsorge sollte nicht einer schleichenden Anglisierung unserer Sprache gelten, sondern der Verdrängung des Deutschen in wichtigen Bereichen des Lebens. Hier sind nicht die Bereiche gemeint, die einer weltweiten lingua franca bedürfen, wie z.B. der Wissenschaft, der Luftfahrt und der globalen Finanzmärkte, sondern die Vielzahl von Lebensbereichen, in denen die Nähe zum Bürger wichtiger ist als die zu internationalen Partnern, wie Innenpolitik, Verwaltung, Kultur und Einzelhandel.

Der Status einer Sprache hängt nicht nur von der Zahl der Sprecher ab und der Menge von Büchern, Filmen und Fernsehsendern, sondern immer mehr auch von der Präsenz der Sprache im digitalen Informationsraum und den verfügbaren Softwareprodukten für diese Sprache. Auch hier stehen die Zeichen für das Deutsche nicht so schlecht. Alle wesentlichen internationalen Softwareprodukte sind in deutschen Versionen verfügbar. Die deutsche Wikipedia ist die zweitgrößte Wikipedia nach der englischen. Mit mehr als 14 Millionen Einträgen ist die Domäne .de das größte Länderkürzel der Welt.

Sprachtechnologisch ist das Deutsche derzeit auch gut durch Produkte und Ressourcen versorgt. Es gibt Programme für die Sprachsynthese, Spracherkennung, Rechtschreibkorrektur und die Grammatiküberprüfung. Die vielen Produkte zur maschinellen Übersetzung können allerdings bislang selten sprachlich korrekte Übersetzungen erzeugen, besonders bei Übersetzungen ins Deutsche, was zu einem großen Teil an den Eigenschaften unserer Sprache liegt.

Die Informationstechnologie steht vor einer Revolution. Nach Personalisierung, Vernetzung, Miniaturisierung, Multimedialisierung, Mobilisierung und Cloud-Computing kündigt sich eine Technologiegeneration an, die dem Menschen aufs Wort gehorcht und ihn durch Kenntnis seiner Sprache besser in Information und Kommunikation unterstützt. Vorboten dieser Entwicklung sind der Übersetzungsdienst Google Translate, der zwischen 57 Sprachen übersetzt, IBMs Supercomputer Watson, der als Quizchampion die amerikanischen Jeopardy-Meister schlug, und Apples mobiler Assistent Siri, der auf dem iPhone Fragen beantwortet.

Die nächste IT-Generation wird die menschliche Sprache beherrschen – zumindest soweit, dass der Mensch mit der Technologie in seiner Sprache kommunizieren und die Technologie automatisch die wichtigsten Informationen aus dem digitalen Wissen der Welt ziehen kann. Die sprachfähige Technik wird verlässlich übersetzen und dolmetschen können, sie wird Gespräche und Texte zusammenfassen und sie wird beim Lernen helfen. Zum Beispiel wird sie die Zuwanderer, die die deutschsprachigen Länder weiterhin benötigen werden, beim Erlernen der deutschen Sprache und bei der kulturellen Integration unterstützen.

Für diese Stufe der Technologie reichen aber Zeichensätze und Wörterbücher nicht aus, auch nicht Rechtschreibkorrektur und Ausspracheregeln. Wenn es um die Modellierung von Sprachverstehen geht und um die automatische Generierung von richtigen Fragen und Antworten, muss die Technologie die Sprache umfassender modellieren und über die Syntax hinaus bis zur Semantik vorstoßen.

Hier klafft nun aber ein Abstand zwischen dem Englischen und dem Deutschen, der derzeit größer wird und nicht kleiner. Nach erfolgreichen Forschungsanstrengungen in den achtziger und neunziger Jahren ist Deutschland dabei, seine führende Rolle in der Sprachtechnologie zu verlieren, die es neben dem englischen Sprachraum eingenommen hatte. Im Großprojekt Verbmobil, gefördert durch das Bundesministerium für Bildung und Forschung und die deutsche Industrie, wurden von 1993 bis 2000 Technologien entwickelt, die heute die Grundlage der automatischen Übersetzung bilden, auch der populären Google-Übersetzung. Danach wurde die Förderung stark zurückgefahren, denn die Förderpolitik braucht ständig neue Themen. Auf diese Weise haben Deutschland und ganz Europa bereits einige spannende Hi-Tech-Innovationen an die USA verloren, wo es nicht nur einen längeren Atem in der strategischen Forschungspolitik, sondern auch noch Kapital für die Vermarktung gibt. Im rasanten Wettlauf der technologischen Innovationen sichert einem der visionäre frühe Start nur dann einen Wettbewerbsvorteil, wenn man bis zum Ziel durchhält, ansonsten reicht es nur für die ehrenvolle Erwähnung in der Wikipedia.

Nach dem Rückgang der Sprachtechnologieforschung im deutschen Sprachraum sind viele Experten zur Kommerzialisierung der Technologien in die USA abgewandert und auch einige Spin-off-Firmen aus Verbmobil und anderen Projekten der achtziger und neunziger Jahre wurden bereits von US-Unternehmen gekauft. Dennoch ist das Forschungspotenzial hierzulande immer noch sehr hoch. Neben angesehenen Forschungszentren an und neben den Hochschulen gibt es eine Reihe innovativer kleiner und mittelständischer Sprachtechnologieunternehmen, die sich trotz Mangel an mutigem Kapital und entschlossener Forschungsförderung mit Mühe und Kreativität im Markt halten.

Zwar förderte Deutschland auch im letzten Jahrzehnt wichtige Entwicklungen in der Web- und Suchmaschinentechnologie, so z.B. im Großprojekt THESEUS, aber die deutsche Sprachtechnologie war hier nur marginal beteiligt, so dass die meisten Ergebnisse an Hand der englischen Sprache demonstriert werden.

Bei allen internationalen Technologievergleichen zeigt sich, dass die Ergebnisse für die automatische Analyse des Englischen viel besser sind als die für das Deutsche, auch wenn – oder vielleicht gerade weil – die Methoden ähnliche sind.

Viele Wissenschaftler schreiben diese Entwicklung dem Umstand zu, dass sich die Computerlinguistik und die Sprachtechnologieforschung seit Jahrzehnten mit all ihren Anwendungen hauptsächlich und zuallererst am Englischen versuchen. So wurden die Methoden und Algorithmen seit über fünfzig Jahren stetig dem Englischen angepasst. In einer kleinen ausgewählten Gruppe der führenden Konferenzen und Fachzeitschriften gab es 971 Publikationen zu Sprachtechnologien für das Englische (Zeitraum: 2008–2010). Mit nur 90 Publikationen kam das Deutsche immerhin noch auf Platz drei, deutlich überholt vom Chinesischen mit 228 Publikationen und gefolgt vom Spanischen und Französischen mit jeweils 80 bzw. 75 veröffentlichten Arbeiten.

Andere Wissenschaftler glauben, dass sich das Englische inhärent besser für die digitale Verarbeitung eignet. Auch Sprachen wie das Spanische und das Französische lassen sich mit den heutigen Methoden leichter verarbeiten als das Deutsche. In jedem Fall ist eine dedizierte, konsequente und nachhaltige Forschung nötig, wenn wir die nächste Generation der IT auch in Lebens- und Arbeitsbereichen nutzen wollen, in denen wir Deutsch sprechen und schreiben.

Fazit ist: Derzeit ist die deutsche Sprache entgegen aller Unkenrufe nicht in Gefahr. Auch im digitalen Raum und im Umgang mit der Technologie wird sie derzeit noch nicht vom Englischen verdrängt. Aber das kann sich sehr schnell ändern, wenn die Technologie in Kürze die menschliche Sprache beherrscht. Durch Fortschritte in der automatischen Übersetzung wird die Sprachtechnologie zur Überwindung der Sprachbarrieren beitragen, aber sie wird nur diejenigen Sprachen verbinden, die in der digitalen Welt überlebt haben. Wo sie vorhanden ist, kann die Sprachtechnologie auch kleineren Sprachen den Weiterbestand sichern – wo sie fehlt, kann selbst eine große Sprache unter Druck geraten.