Michael Köhler: Wörterbücher sind meist schwere, eng bedruckte Verzeichnisse einer Sprache. Sie informieren über Schreibweise, Aussprache, Geschlecht, Grammatik, Bedeutung und Verwendung. Es sind aber auch Sprachschätze. Sie erklären Wortkarrieren und Begriffsgeschichten. Nur: Wörterbücher und Lexika scheinen von gestern zu sein. Sie verschwinden. An die Stelle der Bibliotheken sind in den Haushalten vermehrt Großbildschirme getreten. Für die Verlage sind herkömmlich gedruckte Wörterbücher kaum noch rentabel. Sie werden nicht fortgeführt, Belegschaften abgebaut.
Nun gibt es ein ehrgeiziges Projekt: ein "Zentrum für digitale Lexikographie der deutschen Sprache". Dort soll das größte deutsche Online-Wörterbuch erstellt werden. Die Wissenschaftsakademien in Berlin, Göttingen, Mainz, Leipzig sowie das "Institut für Deutsche Sprache" in Mannheim wollen den deutschen Wortschatz im größten digitalen Wörterbuch erfassen. Überlieferte Wörterbücher wie der "Grimm" etwa werden eingearbeitet. Das Projekt wird vom Bundesministerium für Bildung und Forschung zunächst für fünf Jahre gefördert. Auch Goethe-Instituts-Chef Klaus-Dieter Lehmann begrüßt das Projekt als digitale Fortsetzung der deutschen Wörterbuchtradition.
Alexander Geyken, den Arbeitsstellenleiter bei der Berlin-Brandenburgischen Akademie der Wissenschaften, habe ich gefragt: Was macht die Einführung eines "Zentrums für digitale Lexikographie der deutschen Sprache" erforderlich?
Alexander Geyken: Zunächst einmal muss man sagen: Der Gegenstand als solcher, nämlich die deutsche Sprache und insbesondere der Wortschatz der deutschen Sprache, nimmt ja nicht ab. Davon zeugen auch etliche solcher Wettbewerbe wie "das Wort des Jahres" oder "das Unwort des Jahres" oder der "Anglizismus des Jahres". Dies auf der einen Seite, auf der anderen Seite sind diejenigen Lexika – oder ich beschränke mich hier eher auf die Wörterbücher, nämlich die Großwörterbücher, diejenigen, die versuchen, umfassend unseren Wortschatz darzustellen – dass die in große Schwierigkeiten geraden sind. Und zwar ganz einfach dadurch, dass die Publikumsverlage die Absätze nicht mehr gefunden haben. Noch schlimmer erging es dem "Wahrig", also dem zweiten deutschen Vertreter der einsprachigen Großwörterbücher. Die mussten sogar ihre Belegschaft so weit reduzieren, dass schließlich das Angebot jetzt nur noch im Internet existiert, aber nicht mehr weiter aktualisiert wird.
Alte Wörterbücher werden eingebunden
Köhler: Alexander Geyken, worauf bauen Sie denn jetzt auf? Wir haben einerseits den Bestand an großen Wörterbüchern, die teilweise auch als Taschenbücher verkauft wurden oder digital – der Grimm wäre hier zu nennen. Es gibt so ein kleines Paradox: Kaum ist das Wörterbuch fertig, ist es auch schon veraltet. Das heißt: Sie bauen einmal auf dem Historischen auf, aber mit welchem Ziel und welcher Absicht tun Sie das?
Geyken: In der Tat fangen wir nicht von Null an, sondern die Akademien, die auch dieses Zentrum tragen werden, haben in ihrer Geschichte bereits große Wörterbücher erstellt, und diese werden eingebunden. Und das ist auch der Vorteil eines digitalen Systems: Diese Wörterbücher können eingebunden werden und sind dadurch auch für die Abfrage möglich und nutzbar. Das heißt also, dass wir zum einen mit großen Wortschatzsubstanzen bereits beginnen können. Und ein weiterer Teil des Zentrums besteht natürlich darin, dass diese Angaben konsolidiert werden sollen, also Inkonsistenzen zwischen den Substanzen sollen minimiert werden. Wir wollen ja fehlende Bedeutungen nachtragen oder auch neue Wörter aufnehmen und lexikografisch beschreiben.
Köhler: Das klingt nach einem ziemlich großen Projekt. Welche Instrumente der Beobachtung haben Sie?
Geyken: Das Projekt ist in der Tat recht groß, lässt sich aber in Zeiten von Big Data beziehungsweise der Verfügbarkeit von sehr vielen Texten leichter lösen. Unsere erste Aufgabe besteht darin, auf noch systematischere Art und Weise, als wir es bis jetzt getan haben, große Textmengen aufzubauen. Darunter kann man zum Beispiel die Belletristik, die Gebrauchsliteratur, die Wissenschaftsliteratur und natürlich auch die journalistische Prosa rechnen. In jüngerer Zeit kommt noch die Internetsprache hinzu. Nimmt man all dies, wird man mehrere Millionen Dokumente bekommen. Die auszuwerten, wird die große Kunst des Systems sein. Und dafür besitzen wir sehr effektive Verfahren, die es einem beispielsweise ermöglichen, Wortkarrieren nachzuzeichnen, indem man ihm aufträgt: "Wie oft ist in einem Jahr ist ein gewisses Wort vorgekommen und in welcher Textdomäne?", um daraus Schlüsse zu ziehen über die Veränderung des Wortschatzes.
Wie lange und wird ein Wort gebraucht - und wie?
Köhler: Das finde ich ein sehr gutes Beispiel, das wir zum Schluss noch mal stark machen müssen, denn ich hätte gerne gewusst, welchen Nutzen ich jetzt von diesem digitalen Lexikon habe, den ich vorher nicht hatte. Sie haben das Stichwort Wortkarrieren genannt. Mir fällt ein, dass vor 20 Jahren ein Begriff in die Arena geworfen wurde, der umstritten war und jetzt wieder aufgetaucht ist und eine sehr unterschiedliche Geschichte hat: zum Beispiel das Wort Leitkultur. Die Unwörter des Jahres sind zu nennen, die blitzen mal auf, dann werden sie wieder abgeblendet. Wie gehen Sie damit um?
Geyken: Traditionell gibt es in Wörterbüchern die Markierungen 'Neuprägung' oder 'veraltet' oder 'veraltend', die einem nur in sehr unspezifischer Weise Auskunft darüber geben, inwieweit ein Wort noch in Gebrauch ist beziehungsweise wann es in Gebrauch kam. In Bezug auf Wörter, die nur eine sehr kurze Karriere hatten, wie beispielsweise die "Abwrackprämie" oder der "Wutbürger", der sich allerdings noch etwas länger halten wird als die Abwrackprämie, ist es so, dass die Instrumente, mit denen wir arbeiten, genau nachzeichnen können, wann ein solches Wort in Gebrauch kam, wie stark es dann in Gebrauch blieb und über welche Zeit und ob es beispielsweise dann wieder abfällt. Ein Beispiel hierfür wäre das Wort "aufmüpfig", also im Sinne von aufsässig, das übrigens das erste Wort des Jahres war, das 1971 von der Gesellschaft für deutsche Sprache gekürt wurde. Dieses etablierte sich erst etwa so zehn Jahre danach, also in den 1980er-Jahren, erreichte dann einen Höhepunkt um das Jahr 2000 herum, ist aber auch jetzt, wenn auch etwas schwächer, immer noch belegt in den Textquellen. Eine solche Geschichte können Sie in einer Grafik darstellen, und wenn Sie dann die zugehörigen Quellen nachschlagen, ist das natürlich wesentlich auskunftsreicher als die bislang vorhandenen Markierungen wie 'veraltend', 'veraltet' oder 'Neuprägung'.
Äußerungen unserer Gesprächspartner geben deren eigene Auffassungen wieder. Der Deutschlandfunk macht sich Äußerungen seiner Gesprächspartner in Interviews und Diskussionen nicht zu eigen.