Archiv

Stimmforschung
Warum wir klingen, wie wir klingen

Die menschliche Stimme ist nicht nur genetisch geprägt. Auch das kulturelle Umfeld gibt ihr eine bestimmte Farbe. Unsere Herkunft hat sogar Auswirkungen darauf, bei welchen Stimmen wir besonders hellhörig werden – selbst wenn sie aus dem Navigationssystem kommen.

Von Bettina Mittelstrass |
    Ein geöffneter Frauenmund
    Ausdruck der Persönlichkeit: die Stimme. (dpa / picture alliance)
    "Wo ist die nächste Tankstelle?"
    "Ich habe mehrere Tankstellen gefunden... acht davon sind ziemlich in der Nähe von Dir."
    Eine freundliche Computerstimme gibt uns Ziele.
    "Nach Osten Richtung Württembergische Straße starten."
    Eine freundliche Stimme zeigt uns den Weg
    "...danach links abbiegen auf Württembergische Straße."
    Die Technik spricht mit uns - mit einfühlsamer Stimme, mit weiblicher oder männlicher Stimme, je nach Vorliebe des Nutzers, mit sanft autoritärer Stimme... denn wir sollen ja tun, was sie empfiehlt, wir sollen dem folgen, was sie sagt.
    "Ansagen, Durchsagen, denen man aber pragmatischerweise Folge leistet, das sind natürlich ganz stark Kultur prägende Stimmen."
    Sagt Stefan Willer, Professor für Kulturforschung an der Humboldt-Universität zu Berlin und stellvertretender Direktor am Zentrum für Literatur- und Kulturforschung Berlin.
    "Und natürlich geht es dann darum, wenn man solche Stimmen einsetzt, programmiert, Sprecherinnen und Sprecher aussucht, die in der U Bahn die Stationen ansagen oder sich dafür entscheidet, computergenerierte Stimmen zu verwenden, also dass man da sicherlich sehr genau darüber nachdenken muss und auch nachdenkt, welche Art von Stimme am besten operativ wirksam wird. Also welchen Stimmen man am liebsten Folge leistet."
    Dafür muss man wissen, wie "Stimme" funktioniert.
    "Was ist eine Stimme? Die Stimme wird artikuliert - darüber wissen wir einiges, die wird körperlich erstmal artikuliert und hervorgebracht. Darüber hat schon Humboldt sehr interessante Aussagen gemacht, die Artikulation des Sprechens, die eben eine physische Seite ist."
    Unsere Stimme: "natürlich künstlich"
    Der Erziehungswissenschaftler Christoph Wulf, Professor für Anthropologie und Erziehung an der Freien Universität:
    "Und dann gibt es ganz sicher eine kulturelle Seite, wie die Sprache angelegt ist. Im Französischen haben sie eine ganz andere Intonation als im Deutschen oder im Englischen. Noch anders ist es im Japanischen. Das sind kulturelle Prägungen der Stimme, die wir von vorne herein, bevor wir geboren werden, schon aufnehmen und denen wir folgen und in deren Rahmen wir uns entwickeln."
    Stimmen, die aus Lautsprechern oder technischem Gerät zu uns sprechen prägen noch nicht allzu lang Kulturräume - erst seit ihrer technischen Reproduzierbarkeit vor rund 100 Jahren. Heute allerdings umgeben sie uns permanent: Sie tönen im Auto, aus dem Handy, aus Radio, Fernseher, Computer. Sie sprechen uns auf dem Bahnhof an, im Kaufhaus, in der Service Center Warteschleife, auf öffentlichen Toiletten und am Ticketautomat - einfach überall. Wie sie zu uns sprechen, hat eine Wirkung - aber welche?
    "Es ist meines Erachtens längst noch nicht ausreichend untersucht, welche kulturellen und gesellschaftlichen Auswirkungen es mit sich bringt, dass wir eigene wie fremde Stimmen aufzeichnen können, dass wir die Stimmen von Toten konservieren und anhören können und dass wir schließlich stimmlich und akustisch mit Geräten, Apparaten interagieren."
    Doris Kolesch, Professorin an der Freien Universität Berlin, spricht durch ein Mikrofon und an ihrer Stimme hört man auch, dass sie nicht frei spricht, sondern vorliest - hier als Vortragende auf einer Tagung zum Thema "Stimme im Ausnahmezustand", die das Zentrum für Literatur und Kulturwissenschaften in Berlin organisiert hat. Das Ohr kann sehr viel und sehr schnell sehr differenziert hören, was für Informationen Stimme überträgt – noch wenig wissen wir darüber wissenschaftlich genau. Die Theaterwissenschaftlerin interessiert das und sie fragt danach, wie historisch geformt die menschliche Stimme ist.
    "Wir glauben, wir hätten die gleiche Stimme wären wir 100 Jahre früher geboren worden. Ich selbst glaube das nicht. Also ich glaube es vielleicht auch, aber meine Forschungen sagen mir eigentlich, dass ich es nicht glauben dürfte."
    Stimme ist, sagt Doris Kolesch, "natürlich künstlich" - geprägt von Technologie, kulturellen Techniken und medialer Vermittlung. Frauenstimmen in Deutschland zum Beispiel sind nachweislich tiefer geworden, geformt von sich verändernden Hörgewohnheiten, geformt von dem, was täglich aus den audiovisuellen Medien schallt.
    "Man kann es für Frauenstimmen ganz klar feststellen. Da gibt es auch Untersuchungen dazu, dass das, was noch aktuell in Stimmbildungsbüchern über die "normale" also durchschnittliche Stimmfrequenz von Männern und Frauen steht, dass das heute für unsere Gesellschaft nicht mehr stimmt. Die Zahlen, die da im Frequenzbereich von Frauen angegeben werden, haben sich deutlich nach unten gesenkt. Wie kommt das? Also wenn wir eine Brille aufhaben, habe ich den Eindruck, ist uns das schon stärker geläufig, diese Geformtheit des Körpers als bei der Stimme, die doch einfach durch die Art und Weise ihrer körperlichen Verfasstheit für uns immer in der Gefahr ist, so ein Hort des Natürlichen zu sein, sage ich jetzt mal vorsichtig."
    Stefan Willer: "Die Stimme ist kulturell unglaublich überformt"
    Wie sehr Stimmen historisch geprägt sind, machen frühe Tonaufzeichnung aus dem Deutschen Kaiserreich oder Tondokumente aus dem Nationalsozialismus deutlich. Die Qualität der technischen Aufzeichnung, das Rauschen und Knarren erzeugt ein Gefühl von Befremdung, aber die Technik ist es nicht allein, die "veraltet" ist, wenn man zum Beispiel die Stimme von Adolf Hitler hört.
    "Es gibt gleichzeitig auch einen bestimmten Habitus des Sprechens, eine bestimmte Form wie sich ein Herrscher darstellt oder wie sich ein Führer darstellt. Und das sind natürlich auch kulturelle Geschichten. Wir können das heute nicht mehr aushalten. Wir finden das lächerlich, abscheulich und wir können auch kaum noch verstehen, warum diese Stimme so viele Menschen fasziniert hat."
    Hitlers Stimme gehört heute zu einem akustischen kulturellen Gedächtnis, über das wir erst seit der Aufzeichnungstechnik verfügen können. Aber seit es dieses Archiv gibt, lässt sich eben auch an vielen Beispielen belegen, dass Stimme sehr viel mehr von historischer Zeit und Kulturraum geprägt ist, als man meinen könnte. Auf eine "natürliche Weise eigen" ist stimmlich eher wenig. Stefan Willer:
    "Die Stimme ist kulturell unglaublich überformt - gerade in Hinweisen auf "Finde Deine eigene Stimme" ist ja gesagt, dass man sie erst einmal kulturell ausfindig machen muss und mit bestimmten Techniken daran arbeiten, dass sie also besonders "eigen" klingt.
    Christoph Wulf:
    "Es ist sowieso ein Irrtum zu glauben, dass man Kultur und Natur unterscheiden kann. Wir sind von Anfang an kulturelle Wesen. Wir haben eine so große Plastizität unseres Gehirns, unseres Körpers, dass wir kulturell geprägt werden, und die Stimme prägt uns und wir werden natürlich auch im Sprechen und durch das Sprechen geprägt - etwa die Melodien oder den Dialekt, den wir als Kinder gehört haben, den wir übernehmen in mimetischen Prozessen."
    Stimme und Hören gehören zusammen, betonen die Wissenschaftler. Sie bedingen sich gegenseitig. Stimme geht ins Ohr. Und was wir an Stimmen hören, formt wiederum den stimmlichen Ausdruck. Am Zentrum für Allgemeine Sprachwissenschaft in Berlin, dem ZAS, versucht man im Phonetiklabor den Stimmeigenschaften genauer auf den Grund zu gehen. Gibt es eine Chance zu unterscheiden, was Erbe und was Umwelt in Bezug auf Stimme ist? Susanne Fuchs, wissenschaftliche Mitarbeiterin ZAS erläutert Untersuchungen einer Kollegin mit Zwillingen. Versuchspersonen sollten hören und einschätzen, wie genetisch verwandt die Sprecher sind.
    "Was würden Sie jetzt schätzen? Sind das dieselben oder nicht? Also ist das ein eineiiges Zwillingspaar oder ein zweieiiges Zwillingspaar?"
    "Was bei beiden herauskommt: Unabhängig von der Genetik ist es so, dass Zwillinge sich nicht unterscheiden lassen. Also sie können zweieiige Zwillinge genau so wenig unterscheiden wie eineiige Zwillinge, obwohl eineiige Zwillinge in ihrer Genetik mehr oder weniger gleich sind und zweieiige Zwillinge so 50 Prozent ungefähr genetisch ähnlich sind."
    Die Macht des Gesangs
    Mit anderen Worten, auch zweieiige Zwillinge, passen sich stimmlich eng aneinander oder an eine wertgeschätzte kulturelle Umgebung an – obwohl sie keine körperliche Voraussetzung irgendwie dazu zwingt. Diese Anpassung gelingt auch noch im Erwachsenenalter - zum Beispiel unter Philosophen und Soziologen.
    "Es gab die Adoniten, die sprachen wie Adorno. Der hatte so eine bestimmte Weise, die Sätze zu ziehen und neu anzusetzen. Und dann gab es plötzlich in den Seminaren der späten 60er Jahre junge Leute, die sprachen wie er. Sie wollten auch so sein wie er. Sie wollten diese intellektuelle und kreative Potenz haben. Ob sie die hatten, will ich mal offenlassen, aber es war das Modell und das erfasste sie."
    Wie sehr die Verlautbarung einer Stimme Menschen auch ganz unmittelbar erfassen kann, hat vermutlich jeder einmal erfahren. Stimme überträgt Gefühle und bewegt emotional – ganz besonders, wenn sie sich musikalisch ausdrückt.
    Christoph Wulf:
    "Gesang – wie uns der Gesang einer begnadeten Stimme erfassen kann im tiefsten Inneren. Platon hat das schon gewusst. Für ihn war die Musik die größte Erzieherin des Menschen, weil sie nämlich nach innen dringt. Die geht nicht über den Kopf, über rationale Konzepte, sondern die geht ins Herz. Und da entfaltet sie sich und da hat sie ihre Macht."
    Damit einhergeht auch eine Macht, Mensch zu Gemeinschaften zusammen zu fügen. Der sakrale Sprechgesang in der katholischen Kirche zum Beispiel, die eindringlichen Stimmen in der besonderen Akustik eines Kirchenraumes entfalten bis heute eine verbindende Wirkung auf die Gemeinden.
    Stefan Willer:
    "In unseren monotheistischen Religionszusammenhängen ist die Stimme ja eigentlich von Anfang an entscheidend. Also: Stimme schafft Welt. Durch das Aussprechen, im Aussprechen wird etwas, wird alles geschaffen. Ist vielleicht auch nicht so stark eine Stimmtheorie am Anfang, sondern so etwas wie eine Sprechakttheorie. Aber für die Propheten tatsächlich, für die alttestamentlichen, speziell für die Propheten ist die Stimme überaus wichtig - also auch eben das Empfangen höherer Botschaften und dann das Weitersagen, also das Reden zum Volk mit der Autorität der göttlichen Stimme."
    Nicht nur Gott drückt sich in der Erfahrung der Propheten über Stimme und das gesprochene Wort aus, auch der Mensch sieht in der modernen Gesellschaft in seiner Stimme auch seinen persönlichen Ausdruck.
    "Die Stimme ist es. Das ist der Mensch, der sich in der Stimme artikuliert."
    Im gesellschaftlichen Alltag gehen wir stets davon aus, dass ein individueller Mensch am Ende für das hörende Gegenüber doch eine unverwechselbare Stimme hat.
    "Sie hören in der Weise wie eine Stimme ansetzt, wie sie sich entfaltet, hören sie etwas, was wahrscheinlich nur sehr bedingt lernbar ist, und wo sich doch etwas artikuliert von der Einzigartigkeit eines Menschen und deswegen sind ja auch - wie man heute auch sehr genau weiß - die Stimmen auch nicht wirklich nachahmbar. Sie können natürlich lernen, eine Stimme nachzuahmen, aber dann ist es wie bei der Unterschrift. Die ist dann immer genau so wie sie das eine Mal war. Aber eine lebendige Stimme nachzuahmen, das ist sehr, sehr schwierig und gelingt nur in Grenzen."
    Gleichzeitig sind Versuche, einen akustischen Stimmabdruck herzustellen wie einen Fingerabdruck noch nicht besonders erfolgreich. Annähernd scheint es zu gehen. Dem Physiker Eduardo Mendel von der Universität Oldenburg gelingt das zumindest soweit, dass man die eigene Stimme wiedererkennt, erzählt Stefan Willer.
    "Er hat nämlich programmiert eine Software, mit der man die eigene Stimme retten kann über ihr Verlöschen, über ihr Vergehen hinaus. Also Leute, denen der Verlust der eigenen Stimme bevorsteht durch zum Beispiel eine Kehlkopf-Operation oder dergleichen, die bekommen ja heutzutage, also da gibt es ja verschiedene Möglichkeiten, Stimmen prothetisch technisch zu simulieren mit Sprachcomputern zu arbeiten. Und seine Idee ist eben, die eigene Stimme zu nehmen, das heißt: bevor die Stimme verloren geht, können die Klienten Patienten ihre Stimme aufnehmen also einsprechen und zwar - das ist sehr verblüffend - es reichen ziemlich wenige Wörter, um dann einen Silbenvorrat zu generieren oder zu speichern, mit dem man also 95 Prozent der natürlichen Sprache tatsächlich technisch generieren kann. So und das wird dann eben nach Stimmenverlust über einen Computer erzeugt - also man kann tippen oder auch auf andere Weise diese Stimmsoftware aktivieren und hat dann die technische simulierte eigene Stimme - eigene Stimme zweiter Ordnung."
    Je mehr wissenschaftlich über Stimme geforscht wird, desto mehr könnte das am Ende nutzen, um vor allem technisch erzeugte Stimmen, die uns heute umgeben, irgendwie menschlicher zu machen – wenn wir das denn wollen.
    "Das betrifft zum Beispiel Pflegeroboter, wo man glaube ich schon sehr zurückhaltend ist, die von ihrer äußerlichen Anmutung zu menschlich wirken zu lassen, weil das glaube ich doch eher befremdlich und unheimlich wirkt. Aber woran dann doch sehr intensiv dann offenbar gearbeitet wird, sind die Stimmen dieser Maschinen."
    Mensch und Maschine interagieren
    Linguisten in Bielefeld zum Beispiel arbeiten in einem Sonderforschungsbereich an dieser sprachlichen Interaktion zwischen Mensch und Maschine. Wie kann man erreichen, dass sich die Maschinen-Stimme auf den realen Sprecher einstellt, so wie das Menschen untereinander tun? Susanne Fuchs vom ZAS erklärt:
    "Also dass nicht, wenn ich Knopf XY drücke immer dieselbe Antwort in derselben Intonation mit derselben Modulation kommt, sondern je nachdem, ob der Sprecher dann sehr aufgeregt ist oder sehr hoch spricht oder vielleicht auch sehr langsam spricht - für alte Leute - die Antwort der Maschine dementsprechend auch passiert. Wenn jemand älter ist, dass man dann natürlich auch langsamer, deutlicher sprechen muss usw. Also da Systeme zu schaffen, Maschinen zu schaffen, die nicht nach Schema F arbeiten, sondern die wirklich sich adaptieren an verschiedene Sprecher oder an den Menschen, der vor ihnen steht, das ist die Idee dahinter."
    Wie beruhigend - oder auch gerade nicht - wenn eine technische hergestellte Stimme im Telefon am Ende immer noch sanfter jenes "Bitte versuchen Sie es später noch einmal" säuselt, während der Nutzer wütend in der Warteschleife hängt und in den Hörer brüllt.
    So präzise man aber die Möglichkeiten der menschlichen Stimme aufzudecken, zu erklären und technisch einzusetzen versucht, alles scheint sie der Wissenschaft trotzdem nicht zu offenbaren.
    "Roland Barthes hat von den Körnchen der Stimme gesprochen. Man kann auch vom Timbre der Stimme sprechen. Das sind Dinge, die wir alle wahrnehmen, wenn wir jemanden sprechen hören, aber wir können das oft nicht in Worte fassen. Da wird etwas kommuniziert, was ein verkörpertes Wissen oder eine verkörperte Fähigkeit des Menschen ist, der zu uns spricht, die wir auch spüren, die uns auch etwas sagt, die man aber sehr, sehr schwer sprachlich fassen kann."