Archiv


Unscharf scharf

Stochastik ist die Wissenschaft der Wahrscheinlichkeiten und Häufigkeiten. Das machte sie insbesondere in Deutschland, wo man gern alles sicher wissen und berechnen wollte, unbeliebt. Dabei beruht diese Einschätzung auf einem Missverständnis, denn auch die Stochastik ist eine exakte Wissenschaft, die Methoden liefert, um aus großen Datenmengen Schlüsse zu ziehen.

Von Maximilian Schönherr | 24.12.2006
    Wahrscheinlichkeitsberechnungen stecken deswegen heute in allen Bereichen des Lebens. Sie liegen Meinungsumfragen zugrunde, mit ihnen lässt sich die Belastbarkeit neuer Materialien abschätzen, sie liefern Methoden, das Bevölkerungswachstum vorherzusagen.

    David Cox, emeritierter Professor am Nuffield College in Oxford, ist der Begründer der modernen Stochastik. Von dem heute über 80-Jährigen stammt unter anderem die Formel, mit der in Krankenhäusern die Überlebenschancen von Krebspatienten abgeschätzt werden. Begonnen hat Cox seine Karriere bei einer Textilfirma, wo er mit stochastischen Methoden das Weben englischer Militäruniformen optimierte. Sir David Roxbee Cox, längst von der Queen zum Ritter geschlagen, und sein Kollege Anton Wakolbinger, Professor an der Universität Frankfurt, zeichnen in dieser Sendung von Maximilian Schönherr die stille Wissenschaft der Unschärfe in einem scharfen Licht.




    Im Frühjahr bekam ich die Einladung zu einem internationalen Stochastikkongress an der Goetheuniversität Frankfurt. Solche Veranstaltungen sind so speziell, so trocken, dass nur Eingeweihte verstehen, was da in den "Lectures" und "Papers" vorgetragen wird. Ohne Mathematikstudium versteht man gar nichts.

    Für Nicht-Naturwissenschaftler hat die Stochastik, die Lehre von den Wahrscheinlichkeiten, griechisch "Die Kunst des Mutmaßens", etwas, ja, Unappetitliches: Wozu sich mit Wahrscheinlichkeiten beschäftigen, die nicht nur ungenau sind, sondern oft auch beliebig, zudem - wie beim Wetterbericht und Meinungsumfragen - meist falsch.

    Was an diesem Vorurteil stimmt, ist, dass es coolere Wissenschaften gibt, die Informatik mit ihrem eleganten Code etwa, oder die Gentechnik mit ihrem eleganten Lebenscode, und die Hirnforschung, die uns sagt, wer wir sind.

    Dass ich trotzdem nach Frankfurt fuhr, hatte einen einzigen Grund: David Cox. - Sir David Cox.

    Er kam aus Oxford angeflogen. Sie hören ihn gerade im Audimax der Uni Frankfurt sprechen. Cox ist der große, ja der größte Stochastiker und einer der bedeutendsten Mathematiker unserer Zeit, über 80 Jahre alt, einer der Leute, deren Name überall in den Mathematik-, Physik-, Soziologie- und Medizinlehrbüchern auftaucht - Coxsches Überlebensmodell, Cox-Regression, Cox-Prozess - wo man aber schnell vergisst, woher dieses "Cox" eigentlich kommt. Es kommt von dem Mann hier auf der Bühne. David Cox hat volles weißes Haar, seine Brille sitzt etwas schief, und er erzählt einigen hundert Stochastikern, Statistikern, Biologen, Soziologen im Publikum Geschichten von Dachsen und Rindern.

    Im englischen Südwesten, also zum Beispiel in Cornwall, breitet sich in den letzten Jahren die Rindertuberkulose aus. Die Übertragungswege der Krankheit sind weitgehend unbekannt, man weiß aber, dass Dachse als Überträger infrage kommen. Viele Landwirte weigerten sich, die unterirdischen Dachsbauten zu sprengen, nur weil in Kotproben Rinder-TB gefunden wurde. Die Briten lieben Dachse, zudem stehen sie unter Naturschutz. Die Sache rief Umweltschützer auf den Plan, sie wurde zum Politikum, und die britische Regierung stellte schließlich eine Expertengruppe um Sir David Cox herum zusammen, die für die Bauern Tipps ausarbeiten sollte, wie sie mit dem Problem umgehen konnten. Und zwar nicht irgendwelche Tipps, sondern fundierte Forschungsergebnisse.

    Die Ergebnisse der Studie werden erst in einigen Monaten vorliegen. Ein Zwischenergebnis liefert Cox aber jetzt schon ab, hier auf der Bühne, nicht ohne Stolz. Eine Antwort auf folgende Frage: Angenommen, das Bakterium wurde auf einer Farm im Kot der Dachse gefunden, soll der Bauer die Dachse auf dieser Farm dann töten? Die Auswertung Tausender Datensätze von verschiedenen Bauernhöfen, die ganz unterschiedlich mit dem Problem umgingen, ergab eindeutig folgendes Bild: Tötet man die Dachse, wird alles kurzfristig besser. Wenige Wochen später aber wird alles viel schlimmer, die Infektion greift verstärkt auf der Farm um sich. Besser also, die die Dachse auf dieser Farm nicht zu töten!

    Applaus.

    Natürlich gab es im Nachhinein Erklärungen. Nur die Anthropologen in dem Forscherteam hatten es vorhergesehen: Dachse sind sehr soziale Tiere, die mit anderen Dachsen aus der Umgebung zum Ort der Katastrophe zurückkehren. Aber erst die Stochastik ermöglichte es, den Bauern handfest, greifbar, konkret wissenschaftlich abgesicherten Rat zu geben.

    In Frankfurt hatte ich nur kurz die Gelegenheit, mit David Cox zu sprechen. Als ich ihn nach seiner berühmtesten Formel, dem "Proportional Hazard Regression Model" von 1972 fragte, nämlich wie lang er dafür gebraucht hat, antwortete Cox so:
    Fünf Jahre, bis ihm dann an einem Tag die mathematische Lösung einfiel. Großartig, dachte ich, und stand einige Wochen später vor dem Nuffield College in Oxford, wo mich David nun persönlich empfing. Er führte mich durch den Innenhof des selbstverständlich steinalten Gebäudekomplexes in einen selbstverständlich steinalten Besprechungsraum, der aussah wie ein Jagdzimmer, mit kleinen Fenstern, dunklen Möbeln, holzvertäfelter Wand und Holzstichen mit Hunden und Pferden.

    " Ich arbeite in Oxford, war viele Jahre in London, und auch in Cambridge.

    Aber ganz früher habe ich in der Flugzeugindustrie gearbeitet. Da ging es um Materialstärken bei Flugzeugen. Danach einige Jahre in der Textilindustrie, wo es massiv Probleme gab. Mein Thema war die Verarbeitung von Wolle.

    Das war damals eine Industrie mit einer viertel Million Beschäftigten. Heute ist sie ganz klein geworden. "

    Die Wollindustrie stellte in den 40er Jahren vor allem Bekleidung für Soldaten her. Während des Webvorgangs gingen Maschinen kaputt, am Ende kamen Stoffe heraus, die fehlerhaft waren, Uniformen, die schnell zerrissen. Die Stochastik hatte damals in England und den USA, jedoch nicht in Deutschland bereits den Ruf, dass man mit ihr unüberschaubar komplexe Probleme in den Griff bekommen konnte. Probleme, für die man keine physikalischen Regeln hatte, die sich auch nicht lösten, indem man sozusagen eben mal ein paar Ingenieure mit ihrem Fachwissen drüberschauen ließ, waren mit der Stochastik zumindest eingrenzbar, auch wenn man dabei oft erst viel später verstand, was eigentlich dahinter steckte.

    Cox konstruierte mathematische Modelle, in die zum Beispiel Details wie die Scherkräfte innerhalb des gewebten Stoffs eingingen. Das Bauen solcher Modelle - im Grunde mathematische Gleichungen für bestimmte Zwecke - ist die Kernaufgabe der Stochastik, während ein Teilgebiet der Stochastik - die Statistik - diese Modelle mit Leben füllt, nämlich mit sinnvollen Daten aus der Praxis. Damals, in den späten 40er Jahren, standen David Cox noch keine Computer zur Verfügung.

    " Ich hatte Assistenten, die elektrische Rechenmaschinen benutzen.

    Damals hießen solche Leute Computer, Rechner. Ein Computer war damals eine Person.

    War das etwas Erniedrigendes, als Angestellter "Computer" genannt zu werden?

    Aber nein.

    Man hat also zu dem Kollegen gesagt: Jetzt übergebe ich die Daten mal dem Computer?

    Ganz genau. Das war schon toll für mich, so jung wie ich war. Mir standen vier Computer zur Verfügung, die den ganzen Tag nur rechneten. Für moderne Verhältnisse war das natürlich trivial. Die brauchten eine Woche für etwas, was ein PC heute in einer Sekunde erledigt. "

    David Cox kann sich heute nicht mehr an konkrete Ergebnisse seiner Wollforschungen erinnern, außer, dass eine andere Abteilung, nämlich die Veterinäre, auf ganz unstochastische Weise herausfanden, dass die Schafe unter Kupfermangel litten und entsprechend problematische Wolle produzierten. 1958 erregte er erstmals Aufsehen. Damals erschien sein Buch über das korrekte Aufstellen von stochastischen Versuchen. Er nennt diese Versuche wie in der Physik: Experimente. Dieses Frühwerk gehört heute noch an vielen Universitäten zum Grundwerkzeug für Stochastikstudenten. In den 60er Jahren forschte Cox am Imperial College in London, einer als konservativ bekannten Universität. Jeder zweite Student will dort Ingenieur werden, erzählt Cox. Das Studium ist so hart, dass die Studenten weder über ihre Kleidung, noch über Politik nachdenken können. Er selbst, ein etablierter Professor, stand der Studentenrevolution eher kritisch gegenüber.

    " Ich war mir über die politischen Vorgänge der späten 60er Jahre durchaus bewusst. Aber ich arbeitete damals am Imperial College in London, und da waren die Studentenrevolten vernachlässigbar. Ganz anders als bei den Wirtschaftlern der London School of Economics - dort waren die Studenten viel radikaler, wenn das auch nie an die Vorgänge in den USA oder Frankreich heranreichte. Es gab ziemlichen Ärger bei uns im physikalischen Institut. Die haben einen halben Tag lang gestreikt. Aber es lief ohne Aufregung und sehr höflich ab. "

    Sein berühmtestes Werk, das "Proportional Hazard Regression Model", ist ein Werkzeug, mit dem man Überlebensabschätzungen machen kann. Es findet sich heute in jedem Statistikprogramm, man kann es sogar als kleines Java-Skript im Internet einsetzen. Auch auf den PCs vieler Krankenhäuser läuft das Coxsche Modell. Sein Kern ist eine mathematische Funktion, die den "Hazard" einschätzt, das Risiko.

    Wenn bei einem Patienten eines bestimmten Alters Krebs diagnostiziert wurde, gibt man in das Programm die geplante Therapie ein, und das Cox-Modell schätzt dann die verbleibende Lebensdauer für diesen Patienten ab. Diese Zahl mag hart und grausam und oft auch völlig falsch sein - sie schöpft aus großen Vergleichsdatenmengen, gewichtet sie gegeneinander und kann dem Arzt als Richtwert dienen. Die Eleganz der Coxschen Idee ist, dass sie nicht in die Vergangenheit zurückgreift, sondern im Hier und Jetzt ansetzt. Man muss sich also nicht, wie das bei anderen Modellen der Fall ist, mit so nebulösen Daten herumschlagen wie zum Beispiel dem Jahr und Monat, in dem die Krankheit bei dem Patienten ausbrach. Wann kann man schon sagen, Krebs bricht aus?

    " Die Nachfrage nach einem solchen Modell kam vor allem von Kollegen in der Medizin und von Statistikern, die klinische Studien machten. Aber die Anwendungen sind viel breiter. Wenn ich's mir genau überlege, steckte mein früheres Interesse an der Stärke von Materialien und industrieller Zuverlässigkeit dahinter.

    Die erste konkrete Anwendung bestand darin, die Überlebenschancen von Kindern mit Leukämie statistisch in den Griff zu bekommen. Ein Freund in Texas hatte mich darauf aufmerksam gemacht, dass es da großen Forschungsbedarf gab.

    Aber die Beliebtheit der Methode kommt heute daher, dass sie sich auf so viele Gebiete anwenden lässt. Wirtschaftswissenschaftler nutzen sie zum Beispiel, um die Bankrottwahrscheinlichkeit von Unternehmen zu messen. "

    Und so klingt es, das Proportional Hazard Regression Model von Sir David Roxbee Cox:

    " h(t) = h0(t) × exp(ß1X1 + ß2X2 + ... + ßmXm) "

    wobei h die Hazardfunktion ist:

    " Anzahl der Personen mit Zielereignis Tod, geteilt durch Anzahl der Personen, die bis zur Zeit t überleben, mal die Intervallbreite. "

    So schön kann Stochastik sein.

    Und so hört sich Stochastik an. Frankfurt, Institut für Stochastik. Normaler Lehrbetrieb. Anton Wakolbinger malt den Studenten Gaußsche Glockenkurven und Poissonsche Punktverteilungen auf die Tafel. Wakolbinger leitet den Stochastiklehrstuhl in Frankfurt und kennt die Arbeiten von David Cox natürlich schon seit seinem Mathematikstudium.

    " Ich begegnete ihm als Autor dieses berühmten Hazard Rate Modells, wo er die Verteilung von zufälligen Lebensdauern in Abhängigkeit von externen Größen beschrieben hat. Vor kurzem habe ich das wieder in einer Diskussion mit meiner Tochter bemerkt, die jetzt in Wien Betriebswirtschaften studiert und sich dort mit der Frage auseinandersetzt, wann hebt ein Produkt vom Markt ab - diese Take-off-Problematik. Ein zufälliger Zeitpunkt, der von bestimmten Faktoren mit beeinflusst wird. Auch das wurde modelliert mit dem Coxschen Hazard Rate Modell. "

    Ob die Firma nun pleite geht oder nicht, ob der Patient mit Blutkrebs in 3 Monaten oder erst mit 92 stirbt - die Stochastik gibt hier nur Anhaltspunkte. Es kann ganz anders sein. Sie sagt nicht, der Bus kommt um 13.48 Uhr, sondern, der Bus kommt um 13.48 Uhr plusminus 6 Minuten. Ist die Stochastik vielleicht keine exakte Wissenschaft?

    " Ich weiß nicht, was das bedeuten soll, eine exakte Wissenschaft. Man macht doch dauernd Annährungen! Mit exakter Wissenschaft verbinde ich höchstens die Physik, aber Physik ist selten exakt. Dagegen sind die Annäherungen der Physik normalerweise extrem genau.

    Sie halten zum Beispiel das Gesetz der Schwerkraft für eine Annäherung?

    Wenn man ganz grundsätzlich wird, ja. Geht man dem Ursprung des Universums und den schwachen Wechselwirkungen auf den Grund, scheinen die Physiker an eine Art harte Realität zu glauben. Ich als Statistiker bin da ein wenig skeptisch. Ich habe eher den Eindruck, dass Physiker oft sehr fantasievolle und bewundernswerte Versuche unternehmen, der Sache immer näher zu kommen.

    Auch die Maxwell-Gleichungen, die die Elektrizität und den Magnetismus beschreiben - alles nur Annäherungen?

    Wenn man auf die Quantenebene heruntergeht, sicher. Und genauso meine ich das. Zu behaupten, die Physiker würden exakt arbeiten, ist in gewisser Weise und für viele Anwendungen ganz vernünftig. Aber an einem Punkt bricht diese Argumentation zusammen. Wenn es um die Dichte von Flüssigkeiten geht, kann man sagen: Gut, das ist also eine Masse in einem kleinen Raum, Masse pro Volumeneinheit. Wir das Volumen immer kleiner, stößt man irgendwann auf die Ebene der Atome und kann nicht mehr weiterrechnen. Also ist die Dichte eine Annährung. Die Strömungsdynamik, ja die ganze klassische Mechanik ist eine Annäherung. Natürlich eine hervorragende Annäherung! Viel besser als was man auf anderen Gebieten findet. In den Sozialwissenschaften ist vieles am Schwimmen. Klar, es gibt da Abschätzungen, die grob mit der Wirklichkeit übereinstimmen, aber das wär's dann auch schon.

    Ich denke, dass die Leute, vor allem diejenigen, die nicht in der Welt der Wissenschaft leben, das Exakte dem Vermuteten vorziehen, oder zumindest Dinge mögen, die exakt aussehen. Dieselben Leute sagen, die Wettervorhersage ist so schlecht wie immer, egal wie stark sich die statistischen Methoden verbessern, sie wird immer das Wetter falsch vorhersagen. Warum, fragen sie, rechnen die Experten mir nicht aus den Wolken und der Windgeschwindigkeit mit einer schönen, exakten Formel endlich mal das Wetter genau aus - Ost-San-Francisco, morgen früh, halb 10?

    Die Wissenschaftler bewegen sich ja dahin, mit ihren dynamischen Modellen, aber sie sind noch weit vom Ziel entfernt. Ein ernstzunehmender Gedanke in diesem Zusammenhang ist, dass man so enorm viel über die physikalische und biologische Welt weiß, aber sobald man anfängt, in einem konkreten Forschungsprojekt zu arbeiten, dann überflügelt die Ungewissheit alles. Selbst wenn man sehr einfache Fragen stellt, die die Grenzen des Wissens berühren, wird die Antwort sein: Es könnte so sein, oder so. Wir wissen es nicht.

    Können Sie dafür ein Beispiel geben?

    Klar: Warum bekommt jemand Krebs oder einen Herzinfarkt, ein anderer mit ganz ähnlichen Voraussetzungen aber nicht?

    Oder die Veterinärepidemiologie, mit der ich jüngst zu tun hatte: Man weiß sehr viel über die Rindertuberkulose, kennt manche Aspekte sehr gut, hatte fast ein Jahrhundert lang Zeit, die Krankheit zu studieren. Bevor 1925 die Milch pasteurisiert wurde, war die Rindertuberkulose ein Hauptüberträger der Tuberkulose bei Kindern. Man weiß also sehr viel darüber. Aber wenn man nun eine konkrete Frage stellt, etwa, wie die Seuche von frei lebenden Tieren auf Zuchtkühe übertragen wird, und was biologisch bei der Übertragung von einer Kuh zur anderen Kuh passiert, weiß man fast nichts.

    Hier kommt die Stochastik ins Spiel. Sie setzt zunächst sorgfältig Experimente auf und beginnt, relevante Daten zu sammeln. Diese Experimente müssen die Wirklichkeit und die Bedingungen von Bauernhöfen respektieren. "

    Mit diesem Plädoyer für ein klares Layout des Experiments wendet sich David Cox gegen den Trend unter seinen jüngeren Kollegen, auf Computerpower zu vertrauen und deshalb zunächst einmal um jeden Preis Daten zu sammeln. Manche Mathematiker betreiben so genanntes Data Mining - sie suchen nach Übereinstimmungen oder Besonderheiten in gewaltigen Datenmengen, ohne viel über die Herkunft der Daten und ihre Zusammenhänge zu wissen. Es gibt einen ganzen Zoo an Formeln, die man über solche Datensätze schicken kann, Monte Carlo heißt nur eine davon. Hacker lieben solche Tools. Im Militär lassen sich Verschlüsselungen nur so brechen, dass man quasi blind versucht, Signifikanzen zu finden, Auffälligkeiten. Mit bloßem Auge sieht man einer Liste von einer Million Zahlen vielleicht an, dass alle Ziffern ungefähr gleich häufig vertreten sind, aber nicht, dass jede 193. Zahl mit Sieben beginnt. Genau das kann ein Hinweis sein, wie man den Code knackt.

    David Cox liegt das nicht. Aber er gehört damit durchaus nicht einer alten Denkschule an. Ihn interessiert, wie schon in seinem Buch von 1958, wie nah an der Wirklichkeit man Daten sammeln kann und die Güte des Modells. Selbst wenn es um den Einsatz seiner eigenen Hazard-Funktion geht, ist er zwiegespalten:

    " Man will meistens wissen, welche Therapie für einen bestimmten Patienten konkret am besten ist. Mein Interesse galt eher der Analyse: Woher kam die Erkrankung eigentlich? "

    Fünf Jahre hat David Cox über sein Überlebensmodell nachgedacht, bevor ihm dann im Jahr 1972 plötzlich die Lösung einfiel. Haben Sie wirklich fünf Jahre hart darüber nachgedacht?

    " Natürlich habe ich nicht die ganze Zeit darüber nachgedacht. Ich habe damals auch gelehrt, geforscht, verwaltet.

    Es gibt zwei Weisen, so etwas anzugehen. Entweder ich entscheide mich dafür, über nichts anderes nach als darüber nachzudenken, Tag und Nacht, bis ich die Lösung habe. Oder man hat das Thema einfach im Hinterkopf, und dann kommt von Zeit zu Zeit ein Gedankenblitz, von denen die meisten verrückt sind; gelegentlich kommt aber auch ein Gedanke daher, der nicht ganz so verrückt ist. Das war der Zustand, in dem ich meistens war.

    Natürlich ist vor allem die industrielle Forschung zunehmend so organisiert, dass man sehr zielgerichtet arbeitet und meiner Meinung nach nicht sehr effizient. "

    Dann klopft es leise an der Tür des Besprechungsraums. Laura Green ist da, Professorin für Epidemiologie an der Universität Warwick. David Cox legt seinen Arm um die Schulter der jungen Frau und bittet sie herein. Sie muss am Nachmittag wieder bei ihren kleinen Kindern sein und möchte mit ihm einiges besprechen. Laura Green benutzt die Werkzeuge von Cox, seine mathematischen Instrumente, auch sein Wissen über das saubere Einrichten von Experimenten.

    Wir gehen zu dritt durch den kleinen Innenhof des Nuffield College - David hält Laura die Tür auf - in den Speiseraum. Ein Speiseraum wie in alten englischen Internatsfilmen: kirchenhohe Decken, ein unendlich langer Tisch, auf hochlehnigen Stühlen leise vor sich hin kauende Menschen. Manche nicken David Cox freundlich zu. Sir David Cox. Ich wollte, bevor ich wieder nach London und Deutschland zurückfahre, eigentlich noch kurz über das "Sir" reden, den Ritterschlag, 1988.

    " Letzte Frage: Sie wurden zum Ritter geschlagen. Wie war das, wer war alles da, waren Sie überrascht?

    Unglaublich überrascht, fast schockiert!

    War Ihre Frau dabei?

    Aber ja. Man durfte eine Ehefrau und zwei Kinder mitbringen. Ich habe aber vier! [lacht] "