"Was wir eben versuchen, ist wirklich ‚dirty data‘, also wirklich die Daten, die in der Praxis erhoben werden, zum Beispiel vom Robert-Koch-Institut in Berlin, das meldepflichtigen Krankheiten registriert, dass man hier die Anzahl der Fälle nimmt und dann versucht, anhand dieser Daten Strukturen zu erkennen: Wie breiten sich diese Infektionskrankheiten aus?"
Genau das ist die Fragestellung, über die Leonhard Held, Professor für Biostatistik an der Universität Zürich, Tag für Tag in seinem schlichten Büro am Zürcher Hirschgraben, nicht weit vom historischen Stadtzentrum entfernt, brütet. Es geht um die Erarbeitung mathematischer Modelle, mit denen sich die Ausbreitung von Infektionskrankheiten einigermaßen verlässlich beschreiben, nach Möglichkeit sogar voraussagen lassen. Solche Modelle aus den bekannten Daten herzuleiten, ist allerdings ziemlich schwierig. Denn: Diese Daten sind in der Regel unvollständig. Sie erfassen zum Beispiel stets nur gemeldete Krankheitsfälle, aber nicht die tatsächlichen Fallzahlen. Und so muss Leonhard Held in seine Modelle von Anfang an auf der Basis von Erfahrungswerten eine "Dunkelziffer" nicht gemeldeter Fälle integrieren – eine Dunkelziffer, die letztlich nur geschätzt werden kann. Am Anfang steht dann die Ermittlung des so genannten "R-O-Wertes". Der kennzeichnet eine Art ‚kritische Masse‘, also jene Fallzahl, bei der sich eine Infektionskrankheit tatsächlich ausbreitet und nicht von selbst wieder zum Erliegen kommt. Held:
"Je nach dem, ob man über oder unter einem gewissen Schwellenwert liegt, bricht dann eine solche Epidemie aus oder nicht. R-O ist von daher ein ganz bekannter Parameter in der Infektionsepidemiologie. Und wenn man eben drunter liegt, hat man ein eher epidemisches Verhalten dieser Infektionskrankheiten. Es gibt dann keine großen Ausbrüche. Liegt man aber drüber oder nahe dran an dem Schwellenwert, dann kann es eben Epidemien geben. Das ist wirklich ein Schwellenwert, der das Verhalten steuert."
Dieser R-O-Wert ist längst Bestandteil klassischer mathematischer Modelle zur Beschreibung von Ausbreitungswellen bekannter Infektionskrankheiten. Diese klassischen Modelle haben aber, so Professor Leonhard Held, einen entscheidenden Nachteil:
"Die klassische Theorie der Infektionsepidemologie befasst sich nur mit dem zeitlichen Aspekt und nicht mit räumlicher Variation. Und dann haben wir noch gewisse Homogenitätsannahmen, dass zum Beispiel alle gleich infektiös sind und sich gleich anstecken können – Annahmen, die in der Praxis auch nicht erfüllt sind."
Neben dem zeitlichen Aspekt – wie rasch erhöhen sich die Fallzahlen in einem gegebenen Zeitraum? – liegen den Zürcher Modellen auch räumliche Aspekte zugrunde. Leonhard Held unterscheidet hier in "low range" und "long range"-Faktoren.
"Da muss man dann auch wissen, wie sich die infektiösen Individuen verbreiten im Raum: Wie viele Personen reisen da zum Beispiel? Reisen die nur lokal? Oder machen die nur kleine Sprünge? Und in welchem Verhältnis legen Personen große Entfernungen zurück oder machen nur lokale Bewegungen? Hier müssen wir also die räumlich-zeitliche Verbreitung von Infektionskrankheiten modellieren."
Das bedeutet: Um die Ausbreitung von Infektionskrankheiten beschreiben und vorhersagen zu können, müssen Daten über das Mobilitätsprofil der betroffenen Region vorhanden sein. Gibt es dort viele reiselustige Manager wie beispielsweise im großstädtischen Ballungsraum Frankfurt, so sind dies "long range"-Faktoren. Geht es beispielsweise um die täglichen Fahrten von Berufspendlern von einer ländlichen Region in die nächstgelegenen Stadt, sprechen die Experten von "low range"-Faktoren. Beide Faktoren gemeinsam müssen richtig gewichtet und in das mathematische Modell miteinbezogen werden. Bleibt das Problem, dass viele Daten, beispielsweise über nicht-gemeldete Krankheitsfälle, gar nicht vorliegen. Diesen zunächst unbekannten Faktoren nähern sich die Wissenschaftler in mehrstufigen Prognoseversuchen an: Von einer Woche zur nächsten versuchen sie sich an einer Ausbreitungs-Vorhersage. Nach einer Woche vergleichen sie den tatsächlichen Ist-Zustand mit dem vorausgesagten Ergebnis. Die Differenz zwischen beiden Werten fließt als Schätzfaktor ein in die Vorhersage für die darauffolgende Woche. Auf diese Weise, so Professor Leonhard Held, wird die Differenz zwischen vorhergesagten Fallzahlen und tatsächlichen Fallzahlen immer kleiner und das zu Grunde liegende mathematische Modell damit immer zuverlässiger:
"Dann haben wir ein natürliches Kriterium, das auch der Laie versteht: Dass wir nämlich dasjenige Modell nehmen, das am besten das zukünftige Verhalten vorhersagt. Also man passt dann die Modelle an bis zu einem gewissen Zeitpunkt, sagt die nächste Woche voraus. Und dann werden die Daten dann eben um diese Woche erweitert. Und man sagt die übernächste Woche voraus. Und dann geht das einfach so sequentiell durch."
Auch in der Vorhersage legt Leonhard Held wert auf die räumliche Verteilung, nicht nur auf den Anstieg der Fallzahlen in Abhängigkeit von der Zeitachse:
"Das geht ja nicht linear, also kreisförmig um den Ursprungsherd. Das kann man auch so sehen, dass das plötzlich springt zum Beispiel nach Berlin und ein zweiter Herd sozusagen entsteht."
Dies ist abhängig vom Mobilitätsprofil jener Region, in der eine Infektionskrankheit ausbricht. Hier drängt sich der Vergleich mit einem unterirdischen Pilzgeflecht auf, das mit sichtbaren Pilzen an ganz unterschiedlichen Stellen durchs Erdreich nach oben drängt. Und genau die mathematische Erfassung dieser räumlichen Komponente erscheint dem Zürcher Wissenschaftler als überaus wichtig, um geeignete Gegenmaßnahmen zu ergreifen:
"Wenn man festgestellt hat, dass diese räumliche Komponente sehr wichtig ist, dann hat man sozusagen eine Schraube, an der man versuchen kann, die Epidemie einzudämmen. Also wenn Sie zum Beispiel sehen, bei Sars, dass diese Flugbewegungen sehr wichtig sind und die eben die Ausbreitung von Sars determiniert haben, dann ist ein möglicher Präventionsmechanismus, den man wählen kann, dass man eben die Flüge unterbindet oder zumindest einschränkt, um eben die Ausbreitung zu verhindern."
Genau das ist die Fragestellung, über die Leonhard Held, Professor für Biostatistik an der Universität Zürich, Tag für Tag in seinem schlichten Büro am Zürcher Hirschgraben, nicht weit vom historischen Stadtzentrum entfernt, brütet. Es geht um die Erarbeitung mathematischer Modelle, mit denen sich die Ausbreitung von Infektionskrankheiten einigermaßen verlässlich beschreiben, nach Möglichkeit sogar voraussagen lassen. Solche Modelle aus den bekannten Daten herzuleiten, ist allerdings ziemlich schwierig. Denn: Diese Daten sind in der Regel unvollständig. Sie erfassen zum Beispiel stets nur gemeldete Krankheitsfälle, aber nicht die tatsächlichen Fallzahlen. Und so muss Leonhard Held in seine Modelle von Anfang an auf der Basis von Erfahrungswerten eine "Dunkelziffer" nicht gemeldeter Fälle integrieren – eine Dunkelziffer, die letztlich nur geschätzt werden kann. Am Anfang steht dann die Ermittlung des so genannten "R-O-Wertes". Der kennzeichnet eine Art ‚kritische Masse‘, also jene Fallzahl, bei der sich eine Infektionskrankheit tatsächlich ausbreitet und nicht von selbst wieder zum Erliegen kommt. Held:
"Je nach dem, ob man über oder unter einem gewissen Schwellenwert liegt, bricht dann eine solche Epidemie aus oder nicht. R-O ist von daher ein ganz bekannter Parameter in der Infektionsepidemiologie. Und wenn man eben drunter liegt, hat man ein eher epidemisches Verhalten dieser Infektionskrankheiten. Es gibt dann keine großen Ausbrüche. Liegt man aber drüber oder nahe dran an dem Schwellenwert, dann kann es eben Epidemien geben. Das ist wirklich ein Schwellenwert, der das Verhalten steuert."
Dieser R-O-Wert ist längst Bestandteil klassischer mathematischer Modelle zur Beschreibung von Ausbreitungswellen bekannter Infektionskrankheiten. Diese klassischen Modelle haben aber, so Professor Leonhard Held, einen entscheidenden Nachteil:
"Die klassische Theorie der Infektionsepidemologie befasst sich nur mit dem zeitlichen Aspekt und nicht mit räumlicher Variation. Und dann haben wir noch gewisse Homogenitätsannahmen, dass zum Beispiel alle gleich infektiös sind und sich gleich anstecken können – Annahmen, die in der Praxis auch nicht erfüllt sind."
Neben dem zeitlichen Aspekt – wie rasch erhöhen sich die Fallzahlen in einem gegebenen Zeitraum? – liegen den Zürcher Modellen auch räumliche Aspekte zugrunde. Leonhard Held unterscheidet hier in "low range" und "long range"-Faktoren.
"Da muss man dann auch wissen, wie sich die infektiösen Individuen verbreiten im Raum: Wie viele Personen reisen da zum Beispiel? Reisen die nur lokal? Oder machen die nur kleine Sprünge? Und in welchem Verhältnis legen Personen große Entfernungen zurück oder machen nur lokale Bewegungen? Hier müssen wir also die räumlich-zeitliche Verbreitung von Infektionskrankheiten modellieren."
Das bedeutet: Um die Ausbreitung von Infektionskrankheiten beschreiben und vorhersagen zu können, müssen Daten über das Mobilitätsprofil der betroffenen Region vorhanden sein. Gibt es dort viele reiselustige Manager wie beispielsweise im großstädtischen Ballungsraum Frankfurt, so sind dies "long range"-Faktoren. Geht es beispielsweise um die täglichen Fahrten von Berufspendlern von einer ländlichen Region in die nächstgelegenen Stadt, sprechen die Experten von "low range"-Faktoren. Beide Faktoren gemeinsam müssen richtig gewichtet und in das mathematische Modell miteinbezogen werden. Bleibt das Problem, dass viele Daten, beispielsweise über nicht-gemeldete Krankheitsfälle, gar nicht vorliegen. Diesen zunächst unbekannten Faktoren nähern sich die Wissenschaftler in mehrstufigen Prognoseversuchen an: Von einer Woche zur nächsten versuchen sie sich an einer Ausbreitungs-Vorhersage. Nach einer Woche vergleichen sie den tatsächlichen Ist-Zustand mit dem vorausgesagten Ergebnis. Die Differenz zwischen beiden Werten fließt als Schätzfaktor ein in die Vorhersage für die darauffolgende Woche. Auf diese Weise, so Professor Leonhard Held, wird die Differenz zwischen vorhergesagten Fallzahlen und tatsächlichen Fallzahlen immer kleiner und das zu Grunde liegende mathematische Modell damit immer zuverlässiger:
"Dann haben wir ein natürliches Kriterium, das auch der Laie versteht: Dass wir nämlich dasjenige Modell nehmen, das am besten das zukünftige Verhalten vorhersagt. Also man passt dann die Modelle an bis zu einem gewissen Zeitpunkt, sagt die nächste Woche voraus. Und dann werden die Daten dann eben um diese Woche erweitert. Und man sagt die übernächste Woche voraus. Und dann geht das einfach so sequentiell durch."
Auch in der Vorhersage legt Leonhard Held wert auf die räumliche Verteilung, nicht nur auf den Anstieg der Fallzahlen in Abhängigkeit von der Zeitachse:
"Das geht ja nicht linear, also kreisförmig um den Ursprungsherd. Das kann man auch so sehen, dass das plötzlich springt zum Beispiel nach Berlin und ein zweiter Herd sozusagen entsteht."
Dies ist abhängig vom Mobilitätsprofil jener Region, in der eine Infektionskrankheit ausbricht. Hier drängt sich der Vergleich mit einem unterirdischen Pilzgeflecht auf, das mit sichtbaren Pilzen an ganz unterschiedlichen Stellen durchs Erdreich nach oben drängt. Und genau die mathematische Erfassung dieser räumlichen Komponente erscheint dem Zürcher Wissenschaftler als überaus wichtig, um geeignete Gegenmaßnahmen zu ergreifen:
"Wenn man festgestellt hat, dass diese räumliche Komponente sehr wichtig ist, dann hat man sozusagen eine Schraube, an der man versuchen kann, die Epidemie einzudämmen. Also wenn Sie zum Beispiel sehen, bei Sars, dass diese Flugbewegungen sehr wichtig sind und die eben die Ausbreitung von Sars determiniert haben, dann ist ein möglicher Präventionsmechanismus, den man wählen kann, dass man eben die Flüge unterbindet oder zumindest einschränkt, um eben die Ausbreitung zu verhindern."