Ein Deckel, der genau auf einen bestimmten Topf passt, ein Schloss, für das es nur einen Schlüssel gibt – nach diesem Prinzip funktionieren viele Proteine, viele Eiweißmoleküle. Sie binden gezielt an bestimmte Substanzen. Das ist der Angriffspunkt vieler Medikamente: Sie docken an eines der Proteine des Krankheitserregers an und setzen ihn dadurch außer Gefecht. Das Problem dabei:
"Möchte man mit einem Medikament gezielt ein Protein angreifen, muss man natürlich wissen, wo genau es andocken muss. Man kann sich so ein Eiweißmolekül vorstellen als einen stark deformierten Ball mit lauter Beulen und Dellen. Und in eine dieser vielen Dellen muss der Wirkstoff genau hineinpassen."
Sagt Alessandra Carbone, Mathematikerin an der Universität Pierre und Marie Curie in Paris. Eine Art hochspezielles 3D-Puzzle also, und Biologen und auch Physiker haben im Laufe der Zeit diverse Methoden entwickelt, um dieses Puzzle zu enträtseln, etwa mithilfe von Röntgenanalysen. Nur: Mit diesen gängigen Methoden lassen sich längst nicht alle Eiweißmoleküle untersuchen, viele sind schlicht ungeeignet. Deshalb geht Carbone einen anderen Weg – einen mathematischen. Ihr Ansatz: Proteine sind Ketten, die aus 20 verschiedenen Sorten von Aminosäuren bestehen. Zwar weiß man bei vielen Proteine nicht, wie sich diese Kette zu einer dreidimensionalen Struktur faltet, also quasi zu dem verbeulten Ball.
Doch immerhin kennt man die Sequenz der Aminosäuren, das heißt ihre Abfolge in der Kette. Und bereits diese Sequenz kann einiges verraten über das Protein und seine Funktion – vorausgesetzt, man analysiert sie mit den geeigneten mathematischen Verfahren.
"Wir versuchen, möglichst viele Informationen aus der Sequenz der Aminosäuren herauszukitzeln. Dazu vergleichen wir die Sequenzen von Proteinen, die eine ähnliche Funktion haben, aber aus unterschiedlichen Lebewesen stammen, etwa aus Hefe, Fischen und dem Menschen. Dann schauen wir zum Beispiel nach, welche Abschnitte der unterschiedlichen Proteinsequenzen gleich sind. Diese Abschnitte haben sich im Laufe der Evolution nicht verändert und dürften deshalb eine zentrale Rolle für die Funktion des Proteins spielen. Genau diese Abschnitte verraten uns dann, wie sich das Protein in der Zelle verhält."
Die Herausforderung: Bei ihren mathematischen Analysen haben es die Forscher mit einem Wust an Daten zu tun, und das macht es nicht einfach, gleiche bzw. ähnliche Abschnitte aufzuspüren und korrekt zuzuordnen. Dazu braucht es spezielle Verfahren der Kombinatorik und Statistik, die Carbone und ihr Team eigens für die Biologie zurechtschneidern müssen – etwa bei einer Methode namens Baum-Topologie.
"Dabei konstruieren wir Diagramme, in denen eingezeichnet ist, wie ähnlich sich bestimmte Abschnitte von Proteinsequenzen bei verschiedenen Lebewesen sind. Das Ergebnis ist ein komplexes Baumdiagramm. Und wenn wir dann die Form dieser Bäume sorgsam analysieren, können wir deutlich präzisere Rückschlüsse ziehen."
Mit ähnlichen Mathe-Methoden hat Carbone nun untersucht, wie das Wechselspiel der Proteine des Hepatitis C Virus aussieht. Eine relativ übersichtliche Angelegenheit, denn das Virus besitzt nur zehn Proteine.
"Wir haben ein komplettes Netzwerk erstellen können, wie die zehn Proteine des Virus miteinander interagieren. Dieses Netzwerk liefert uns nun viele Informationen darüber, wie diese Proteine im Virus funktionieren."
Und vielleicht, hofft Carbone, erwachsen daraus ja auch neue Therapieansätze – etwa ein Wirkstoff, der verhindert, dass das Virus die Leberzellen überhaupt infizieren kann.