Arndt Reuning: Bettina Wulff, die Frau des ehemaligen Bundespräsidenten Christian Wulff, wehrt sich dagegen, dass die Suchmaschine Google bei der Eingabe ihres Namens automatisch zum Beispiel den Begriff "Prostituierte" ergänzt. Der Bundesdatenschutzbeauftragte Peter Schaar unterstützt sie in diesem Konflikt. Er sagt, Menschen sollten die Möglichkeit haben, solche eher verletzenden Assoziationen auszuschließen. Google hingegen argumentiert, die Vorschläge spiegelten bloß das Suchverhalten der Internetnutzer wider - für uns ein Anlass, einmal nachzufragen. Bei meinem Kollegen und Computerexperten Jan Rähm möchte ich das machen. Herr Rähm, wie funktioniert dieses autovervollständigen der Google-Suche denn eigentlich?
Jan Rähm: Also dieses Vervollständigen funktioniert so, dass ein Nutzer einen Suchbegriff eingibt und dann auf ein Ergebnis klickt, das da in der Google-Suche angezeigt wird. Je öfter er das macht, umso mehr lernt Google, was die Nutzer - also nicht nur der eine, sondern die Nutzer weltweit - suchen, und generiert daraus Begriffe, die es dann in diese Autovervollständigen-Funktion einfügt. Das könnte sein zum Beispiel beim Deutschlandfunk und den Hörern dieser Sendung: Sie gegen ein "DLF" Leerzeichen "F" und dann sollte langsam aber sicher "Forschung aktuell" da stehen. Und genau so funktioniert das: Je öfter das gesucht wird, umso eher wird es dort vorgeschlagen, umso höher rückt es auch.
Reuning: Weiß man denn, welche Algorithmen dahinter stehen?
Rähm: Nein, die Algorithmen hält Google sicher hinter Verschluss. Weder die Suchalgorithmen noch die Algorithmen für dieses Autocomplete, also diese Autovervollständigungs-Funktion sind bekannt. Und Google hat bisher auch noch keine Anzeichen gemacht, dass es die Algorithmen irgendwann offenlegen will. Das fordern jetzt allerdings auch einige Experten im Netz, dass man da einfach mal reinschauen kann, um zu sehen, wie das funktioniert, um da möglicherweise dann so Ausfälle auch zu vermeiden.
Reuning: Wieso werden denn eigentlich relativ komplizierte Begriffe angezeigt wie "Prostituierte" oder auch "Rotlichtmilieu", für die es in der deutschen Sprache doch auch eigentlich einfachere Wörter gibt?
Rähm: Das ist eine sehr, sehr gute Frage. Das wird wohl auch mit diesen Algorithmen irgendwo zusammenhängen. Es kann aber auch sein, dass diese einfachen Worte, die sie meinen, von vornherein ausgeschlossen sind. In dieser Autovervollständigen-Funktion gibt es eine Blacklist, also eine Ausschlussliste. Auf dieser Liste stehen Worte drauf, die entweder schon irgendwann erfolgreich rausgeklagt wurden aus dieser Funktion oder die anstößig sind oder die Google als anstößig empfindet. Weiter sind das Begriffe aus dem Bereich der Pornografie, der Hasspredigten oder Hassreden und auch Begriffe, die mit Urheberrechtsverletzungen in Verbindung stehen. Die sind dort gesperrt, die können also nicht eingegeben werden. Zurück zur Frage: Die einfachen Begriffe sind möglicherweise gesperrt und werden dadurch nicht angezeigt.
Reuning: Gibt es denn eine Möglichkeit, solch eine Suche zu manipulieren, also bestimmte Assoziationen künstlich zu erzeugen?
Rähm: Ja, diese Frage habe ich Daniel Wette von Fairrank Köln, das ist ein Suchmaschinenoptimierer, gestellt. Und der hat gesagt: ja, das kann man durchaus manipulieren. Er hat das mit seiner Firma schon ein paar Mal ausprobiert. Und zwar geht das über Menschen. Maschinell ist diese Manipulation eher schwierig möglich. Google kann anhand seiner Algorithmen erkenne, wenn eine Maschine dort Suchbegriffe eingibt und auf die Ergebnisse klickt oder auf diese vorgeschlagenen Suchen klickt. Die schmeißt es dann raus. Wenn aber jetzt Menschen Suchen - zum Beispiel wieder nach "DLF Forschung aktuell": je häufiger Sie das tun, umso eher kommt das in diese Autocompletion rein, in diese Autovervollständigung und umso eher wird das also auch angezeigt. Und wenn man jetzt 10.000 Mal danach sucht und klickt, umso wahrscheinlicher ist es, dass es angezeigt wird. Dafür kann man im Internet Menschen mieten - so böse das klingt. Das sind dann so eine Art Minijobs, dass 100 Mal zum Beispiel danach gesucht und geklickt wird. Und so kann man sich da nach oben schieben und das Ganze ganz erfolgreich manipulieren.
Reuning: Und irgendwann dürfte ja eine Schwelle erreicht sein, wo sich so eine Art Schneeballsystem in Bewegung setzt.
Rähm: Ganz genau. Je häufiger das dann auch angezeigt wird, umso häufiger klicken dann andere Nutzer natürlich auch auf diese Vorgeschlagenen begriffe und verstärken den Algorithmus dadurch, dieses automatische Anzeigen. Und so wird das auch im vorliegenden Fall gewesen sein. Denn - das hat Daniel Wette auch gesagt - negative Begriffe werden deutlich häufiger angeklickt und werden dann automatisch auch immer höher im Ranking gesetzt.
Jan Rähm: Also dieses Vervollständigen funktioniert so, dass ein Nutzer einen Suchbegriff eingibt und dann auf ein Ergebnis klickt, das da in der Google-Suche angezeigt wird. Je öfter er das macht, umso mehr lernt Google, was die Nutzer - also nicht nur der eine, sondern die Nutzer weltweit - suchen, und generiert daraus Begriffe, die es dann in diese Autovervollständigen-Funktion einfügt. Das könnte sein zum Beispiel beim Deutschlandfunk und den Hörern dieser Sendung: Sie gegen ein "DLF" Leerzeichen "F" und dann sollte langsam aber sicher "Forschung aktuell" da stehen. Und genau so funktioniert das: Je öfter das gesucht wird, umso eher wird es dort vorgeschlagen, umso höher rückt es auch.
Reuning: Weiß man denn, welche Algorithmen dahinter stehen?
Rähm: Nein, die Algorithmen hält Google sicher hinter Verschluss. Weder die Suchalgorithmen noch die Algorithmen für dieses Autocomplete, also diese Autovervollständigungs-Funktion sind bekannt. Und Google hat bisher auch noch keine Anzeichen gemacht, dass es die Algorithmen irgendwann offenlegen will. Das fordern jetzt allerdings auch einige Experten im Netz, dass man da einfach mal reinschauen kann, um zu sehen, wie das funktioniert, um da möglicherweise dann so Ausfälle auch zu vermeiden.
Reuning: Wieso werden denn eigentlich relativ komplizierte Begriffe angezeigt wie "Prostituierte" oder auch "Rotlichtmilieu", für die es in der deutschen Sprache doch auch eigentlich einfachere Wörter gibt?
Rähm: Das ist eine sehr, sehr gute Frage. Das wird wohl auch mit diesen Algorithmen irgendwo zusammenhängen. Es kann aber auch sein, dass diese einfachen Worte, die sie meinen, von vornherein ausgeschlossen sind. In dieser Autovervollständigen-Funktion gibt es eine Blacklist, also eine Ausschlussliste. Auf dieser Liste stehen Worte drauf, die entweder schon irgendwann erfolgreich rausgeklagt wurden aus dieser Funktion oder die anstößig sind oder die Google als anstößig empfindet. Weiter sind das Begriffe aus dem Bereich der Pornografie, der Hasspredigten oder Hassreden und auch Begriffe, die mit Urheberrechtsverletzungen in Verbindung stehen. Die sind dort gesperrt, die können also nicht eingegeben werden. Zurück zur Frage: Die einfachen Begriffe sind möglicherweise gesperrt und werden dadurch nicht angezeigt.
Reuning: Gibt es denn eine Möglichkeit, solch eine Suche zu manipulieren, also bestimmte Assoziationen künstlich zu erzeugen?
Rähm: Ja, diese Frage habe ich Daniel Wette von Fairrank Köln, das ist ein Suchmaschinenoptimierer, gestellt. Und der hat gesagt: ja, das kann man durchaus manipulieren. Er hat das mit seiner Firma schon ein paar Mal ausprobiert. Und zwar geht das über Menschen. Maschinell ist diese Manipulation eher schwierig möglich. Google kann anhand seiner Algorithmen erkenne, wenn eine Maschine dort Suchbegriffe eingibt und auf die Ergebnisse klickt oder auf diese vorgeschlagenen Suchen klickt. Die schmeißt es dann raus. Wenn aber jetzt Menschen Suchen - zum Beispiel wieder nach "DLF Forschung aktuell": je häufiger Sie das tun, umso eher kommt das in diese Autocompletion rein, in diese Autovervollständigung und umso eher wird das also auch angezeigt. Und wenn man jetzt 10.000 Mal danach sucht und klickt, umso wahrscheinlicher ist es, dass es angezeigt wird. Dafür kann man im Internet Menschen mieten - so böse das klingt. Das sind dann so eine Art Minijobs, dass 100 Mal zum Beispiel danach gesucht und geklickt wird. Und so kann man sich da nach oben schieben und das Ganze ganz erfolgreich manipulieren.
Reuning: Und irgendwann dürfte ja eine Schwelle erreicht sein, wo sich so eine Art Schneeballsystem in Bewegung setzt.
Rähm: Ganz genau. Je häufiger das dann auch angezeigt wird, umso häufiger klicken dann andere Nutzer natürlich auch auf diese Vorgeschlagenen begriffe und verstärken den Algorithmus dadurch, dieses automatische Anzeigen. Und so wird das auch im vorliegenden Fall gewesen sein. Denn - das hat Daniel Wette auch gesagt - negative Begriffe werden deutlich häufiger angeklickt und werden dann automatisch auch immer höher im Ranking gesetzt.