
Im Rahmen ihrer Studie spielten sie drei Sekunden lange Videos ab, auf denen mehrere Personen zu sehen waren. Die Szenen wurden sowohl KI-Systemen wie auch menschlichen Versuchsteilnehmern vorgeführt.
Letztere waren sich bei der Beurteilung weitgehend einig - etwa bei der Frage, ob zwei Menschen im Film miteinander sprachen. Die insgesamt mehr als 350 verschiedenen KI-Modelle, die für die Studie eingesetzt wurden, taten sich mit einer Einschätzung hingegen schwer.
Lebensgefahr bei Fehlurteil
Für die Wissenschaftler zeigt sich daran, wie komplex der Vorgang des Sehens ist: Es genügt demnach nicht, wenn eine KI Objekte und Gesichter erkennen kann. Sie muss auch die Geschichte dahinter verstehen. Je nach Einsatzbereich hat dies ganz praktische Konsequenzen. Selbstfahrende Autos mit KI-Unterstützung müssen zum Beispiel erkennen, ob Fußgänger gerade eine Straße überqueren wollen oder ob sie sich auf dem Gehweg unterhalten.
Diese Nachricht wurde am 24.04.2025 im Programm Deutschlandfunk gesendet.