Archiv

Geteiltes Wissen
Community Intelligence zwischen Prognose und Überwachung

Keiner von uns ist so klug wie wir alle zusammen - auf diesem Prinzip basiert Community Intelligence. Daten werden dafür gesammelt und geteilt, um daraus Erkenntnisse zu gewinnen und zum Beispiel Unternehmen zu optimieren. Ein Überblick über Funktion und Gefahr dieses Konzepts.

Von Peter Welchering |
Nullen und Einsen auf blauen Hintergrund stellen Datentransfer da
Gegenwärtig wird darüber diskutiert, wie Community-Intelligence-Anwendungen technisch und organisatorisch kontrolliert werden können. (picture alliance/Zoonar/dani3315)
Rob Bernshteyn: "Die Gesundheitsbranche ist eine der interessantesten Bereiche. Wie schnell dort Dinge auftauchen, die uns helfen, gesund und am Leben zu bleiben. Wir sehen gerade ein erstaunliches Beispiel für Community Intelligence und dessen Anwendung bei den Leuten, die nach Behandlungsmöglichkeiten für COVID-19 und im Kampf gegen das Coronavirus suchen. Sie tauschen zentral Daten aus und bauen auf diesen Daten eine globale Gemeinschaft der Heilberufe auf."
Was Rob Bernshteyn vom amerikanischen Cloud-Betreiber Coupa schildert, ist - auch angesichts der US-Präsidentenwahl - eines jener Themen, über die die IT-Szene in den USA sehr intensiv diskutiert. Dabei geht es aber gar nicht so sehr um die Pandemiebekämpfung. Das Coronavirus ist dafür ein gutes Beispiel, um an einer sehr großen und allen bekannten Gefahr aufzuzeigen, dass Community Intelligence ein mächtiges Werkzeug ist. Natürlich auch im Kampf gegen eine Pandemie, aber nicht nur dort.
Was ist Community Intelligence?
Hinter Community Intelligence steht das Konzept: Alle geben alle Daten und Transaktionen in die Cloud und dort werden sie ständig analysiert. In der Pandemiebekämpfung heißt das, dass alle Patientendaten, Medikationspläne, Behandlungsmethoden in Echtzeit in eine Datenbank eingepflegt werden und daraus dann über neuronale Netze konkrete Verlaufsprognosen für einzelne Patienten, Behandlungsempfehlungen und ähnliches errechnet werden. In einem weiteren Schritt sollen Unternehmen das nutzen. Überweisungen, Rechnungen, Produktionsdaten, Daten zu Mitarbeitern, Lieferanten, Kunden – alles stellen sie in die Cloud ein und erhalten dafür Vorschläge, wie Verträge auszugestalten sind, die Belegschaft auszubauen ist, wie sie mit ihren Lagerbeständen umgehen sollen.

Aber es gibt auch Vergleichsdaten: Jedes Unternehmen, das seine Daten in die Cloud zur Analyse einspielt, bekommt ein aktuelles Benchmarking. Da kann es dann sehen, wo es im Vergleich zu Konkurrenzunternehmen steht, wo noch Optimierungsmöglichkeiten bei den Angestellten, in den Lieferketten, bei den Büroflächen liegen. Es gibt da zwei Lager in der Community-Intelligence-Bewegung. Die einen sagen, das ist in erster Linie eine grandiose Optimierungsmöglichkeit. Die anderen sagen: Das geht viel weiter, das ist ein gesellschaftlicher Entwurf. Hinter diesem Entwurf steht: Jedes Individuum gibt alle seine Daten in die zentrale Datensammlung und erhält dafür Optimierungsvorschläge. Also Vorschläge, wie er sich selbst optimieren kann, eine bestimmte Sportart stärker zu betreiben, sich zu kleiden, sich zu geben, eine Fremdsprache zu lernen. Optimierung ist dabei das große Zauberwort.
Prinzip: Keiner ist so klug wie alle zusammen
Rob Bernshteyn erläutert das Konzept einer Community Intelligence wie folgt: "Community Intelligence basiert auf einem sehr einfachen Prinzip, nämlich dass keiner von uns so klug ist wie wir alle zusammen. Und wenn wir in der Lage sind, Daten aus einem großen Stichprobensatz zu sammeln, dann bekommen diese Daten einen Sinn. Wir können aus ihnen Erkenntnisse gewinnen. Und diese Erkenntnisse gehen dann zurück an die Unternehmen oder Menschen, die diese Daten bereitgestellt haben."

Alle Unternehmen sollen sich in einen großen Datenpool einbringen. Kostenstellen, Gehälter der Mitarbeiter, Lieferantenlisten, Mitarbeiterqualifikationen, geleistete Arbeitsstunden, Energieverbrauch, Büromieten – alle Daten eines Unternehmens fließen in den zentralen Datenpool. Dort verarbeitet sie ein neuronales Netz, das dann Fragen beantworten soll. Zum Beispiel: Wie kann ich schnell 15 Prozent der Kosten in diesem Unternehmen einsparen? Oder: Werden wir in den nächsten 18 Monaten mehr oder weniger Bürofläche brauchen?

Rob Bernshteyn: "Community Intelligence kann unseren Kunden helfen zu prognostizieren, wann Lieferanten vom Markt verschwinden. Dazu werden unterschiedliche Tatsachen ausgewertet. Etwa dass sie Bestellungen zu spät abschicken oder dass viele der von ihnen gelieferten Waren fehlerhaft sind. Wir können Community Intelligence nutzen, um unseren einzelnen Kunden Benchmarks anzubieten. Sie können vergleichen, wie schnell in ihrem Unternehmen Genehmigungsprozesse ablaufen, oder welche Art von Verhandlungen sie führen. Wir verwenden Community Intelligence, um Betrug zu prognostizieren."
Diskussion über Kontrolle von Community Intelligence
Gegenwärtig wird darüber diskutiert, wie Community-Intelligence-Anwendungen technisch und organisatorisch kontrolliert werden können. Vor allem wenn nicht nur Unternehmen ihre geschäftlichen Entscheidungen mit Hilfe von Community Intelligence treffen wollen, sondern auch Individuen. Ist die Ausweitung dieses Technologieansatzes auf alle Einwohner eines Landes zum Beispiel überhaupt sinnvoll oder wünschenswert? Kritiker vergleichen das mit dem Social-Scoring in China. Dort erhalten Bürger für gewünschtes Verhalten Punkte, bei unerwünschten Verhalten gibt es Punktabzug. Daraus berechnet der Staat einen "Social Score", der über Berufschancen und sogar über die Möglichkeit, mit einem Hochgeschwindigkeitszug zu verreisen, entscheidet.

Rob Bernshteyn ist dieser Vergleich von Community Intelligence mit dem Social Scoring gar nicht recht: "Ich denke, das ist ein sehr spezifisches System, was die da in Sachen Bürger-Management machen. Es gibt viele Möglichkeiten, diese Art eines Konzeptes zentraler Datensammlung und –nutzung zu verwenden. Die Frage ist dann: Wem nutzt das?"

Diese Frage sollten wir uns bei Pooling-Systemen dieser Art, wie etwa einem Social Score, immer vor Augen führen, meint der Risikoforscher Professor Gerd Gigerenzer, emeritierter Direktor des Max-Planck-Institutes für Bildungsforschung: "Möchten wir, dass wir am Ende, wenn die technischen Möglichkeiten da sind, die ganzen Datenbanken zusammenzufahren, das ist die Voraussetzung für den sozialen Kredit-Score, wollen wir warten, bis es dahin kommt und erst dann uns überlegen, ob wir das jetzt umsetzen sollen? Oder möchten wir eine Diskussion in der Gesellschaft führen. An den Schulen, um die Jugend mit rein zu nehmen und darüber zu informieren und sie mitdenken zu lassen. Das würde ich mir wünschen. Das wäre ein Weg hin zu digitaler Risikokompetenz."

Wo lässt sich beim Daten-Pooling und bei der Datenanalyse die Grenze zwischen den für alle nützlichen Prognosen und regelrechter Überwachung ziehen?

Diese Grenzziehung hängt natürlich immer ein Stück weit vom kulturellen Hintergrund ab. In China wird das Social-Score-System mit seinen ganzen Überwachungstechnologien von vielen durchaus begrüßt, weil die sagen, damit könne eben auch die Korruption in den Verwaltungen ein Stück weit besser eingedämmt werden. Vor unserem europäischen Hintergrund bewerten wir dieselben Technologien natürlich ganz anders.
Was sind technische Kriterien?
Wenn man da die Grenze zwischen Prognose und Überwachung ziehen will, hat man es in erster Linie mit Anonymisierung zu tun, und somit mit Fragen der Rückrechenbarkeit auf Identitäten. Wenn absolut anonymisiert wird, kann nicht auf die Identität eines einzelnen Menschen rückgerechnet werden. In einem solchen Fall lassen sich gepoolte Daten hervorragend für Prognosezwecke einsetzen, ohne dass der Einzelne überwacht oder in seinen Freiheiten beschnitten würde. Ein Beispiel aus der Coronakrise sind reine Bewegungstasten. Wenn die absolut anonymisiert von allen Smartphone-Besitzern erhoben werden, lässt sich der Erfolg von Kontaktbeschränkung zur Pandemie-Bekämpfung überprüfen. Aus den Daten kann eine Prognose berechnet werden, wie sich die Mobilität und Kontakthäufigkeit entwickeln wird, dann kann sogar weiter gerechnet werden, wie sich die Zahl der Neuinfektionen mit welcher Wahrscheinlichkeit entwickelt. Aus den anonymen Krankheitsverläufen lässt sich die Hospitalisierungsrate, sogar die Zahl des beatmungspflichtigen Intensivpatienten errechnen. Alles reine Prognose, alles fern von Überwachung. Die fängt dann an, wenn das Smartphone in Sachen Pandemiebekämpfung als eine Art elektronische Fußfessel eingesetzt wird wie häufiger in Asien zu sehen ist.
KI-gestützte Software für die Bewertung, Analyse und Entscheidungsvorbereitung
Da haben wir es mit Mustererkennung und neuronalen Netzen zu tun. Die Mustererkennung dient der Identifizierung von Verhaltensabläufen oder -mustern. Die neuronalen Netze rechnen dann Entscheidungen, etwa, ob ein Kunde ein kurzfristiges oder längerfristiges Zahlungsziel bekommt. Das Problem dabei ist die mangelnde Transparenz der Gewichtungen. Also welche Kriterien werden für die Berechnung wie gewichtet. Wie stark hängt die Kreditwürdigkeit von einem Sitz im Ausland, von der Bilanzsumme, von der Branche, in der Unternehmen tätig sind ab. Da sagen die Vertreter der Community Intelligence, dass diese Gewichtungen von den Anbietern transparent gemacht werden. Aber dafür gibt es eben noch kein Standardmodell, und deshalb ist das so problematisch. Und auch Sicherheitstechniken, die einen Missbrauch verhindern, sind da noch nicht so richtig entwickelt. Die Grenze von Prognose zur Überwachung kann jederzeit überschritten werden. Da gibt es noch keinen Algorithmus, der das wirksam verhindert.