Die Welt verändert sich vor unseren Augen in rasendem Tempo. Keine drei Monate nachdem die Behörden von Wuhan erstmals die Weltgesundheitsorganisation (WHO) über ein neuartiges Coronavirus informiert haben, sind mehr als 3 Milliarden Menschen mit schweren Einschränkungen ihrer Bewegungsfreiheit konfrontiert, die mindestens mehrere Wochen dauern sollen.Dieses Regime der erzwungenen Immobilität ist nur der sichtbarste Teil einer tektonischen Verschiebung der politischen Landschaft, in der Maßnahmen durchgesetzt werden, die bis vor Kurzem noch undenkbar waren. Gleichzeitig radikalisieren sich bestehende Entwicklungen.
Bei der Nutzung digitaler Daten im Kampf gegen die Ausbreitung des Virus kommt beides in problematischer Weise zusammen. Es ist naheliegend, auf „die Daten“ der großen Firmen der Mobilfunk- und Social-Media-Branche zurückzugreifen, um die Ausbreitung des Virus zu bekämpfen. Seit Jahren betonen diese Firmen gern, wie genau sie uns kennen, wie detailliert sie über unsere Handlungen, Sorgen und Wünsche Bescheid wüssten und dass sie unser künftiges Verhalten aus unserem bisherigen ableiten könnten.Mehr noch, die digitale Netzwerktheorie, etwa Facebooks „social graph“, der die Beziehungen zwischen allen Nutzern der Plattform darstellt, und die Netzwerktheorie der Epidemiologie sind in ihren Grundlagen sehr ähnlich.
Beide interessieren sich dafür, wie Menschen miteinander verbunden sind und wie sich gewisse Dinge – Informationen, Handlungen, Krankheiten – entlang dieser Verbindungen ausbreiten.Es scheint also eine geradezu perfekte Passung zu geben, zwischen dem, was die Datenanalyse verspricht, und dem, was gesundheitspolitisch von höchster Dringlichkeit ist. Das Problem dabei: „Daten“ sind nicht gleich „Daten“. Das Erkenntnispotenzial spezifischer Datentypen ist höchst unterschiedlich. Ganz zu schweigen davon, dass unter dem derzeitigen Handlungsdruck etablierte Grundrechte im Bereich Datenschutz aufgeweicht werden, ohne dass neue Instrumente für den demokratiefähigen Umgang mit diesen Daten geschaffen werden.
Als eine der ersten Firmen in Europa übergab Motionlogic, eine Tochter der Deutschen Telekom, am 17. März anonymisierte Standortdaten dem Robert-Koch-Institut (RKI) zur Auswertung. Zehn Tage später verkündete die EU-Kommission, dass sie in Gesprächen mit den Mobilfunkanbietern sei, um europaweit auf solche Daten zurückgreifen zu können. Konkret handelt es sich dabei um aggregierte Daten aus Funkzellen, jenen Antennen, mit denen mobile Telefone immer verbunden sein müssen, um überhaupt Netzanbindung zu haben.Der Radius einer Funkzelle kann im dünnbesiedelten ländlichen Raum mehrere Kilometer betragen, in städtischen Ballungsgebieten sind es wenige hundert Meter. Dort ist es möglich, durch Kombination der Daten aus mehreren Funkzellen die Position auf ungefähr 30 Meter genau zu bestimmen. Daraus lassen sich natürlich keine Kontakte ablesen, es wäre schon schwierig, Menschenansammlungen festzustellen.Nur weil sich 50 Mobiltelefone gleichzeitig in einer Funkzelle befinden, heißt das nicht, dass dies auch epidemiologisch relevant ist. Bewegungsströme hingegen lassen sich so gut analysieren, um etwa zu bestimmen, ob Ausgangsbeschränkungen wirken oder ob sie noch weiter verschärft werden sollten. Es ist anzunehmen, dass sich auch Angela Merkel auf solche Daten stützte, als sie sich am 28. März bei der Bevölkerung für die Einhaltung der neuen Regeln bedankte.
Wichtiger, als solche allgemeinen Bewegungsströme zu erfassen, ist aber die individuelle Kontaktnachverfolgung. Dafür müssen die Daten sehr viel genauer sein, inklusive der Adressierbarkeit von Einzelpersonen. Zwei verschiedene Datentypen kommen hierfür infrage. Zum einen sind das Ortungsdaten, die auf dem Satellitensystem GPS beruhen. Hier liegt die Genauigkeit der Ortung bei wenigen Metern. Das reicht, um Hotspots zu bestimmen, etwa ein Lokal, in dem sich ein Erkrankter aufgehalten hat. Es reicht auch, um Menschenansammlung zu erkennen. Google bietet schon seit Längerem auf dieser Grundlage Vorhersagen an, wie voll etwa ein öffentlicher Ort zu einer bestimmten Uhrzeit sein wird. Auch Verkehrsstaus werden so in Echtzeit ermittelt.
Ein anderer Weg ist, von einer absoluten Ortung abzusehen und stattdessen die relative Distanz zwischen Personen zu messen. Dazu wird das Bluetooth-Signal verwendet. Ursprünglich entwickelt für kabellose Verbindungen über kurze Distanzen (etwa zu Kopfhörern), kann es auch genutzt werden, um eine Liste aller in der Nähe befindlichen Geräte zu erstellen. Ihre Nutzer können dann über einen Krankheitsfall benachrichtigt und über ein erhöhtes Ansteckungsrisiko informiert werden. Wo dieser Kontakt stattgefunden hat, muss nicht festgestellt werden, auch nicht notwendigerweise mit wem.Keiner der beiden Datentypen ermöglicht eine automatische Verfolgung des Virus, nicht nur, weil nach wie vor Ungenauigkeiten bestehen. Noch entscheidender ist, dass die zugrunde liegenden mathematischen Modelle sich zwar ähneln, aber die digitalen Daten – wie so oft – ein größeres Maß an Präzision suggerieren, als sie tatsächlich liefern können. Denn um einen „Link“ im epidemiologischen Sinn, also die hohe Wahrscheinlichkeit einer Übertragung, feststellen zu können, braucht es viel nuancierte Information als die reine Nähe von Geräten.
So lässt sich aus diesen Daten nicht herauslesen, ob zwei Personen den notwendigen Sicherheitsabstand einhalten oder sich die Hand geben; und schon gar nicht, ob das Virus übertragen wird. Im besten Fall ist es möglich, ein relativ weites Netz an vorsorglicher Quarantäne zu werfen. Was immer noch deutlich präziser wäre, als die ganze Bevölkerung in Isolation zu schicken.
Big Data gegen das Virus?
Aber auch dies ist unmöglich, wenn man nicht weiß, wer erkrankt ist und wessen Kontakte entsprechend nachverfolgt werden müssen. Ohne eine gut ausgebaute Daseinsvorsorge im Bereich der öffentlichen Gesundheit, die in der Lage ist, schnell massenhaft Tests durchzuführen, führen solche Maßnahmen ins Leere; selbst wenn – theoretisch – feingliedrige Bewegungs- beziehungsweise Kontaktdaten vorhanden wären.In der Praxis sind solche Daten aber nicht einfach verfügbar, schon gar nicht für die Gesundheitsämter, sondern müssen erst beschafft werden. Hier gibt es zwei Möglichkeiten, die miteinander kombinierbar sind. Das eine ist die Installation von Apps auf dem Smartphone, mit deren Hilfe Daten erhoben werden können. Dies verlangt die aktive Teilnahme der Nutzer.
Zum anderen verfügen die großen Social-Media-Plattformen, und die vielen im Hintergrund agierende Datenhändler, in ihren firmeneigenen Rechenzentren bereits über große Mengen von Daten. Mit ihnen lassen sich detaillierte Bewegungsprofile und Kontaktketten rekonstruieren, wobei die Qualität dieser Daten von außen schwierig zu beurteilen ist.
Der Druck, solche Daten zu beschaffen, wächst jeden Tag, mit dem sich die Folgen der Krise tiefer in die Gesellschaft fressen. Auch Wissenschaftler rufen dazu auf, weil sich Effizienzgewinne erzielen lassen. Denn die datenunterstützte Kontaktnachverfolgung erlaubt, schneller und zielgenauer mehr Menschen zu kontaktieren und in Quarantäne zu schicken und damit Isolation und soziale Distanzierung viel präziser durchzuführen und gleichzeitig die Kosten für die Allgemeinheit vergleichsweise niedrig zu halten.
Aus gesundheitspolitischer Sicht ist es entscheidend, dass solche Maßnahmen schnell, umfassend und effektiv durchgeführt werden, gerade auch um die Epidemie in der Zeit nach der Aufhebung der Ausgangsbeschränkungen kontrollieren zu können. Aus gesellschaftspolitischer Sicht ist es jedoch ebenso wichtig, wie solche Maßnahmen durchgeführt werden, denn die technologisch-administrativen Strukturen, die jetzt geschaffen werden, werden wohl das Ende der Krise überdauern.
Der Druck der Krise, der schnelles Handeln erfordert, eröffnet mächtigen Akteuren die Möglichkeit, sich neue Datenquellen zu erschließen und damit ihren bereits beträchtlichen Wissens- und Machtvorsprung noch weiter auszubauen. Am offensichtlichsten ist dies in China, wo der Staat nicht nur immer neue Überwachungswerkzeuge eingeführt hat, sondern in der Phase des langsamen Abbaus der kollektiven Beschränkungen individuelle Bewegungsfreiheit mittels eines algorithmisch ermittelten Werts festgelegt wird.
Die Teilnahme an diesem System ist weder freiwillig noch ist der Umgang mit den Daten transparent. Aber auch in Demokratien findet ein problematischer Run auf neue Datenquellen statt. In Israel etwa wurde direkt der Inlandsgeheimdienst Schin Bet mit dem Tracking Infizierter beauftragt; mit der lapidaren Begründung, dort seien die erforderlichen Ressourcen und das technologische Wissen bereits vorhanden. Der israelische Überwachungsspezialist NSO-Group, der unter anderem für einige Golfstaaten Journalisten und Menschenrechtsaktivisten ausspioniert, brachte umgehend eine Tracker-App auf den Markt, die Staaten einsetzen können, um Bewegungsprofile von Nutzern auszuwerten. Solche kommerziellen Angebote gibt es immer mehr, teilweise garniert mit dubiosen Versprechen, auch künstliche Intelligenz zu nutzen.
Aber nicht nur personenbezogene Daten stehen im Visier, sondern auch Daten der öffentlichen Infrastruktur. Ganz besonders lukrativ sind die des Gesundheitssystems, das schon seit Jahren von allen großen Firmen mit Versprechungen der „Effizienzsteigerung“ umworben wird. Nun könnten die Dämme brechen. So werden jetzt in Großbritannien Daten des schon vor der Krise überforderten Gesundheitssystem zur „Optimierung“ an ein Konsortium, dem Amazon, Microsoft, Palantir und der lokale Anbieter Faculty AI anghören, übermittelt.1 Deren Datenanalyse soll nun (mit) entscheiden, wie die knappen Ressourcen verteilt werden. So entstehen Abhängigkeiten, welche die Entscheidungsfähigkeit der öffentlichen Hand untergraben. Auf freiwillige Kontaktnachverfolgunghingegen setzt Südkorea, und das sehr erfolgreich. Hier entwickelte das Innenministerium eine App, welche über GPS die Bewegungsprofile der Nutzer erfasst.
Die App warnt, wenn man sich einer erkrankten Person bis auf zwei Meter genähert haben beziehungsweise sich ohne Schutzmaske in einem Raum aufhielten, in dem ein Kranker hustete. Dieses Informationsdetail kann natürlich nicht automatisch erhoben werden, sondern stammt aus der persönlichen Befragung der Erkrankten. Wird eine Nähe festgestellt, muss der Nutzer der App ebenfalls in Quarantäne. Zusätzlich werden die Daten der Erkrankten veröffentlicht, in Karten visuell aufbereitet und laufend aktualisiert.Aus europäischer Sicht stellt dies einen schweren Eingriff in die Privatsphäre dar. Eine Alternative entwirft das Projekt „Pan-European Privacy-Preserving Proximity Tracing“, das mittels Bluetooth Kontakte in relevanter Nähe aufzeichnet, um im Bedarfsfall das so erfasste Netzwerk zu warnen, ohne persönliche Daten preiszugeben. Noch sind solche datensparsamen Apps allerdings nirgends in Europa im Einsatz.
Demokratisches Big Data?
Aber Schutz der Privatsphäre allein, so er denn implementiert wird, genügt ohnehin nicht. Daten sind ja nur das Rohmaterial für vielfältige Analysen und Modelle. Deshalb ist es wichtig, zusätzlich Formen der Nutzung von „Big Data“ zu entwickeln, die mit demokratischen Prinzipien vereinbar sind. Dazu braucht es aber nicht nur technische, sondern auch institutionelle und regulative Innovationen. Entlang folgender Linien könnte es erreicht werden:
Erstens, es muss eine Nutzungsbeschränkung für die Daten bestehen. Um das zu gewährleisten, muss eine externe Stelle die zu untersuchenden Probleme und erlaubten Fragestellungen bestimmen. Es dürfen keine weiteren Analysen gemacht werden, nur weil die Daten vorhanden sind.
Zweitens, Vergleichbarkeit der Auswertungen muss ermöglicht werden. Die Datenanalyse darf nicht nur einem einzigen Anbieter überlassen werden. Daten sprechen nie für sich selbst, sondern werden in Modelle gefüttert, denen eine Vielzahl von Annahmen zugrunde liegen. Ob die Modelle überhaupt halten, was sie versprechen und welches davon für das konkrete Problem das geeignetste ist, lässt sich nur im Vergleich der Resultate ermitteln.
Drittens, nach der Beendigung der Analyse müssen die Fragestellung und die Modelle offengelegt werden, um deren Nützlichkeit und den ethischen Umgang mit sensiblen Daten beurteilen zu können. So kann ein kollektiver Lernprozess stattfinden.
Und viertens müssen die Daten nach der Analyse wieder gelöscht werden.Unter dem Druck der aktuellen Krise ist es sehr schwer, ein solches Regime zu entwickeln, aber es ist höchste Zeit, dass es in Angriff genommen wird. Denn der Bedarf, auf komplexe und sensible Datenmodelle zurückgreifen zu können, um Fragen von öffentlichem Interesse beantworten zu helfen, wird nicht kleiner werden, sondern in Zukunft – nicht nur im Kontext von Pandemien – immer öfter auftauchen.
1 „The power of data in a pandemic“, Department of Health and Social Care, 28. März 2020, www.healthtech.blog.gov.uk.
https://monde-diplomatique.de/artikel/!5672015
© LMd, BerlinLe Monde diplomatique vom 09.04.2020, von Felix Stalder