Wenn Unternehmen anonym Daten erheben, kann man nicht mehr rückverfolgen, welche Person dahinter steckt – sollte man meinen. Eine Studie der Universität Leuven und des Imperial College London schlägt jetzt allerdings Alarm: Aus 99,98 Prozent der untersuchten Datensätze konnten Rückschlüsse auf die Personen gezogen werden, von denen diese stammten.
Sie dürften eigentlich nicht den Weg zu der Person weisen, der sie gehören, und tun es in vielen Fällen doch: Die Rede ist von anonymisierten Daten. Forscher der Universität Leuven und des Imperial College London untersuchten mit einem auf Machine Learning basierenden Tool Datensätze von Amerikanern. Anhand von 15 Charakteristika, darunter Alter, Geschlecht und Familienstand, konnten sie Rückschlüsse auf die Identität der Personen ziehen. Denn auch wenn Daten wie Name und E-Mail-Adresse anonymisiert werden, kann häufig dennoch die Person hinter dem Datensatz identifiziert werden.
Dr. Luc Rocher von der University Leuven, der am Report zur Studie mitgeschrieben hat, sagt: „Während es viele Menschen gibt, die männlich sind, in ihren Dreißigern und in New York City leben, kann man von bedeutend weniger behaupten, dass sie am 5. Januar geboren wurden, einen roten Sportwagen fahren und zwei Kinder – beides Mädchen – sowie einen Hund haben.“ Die Problematik wird anhand dieses konkreten Beispiels deutlich: Die Anonymisierung einzelner Daten ist augenscheinlich nicht automatisch gleichbedeutend mit der vollkommenen Anonymisierung einer Person.
Die sogenannte Re-Identifizierung von anonymisierten Daten scheint also durchaus möglich. Dr. Yves-Alexandre de Montjoye vom Imperial College London sagt dazu: „Unsere Forschung zeigt, wie einfach – und wie genau – Personen in diesem Fall verfolgt werden können“. Die Ergebnisse der Studie dürften die Diskussion über Datenschutz weiter vorantreiben.