Bilderkennung mit Facebook-Daten: Ich weiß, wer du bist (Spiegel Online, 2.8.2011)
Bilderkennung mit Facebook-Daten
Ich weiß, wer du bist
Sie nennt sich Daisy, flirtet auf einer Datingplattform im Internet, aber wie heißt die Schöne im wahren Leben? Was mag sie, wer sind ihre Freunde? US-Forschern ist es gelungen, Hunderte Nutzer eines Flirtportals zu identifizieren – mit Standard-Software zur Gesichtserkennung.
Spiegel Online, 2.8.2011
{jumi [*3]}
Eine Geschichte aus einer möglichen Zukunft: Sie sitzen in der U-Bahn einem interessanten Menschen gegenüber. Wie heißt er? Wo arbeitet er? Wofür interessiert er sich? Sie halten kurz ihr Smartphone hoch, fotografieren unauffällig das Gesicht ihres Gegenübers und nach ein paar Sekunden erscheinen auf ihrem Handy all diese Details.
Ferne Zukunft? Im Prinzip wäre das technisch schon sehr bald möglich, sagen die Forscher Alessandro Acquisti, Ralph Gross und Fred Stutzman von der Carnegie Mellon University. Die Wissenschaftler haben in mehreren Experimenten Belege dafür gefunden, dass die Technik funktioniert. Es ist möglich, Menschen nahezu in Echtzeit per Software zu identifizieren – anhand von im Internet frei verfügbaren Fotos.
Acquisti und Gross stellen ihre vorläufigen Forschungsergebnisse in den kommenden Tagen vor, unter anderem auf der Black Hat Konferenz, einem der wichtigsten Treffen von IT-Sicherheitsforschern.
Klarnamen für pseudonyme Nutzer von Datingsites
In einem Experiment haben Acquisti, Gross und Stutzman versucht, die Nutzer einer Datingwebsite zu identifizieren, die dort nur unter Pseudonym agierten. Dabei beschränkten sich die Forscher auf Mitglieder aus einer Stadt in Nordamerika – um die für die Fotoanalyse nötige Rechenkraft zu reduzieren.
Ein Suchroboter entdeckte 275.540 passende Facebook-Profile und 5818 Flirtprofile auf der Datingsite. Im nächsten Schritt glich die Gesichtserkennungssoftware die von Facebook geladenen Porträtfotos mit denen von der Datingsite auf Übereinstimmungen ab. Zu 13,9 Prozent der Datingprofile fand die Software ein Facebook-Profil mit einem ähnlichen Porträtfoto.
Das Einwohnermeldeamt des Webs
Um die Qualität der Software einzuschätzen, wurden die Bilder anschließend von Menschen überprüft. Ergebnis: Die Menschen attestierten bei 10,5 Prozent der Datingprofile eine “sichere” oder “wahrscheinliche” Übereinstimmung. Sprich: Zu 610 Flirtprofilen mit Pseudonymen fanden die Forscher das passende Facebook-Konto – und damit in den meisten Fällen den wahren Namen.
Facebook schreibt den Nutzern in den Nutzungsbedingungen vor, ihren ” tatsächlichen Namen ” anzugeben, die Mehrheit der Nutzer hält sich wohl an diese Vorgabe. In einer Umfrage gaben fast 90 Prozent der von Acquisti und Gross befragten Nutzer an, mit ihren wahren Namen bei Facebook registriert zu sein.
Facebook ist so etwas wie das Einwohnermeldeamt des Webs geworden. Das Unternehmen behandelt Namen und Profilfoto der registrierten Nutzer als öffentlich zugängliche Informationen – es gibt für diese Details keine Privatsphäre-Einstellungen.
“Demokratisierung von Überwachungstechnik”
Die Veröffentlichung ihres Papers in einer wissenschaftlichen Fachzeitschriften steht noch bevor. Aber auf Basis der SPIEGEL ONLINE vorliegenden Vorabversion lässt sich sagen: Wenn die Ergebnisse der Forscher sich in größerem Maßstab reproduzieren lassen – und es spricht viel dafür, dass das bald möglich ist -, wirkt die deutsche Datenschutzdebatte über die Verpixelung von Häusern in Straßenpanoramen wie aus einem vergangenen Jahrhundert.
Die Forscher sagen eine “Demokratisierung von Überwachungstechnik” voraus – es soll in absehbarer Zeit jedem Smartphonebesitzer möglich sein, mit Standardsoftware Informationen über wildfremde Passanten abzurufen. Die Wissenschaftler haben bei ihren Experimenten handelsübliche Webcams und Smartphones benutzt, dazu Standard-Gesichtserkennungssoftware vom US-Unternehmen PittPatt, das Ende Juli von Google gekauft wurde.
Gesichtsabgleich in Echtzeit
In einem zweiten Experiment wollten die Forscher erproben, wie gut die De-Anonymisierung in Echtzeit funktioniert. Dazu luden die Forscher Studenten ein, an einer Online-Befragung teilzunehmen. Die 93 Probanden wurden zunächst mit einer Webcam fotografiert, dann füllten sie am Computer allgemeine Fragen zu ihrer Facebook-Nutzung aus. Im Hintergrund glich die Gesichtserkennungssoftware die eben aufgenommenen Porträts mit den öffentlich zugänglichen Fotos aus gut 25.000 Facebook-Profilen ab, die eine Verbindung zum College hatten. Die Software brauchte im Schnitt 2,89 Sekunden, um jedem Teilnehmer das mit hoher Wahrscheinlichkeit ähnliche Facebook-Foto zuzuordnen.
Am Ende der Online-Befragung zeigte der Computer den Probanden diese bei Facebook gefundenen Fotos mit der Frage, ob sie darauf zu sehen sind. In 42 Prozent der Fälle erkannten die Probanden sich auf dem Foto wieder.
Das ist eine erstaunlich hohe Zahl, bedenkt man, dass die Forscher ein Standardprogramm, eine 35-Dollar-Webcam und ausschließlich öffentlich zugängliche Informationen nutzten.
Mehrheit der Studenten hält ihr Facebook-Profilbild für nicht-öffentlich
Ein interessantes Detail dieser Studie: Gut 84 Prozent der befragten Studenten gaben an, bei Facebook als Hauptprofilfoto ein Porträt von sich selbst zu nutzen. Und mehr als die Hälfte der Studenten war überzeugt, dass dieses Foto nicht für jedermann im Netz zugänglich sei. Doch das ist ein Irrtum: Das Porträtfoto behandelt Facebook als öffentlich – jede App, jeder Nutzer kann es abrufen wie auch den dazugehörenden Namen. Das war nicht immer so. Facebook weitet seit Jahren seine Standardvorgaben aus, heute gilt viel mehr per Standard als öffentlich oder für “Alle” freigegeben als noch vor zwei Jahren.
Natürlich ist niemand gezwungen, bei Facebook ein Foto hochzuladen, schon gar nicht ein Porträt. Aber das wird mehr und mehr zur sozialen Norm – Profile ohne Gesichter wirken verdächtig.
Echtzeit-Identifizierung per Smartphone
Derzeit experimentieren Acquisti und Gross mit einer Smartphone-Anwendung, die zu aufgenommenen Fotos von Unbekannten in Echtzeit Online-Identitäten zuordnet und Namen, Interessen, Vorlieben und derlei mehr anzeigt.
Die Forscher gehen davon aus, dass so etwas in naher Zukunft funktionieren und wohl auch für jedermann verfügbar sein wird. Derzeit reicht die bei Cloud-Diensten schnell abrufbare Rechenkraft nicht aus, um ohne räumliche Eingrenzung Identitäten per Gesichtserkennung zu suchen. Die notwendige Rechenzeit für den Abgleich eines Fotos mit den Profilbildern aller in Deutschland registrierten Facebook-Nutzer ist noch zu groß. Aber das sind lösbare Probleme: Die Mehrheit der Menschen, die in Hamburg die U-Bahn benutzen, wohnt wahrscheinlich auch in der Hansestadt. Daher könnte ein Suchender seine Recherche also auf die Stadt beschränken.
Targeting im Offline-Handel?
Die Algorithmen zur Gesichtserkennung werden immer besser, die Preise für Rechenzeit sinken und das Reservoir an frei zugänglichen Profilfotos und verknüpften persönlichen Details wächst. In zehn Jahren könnte es Kontaktlinsen geben, die unauffällig Digitalfotos der Umgebung mit Datenbanken abgleichen und Zusatzinformationen anzeigen, zum Beispiel über das Gegenüber in der U-Bahn? Vielleicht werden dann die Schminktipps gegen Gesichtserkennung, wie sie der Künstler Adam Harvey gibt, in naher Zukunft in Ratgebern von Datenschützern auftauchen.
Wichtiger für die weitere Entwicklung werden aber die kommerziellen Möglichkeiten dieser Technik sein: Gesichtserkennung könnte das Werkzeug sein, um die Targeting-Möglichkeiten aus der Online-Werbung in die Offline-Welt zu übertragen. Wie wäre es zum Beispiel, wenn ein Design-Laden auf Basis der Gesichtserkennung dieselben Statistiken zur Laufkundschaft erhält wie sie heute jeder Seitenbetreiber auf Facebook hat: Wie viel Prozent der Besucher sind weiblich und zwischen 18 und 24 Jahre alt?
Die Entwicklung ist nicht mehr umzukehren, schreiben Acquisti und Gross in einer Rohfassung ihres Ausblicks – Namen und Porträtfotos von Millionen Webnutzern sind längst verknüpft im Web. Es ist nur eine Frage der Zeit, dass wir mit der Analyse dieser Informationen mehr und mehr in der Offline-Welt konfrontiert werden.
Die Wissenschaftler schreiben: “Als Nutzer sozialer Netzwerke haben wir längst einer Datenbank mit De-facto-Real-Identitäten zugestimmt.”