Das Netz als Rohstoff für Künstliche Intelligenz
Jetzt gibt es noch eine Sache, die Software zuverlässiger erledigen kann als Menschen: Eine Million Fotos fehlerarm in 1000 vordefinierte Kategorien sortieren. Das erledigt ein bei Baidu entwickeltes Programm mit einer Fehlerquote von 4,58 Prozent. Menschen lagen bei den Imagenet-Fotos nach Training bei 5 Prozent Fehlerquote.
Das klingt ganz beachtlich, aber hey: Hier geht es darum, verschiedene Terrier-Arten, Gurken und Dreiräder korrekt auf Fotos zu erkennen. Nicht trivial, aber doch etwas weltfremd als Beleg für die enormen Fortschritte künstlicher Intelligenz. Oder?
Ich denke nicht. Was Baidu bei da bei der Bilderkennung schafft, erledigt Software heute bereits für Millionen Menschen: Programme sortieren für uns die unüberschaubare Wirklichkeit in erfassbare, für uns nützliche Ausschnitte. Beispiele, die so alltäglich sind, dass sie banal klingen:
- Software entscheidet, wie viel Aufmerksamkeit wir welchen Freunde und Bekannten schenken (auf Facebook).
- Software wählt die fünf oder sechs Aspekte aus, auf die wir uns bei der Recherche zu einem Buch, einem Menschen oder einer Firma fokussieren, weil sie in den Suchtreffern weit oben stehen.
- Software beurteilt, wie vertrauenswürdig Käufer sind (und entscheidet, wer wie zahlen und wohin was geliefert werden darf).
Abstrahiert man von diesen Beispielen, ist diese Entwicklungsrichtung zu erkennen: Software erfüllt mehr und mehr eine Aufgabe, die lange menschengemachten Medien vorbehalten war: Software strukturiert die Welt. Sie ist eine Schnittstelle zur Welt. Dabei hilft es, dass heute der überwiegende Teil des aktuellen Weltwissens, der menschlichen Reaktionen und digital und online vorliegt. Das Internet ist der Rohstoff für Software, die daraus etwas Neues, für Menschen Brauchbares zieht und zusammenstellt. So wie Googles Knowledge Graph in diesem Beispiel:
https://twitter.com/fst/status/598041441055703040/
Was folgt daraus?
- Es wird Ärger und Verteilungskämpfe zwischen Rohstofflieferanten und den Erschaffern der Software geben, die Rohstoffe veredelt und vermarktet. (Hier einige Gedanken dazu)
- Wir werden viel mehr Medienwirkung-Experimente sehen. Baidus Bilderkenner hat sich selbst (nach Vorgaben seiner Entwickler) optimiert. Im Netz ist mit einem Millionenpublikum der Reaktion bestimmter Nutzer auf bestimmte Veränderungen des Angebot experimentell messbar. Und die Ziele dieser Optimierung? Nutzungintensität steigern? Verkaufswirkung von Content Marketing erhöhen? Nutzer glücklich machen? Führt uns zu Punkt 3.
- Wir brauchen Kriterien und Methoden, um unabhängig zu prüfen, ob Software diese Aufgaben gut und richtig macht. Eine Berufsethik für die Erschaffer dieser Programme wäre auch nicht schlecht. Wenn es seit Jahren Testfahrten für Software-gesteuerte Autos gibt, warum nicht auch für Welt.
Ich habe obenoft Software tut dies und jenes geschrieben. Mir ist völlig klar, das Menschen sie schaffen. Doch wie die Autoren des Papers zum Baidu-Bilderkenner schreiben:
„It is possible that other approaches will yield the same results with less demand on the computational side. The authors of this paper argue that with more human effort being applied, it is indeed possible to see such results. However human effort is precisely what we want to avoid.“