Künstliche Intelligenz: Roboter machen Ihre Tweets zu Geld (Spiegel Online, 24.2.2012)
Künstliche Intelligenz
Roboter machen Ihre Tweets zu Geld
Software, die lesen und schreiben kann? Kein Sci-Fi-Szenario, sondern längst Alltag: Textanalyse-Roboter beobachten Twitter für Hedgefonds, Sicherheitssoftware sucht in Firmen-E-Mails nach Hinweisen auf Korruption. Doch Experten fürchten, Roboter-Auswerter könnten manipuliert werden.
Spiegel Online, 24.2.2012
{jumi [*3]}
Die New Yorker Firma Dataminr verrät wenig über Details ihres Geschäfts. Auf der kargen Firmen-Website heißt es, man nutze Social Media als Echtzeit-Sensorennetzwerk, um “aufkommende Ereignisse” aufzuspüren und Kunden im “Finanz- und Regierungssektor” Alarmsignale zu geben. Nur ein konkretes Beispiel für diese Arbeit ist öffentlich bekannt: Dataminr habe seinen Kunden den ersten Alarm zum Tod Osama Bin Ladens 23 Minuten vor der ersten Nachrichtenagentur geschickt, erzählte Dataminr-Geschäftsführer Ted Bailey Mitte 2011 bei einer Entwicklerkonferenz.
Grundlage für diesen Alarm waren 19 bei Twitter veröffentlichte Nachrichten. Twitter ist eine wichtige Quelle für Dataminr. Die Software liest alle Tweets, die veröffentlicht werden, und sie hat alle Tweets analysiert, die jemals veröffentlicht worden sind. Bailey beschrieb Entwicklern das Vorgehen seiner Programme so: “Wir konzentrieren uns auf aggregierte Daten. Wir vergleichen alles, was jetzt geschieht, mit allem, was in der Vergangenheit passiert ist.”
Diesen Ansatz verfolgen viele neue Anwendungen, bei denen Software Texte liest, analysiert oder sogar schreibt: Da heute eine so große Menge strukturierter Daten wie noch nie zuvor digital zugänglich sind, kommt es nicht mehr nur darauf an, dass Software den Sinn von Aussagen versteht. Unternehmen wie Dataminr können große Textmengen statistisch auswerten, um Auffälligkeiten zu entdecken.
Software sucht “plötzliche emotionale Reaktionen”
Dataminr prüft Geschäftsführer Bailey zufolge beispielsweise, wie viele Tweets zu einem bestimmten Aspekt eines Themas existieren. Das Programm analysiert, ob diese Verteilung auf Basis historischer Daten ungewöhnlich ist. Außerdem prüft Dataminr, wie Twitter-Nutzer auf bestimmte Themenaspekte reagieren. Die Software sucht in den Texten nach Hinweisen auf “plötzliche emotionale Reaktionen” – ein Indikator für die Bedeutung einer neuen Entwicklung.
Wie gut die Dataminr-Software funktioniert, kann man von außen nicht beurteilen. Wie viele Ereignisse hat die Software übersehen? Wie oft hat sie Fehlalarm ausgelöst? Wie bewertet Dataminr, dass eine neue Entwicklung nicht nur ungewöhnlich, sondern auch relevant für die Finanzmärkte ist? Michael Hess, Leiter des Instituts für Computerlinguistik der Universität Zürich, beurteilt das Aufspüren neuer Entwicklungen per Textanalyse als “eine der schwierigeren Anwendungen”.
Das Grundproblem: Man könne wichtige, börsenrelevante Ereignistypen und die Art, in der sie in verschiedenen Sprachen beschrieben werden, von Hand zusammenstellen. Aber mit einer solchen Liste relevanter Ereignistypen werde man “die wirklich unerwarteten Ereignisse definitionsgemäß verpassen”. Zudem warnt Hess vor Manipulation: “Es dürfte einer Organisation mit entsprechenden Ressourcen ein Leichtes sein, hier Desinformation zu streuen und ‘fake events’ zu erzeugen.”
Banken und Hedgefonds zapfen Twitter-Analysen an
Wie Dataminr das Relevanzproblem lösen und Manipulationen vorbeugen will, bleibt das Geheimnis der Firma. Das Unternehmen hat auf Anfragen von SPIEGEL ONLINE nicht reagiert. Bekannt ist nur, dass zum Zeitpunk von Bin Ladens Tod drei große Banken und ein Hedgefonds zu den Dataminr-Kunden gehörten.
Einfacher dürfte eine andere Anwendung von Textanalyse im Investmentgeschäft umzusetzen sein: Software soll aus Äußerungen beispielsweise auf Twitter ein Stimmungsbild ableiten. Der Informatikprofessor Johan Bollen von der Indiana University hat in einem Fachartikel beschrieben, dass eine Stimmungsanalyse von Tweets Prognosen über Kursveränderungen des Dow-Jones-Index signifikant verbessern kann – zumindest bei einer rückwirkenden Analyse. Solche Twitter-Stimmungsbilder nutzt der Londoner Hedgefonds-Anbieter Derwent Capital Markets für Investitionsentscheidungen bei seinem “Derwent Absolute Return Fund”. Auf Fragen zum Vorgehen und der bisherigen Wertentwicklung hat das Unternehmen nicht geantwortet.
Dow-Jones-Kursentwicklung korreliert mit Twitter-Stimmung
Derwent und ein Team des Informatikprofessors Johan Bollen haben einige Zeit zusammengearbeitet. Der Forscher bestätigt: “Wir haben im Sommer 2011 Stimmungssignale an Derwent geliefert, wir arbeiten nun aber mit anderen Parteien zusammen.” Aufgrund strenger Geheimhaltungsvereinbarungen könne er sich darüber hinaus nicht äußern.
Bollen zufolge ist die von ihm beobachtete Korrelation zwischen Stimmungsbildern aus Tweet-Analysen und der Kursentwicklung von Aktienindizes in den vergangenen Jahren relativ konstant gewesen. Er hält die Erfolgschancen von Manipulationsversuchen für gering, weil sein System alle Tweets analysiert: “Um unsere Ergebnisse zu manipulieren, müssten sehr viele Nutzer koordiniert bestimmte Dinge zu bestimmten Zeitpunkten veröffentlichten.”
Ob die Twitter-Analyse die Wertentwicklung von Hedgefonds generell verbessert, lässt sich derzeit nicht sagen. Hans Uszkoreit, wissenschaftlicher Direktor des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI), hält das aber zumindest für plausibel: “Aufgrund der großen Datenmenge kann das genügen, um allgemeine Entwicklungen wie etwa einen Meinungsumschwung bei Investoren zu diagnostizieren.” Uszkoreit warnt allerdings vor den Folgen des Einsatzes solcher Programme: “Wenn viele Akteure auf dieselben Indikatoren am Markt reagieren, werden die Kursausschläge härter und erratischer, das haben wir in den vergangenen Jahren beobachtet.”
Es spricht einiges dafür, dass diese Entwicklung gerade im Gange ist: Neben Dataminr und Derwent analysieren die Programme vieler anderer Unternehmen wie MarketPsy oder WiseWindow Texte bei Twitter und in anderen soziale Medien, auch für die Finanzbranche.
Textanalyse fahndet nach Betrügern
Solche Textanalyse-Software wird aber nicht spezifische Hinweise, etwa auf die drohende Insolvenz einer Firma entdecken. Diese Programme beobachten Veränderungen in der Masse von Nachrichten, sie entdecken nicht eine einzelne, relevante Nachricht. Es gibt aber auch Texterkenner, die für so etwas ausgelegt sind. Zum Beispiel die Programme des US-Unternehmens Cataphora, die E-Mails in Unternehmen nach Hinweisen auf Korruption, Unterschlagung, Veruntreuung absuchen. Diese Software geht nach einem ähnlich Muster wie Dataminr vor: Sie sucht in einer enormen Textmenge nach Abweichungen von der Norm.
Nun muss nicht jede Abweichung vom normalen Textaufkommen auf Betrug oder Korruption hinweisen. Aber so genau muss die Software auch gar nicht arbeiten, sagt KI-Forscher Uszkoreit: “Software kann diese sehr spezifische Frage nicht zuverlässig allein beantworten, aber sie erleichtert die Arbeit der Analysten, weil sie zuverlässig Auffälligkeiten entdeckt. Menschen müssen dann entscheiden, ob diese Auffälligkeiten relevant sind.”
Anders gesagt: Software kann erkennen, welche Texte auffällig sind. Was die Texte aber im Detail bedeuten, beurteilen Menschen.
Schreibroboter melden Bilanzzahlen
Zum Schreiben bestimmter Artikel ist das Textverständnis künstlicher Intelligenz heute gut genug. US-Unternehmen wie Marketbrief und Narrative Science lassen ihre Programme auf Basis strukturierter Daten Artikel für Kunden schreiben. Narrative Science verfasst auf Basis von Sportergebnissen Spielberichte und auf Basis von Immobilienpreisen monatliche Marktberichte. Die Marketbrief-Software formuliert aus den Eingaben von Unternehmen bei der US-Börsenaufsicht SEC aktuelle Wirtschaftsmeldungen. Bis zu 100.000 Seiten SEC-Unterlagen analysiert Marketbrief täglich, Kunden bezahlen für ein Abo des Dienstes im Monat 29 Dollar.
Marketbrief-Gründer Jason Zucchetto beschreibt, dass manche SEC-Eingaben aufwendiger zu analysieren sind: “Firmenergebnisse und Insider-Transaktionen sind sehr leicht zu analysieren, bei anderen wichtigen Eingaben muss unsere Software erst herausfinden, was passiert ist – wurde ein neuer Geschäftsführer eingestellt oder gefeuert, hat die Firma eine andere gekauft?”
Zucchetto will seine Schreibprogramme auf andere strukturierte Daten loslassen – Zulassungen von Medikamenten, Gerichtsunterlagen, Regierungdokumente. Sein Vorhaben für die nahe Zukunft: “Wenn Gesetzesvorhaben eingebracht oder verändert werden, wird unsere Software – hoffentlich – die Veränderungen erkennen und für ein breites Publikum aufbereiten.”