Geheimtipps aus den Tagebüchern (Frankfurter Rundschau, 28.2.2003)
Geheimtipps aus den Tagebüchern
Mit einer systematischen Auswertung von Weblogs könnten Suchmaschinen ihre Ergebnisse zu aktuellen Themen verbessern
Frankfurter Rundschau, 28.2.2003
Es stand natürlich zuerst in einem jener Netztagebücher: Die große Suchmaschine Google hat einen der größten Anbieter für Weblog-Software, Pyra Labs, gekauft. Das Weblog des Journalisten Dan Gillmor kam drei Tage früher als Wall Street Journal und Washington Post. Nicht nur die Verbreitung der Nachricht ist interessant, auch ihr Hintergrund: Warum kauft ein Unternehmen, das hilft, Informationen zu finden, eine Firma, die Menschen Informationen produzieren lässt ? Die Geschichte der Weblogs liefert Antworten.
Eines der ersten Netztagebücher hat vom Jahr 1993 an der Browser-Programmierer Marc Andreessen verfasst. Auf der Seite "Mosaic What's New" verwies er, jeweils mit einem kurzen Kommentar versehen, auf neue, seiner Meinung nach interessante Internetseiten. Die aktuellsten Einträge standen oben auf der Seite, die älteren unten. Diese äußere Form haben Weblogs noch heute.
Während des ersten Booms vor zwei Jahren kamen neue Formen auf: Den klassischen Informations-Weblogs mit persönlichen Kommentaren folgten scharf kommentierende Meinungs-Weblogs. Sie zeichnen sich nicht so sehr durch die Güte ihrer Verweise aus, sondern stärker durch ihre originelle Kommentierung. Eine weitere neue Form sind Bauchnabel-Weblogs, deren Autoren persönliche Alltagsberichte liefern – und nur davon ausgehend ab und an auf Informationen außerhalb verweisen, statt Informationen zum Anlass für persönliche Kommentare zu nehmen.
Doch zumindest die klassischen und die Meinungs-Weblogs haben eines gemeinsam: Sie liefern Informationen über Informationen und verteilen mittels der Verweise Aufmerksamkeit neu. Diese Funktion macht Pyra Labs Produkt Blogger so interessant für Google. Einmal in die Suchmaschine eingebunden, könnten sie die Qualität der Ergebnisse steigern.
Anders als bei Bloggers Konkurrenten sind die Inhalte der etwa 200 000 täglich schreibenden Autoren über eine zentrale Datenbank des Diensts greifbar. Mit ihr kann – geschickte Programmierung vorausgesetzt – ohne große Verzögerung erkundet werden, welchen Themen Fachleute gerade ihre Aufmerksamkeit zuwenden. Google versucht sich an solcher Trendforschung bereits seit Anfang 2001 mit seinen wöchentlichen Zeitgeistberichten. Die deuten, ausgehend von Suchanfragen, welche Themen an Bedeutung gewinnen und verlieren. Doch die Aussagen sind allgemein und kommen mit einer entscheidenden Verzögerung: Was den Suchenden wichtig ist, weiß Google erst, wenn sie anfangen, danach zu suchen. Und die Quantität der Suchanfragen schlägt die Qualität der Verweise einer vielleicht früher informierten Elite.
Im Fall der Blogger-Übernahme durch Google hätte sich das im Suchverhalten wohl erst deutlich niedergeschlagen, nachdem Wall Street Journal und Washington Post berichteten. Doch auf den Weblog-Eintrag des Experten Dan Gillmor verwiesen schon drei Tage zuvor binnen weniger Stunden einige tausend andere Weblogs aus dem Technologiesektor. Anhand dieser Daten hätte ein entsprechendes Auswertungssystem die Bedeutung der Nachricht eher erkannt.
Solche Informationen kann Google gut gebrauchen, wenn es auch zu aktuellen, nur für bestimmte Zielgruppen interessanten Themen hochwertige Suchergebnisse liefern will. Dass Googles bisherige Technologie ein Aktualitätsproblem hat, wird vor allem beim Nachrichtenangebot "Google News" deutlich. Es bündelt 4500 Informationsseiten in thematische Rubriken und stuft die Bedeutung ausschließlich mit Algorithmen ohne jeden menschlichen Eingriff ein. In die automatische Auswahl fließen allgemeine Beliebtheit, Anklang bei als Experten gesehenen Seiten sowie Aktualität der ausgewerteten Nachrichtenseiten ein. Nur: Es dauerte eine Stunde, bis nach dem Columbia-Absturz in "Google News" entsprechende Schlagzeilen als "Top Stories" auftauchten. Dazu kommt, dass "Google News" nur die allgemeine Relevanz einer Nachrichtenseite einbezieht. Auch hier beeinflusst letztlich Quantität mehr als Qualität die Ergebnisse. Deshalb kann das automatisch generierte Angebot nie Themen außerhalb des Medien-Mainstreams entdecken. Im Gegenteil: Das Angebot steigert die oft kritisierte homogene Themenauswahl im Journalismus noch weiter.
Weblogs sind wesentlich schneller – und vor allem durchlässiger für Neues. Ein Beispiel sind die rassistischen Äußerungen des ehemaligen republikanischen Mehrheitsführers im US-Senat, Trent Lott. Aus einem knappen Bericht des Fernsehsenders ABC wurde erst durch Diskussionen und Verweise in Weblogs auf Details aus Lotts Vergangenheit ein Skandal, wie die New York Times im Nachhinein festgestellt hat.
Die Daten waren schon lange vor dieser Beobachtung verfügbar: Welcher Experte verweist wann auf welche Seiten ? Wie stark steigt die Aufmerksamkeit dafür insgesamt ? Das alles speichern die meisten Weblogs in einem offenen Standard: Really Simple Syndication, kurz RSS.
Wie – vergleichsweise – einfach das auszuwerten ist, zeigte vor knapp zwei Jahren der Doktorand Cameron Marlow am Massachusetts Institute of Technology (MIT). Er hat Blogdex geschaffen, einen Index, der täglich die Verweise in gut 9000 Weblogs analysiert und immer wieder Aufmerksamkeit auf skurrile bis spannende Themen lenkt. Blogdex nutzt bei Weitem nicht alle verfügbaren Informationen. So wäre es durchaus möglich, thematische Kategorien zu definieren, um so zielgerichteter auszuwerten. Google gelingt das in seinem Nachrichtenangebot heute schon gut. Bei den von Blogger verwalteten Weblogs wäre es auf Grund der Selbsteinschätzung der oft hochgradig spezialisierten Autoren noch einfacher.
Solche konkreten Pläne für den Datenbestand von Blogger hat Google bislang nicht veröffentlicht. Dafür diskutieren Beobachter, Blogger und bloggende Beobachter die Möglichkeiten umso ausführlicher. Nur ein Fachmann schweigt hartnäckig dazu: Evan Williams, der Gründer von Blogger, hat sein eigenes Weblog deaktiviert: "Ich bin im Moment recht beschäftigt damit, mich auf ein neues Leben vorzubereiten. Also habe ich das Blog vom Netz genommen, um Klarheit in meinem Kopf zu schaffen", schreibt er.