Zum Inhalt springen

Woher weiß Google, wann meine Katze stirbt?

Konrad Lischka
Konrad Lischka
4 minuten gelesen
Woher weiß Google, wann meine Katze stirbt?

Wie lange leben Katzen? Exakt 15 Jahre, sagt Google.com. Bähm! Nicht “10 bis 15”, nicht “ungefähr 15 Jahre”, sondern „15 Jahre“. Das ist die Antwort auf die Suchanfrage „How long do cats live“.

Mich überrascht dieser exakte Wert.

Woher kommt die Zahl?

01 Katze

Zunächst dachte ich: Vielleicht steht es so in der Wikipedia. Aber nein, der von Google in einer anderen Box verlinkte Artikel auf en.wikipedia.org gibt 12 bis 15 Jahre als Lebenserwartung an – unter Verweis auf die so-la-la-Quelle about.com. Laut dem deutschen Magazin „Geliebte Katze“ liegt die Lebenserwartung heute bei 15 bis 20 Jahren.

Ich habe keine Ahnung, wie alt Katzen im Durchschnitt heute werden. Aus den wenigen mir öffentlichen zugänglichen Quellen im Netz weiß ich, dass die Lebenserwartung gestiegen ist und dass es mangels aktueller Empirie keine exakten Daten gibt.

Das Katzenbeispiel veranschaulicht sehr gut eine schleichende, aber grundlegende Veränderung der Funktionen von Suchmaschinen und anderen Vermittlern im Netz. Sie werden selbst zu Quellen statt auf Quellen zu verweisen. Nehmen wir die Google-Trefferliste zum Durchschnittsalter von Katzen: Die Nutzer haben ein enormes Vertrauen, dass Google die relevantesten Treffern oben in dieser Liste anzeigt. Und nun steht über dieser Liste die Aussage: 15 Jahre. Ohne Quelle. Meine Vermutung ist, dass viele Menschen die verinnerlichte hohe Glaubwürdigkeit Googles bei der Relevanzbestimmung auf diese Aussage übertragen.

Dabei ist es etwas grundsätzlich anderes, eine Antwort zu geben als mehrere Quellen aufzuführen. Wir können zitierte Quellen vergleichen, ihre Glaubwürdigen selbst einschätzen und die Relevanz der Trefferliste auf der Basis hinterfragen. Das geht bei einer referenzfreiens Antwort wie „15 Jahre“ nicht.

Ich glaube, dass diese Art der Suchergebnisse zunehmen wird. Dafür sprechen: Die Ausgaben für Schnittstellen wie Siri, Cortona oder Google Now. Die Dominanz von Mobiltelefonen. Die Möglichkeiten zur Monetarisierung einer zentralen, geschlossenen Mobilplattform wie sie Wechat in China demonstriert.

Und wir haben immer noch keine Ahnung, warum da „15 Jahre“ steht. Anders als eine Trefferliste zeigt diese Art der Präsentation in einer Antwortbox nicht die Vielfalt durchaus widersprüchlicher Quellen.

Tippt man „goat lifespan“ als Suchanfrage ein, sieht die Antwort etwas anders aus: 15-18 Jahre. Diese Angabe könnte aus einem Wikipedia-Artikel stammen, der als Quelle „Handbook of Biological Data“ von 1956 angibt. Ich weiß nicht, ob sich die Lebenserwartung von Ziegen in den vergangenen 60 Jahren gar nicht verändert hat und ob es überhaupt so etwas wie DIE Lebenserwartung von Ziegen gibt.

01 Ziege

Googles Knowledge Graph weiß das vielleicht, verrät es aber nicht. Eine interessante Theorie zum Entstehen dieser Angaben hat The Verge. Der Autor schreibt nach einem Gespräch mit dem der Knowledge-Graph-Produktmanagerin Emily Moxley:

„There’s also no specific place that Google trusts as a source for actor information, or animal information. It’s just that when you look for lengths of time that are associated with “goat + lifespan,” they tend to fall between 15 and 18 years. It’s ambient data, coming from everywhere and nowhere. If you get enough of a consensus, it turns into something that looks an awful lot like a fact.“

Das könnte auch stimmen.

Eine Erklärung, die beides zusammenbringt: Vielleicht schreiben die Menschen auf vielen Webseiten die Angaben aus der englischsprachigen Wikipedia zur Lebenserwartung von Ziegen ab, die aus einem Handbuch von 1956 stammen. Und in der Google-Antwort auf die Frage nach der Lebenserwartung von Ziegen erscheint dieser Wert dann ohne jede Referenz als derzeit gültiges Wissen – obgleich die Empirie mehr als ein halbes Jahrhundert alt ist (wenn die Angaben im „Handbook of Biological Data“ denn auf Empirie beruhen).

Bei Wörtern in englischer Sprache liefert Google direkt auf den Trefferseiten Definitionen als eigenen Inhalt ohne Quellenangabe. Hier ist aber vergleichsweise einfach, den Ursprung zu ermitteln – man sucht einfach nach Fundstellen für den Text der Definition im Netz. Und so zeigt sich dann, dass Google für den Begriff transgender diese Definition des Oxford Dictionary allen anderen vorzieht:
„denoting or relating to a person whose self-identity does not conform unambiguously to conventional notions of male or female gender.“

04 transgender

Warum wird diese Definition als einzige angezeigt? Ist sie treffender als die – sehr unterschiedlichen Definitionen – von Collins, Merriam-Webster, Macmillan, Wiktionary, Wikipedia? Oder hat die Verwendung dieser Definition nichts mit der Qualität des Inhalts zu tun, sondern ist sie zum Beispiel der Tatsache geschuldet, dass nur mit einigen Anbieter (oder nur mit einem?) Verträge über die Nutzung solche Inhalte ohne Quellenhinweis geschlossen wurden? Keine Ahnung.

Beim tennis elbow scheint die Definition des Oxford Pocket Dictionary of Current English von 2009 anderen überlegen zu sein.

Die Lebenserwartung von Katzen, Ziegen und Wortdefinitionen mag man als Kleinigkeiten abtun. Was ist schon schlimm daran, wenn unklar ist, woher die Daten kommen, wie aktuell und wie belegt sie sind? Es geht ja nur um eine ungefähre Vorstellung. Stimmt schon. Problematisch finde ich es dennoch, das Nutzer keine Möglichkeit haben, das Entstehen dieser Angaben nachzuvollziehen. Schließlich fragen Menschen ihre digitalen Assistenten (formerly known as Suchmaschinen) nicht unbedingt nur nach der Lebenserwartung von Katzen und Ziegen. Sondern auch nach Gesundheitstipps.
Zum Beispiel: how to lose weight?

Als Antwort darauf ist über den Suchtreffern eine Acht-Punkte-Liste zu sehen, die von einer Seite namens Dietdoctor.com stammt. Sie beginnt mit:
„1. Choose a Low-Carb Diet. If you want to lose weight you should start by avoiding sugar and starch (like bread).“

Warum ist dieser Hinweis so prominent hervorgehoben und der Text von der verlinkten Seite übernommen worden? Ich habe keine Ahnung. Ich weiß nur, dass die Empirie zur Überlegenheit von Low-Carb-Diäten ähnlich unübersichtlich wie beim Alter von Katzen und Ziegen ist. Ich finde: Wenn ein Medium die Fragen der Nutzer beantwortet, sollte es dem Nutzer die Quellenlage immer transparent machen. Und wenn es keine klare Antwort gibt, sollte die Antwort sein: Es ist kompliziert. Und nicht: “15 Jahre!“ Oder: „Low Carb!“

03 diet

Das Beitragsbild ist gemeinfrei und wurde vom norwegischen Nationalarchiv digitalisiert.

Blog

Konrad Lischka

Projektmanagement, Kommunikations- und Politikberatung für gemeinnützige Organisationen und öffentliche Verwaltung. Privat: Bloggen über Software und Gesellschaft. Studien, Vorträge + Ehrenamt.
Immer gut: Newsletter abonnieren


auch interessant

Bahnstreik und Bahntarif - gut zu wissen

Was mich nervt: Aktuelle Happen in der Berichterstattung, ohne Einordnung und Hintergrund - zum Beispiel beim Bahnstreik. Viel Aufregung, viele Zitate, aber wenig Rahmen, um das einzuordnen. Ich hätte gerne in jedem Beitrag zum Thema einen Werkzeugkasten, um das gerade Aktuelle einordnen zu können. Bei der Tarifauseinandersetzung zum Beispiel: Wie

Bahnstreik und Bahntarif - gut zu wissen

Das Dilemma beim bezahlbaren Wohnraum: 2,5 Mrd. Subventionen für Neubau, 20 Mrd. für hohe Mieten

Ein paar Zahlen zum Wohnungsmarkt in Deutschland: * In Deutschland fehlen derzeit 910.000 Sozialwohnungen (Wohnungsmarkt-Studie vom Pestel-Institut S. 29) * In Deutschland lag die Quote von Baugenehmigungen für Wohngebäude Anfang 2023 bei rund 70 % der Genehmigungen in 2015 (Eurostat via FT) * Für 2024 rechnet der Zentralverband des Deutschen Baugewerbes ZDB mit

Das Dilemma beim bezahlbaren Wohnraum: 2,5 Mrd. Subventionen für Neubau, 20 Mrd. für hohe Mieten

Fun Facts (1)

Produktivität = BIP / Stunden Lohnarbeit Deutschland, Frankreich und die USA liegen bei der Arbeitsproduktivität gleichauf. 55 Euro Bruttoinlandsprodukt werden mit jeder Stunde Lohnarbeit erwirtschaftet. Die Zahlen sind vergleichbar (inflations- und kaufkraftbereinigt), Basis stammt von OECD, Berechnung von Thomas Piketty (Daten) Geheimwaffe Gurkenwasser In Bayern kommt Recycling-Gurkenwasserim Winterdienst auf die Straßen. Der

Fun Facts (1)