Zum Inhalt springen

Technikärgernis Rechtschreibprüfung: Barock Obama und die Stinker-Raketen (Spiegel Online, 12.3.09)

Konrad Lischka
Konrad Lischka
4 minuten gelesen

Technikärgernis Rechtschreibprüfung

Barock Obama und die Stinker-Raketen

Internat statt Internet, Nato statt Nano, Cupertino statt Kooperation: Das kommt raus, wenn Software Texte verbessert. Die Korrekturkomik findet man sogar in offiziellen Dokumenten der EU und Nato. Experten sagen, die Programme könnten einfach nicht perfekt sein – aber lustig!

Spiegel Online, 12.3.2009

Auf Seite 15 von 43 wird das Nato-Forschungspapier zur “Interoperabilität innerhalb der Allianz und mit Koalitionspartnern” richtig lustig: Da schreibt der Autor, man könne die technische Vernetzung der Nato mit anderen Organisationen verbessern – zum Beispiel mit der “Organisation for Security and Cupertino in Europe” (PDF-Dokument).


Die Organisation für Sicherheit und Cupertino?

Cupertino?

Der Ort in Kalifornien, in dem Apple seinen Firmensitz hat?

Gemeint ist die OSZE, die Organisation für Sicherheit und Zusammenarbeit in Europa. Und geschrieben hat der Autor im englischen Original ganz sicher zuerst auch “cooperation”. Woraus die Rechtschreibprüfung dann Cupertino machte.

Der Nato-Autor ist 1999 Opfer des Cupertino-Effekts geworden. Eine ältere Version von Microsofts Textverarbeitungsprogramm, offenbar Word 97, hat in manchen Fällen in englischen Texten als Ersatz für die Eingabe co-operation (wohl in dieser Schreibweise) die Stadt Cupertino vorgeschlagen. Der US-Linguist Benjamin Zimmer hat diese verblüffenden Fehler eingehender erforscht. Er zitiert den Beitrag einer EU-Übersetzerin, die den Fehler im Jahr 2000 “Cupertino-Effekt” taufte. Zimmer urteilt heute: “Trotz aller Fortschritte der Softwareentwickler können die Korrekturprogramme nie perfekt sein.” Er glaubt, dass Fehler wie der Cupertino-Effekt “in der einen oder anderen Form immer wieder auftauchen werden”. Aber Zimmer weist darauf hin: “Das sind nur Empfehlungen. Letztendlich ist es die Aufgabe des Menschen, aufmerksam genug zu sein, um die falschen von den richtigen Korrekturvorschlägen zu unterscheiden.”

Das ist offenbar nicht immer der Fall. Auf den Web-Seiten des EU-Parlaments, der Nato und der Uno findet man heute noch Hunderte offizieller englischsprachiger Pressemitteilungen, Erklärungen und Dokumente, in denen an merkwürdigen Stellen “Cupertino” steht. Zum Beispiel: “In dem deutsch-italienischen Kampfverband erwies sich die Cupertino mit unseren italienischen Kameraden als sehr fruchtbar.”

Im Redaktionsalltag liefert die Rechtschreibprüfung von Microsoft Word 2002 und Mac Word 2008 kuriose Korrekturvorschläge. Einige Beispiele:

 

  • Stinker-Rakete statt Stinger-Rakete
  • Barock Obama statt Barack Obama
  • Pädophilie statt Pädophile
  • Nato-Maßstab statt Nano-Maßstab

Warum schlägt Word so etwas vor? André Kramer, Redakteur beim Fachmagazin “c’t”, der eine Magisterarbeit (PDF-Dokument) über Rechtschreibkorrektursysteme geschrieben hat, erklärt diese merkwürdigen Korrekturvorschläge mit dem Umfang des Lexikons der Korrektursoftware: “Es dauert oft eine Weile, bis Begriffe wie Hedgefonds, Punkrock, Gigabit und al-Qaida Eingang ins Lexikon finden. Bei solchen unbekannten Begriffen schlägt die Software den am wahrscheinlichsten gemeinten Begriff aus dem Lexikon vor.”

Welcher Begriff am wahrscheinlichsten gemeint sein könnte, errechnet eine Rechtschreibprüfung in einem mehrstufigen Verfahren. Software-Experte Kramer erklärt das Prinzip so: “Da wird einbezogen, wie häufig einzelne Tippfehler auftreten. Das kann, muss aber nicht zwangsläufig etwas mit der Nähe der einzelnen Tasten zu tun haben.”

Welcher Korrekturvorschlag als erster genannt und bei einer Autokorrektur auch eingesetzt wird, berechnet die Software anhand der Wahrscheinlichkeit, dass die als möglicher Ersatz ausgemachten Worte überhaupt gemeint sein können. Diese Worthäufigkeiten berechnen die Entwickler von Korrektursystemen, indem sie Programme große Textmengen auswerten lassen.

Trotz dieses Aufwands geht dann doch so mancher Korrekturvorschlag daneben – und dann steht da “Stinker-Rakete”.

Dramatisch findet das Korrektur-Kenner Kramer nicht: “Die Qualität einer Rechtschreibprüfung würde ich daran nicht messen. Einen Begriff wie die Stinger-Rakete muss ein allgemeines Lexikon nicht unbedingt kennen.”

Microsoft Word kennt 1995 das Internet nicht

Peinlicher ist das bei Begriffen wie Internet. In seiner Magisterarbeit zu Rechtschreibkorrektursystemen von 2004 schreibt Kramer, dass Microsofts Textverarbeitung Word 95 im Jahr 1995 das Internet noch nicht kannte. Als Korrekturvorschlag gab diese Word-Version “Internat” aus.

Dabei stand das Wort Internet schon Jahre zuvor in deutschen Medien – zum Beispiel 1992 im SPIEGEL (“So brachte etwa der ‘Internet-Wurm’ eines amerikanischen Hackers weltweit rund 6000 Computer zum Erliegen”), dann wieder 1993 (“im weltumspannenden Wissenschaftsnetz ‘Internet'”)..

Dass das Internet 1995 nicht im Lexikon der Word-Rechtschreibkorrektur auftauchte, ist peinlicher als das Fehlen von Stinger-Raketen. Eine gute Rechtschreibkorrektur erkennt man allerdings nicht einfach an der Größe des Lexikons. Kramer: “Der Umfang ist kein Maßstab für die Güte der Korrektur. Der sehr gute Duden-Korrektor zum Beispiel arbeitet mit Wortstämmen und leitet davon verschiedene Formen ab, jeder im Lexikon eingetragene Wortstamm entspricht weit mehr tatsächlich erkannten Wörtern.”

Allumfassend kann kein Lexikon sein

Manche Lücken im Lexikon einer Rechtschreibprüfung kann man den Entwicklern durchaus vorhalten (Internet), andere eher nicht (Barock Obama). Denn allumfassend und somit perfekt kann kein Lexikon sein.

Da gilt heute noch, was André Kramer in seiner Magisterarbeit ( PDF-Dokument) 2004 schrieb: “Diese Grenzen resultieren schließlich auch nicht nur im Unvermögen der Programmierer oder der fehlenden visionären Kraft der Systementwickler. Die unendlichen Ausdrucksmöglichkeiten, die die Sprache bietet, die Bildung neuer Nominationseinheiten oder die fließenden Wortgrenzen, können nur zu einem bestimmten Grad vollständig abgebildet werden.”

Mit Groß-, Getrenntschreibung und Komposita hat auch aktuelle Software Probleme – Mac Word 2008 erkennt zum Beispiel den Begriff Kompositaerkennung nicht, obwohl er aus zwei erkannten Worten (Komposita und Erkennung) zusammengesetzt ist.

Auch Eigennamen sind immer noch ein Problem. Dass Korrektursoftware zum Beispiel aus dem Familienamen Hillenbrand einen Höllenbrand macht, ist beim derzeitigen Stand der Technik kaum zu vermeiden.

Die Seeschwamm-Verteidigung

Diese Probleme garantieren so manchen aberwitzigen Fehler.

Der kalifornische Anwalt Arthur Dudley zum Beispiel ist unter US-Juristen berühmt für ein Dokument, das er vor drei Jahren an ein Gericht in San Francisco schickte. Versehentlich ließ er seine Textverarbeitung den Fachbegriff sua sponte (steht für aus eigenem Antrieb) übersetzen. Heraus kam: sea sponge – ein Seeschwamm. Fünf mal tauchte der Schwamm in dem Schreiben auf, über das US-Juristen heute noch lachen. Bemerkt hat den Fehler damals Dudleys Mandant.

Die “New York Times” musste vor einigen Jahren diesen der Autokorrektur geschuldeten Fehler korrigieren: Die Software hatte den Football-Spieler DeMeco Ryans in einem Artikel durchgängig umgetauft – in Demerol, ein Betäubungsmittel.

Rechtschreibprüf-Programme sind eben immer noch nur eine gute Hilfe zum Aufspüren von Vertippern und Schludrigkeiten. Als Korrektor-Ersatz ist die Software überschätzt. Bei weitem unterschätzt dürfte allerdings das Unterhaltungspotential der Rechtschreibprüfung sein. Die “sea sponge defense” bringt es inzwischen schon auf zwei Google-Trefferseiten.


Konrad Lischka

Projektmanagement, Kommunikations- und Politikberatung für gemeinnützige Organisationen und öffentliche Verwaltung. Privat: Bloggen über Software und Gesellschaft. Studien, Vorträge + Ehrenamt.
Immer gut: Newsletter abonnieren


auch interessant

Wer investiert in die Zukunft, wenn alle sparen?

Der common senf aktueller Debatten um Staatsausgaben, Tarifverhandlungen und Zinspolitik scheint mir gerade ein gefährlicher: Alle sollen sparen. Der Staat soll weniger ausgeben und damit der Gesamtwirtschaft Geld entziehen. Arbeitnehmer sollen Reallohnverluste akzeptieren, sparen und damit der Gesamtwirtschaft Geld entziehen. Und Unternehmen sollen sparen, bloß keine Kredite aufnehmen für Investitionen

Wer investiert in die Zukunft, wenn alle sparen?

Paradox der Gegenwart

Einerseits sehen so viele Menschen ihre individuellen (Konsum)Bedürfnisse als das wichtigste Gut, als absolut schützenswert. Überspitzte Maxime: Was ich will, ist heilig – alles geht vom Individuum aus. Andererseits erscheint genauso viele Menschen das Individuum ganz klein, wenn es darum geht, etwas zu verändern in der Welt. Überspitzte Maxime: Ich

Paradox der Gegenwart

Wie Schmecken funktioniert

Gelernt: Geschmack und Aroma sind zwei ganz unterschiedliche Wahrnehmungen. Für jede ist ein anderer Teil im Gehirn verantwortlich. Und jede basiert auf unterschiedlichen Daten: Für den Geschmack kommen Eindrücke von der Zunge, fürs Aroma von Rezeptoren in der Nase. Beides vermischt das Gehirn zum Gesamteindruck Schmecken. Sehr lesenswerter Aufsatz darüber

Wie Schmecken funktioniert