Die Tastatur ist eine unvollkommene Mensch-Maschine-Schnittstelle: Das fehlerfreie Eintippen langer Texte gelingt nicht immer, gerade wenn die Zeit drängt. Zudem erschwert die wechselvolle Geschichte der deutschen Rechtschreibung orthografisch (oder orthographisch) korrektes Deutsch. Wer nicht den Luxus eines sprachkundigen Korrektorats genießt, muss auf eine Rechtschreib-Software zurückgreifen, da die Betriebsblindheit gegenüber eigenen Texten eine zusätzliche Hürde beim Finden der Rechtschreibfehler aufbaut.
Wie bei allen Filtern, die gültige und ungültige Werte trennen, gibt es auch bei der Rechtschreibprüfung False-negatives und False-positives. Buchstabendrehern wie in "Art und Wiese" gegenüber sind die Spellchecker bislang machtlos: "Wiese" erkennen sie als richtig geschriebenes Wort, die Bedeutung der Wortfolge bleibt ihnen verborgen.
Das Problem der False-positives stellt vor allem die Geduld des Anwenders auf die Probe. Die unter Linux verbreiteten Prüfprogramme wie Ispell oder Aspell muten es dem Anwender oft zu, mehrere Wörter pro Absatz von Hand auf Richtigkeit zu prüfen - ihre Wortlisten sind einfach zu klein.
Umfangreiche Wörterbücher zusammenstellen und aufbereiten erfordert viel Experten-Arbeitszeit, sodass die Open-Source-Gemeinde ihre Schwierigkeiten damit hat. Daher testet diese Bitparade neben den freien Rechtschreibprüfungen Ispell [1], Aspell [2] und Hunspell [3] die für etwa 20 Euro verfügbare kommerzielle Software Duden-Korrektor [4].
Intelligenz gefragt
Im Deutschen und vielen anderen Sprachen existieren die meisten Wörter in unterschiedlichen Formen (leg-t, leg-te, ge-leg-t oder Tisch, Tisch-e, Tisch-es), Vor- und Nachsilben verändern die Bedeutung von Wörtern (Sicht, Um-sicht oder trink-en, trink-bar), mehrere eigenständige Wörter lassen sich kombinieren (blau-grau, Arbeit-s-speicher). Aus der Kombination aller Grundelemente und aller ihrer möglichen Vor- und Nachsilben ergibt sich folglich eine schier unendliche Anzahl orthografisch korrekter Wortformen.
Sprache lässt sich daher in der Praxis nicht mit statischen Listen erfassen. Vielmehr muss Rechtschreibsoftware Regeln beherrschen, nach denen sie die Elemente der Sprache kombiniert. Dabei gibt es eine ganze Reihe von Herausforderungen zu meistern: "Legtest" ist eine korrekte Wortform, "trinktest" dagegen sollte der Rechtschreibprüfung aufstoßen. Beim Vergleich von "Arbeit-s-speicher" und "Regen-messer" fällt auf, dass im ersten Fall zwischen den Wortbestandteile ein zusätzliches Fugen-s steht, im zweiten Fall nicht.
"Tische" ist der Plural von "Tisch", "Computer" hingegen verändert sich in der Mehrzahl nicht, "Computere" muss die Rechtschreibprüfung daher als Tippfehler erkennen, zumal [R] und [E] auf der Tastatur nebeneinander liegen: Das zusätzliche "e" schleicht sich leicht beim Tippen ein.
Formenrepertoire
Ein Beispiel, wie Rechtschreib-Software Wortbildungsregeln umsetzt, ist die relativ neue und leistungsfähige Rechtschreibprüfung Hunspell [3], die Open Office seit Version 2.0.2 nutzt (Abbildung 1). Das Wörterbuch besteht aus einer Wortliste und einem Formenrepertoire, auf das die Wortliste Bezug nimmt. Eine eigene Regelsprache verknüpft die Wortgrundbestandteile in der Wortliste mit bestimmten Klassen aus der Formenliste. So verweist der Wörterbucheintrag "töt" zum Beispiel auf eine Formenreihe wie "-e, -est, -et, -en". Das Wörterbuch legt außerdem fest, dass "töt" verpflichtend eine Endung hinzuzufügen ist, "steh" hingegen nicht. Oft muss die Rechtschreibprüfung einen Zusammenhang zwischen Vor- und Nachsilbe berücksichtigen: "ge-" als Vorsilbe fordert die Endung "t" ("ge-leg-t). Den vollen Umfang der Hunspell-Regelsprache erläutert das Handbuch [5].