|
58 | Projekteküche
Freie Software ist sozial - besonders wenn sie Hilfeprojekte bei Katastrophen koordiniert.
62 | Bitparade
PDF-Präsentationen, die auf jedem Rechner laufen - welche Software liefert die besten Ergebnisse?
68 | Tooltipps
Programme zum Ausfüllen von PDF-Formularen, Spiegeln von Webseiten, Verwalten von Cronjobs und mehr.
|
Warum funktionieren die freien Rechtschreibprüfungen eigentlich so schlecht (Abbildung 1, [1])? Zum einen liegt es sicherlich daran, dass sich in der Open-Source-Welt nicht allzu leicht Freiwillige finden, um umfangreiche Wortlisten aus manuellen Transskripten oder ebenfalls manuell zu korrigierenden Scans zusammenzustellen. Nicht ohne Grund besteht ein wichtiger Unterschied zwischen dem freien Open Office und dem kommerziellen Star Office in der besseren Rechtschreibprüfung.
Andererseits wachsen die Wortlisten auch dashalb so langsam, weil die gängigen Rechtschreibprogramme neue Wörter lediglich dem Benutzer zugänglichen privaten Wortlisten hinzufügen. Auch wenn es sich bisher nicht durchgesetzt hat: Wörterbücher gehören auf einen zentralen Server.
Abbildung 1: Frei nicht im Sinne von fehlerfrei: Obwohl im Text wenig IT-Vokabular vorkommt, kennt der GPL-Spellchecker Hunspell etliche Wörter nicht.
Vergesellschaften
Ein erster Schritt wäre, die privaten Wörterbücher mehrerer Benutzer per Hand zusammenzuführen. Ein Versuch beim Linux-Magazin und den Schwesterzeitschriften zeigte aber, dass es nicht damit getan ist, die Wortlisten der Redakteure zu kombinieren: Zu leicht schleichen sich bei stundenlanger Arbeit Tippfehler in das Wörterbuch ein. Das Korrekturlesen Tausender Einzelwörter möchte man jedoch niemandem zumuten.
Delegieren
Dabei könnten die im Kontext des Web 2.0 verbreiteten Verfahren zum Sammeln von User-generated Content einen zentralen Redakteur ersetzen oder ihm zumindest viel Arbeit abnehmen. Ist eine Wortliste nach Häufigkeit gewichtet, dann lassen sich die wichtigsten Einträge auch mit begrenzten Ressourcen korrekturlesen - in der Praxis schon deshalb ein Fortschritt, weil elektronische Rechtschreibprüfungen sowieso nur zum Verringern der Fehlerzahl taugen und nie Fehlerfreiheit garantieren.
Bietet der Server noch die Möglichkeit, bei Zweifelsfällen die Benutzer über falsche und richtige Schreibweisen abstimmen zu lassen, ergibt sich vielleicht ganz ohne zentralen Redakteur eine Wortliste von ausreichender Qualität. Auch die Silbentrennung, wie die Rechtschreibprüfung ein Problemkind freier Textverarbeitungsprogramme, ließe sich so verbessern. Sinnvoll wären auch eigene Instanzen für Inhouse-Anwendungen, die etwa Produktnamen vereinheitlichen.
Eigentlich ist es überraschend, dass es, soviel der Autor weiß, keine freie Anwendung dafür gibt. Zwar existieren seit Langem das Dict-Protokoll [2] und auch Implementierungen [3], die es erlauben, Wörterbücher über TCP zur Verfügung zu stellen. Einen Workflow für das Integrieren neuer Wörter inklusive Korrekturlesen gibt es jedoch nicht.
Dabei sollte es nicht so schwer sein, eine solche Software aus vorhandenen Komponenten selbst zu stricken. Ein Ansatz wäre es, die Aspell- und Ispell Benutzerwörterbücher der einzelnen Anwender regelmäßig auf einen Server hochzuladen und auszuwerten. Ein Webfrontend könnte dann neu hinzugekommene Wörter zur wöchentlichen Überprüfung anzeigen. So ließe sich die stupide Arbeit leichter bewältigen, als wenn das im Laufe der Jahre gesammelte Vokabular in einem Stück aufschlägt.
Beim Aufspüren von falschen Schreibungen würde es helfen, ähnliche neue Wörter über die Editierdistanz [4] herauszufiltern und in der Anzeige zu gruppieren. Statt der gewöhnlichen Editierdistanz wäre es wohl sinnvoll, die so genannte Typewriter-Distanz zu nutzen, die bei Schreibvarianten den Abstand der Buchstaben auf der Tastatur einbezieht.