Wenige andere Aspekte werden so häufig als großartige Innovation von Unix-Systemen hervorgehoben wie Regular Expressions. Und tatsächlich eröffnen sie jedem, der sie beherrscht, reiche Möglichkeiten bei der Suche in Texten, Logdateien und vielem mehr. Dabei muss sich der Anwender nicht auf eine Software beschränken, denn viele Linux-Programme verstehen in ihren Suchfunktionen reguläre Ausdrücke, etwa die gängigen Editoren Emacs, Vi und Nedit, ja selbst der Open Office Writer. Auch wer in Skriptsprachen Textdateien verarbeitet, kommt an Regular Expressions kaum vorbei.
Regex-Helfer
Komplexe Suchmuster damit aufzubauen ist allerdings fehlerträchtig: Konzeptuellen Suchwünschen entsprechen kryptische Kürzel, im Detail weichen die Dialekte verschiedener Tools voneinander ab, häufiges Testen ist also gefragt. Die Software Redet [1] hilft dabei, Regular Expressions ohne tiefe Kenntnis der Abkürzungen aufzubauen. Sie erlaubt interaktive Tests mit verschiedenen Tools und erzeugt auf Wunsch schließlich fertige reguläre Ausdrücke.
Bevor es losgehen kann, gilt es allerdings, noch ein kleines Hindernis zu überwinden. Redet ist in Tcl geschrieben, was an sich noch kein Problem sein sollte. Jedoch benutzt es zusätzlich die objektorientierten Erweiterungen Itcl, Itk und Iwidgets, die es nicht für alle Distributionen in Binärform gibt. Sie selbst zu kompilieren ist aber ebenfalls nicht ganz einfach. Wer in seiner Distribution die erwähnten Pakete bereits vorfindet, ist also fein raus und kann nach dem Download das Redet-Skript direkt starten.
Fremde Zeichen
Allen anderen empfiehlt Redet-Entwickler Bill Poser, der übrigens im Hauptberuf Linguistik-Professor ist, das Tcl-Paket der Firma Activestate zu verwenden [2]. Dabei handelt es sich durchweg um freie Software, die neben den Tcl-Kernpaketen eine ganze Reihe praktischer Erweiterungen enthält. Zur Installation ist nicht mehr zu tun, als das Active-Tcl-Paket zu entpacken und den Ausführungspfad entsprechend zu setzen.
Nach dem Start erscheint das Hauptfenster, das neben den Menüs ein Textfeld für Testdaten und eins für das Ergebnis der Regex-Suche enthält (Abbildung 2). Eine recht detaillierte Beschreibung aller Menüpunkt bietet neben der eingebauten Hilfefunktion die Online-Referenz auf der Website [1].
Zum Test der Regular Expressions verwendet Redet das jeweilige Tool selbst, das also installiert sein muss. Nur Tcl-Regexes evaluiert Redet intern selbst. Die Software eignet sich besonders gut zum Bau von regulären Ausdrücken, die auf fremd- oder mehrsprachige Textmuster passen sollen. Dazu lädt es selbst erstellbare Zeichentabellen, es bietet eine reiche Auswahl an akzentuierten Zeichen und akzeptiert auch UTF8-Code.