Open Source im professionellen Einsatz
Linux-Magazin 09/2014
© Le Moal Olivier , 123RF

© Le Moal Olivier , 123RF

Vier CAT-Tools im Test

Sprachvermittler

, ,

CAT-Programme erleichtern und beschleunigen die Arbeit von Übersetzern, übersetzen aber nicht selbst. Sie helfen beim Einhalten terminologischer und stilistischer Konsistenz sowie bei der Qualitätskontrolle. Vier Testkandidaten bringen Struktur in kleine und große Übersetzungsprojekte.

948

Software-Lokalisierer und Fachübersetzer profitieren gleichermaßen von CAT-Programmen (Computer-aided Translation). Beim Einlesen der Texte teilt die Software diese zunächst in Segmente auf. Das sind sinnvolle Teilstücke, etwa Abschnitte, Sätze oder Wortgruppen. Diese übertragen Anwender dann nach und nach von der Quell- in die Zielsprache. Dabei unterstützen sie das integrierte Translation-Memory-System (TM) und die Terminologiedatenbank. Ersteres speichert bereits übersetzte Einheiten. Taucht während des Übersetzens ein Segment entweder genau so oder ähnlich wieder auf, schlägt das TM vor, Teile erneut zu verwenden. Die Termbase pflegen Anwender selbst; sie nimmt ähnlich wie ein Wörterbuch einzelne Ausdrücke sowie Zusatzinformationen in mehreren Sprachen auf.

Um Daten zwischen CAT-Programmen auszutauschen, haben sich im Wesentlichen zwei Formate etabliert: XLIFF und TMX. Das XML Localization Interchange File Format kommt beim Transportieren zweisprachiger Dateien zum Einsatz. Es eignet sich dazu, Übersetzungsdaten und die zugehörigen Kontextinformationen unabhängig von deren ursprünglichem Format an andere Nutzer oder Programme weiterzugeben.

Translation Memory Exchange basiert ebenfalls auf XML und nimmt außer den Segmentpaaren auch andere Informationen auf, etwa Angaben zu Benutzer, Datum der Erstellung/Änderung, Häufigkeit und Kontext und so weiter. Obwohl TMX ein offener Standard ist, funktioniert die Zusammenarbeit mehrerer CAT-Programme nicht immer verlustfrei, da sie die Dateien unterschiedlich auszeichnen. Ein Griff zum externen TMX-Editor löst das Import-/Exportproblem.

Die Bitparade geht mit vier CAT-Systemen für den Linux-Desktop in Klausur. Es treten an: Omega T [1], Swordfish [2], Virtaal [3] und Wordfast Pro [4]. Virtaal ist in Python implementiert, die anderen drei Kandidaten sind Java-Programme. Alle vorgestellten Tools sind plattformübergreifend und laufen auch unter Windows und OS  X.

Die Tester schauten sich auf einem Ubuntu-14.04-System mit der Laufzeitumgebung von Oracle [5] an, welche Dokumenttypen die Programme unterstützen und wie es mit dem Im-/Export von TMX und XLIFF aussieht. Sie untersuchten auch den Austausch mit dem Windows-Programm SDL Trados Studio [6], das auf SDLXLIFF setzt, ein abgewandeltes XFLIFF-Format.

Omega T

Der erste Testkandidat steht unter der GPLv2 und ist kostenlos. Die meisten Distributionen bieten Omega T [1] in den Repositories an. Unter Ubuntu präsentiert der Paketmanager die Version 2.3.0. Da die Entwicklung des CAT-Tools schnell voranschreitet, schauten sich die Tester die aktuelle Version 2.6.3_10 vom Juni 2014 an. Im Downloadbereich gibt es Ausgaben mit und ohne Java-Laufzeitumgebung. Wer Letzteres wählt, sollte vor der Installation dafür sorgen, dass die Oracle-JRE vorhanden ist.

Nach dem Auspacken des Quellarchivs starten Anwender das Tool über »./OmegaT« . Erhalten sie eine Fehlermeldung, passen sie die Pfade zur JRE an. Das Skript »./linux-install.sh« kopiert das Programm nach »/opt/omegat« und fordert dazu Rootrechte per Sudo ein.

Omega T präsentiert ein dreigeteiltes Hauptfenster: links den Übersetzungseditor, rechts oben die Anzeige für Treffer aus dem Translation-Memory-System und darunter die Terminologiedatenbank, die bei Omega T »Glossar« heißt. Am unteren Rand stehen die Bereiche »Wörterbuch« , »Maschinelle Übersetzung« , »Multiple Übersetzungen« , »Notizen« und »Kommentare« . Anwender ziehen sie ins Hauptfenster hinein und ordnen sie nach ihren Wünschen an.

Das CAT-Tool arbeitet projektbezogen. Über das Menü »Projekt« legen die Nutzer ein neues Projekt an und bestimmen das Arbeitsverzeichnis. Im folgenden Dialogfenster wählen sie die Sprache der Quell- und Zieldatei, legen Orte für die Originaldokumente, das TM, das Glossar, Wörterbücher und übersetzte Files fest. Die Optionen für die Segmentierung sind sinnvoll voreingestellt. Wer hier etwas verändern will, sollte sich tiefer in die Materie einarbeiten.

Als Nächstes fügen Übersetzer dem Projekt Dateien hinzu – entweder Files von der Platte oder Texte aus dem Internet. Auch wenn der Dialog eine Mediawiki-URL verlangt, können Anwender hier auch beliebige Links zu Dokumenten im Netz eingeben.

Omega T öffnet neben reinen Textdateien die Formate (X)HTML, XLIFF, Microsoft Office 2007 bis 2010, Open Document, Docbook, Latex, Android-Ressourcen, Java-Properties, Gettext PO und einige mehr. Einen Blick auf alle unterstützten Dateiformate bietet der Dialog »Optionen | Dateifilter« . Das CAT-Tool unterstützt Unicode, nicht-lateinische Alphabete und linksläufige Schriften. Es behält die Formatierung und den Dateityp der Ausgangstexte bei.

Schritt für Schritt

Die Projektdateien zerlegt das Programm selbstständig in Segmente. Im Editorfenster ist der jeweils aktive Abschnitt hervorgehoben. [Strg]+[N] springt zum nächsten Textsegment und [Strg]+[U] zum nächsten noch nicht übersetzten. Der ausgewählte Teil erscheint zweimal untereinander. Anwender löschen nun die ursprüngliche Fassung und tragen ihre eigene Übersetzung ein.

Trennlinien zwischen den Segmenten oder eine Aufteilung in Spalten gibt es nicht, was es etwas schwierig macht, die Übergänge zu erkennen. Das Menü »Ansicht« offeriert immerhin einige Möglichkeiten, den Editor mit Farben übersichtlicher zu gestalten (Abbildung 1).

Abbildung 1: Die gesamte Übersetzungsarbeit findet in einem einzigen Editorfenster statt. Zur besseren Übersicht setzt Omega T ein paar Farbtupfer.

Über »Optionen | Rechtschreibprüfung« aktivieren Anwender den Spellchecker. Im oberen Feld wählen sie ein lokales Verzeichnis für die Wörterbücher, über »Installiere neues Wörterbuch« spielen sie neue Lexika ein. Omega T kontaktiert dazu die im Feld »URL« eingetragene Adresse. Voreingestellt ist der Server des Open-Office-Projekts. Das Tool arbeitet auch mit lokalen Wörterbüchern zusammen. Hinweise dazu und zum Konvertieren von Lexika gibt das Handbuch.

Erkennt Omega T einen Textteil, der einem bereits übersetzten ähnelt, kommt das Translation-Memory-System zum Einsatz, das Feld »Unscharfe Treffer« zeigt Übersetzungsvorschläge an. Der Shortcut [Strg]+[R] ersetzt den Inhalt des aktiven Segments durch den des Übersetzungsspeichers, [Strg]+[I] fügt ihn an der aktuellen Cursorposition im Editor ein. Zeigt das rechte Feld mehrere Treffer, nummeriert Omega T sie durch. Anwender übernehmen dann mit [Strg]+[1],[Strg]+[2] und so weiter gezielt einen Eintrag.

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 8 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

Linux-Magazin kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

comments powered by Disqus

Ausgabe 11/2017

Digitale Ausgabe: Preis € 6,40
(inkl. 19% MwSt.)

Stellenmarkt

Artikelserien und interessante Workshops aus dem Magazin können Sie hier als Bundle erwerben.