Open Source im professionellen Einsatz
Linux-Magazin 12/2005

Software internationalisieren mit Gettext

Programme von Welt

Ein Programm nachträglich für mehrere Landessprachen umzubauen erfordert hohen Aufwand. Besser ist es, von Anfang an im Sourcecode die nötigen Vorkehrungen für mehrsprachige Strings zu schaffen. Das Gettext-System bietet dafür die passende Infrastruktur.

612

Choose a language - oder doch lieber "Wählen Sie eine Sprache"? Eine Software in viele Landessprachen übersetzen wird angesichts der weltweiten Verbreitung von Linux immer wichtiger. Häufig kocht dabei aber jeder Programmierer sein eigenes Süppchen. Während Hardliner alle Sprachen direkt im Quellcode unterbringen, trennen umsichtige Entwickler mit selbst entwickelten Systemen Programmcode und Textausgabe. Um Wildwuchs zu vermeiden, schuf das GNU-Projekt 1995 das Gettext-Paket.

Dolmetscher

Gettext besteht aus einigen Programmen und einer Bibliothek, die im Zusammenspiel die Übersetzungsarbeiten nicht nur radikal vereinfachen, sondern gleichzeitig auch standardisieren. Welche Programmiersprachen Gettext gegenwärtig beherrscht, verrät der Kasten "Unterstützte Programmiersprachen".

Als Beispiel für die Übersetzung von Software dient das bekannte Hello World in C. Dieses Programm gibt über die Funktion »printf()« stur den englischen Text "Hello World" aus, egal wo die Anwendung sie auch immer ausführt. Um der Software Deutsch beizubringen, bindet man in einem ersten Stritt das Gettext-System ein. Das erledigen diese beiden Headerdateien:

#include <libintl.h>
#include <locale.h>


»libintl.h« enthält die im Folgenden verwendeten Funktionen, »locale.h« einige wichtige Konstanten. Nun wäre es schön, wenn das Programm die Zeichenkette »hello world« selbstständig gegen das deutsche Pendant austauschen würde - abhängig vom Inhalt der Sprach-Umgebungsvariablen wie »LANG« (siehe Kasten "Umgebungsvariablen"). Dabei hilft die Funktion »gettext()«, die dem Paket seinen Namen verlieh. Aus »printf("hello worldn")« wird somit »printf(gettext("hello worldn"))«.

Während der Ausführung schlägt Gettext in einer Datei die Übersetzung für »hello worldn« nach und liefert die passende deutsche Zeichenkette zurück. Ist keine entsprechende Übersetzungsdatei vorhanden oder tritt ein anderer Fehler auf, erscheint der im Quellcode festgelegte String. Auf diese Weise lassen sich alle Zeichenketten, die der Benutzer später zu Gesicht bekommt, in Gettext-Funktionsaufrufen kapseln.

Kleiner Langenscheidt

Die in der Gettext-Terminologie als Kataloge bezeichneten Übersetzungsdateien muss der Programmierer selbst erzeugen. Dabei hilft das Programm Xgettext:

xgettext -d hello -n hello.c


Dieser Aufruf findet in der Datei »hello.c« alle »gettext«-Aufrufe und speichert die entsprechenden Zeichenketten in einer ».po«-Datei (für Portable Object). Im Hello-World-Beispiel sieht das Ergebnis aus wie in Listing 1. Am Anfang der Datei stehen die allgemeinen Informationen wie etwa Übersetzer oder Erstellungsdatum. Kommentare beginnen mit einer Raute »#«.

Am wichtigsten sind die letzten vier Zeilen. Zunächst ist nach dem »#:« der Ort der Zeichenkette angegeben, im Beispiel Zeile 8 von »hello.c«. Dem »#,« folgen die so genannten Flags. Hier legt »c-format« fest, dass die Nachricht ein String im C-Format ist. Hilfsprogramme können mit dieser Information prüfen, ob die C-typischen Steuerzeichen wie »n« oder »%d« auch in der Übersetzung auftauchen. Hinter »msgid« steht der Ursprungstext, darunter bei »msgstr« die Übersetzung, die im Beispiel noch fehlt.

Für jede zu unterstützende Sprache ist eine solche Datei anzulegen und vom entsprechenden Dolmetscher auszufüllen. Das kann entweder per Texteditor oder mit einem der zahlreichen Übersetzungsprogramme geschehen. Beispiele für diese Werkzeuge sind PO-Edit (Abbildung 1), KBabel oder Gtranslator. Praktisch dafür ist auch das Ubuntu-Projekt Rosetta (Abbildung 2).

Unterstützte
Programmiersprachen

C, C++, Objective C, Shellskripte, Python, Librep (Lisp), GNU Smalltalk, Java, GNU Awk, Pascal (Free Pascal Compiler), YCP (Yast-Skriptsprache), Tcl/Tk, Perl, PHP, Pike.

Das Hilfsprogramm »xgettext« ist standardmäßig auf C und C++ eingestellt. Bei Bedarf deaktiviert der Parameter »-L Sprache« die Erkennungsautomatik.

Um nicht für jede Sprache Xgettext starten zu müssen, gibt der Programmierer der einmal produzierten Datei am besten die Endung ».pot« für Portable Object Template und verwendet sie als Vorlage für alle weiteren Kataloge. Wie man mit Änderungen am Quellcode umgeht, verrät der Kasten "Revisionen".

Linux-Magazin kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Bash Bashing

    Völker hört die Signale: Internationalisierung ist für Desktop-Programme üblich, bei von Menschen bedienten Skripten nicht. Dabei erfordert die Völkerverständigung nur wenig Mehrarbeit.

  • Verständigungsprobleme

    Nachdem es in Heft 11/2000 um die Übersetzung von GNOME-Programmen ging, soll nun natürlich auch KDE nicht zu kurz kommen. Dieser Artikel gibt einen Überblick über die vorhandenen Mechanismen zur Internationalisierung von KDE-Anwendungen und über die Arbeit der Übersetzungsteams.

  • Schneller kompilieren

    Bis zum Faktor 10 ohne Hardware-Upgrade: Die Compiler-Cache-Software CCache übersetzt C- und C++- Programme in Rekordzeit. Intelligentes Caching macht's möglich.

  • Internationale, die zweite Thorsten Fischer

    XML ist - man kann es schon nicht mehr hören - in aller Munde. Auch Gnome macht heftigen Gebrauch davon, und irgendwann stellt sich dann die Frage nach der Internationalisierung und Lokalisierung von XML-Dateien.

  • Software nach Standardmaß

    Die viel gerühmte Vielfalt bei freier Software bringt nicht nur Vorteile, sondern auch Probleme. Allein die Website Distrowatch zählt über 350 Distributionen - und die kochen in vielen Fragen ihr eigenes Süppchen. Die Linux Standard Base sorgt dafür, dass konforme Anwendungen überall laufen.

comments powered by Disqus

Ausgabe 08/2016

Artikelserien und interessante Workshops aus dem Magazin können Sie hier als Bundle erwerben.