Open Source im professionellen Einsatz

LGPL-Bibliothek für die Silbentrennung

17.03.2008

Der Entwickler Steve Wolter hat Version 1.0 von Libhyphenate, seiner C++-Bibliothek für Silbentrennung, veröffentlicht. Eine Beispielanwendung hat er ebenfalls geschrieben.

161

Libhyphenate setzt den Trennungsalgorithmus um, der auch im Satzsystem Tex Verwendung findet und in der Doktorabeit "Word Hy-phen-a-tion by Com-put-er" von Frank Liang beschrieben ist. Derzeit liefert die Bibliothek Trennwörterbücher für US-Englisch, Deutsch und Französisch mit. Weitere sollen sich nach Angaben des Programmautors aus den entsprechenden Tex-Dateien erzeugen lassen. Die aktuelle Release behebt Probleme mit der UTF-8-Kodierung in deutschen Texten, die in Vorgängerversionen auftraten.

Wolter hat bereits eine erste kleine Anwendung auf Basis seiner C++-Bibliothek geschaffen: XHTML-Hyphenate, seit kurzem in Version 1.0 erhältlich, bietet Silbentrennung für XHTML-Dokumente. Dazu fügt es in alle Textinhalte (von Überschriften abgesehen) an den Silbengrenzen das bedingte UTF-8-Trennzeichen U+00AD ein, das viele Browser interpretieren, Firefox aber ignoriert. Die korrekte Spracheinstellung für die Trennung entnimmt das Programm den Attribut "xml:lang".

XHTML-Hyphenate steht unter GPL, die Bibliothek Libhyphenate unter der LGPL. Beide sind auf der Homepage des Autors als Quelltext-Archive erhältlich.

Ähnliche Artikel

  • LibCMIS 0.4 bringt Anschluss an Google Drive

    LibCMIS, eine C++-Bibliothek zur Anbindung von Programmen an Content Management Systeme (CMS), ist in Version 0.4.1 verfügbar.

  • LM-Sensors-Bibliothek wechselt zur LGPL

    LM-Sensors, ein Paket zur Hardwareüberwachung unter Linux, ist in Version 3.2.0 erhältlich. Ab dieser Release steht die enthaltene Bibliothek Libsensors unter LGPLv2.1.

  • Freiheit den Bibliotheken!

    Ein Problem, auf das Copyleft-Juristen immer wieder angesprochen werden, betrifft die Bibliotheken für Open-Source- Software. Diese werfen spezielle Fragen auf, von denen die wichtigsten im Folgenden angesprochen werden.

  • SyncML-Client kommt unter die LGPL

    Das auf die Synchronisation von PCs und mobilen Geräten spezialisierte schweizerische Unternehmen Synthesis AG stellt seine SyncML-Lösung unter die LGPL.

  • Docbook

    Docbook gilt als Nonplusultra der technischen Dokumentation. Dieser Artikel zeigt, dass der Einstieg in die XML-Anwendung gar nicht schwer ist. Als Belohnung winken PDFs, E-Books und Manpages.

comments powered by Disqus

Ausgabe 01/2015

Digitale Ausgabe: Preis € 6,40
(inkl. 19% MwSt.)

Artikelserien und interessante Workshops aus dem Magazin können Sie hier als Bundle erwerben.