Open Source im professionellen Einsatz
Linux-Magazin 10/2014
© Tasnadi Erika, 123RF

© Tasnadi Erika, 123RF

Alte Dateien konvertieren und öffnen

Dem Vergessen entreißen

Lassen sich Dokumente aus den letzten 20 Jahren auch heute noch problemlos öffnen? Die Redaktion hat alte Festplatten durchwühlt und Leser um angestaubte Dateien gebeten. Die ausgegrabenen Dokumente sorgten für einige kleine Überraschungen.

1293

Alle, die Mitte der 1990er Jahre Linux für sich entdeckten, schrieben ihre Briefe und Diplomarbeiten mit Star Office. Eine ähnlich funktionsreiche Alternative für das Büropaket gab es nicht, zudem durften es Privatanwender kostenlos nutzen. Wer die damals angelegten Dateien aber heute öffnen möchte, bekommt ein Problem: Open und Libre Office, die auf dem zur Jahrtausendwende veröffentlichten Quellcode von Star Office basieren, verweigern die Mitarbeit.

Tatsächlich wechselte in der Geschichte der beiden Büropakete das Dateiformat sogar zweimal. Das erste Open Office schmiss 2002 das proprietäre Dateiformat von Star Office über Bord und verwendete ein eigenes, aber offengelegtes namens Openoffice.org XML. Die Endung für Textdokumente lautete SXW.

Seit Open Office 2 kommt jedoch das mittlerweile standardisierte Open-Document-Format zum Einsatz, Textdokumente enden also auf ODT. Open Office 2 war die letzte Version, die noch die alten Star-Office-Dokumente mit der Endung SDW lesen und konvertieren konnte. Wer seine alten Briefe in die Neuzeit retten möchte, muss folglich noch einmal Open Office 2 installieren (Abbildung 1).

Abbildung 1: Open Office 2 kann noch alte Star-Office-Dokumente öffnen – hier unter Ubuntu 08.04 in einer virtuellen Maschine.

Zwar bietet Apache diese alte Version noch in seinem Archiv zum Download an [1], doch lässt sie sich nicht mehr einfach auf aktuellen Systemen in Betrieb nehmen: Auf einem Testsystem mit Ubuntu 14.04 stürzte Open Office 2.4.3 reproduzierbar ab. Einen Ausweg bietet eine virtuelle Maschine (siehe Kasten "Reanimation"). Die Dateien aus Open Office 1 lesen hingegen auch noch aktuelle Open- und Libre-Office-Versionen.

Reanimation

Lässt sich ein Dokument nicht mehr mit aktueller Software öffnen oder konvertieren, muss der Linux-Anwender zwangsweise noch einmal das alte Programm bemühen. In ihm kann er das Dokument aufrufen, es bei Bedarf nachbearbeiten und es dann in ein Austauschformat exportieren. Häufig bleiben so Formatierungen und Formeln besser erhalten, als bei einem Import in eine neue Software.

Sofern die benötigte Anwendung nicht mehr auf dem aktuellen Rechner läuft und kein älterer Rechner mehr greifbar ist, kann der Nutzer es in einer virtuellen Maschine reanimieren. Eine solche passend einzurichten und zu starten ist jedoch recht aufwändig. So benötigt er neben der eigentlichen Anwendung auch noch ein passendes Betriebssystem. Microsoft Works 2.0 verlangt beispielsweise nach Windows 3.1, für Open Office 2 muss der Restaurator hingegen eine Linux-Distribution aus dem Jahr 2009 finden. Aber das ist recht schwierig, da viele Distributoren immer nur die letzten Versionen ihrer Distribution vorhalten. Eine Ausnahme ist Canonical, das sämtliche vorherigen Ubuntu-Versionen in einem Archiv anbietet [2].

Bei MS-DOS-Programmen erspart der darauf spezialisierte Emulator Dosbox [3] zumindest die Installation des Betriebssystems, startet im Gegenzug aber auch nicht alle Anwendungen.

Schreibmaschinen

Bevor Star Office die Bühne betrat, mussten Linux-Anwender der ersten Stunde auf das kommerzielle Applixware zurückgreifen. Hersteller Vistasource bietet auf seinen Seiten sogar noch die alte Version 6.1 an [4]. Die kostenlose Testversion läuft zwar nur 30 Tage, für das Konvertieren alter Dateien sollte das jedoch ausreichen (Abbildung 2).

Abbildung 2: Damit Applixware läuft, muss der User es zunächst über das beiliegende Skript installer einrichten.

Das von Vistasource bereitgestellte Paket mit der 32-Bit-Version war in den Linux-Magazin-Tests jedoch immer defekt. Die ebenfalls noch erhältliche Version 6 ließ sich hingegen entpacken, verlangt aber eine sieben Jahre alte »libstdc++« -Version, für die es unter [5] zum Glück noch ein Debian-Paket gibt. Alternativ importiert auch Calligra Words alte Applixware-Dokumente, wobei in den Tests jedoch die meisten Formatierungen verloren gingen (Abbildung 3).

Abbildung 3: Calligra Words importiert kaum ein Dokument korrekt. Im Bild ist zum Beispiel das Applixware-Dokument zu sehen, das Abbildung 2 im Original zeigt.

Works, Ami Pro und Word Pro – diese lustig klingenden Programme kannte in den 90er Jahren fast jeder Computerbesitzer. Von Microsoft kam das kleine Office-Paket Works, das wesentlich günstiger als das große Office-Paket war und vor allem vielen neu gekauften Rechnern beilag. Erst vor vier Jahren stampfte Microsoft die kleine Suite zugunsten von Word & Co. ein. Umso erstaunlicher, dass unter Linux kaum ein Programm die Dokumente importieren kann. Lediglich Libre Office (nicht aber Open Office) öffnet Textdokumente mit der Endung WPS. In den Beispieldokumenten blieben beim Import sogar alle Formatierungen erhalten (Abbildung 4).

Abbildung 4: Libre Office importiert die Textdateien aus Works mit recht ordentlichen Ergebnissen.

Mit Tabellen und Datenbanken von Works kann Libre Office allerdings nichts anfangen. Der Import von Tabellen lässt sich zwar erzwingen, die Ergebnisse sind jedoch unbrauchbar. Kurz nach Redaktionsschluss veröffentlichte die Document Foundation Libre Office 4.3, das Works-Dateien zu importieren in der Lage sei.

Und tatsächlich konnten die Tester solche Dokumente öffnen, ein Teil der Relationen mutierte dabei allerdings zu HTML-Entities. Works-Datenbanken verarbeitet die neue Version zu Tabellen.

Wer Probleme mit Works-Dokumenten hat, muss das Windows-Programm in einer virtuellen Maschine installieren (siehe Kasten "Reanimation"). Microsoft bietet zudem ein offizielles Konvertierungstool [6] an, das ebenfalls eine Windows-Umgebung erfordert. Datenbanken lassen sich alternativ auf der Seite [7] in CSV-Tabellen umwandeln.

Der Computerhändler Escom legte seinen PCs in den 90er Jahren die Lotus Smartsuite bei. Sie enthielt unter anderem die Textverarbeitung Ami Pro, die ab 1995 unter dem neuen Namen Word Pro firmierte. Libre und Open Office öffnen lediglich Dokumente aus Word Pro mit der Endung LWP, nicht aber Ami-Pro-Dateien mit der Endung SAM. Das in Calligra Words aufgegangene K-Word konnte simple Ami-Pro-Dokumente lesen, Calligra selbst bietet den Import von Ami-Pro-Dateien aber nicht mehr an.

Einfache Word-Pro-Dokumente liest Libre Office zuverlässig, das Layout blieb in den Tests erhalten (Abbildung 5). Anders sah es bei komplexeren Dokumenten mit Tabellen aus: Libre Office ignorierte sie, teilweise saßen die Tester vor einer weißen Seite.

Abbildung 5: Einfache Word-Pro-Dateien kann Libre Office lesen.

Dosenöffner

Libre Office importierte auch Word-Dokumente mit der Endung DOC bis zurück zu Word für Windows in Version 6 respektive 95. Dies verlief beim Test allerdings nicht immer ganz fehlerfrei: Während das Layout von einfachen Testdokumenten erhalten blieb, sahen komplexere Dokumente zerrupft aus (Abbildung 6). Bei einem Word-Dokument verweigerte Libre Office zudem die Zusammenarbeit.

Abbildung 6: Libre Office importiert Word-Dateien zwar klaglos, stolpert aber über komplexe Layouts.

Verheerend verlief der Import von Word-Dokumenten in Calligra Words: Dort blieb kaum etwas vom Layout übrig, in einem Fall färbte die Textverarbeitung sogar den kompletten Text blau ein (Abbildung 7). Die genannten guten Ergebnisse gelten übrigens nicht für die ersten Word-Versionen für DOS. Ein von einem Leser Anfang der 1990er Jahre mit MS Word 5 erstelltes Textdokument (Endung »txt« ) erkannten Libre und Open Office lediglich als reinen Text und zeigten sämtliche Steuerzeichen mit an. Gleiches galt für Dokumente aus Word für OS/2, auch bekannt als PM Word. Immerhin kam der reine Text zum Vorschein.

Abbildung 7: Calligra Words erhält im Wesentlichen nur den Text aus den Word-Dokumenten.

Teilweise hilft das Kommandozeilen-Programm Antiword [8], das auch vielen Distributionen beiliegt. Es konvertiert die ganz alten Word-Formate wahlweise in reinen Text, XML, Postscript oder PDF. Anwender müssen sich also entscheiden, ob sie das Layout erhalten oder den Text nachbearbeiten wollen.

Einwandfrei importieren ließen sich hingegen Wordperfect-Dokumente aus den 90er Jahren. Diese Textverarbeitung war noch vor dem Erscheinen von Microsoft Word Marktführer und erschien später auch in einer nativen Fassung für Linux. Der aktuelle Eigentümer Corel sparte sich jedoch die native Konvertierung und verkaufte lieber eine per Wine betriebene Windows-Version für Linux.

Die Textverarbeitung Wordstar geriet Anfang der 90er in den Schatten von Word und Wordperfect. Obwohl das Programm einige Anhänger behielt, konnten die Tester keine Konvertierungsmöglichkeit finden. Lediglich die Windows-Versionen von Star Office 5.2 bis 8 importierten Wordstar-Dokumente (Endung WSD). Unter dem Namen Word Tsar [9] entsteht derzeit ein Wordstar-Klon.

Unkompliziert ließen sich alte Latex-Dokumente übersetzen – vorausgesetzt sie verwenden keine extrem exotischen Zusatzpakete. Sogar der Editor Lyx las seine 14 Jahre alten Projektdateien ohne Murren ein (Abbildung 8).

Abbildung 8: Der Wysiwym-Editor Lyx öffnet auch noch ältere Projektdateien, wenn keine exotischen Latex-Pakete zum Zuge kommen.

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 7 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

Linux-Magazin kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • LibreOffice 5.0 in Sichtweite

    Die Open Document Foundation bereitet die Veröffentlichung der nächsten Version des beliebten Office-Pakets vor. Erscheinen soll LibreOffice 5.0 Ende Juli 2015 und wird einige nützliche, wenn auch keine revolutionären neuen Funktionen mitbringen.

  • Bitparade

    Im Büro spielen die Interoperabilität und die Kooperationsfähigkeit einiger Anwendungsprogramme eine gewichtige Rolle. Die Bitparade nimmt sich vier große Office-Suiten für Linux zur Brust und prüft, wie gut diese mit Fremdformaten zurechtkommen.

  • Open Office 3.3 veröffentlicht

    Die Openoffice.org-Community hat der Document Foundation bei der Veröffentlichung des Open-Office-Forks Libre Office 3.3 den Vortritt gelassen und Open Office 3.3 erst zwei Tage später veröffentlicht.

  • Libre Office 4.2 ist fertig

    Die Document Foundation hat Version 4.2 von Libre Office veröffentlicht. Die freie Bürosuite erfuhr unter anderem Performanceverbesserungen und kann noch mehr Fremdformate importieren.

  • Bessere OOXML-Unterstützung für Libre Office 4.2 geplant

    Die Veröffentlichung von Libre Office 4.2 steht noch lange nicht ins Haus, aber Miklos Vajna, seines Zeichens Libre-Office-Entwickler bei Suse, hat in seinem Blog bereits erste Neuerungen vorgestellt.

comments powered by Disqus

Stellenmarkt

Artikelserien und interessante Workshops aus dem Magazin können Sie hier als Bundle erwerben.