Aus Linux-Magazin 10/2014

Alte Dateien konvertieren und öffnen

© Tasnadi Erika, 123RF

Lassen sich Dokumente aus den letzten 20 Jahren auch heute noch problemlos öffnen? Die Redaktion hat alte Festplatten durchwühlt und Leser um angestaubte Dateien gebeten. Die ausgegrabenen Dokumente sorgten für einige kleine Überraschungen.

Alle, die Mitte der 1990er Jahre Linux für sich entdeckten, schrieben ihre Briefe und Diplomarbeiten mit Star Office. Eine ähnlich funktionsreiche Alternative für das Büropaket gab es nicht, zudem durften es Privatanwender kostenlos nutzen. Wer die damals angelegten Dateien aber heute öffnen möchte, bekommt ein Problem: Open und Libre Office, die auf dem zur Jahrtausendwende veröffentlichten Quellcode von Star Office basieren, verweigern die Mitarbeit.

Tatsächlich wechselte in der Geschichte der beiden Büropakete das Dateiformat sogar zweimal. Das erste Open Office schmiss 2002 das proprietäre Dateiformat von Star Office über Bord und verwendete ein eigenes, aber offengelegtes namens Openoffice.org XML. Die Endung für Textdokumente lautete SXW.

Seit Open Office 2 kommt jedoch das mittlerweile standardisierte Open-Document-Format zum Einsatz, Textdokumente enden also auf ODT. Open Office 2 war die letzte Version, die noch die alten Star-Office-Dokumente mit der Endung SDW lesen und konvertieren konnte. Wer seine alten Briefe in die Neuzeit retten möchte, muss folglich noch einmal Open Office 2 installieren (Abbildung 1).

Abbildung 1: Open Office 2 kann noch alte Star-Office-Dokumente öffnen – hier unter Ubuntu 08.04 in einer virtuellen Maschine.

Abbildung 1: Open Office 2 kann noch alte Star-Office-Dokumente öffnen – hier unter Ubuntu 08.04 in einer virtuellen Maschine.

Zwar bietet Apache diese alte Version noch in seinem Archiv zum Download an [1], doch lässt sie sich nicht mehr einfach auf aktuellen Systemen in Betrieb nehmen: Auf einem Testsystem mit Ubuntu 14.04 stürzte Open Office 2.4.3 reproduzierbar ab. Einen Ausweg bietet eine virtuelle Maschine (siehe Kasten “Reanimation”). Die Dateien aus Open Office 1 lesen hingegen auch noch aktuelle Open- und Libre-Office-Versionen.

Reanimation

Lässt sich ein Dokument nicht mehr mit aktueller Software öffnen oder konvertieren, muss der Linux-Anwender zwangsweise noch einmal das alte Programm bemühen. In ihm kann er das Dokument aufrufen, es bei Bedarf nachbearbeiten und es dann in ein Austauschformat exportieren. Häufig bleiben so Formatierungen und Formeln besser erhalten, als bei einem Import in eine neue Software.

Sofern die benötigte Anwendung nicht mehr auf dem aktuellen Rechner läuft und kein älterer Rechner mehr greifbar ist, kann der Nutzer es in einer virtuellen Maschine reanimieren. Eine solche passend einzurichten und zu starten ist jedoch recht aufwändig. So benötigt er neben der eigentlichen Anwendung auch noch ein passendes Betriebssystem. Microsoft Works 2.0 verlangt beispielsweise nach Windows 3.1, für Open Office 2 muss der Restaurator hingegen eine Linux-Distribution aus dem Jahr 2009 finden. Aber das ist recht schwierig, da viele Distributoren immer nur die letzten Versionen ihrer Distribution vorhalten. Eine Ausnahme ist Canonical, das sämtliche vorherigen Ubuntu-Versionen in einem Archiv anbietet [2].

Bei MS-DOS-Programmen erspart der darauf spezialisierte Emulator Dosbox [3] zumindest die Installation des Betriebssystems, startet im Gegenzug aber auch nicht alle Anwendungen.

Schreibmaschinen

Bevor Star Office die Bühne betrat, mussten Linux-Anwender der ersten Stunde auf das kommerzielle Applixware zurückgreifen. Hersteller Vistasource bietet auf seinen Seiten sogar noch die alte Version 6.1 an [4]. Die kostenlose Testversion läuft zwar nur 30 Tage, für das Konvertieren alter Dateien sollte das jedoch ausreichen (Abbildung 2).

Abbildung 2: Damit Applixware läuft, muss der User es zunächst über das beiliegende Skript »installer« einrichten.

Abbildung 2: Damit Applixware läuft, muss der User es zunächst über das beiliegende Skript »installer« einrichten.

Das von Vistasource bereitgestellte Paket mit der 32-Bit-Version war in den Linux-Magazin-Tests jedoch immer defekt. Die ebenfalls noch erhältliche Version 6 ließ sich hingegen entpacken, verlangt aber eine sieben Jahre alte »libstdc++« -Version, für die es unter [5] zum Glück noch ein Debian-Paket gibt. Alternativ importiert auch Calligra Words alte Applixware-Dokumente, wobei in den Tests jedoch die meisten Formatierungen verloren gingen (Abbildung 3).

Abbildung 3: Calligra Words importiert kaum ein Dokument korrekt. Im Bild ist zum Beispiel das Applixware-Dokument zu sehen, das <a href="#article_f2" class="figure" title=

Abbildung 2 im Original zeigt.” width=”300″ height=”189″ /> Abbildung 3: Calligra Words importiert kaum ein Dokument korrekt. Im Bild ist zum Beispiel das Applixware-Dokument zu sehen, das Abbildung 2 im Original zeigt.

Works, Ami Pro und Word Pro – diese lustig klingenden Programme kannte in den 90er Jahren fast jeder Computerbesitzer. Von Microsoft kam das kleine Office-Paket Works, das wesentlich günstiger als das große Office-Paket war und vor allem vielen neu gekauften Rechnern beilag. Erst vor vier Jahren stampfte Microsoft die kleine Suite zugunsten von Word & Co. ein. Umso erstaunlicher, dass unter Linux kaum ein Programm die Dokumente importieren kann. Lediglich Libre Office (nicht aber Open Office) öffnet Textdokumente mit der Endung WPS. In den Beispieldokumenten blieben beim Import sogar alle Formatierungen erhalten (Abbildung 4).

Abbildung 4: Libre Office importiert die Textdateien aus Works mit recht ordentlichen Ergebnissen.

Abbildung 4: Libre Office importiert die Textdateien aus Works mit recht ordentlichen Ergebnissen.

Mit Tabellen und Datenbanken von Works kann Libre Office allerdings nichts anfangen. Der Import von Tabellen lässt sich zwar erzwingen, die Ergebnisse sind jedoch unbrauchbar. Kurz nach Redaktionsschluss veröffentlichte die Document Foundation Libre Office 4.3, das Works-Dateien zu importieren in der Lage sei.

Und tatsächlich konnten die Tester solche Dokumente öffnen, ein Teil der Relationen mutierte dabei allerdings zu HTML-Entities. Works-Datenbanken verarbeitet die neue Version zu Tabellen.

Wer Probleme mit Works-Dokumenten hat, muss das Windows-Programm in einer virtuellen Maschine installieren (siehe Kasten “Reanimation”). Microsoft bietet zudem ein offizielles Konvertierungstool [6] an, das ebenfalls eine Windows-Umgebung erfordert. Datenbanken lassen sich alternativ auf der Seite [7] in CSV-Tabellen umwandeln.

Der Computerhändler Escom legte seinen PCs in den 90er Jahren die Lotus Smartsuite bei. Sie enthielt unter anderem die Textverarbeitung Ami Pro, die ab 1995 unter dem neuen Namen Word Pro firmierte. Libre und Open Office öffnen lediglich Dokumente aus Word Pro mit der Endung LWP, nicht aber Ami-Pro-Dateien mit der Endung SAM. Das in Calligra Words aufgegangene K-Word konnte simple Ami-Pro-Dokumente lesen, Calligra selbst bietet den Import von Ami-Pro-Dateien aber nicht mehr an.

Einfache Word-Pro-Dokumente liest Libre Office zuverlässig, das Layout blieb in den Tests erhalten (Abbildung 5). Anders sah es bei komplexeren Dokumenten mit Tabellen aus: Libre Office ignorierte sie, teilweise saßen die Tester vor einer weißen Seite.

Abbildung 5: Einfache Word-Pro-Dateien kann Libre Office lesen.

Abbildung 5: Einfache Word-Pro-Dateien kann Libre Office lesen.

Dosenöffner

Libre Office importierte auch Word-Dokumente mit der Endung DOC bis zurück zu Word für Windows in Version 6 respektive 95. Dies verlief beim Test allerdings nicht immer ganz fehlerfrei: Während das Layout von einfachen Testdokumenten erhalten blieb, sahen komplexere Dokumente zerrupft aus (Abbildung 6). Bei einem Word-Dokument verweigerte Libre Office zudem die Zusammenarbeit.

Abbildung 6: Libre Office importiert Word-Dateien zwar klaglos, stolpert aber über komplexe Layouts.

Abbildung 6: Libre Office importiert Word-Dateien zwar klaglos, stolpert aber über komplexe Layouts.

Verheerend verlief der Import von Word-Dokumenten in Calligra Words: Dort blieb kaum etwas vom Layout übrig, in einem Fall färbte die Textverarbeitung sogar den kompletten Text blau ein (Abbildung 7). Die genannten guten Ergebnisse gelten übrigens nicht für die ersten Word-Versionen für DOS. Ein von einem Leser Anfang der 1990er Jahre mit MS Word 5 erstelltes Textdokument (Endung »txt« ) erkannten Libre und Open Office lediglich als reinen Text und zeigten sämtliche Steuerzeichen mit an. Gleiches galt für Dokumente aus Word für OS/2, auch bekannt als PM Word. Immerhin kam der reine Text zum Vorschein.

Abbildung 7: Calligra Words erhält im Wesentlichen nur den Text aus den Word-Dokumenten.

Abbildung 7: Calligra Words erhält im Wesentlichen nur den Text aus den Word-Dokumenten.

Teilweise hilft das Kommandozeilen-Programm Antiword [8], das auch vielen Distributionen beiliegt. Es konvertiert die ganz alten Word-Formate wahlweise in reinen Text, XML, Postscript oder PDF. Anwender müssen sich also entscheiden, ob sie das Layout erhalten oder den Text nachbearbeiten wollen.

Einwandfrei importieren ließen sich hingegen Wordperfect-Dokumente aus den 90er Jahren. Diese Textverarbeitung war noch vor dem Erscheinen von Microsoft Word Marktführer und erschien später auch in einer nativen Fassung für Linux. Der aktuelle Eigentümer Corel sparte sich jedoch die native Konvertierung und verkaufte lieber eine per Wine betriebene Windows-Version für Linux.

Die Textverarbeitung Wordstar geriet Anfang der 90er in den Schatten von Word und Wordperfect. Obwohl das Programm einige Anhänger behielt, konnten die Tester keine Konvertierungsmöglichkeit finden. Lediglich die Windows-Versionen von Star Office 5.2 bis 8 importierten Wordstar-Dokumente (Endung WSD). Unter dem Namen Word Tsar [9] entsteht derzeit ein Wordstar-Klon.

Unkompliziert ließen sich alte Latex-Dokumente übersetzen – vorausgesetzt sie verwenden keine extrem exotischen Zusatzpakete. Sogar der Editor Lyx las seine 14 Jahre alten Projektdateien ohne Murren ein (Abbildung 8).

Abbildung 8: Der Wysiwym-Editor Lyx öffnet auch noch ältere Projektdateien, wenn keine exotischen Latex-Pakete zum Zuge kommen.

Abbildung 8: Der Wysiwym-Editor Lyx öffnet auch noch ältere Projektdateien, wenn keine exotischen Latex-Pakete zum Zuge kommen.

Kästchenpapier

Excel-Tabellen mit der Endung XLS importierte Libre Office problemlos, Formeln und Diagramme blieben intakt (Abbildung 9). Lediglich die Makros warf die Tabellenkalkulation über Bord. Die Ergebnisse in Calligra Sheets fallen eher unbefriedigend aus: Nicht nur das Layout verrutschte, Diagramme ersetzte die Tabellenkalkulation zudem durch das Bild eines Fragezeichens (Abbildung 10). Auffällig ist, dass die Testdokumente fast nur simple Formeln und einfache Berechnungen enthalten. Die Mehrheit der Excel-Nutzer scheint dessen Funktionsumfang nur zu einem Bruchteil zu nutzen.

Abbildung 9: Mit Excel-Tabellen und darin enthaltenen Diagrammen hat Libre Office keine Probleme …

Abbildung 9: Mit Excel-Tabellen und darin enthaltenen Diagrammen hat Libre Office keine Probleme …

Abbildung 10: … wohl aber der Konkurrent Calligra Sheets.

Abbildung 10: … wohl aber der Konkurrent Calligra Sheets.

Bei Powerpoint-Dokumenten punktet das Präsentationsprogramm Calligra Stage. In den Testdokumenten fehlen nur die Aufzählungspunkte. Libre Office zeigt auch damit keine Probleme. Aus Access-Datenbanken kann Kexi zumindest die Tabellen importieren. Ein Testdokument brachte die Anwendung allerdings zum Absturz, die Konvertierung scheint dennoch funktioniert zu haben.

Eine Alternative bieten die MDB-Tools [10]. Das in dem Paket enthaltene Kommandozeilen-Programm »mdb-export« überführt eine Datenbank ins CSV-Format, »gmdb2« stellt eine grafische Benutzeroberfläche, die in eine MDB-Datei hineinlinst (Abbildung 11). Zu den MDB-Tools gehören übrigens auch Bibliotheken und Werkzeuge für Entwickler, mit denen diese aus C-Programmen heraus auf Access-Datenbanken zugreifen. Libre und Open Office können derzeit keine Access-Datenbanken öffnen.

Abbildung 11: Mit Gmdb 2 aus den MDB-Tools öffnen und exportieren Anwender Access-Dateien.

Abbildung 11: Mit Gmdb 2 aus den MDB-Tools öffnen und exportieren Anwender Access-Dateien.

Bunte Karteikarten

Noch weit bis in die 90er Jahre nutzten viele Anwendungen Dbase-Datenbanken. Diese können unter anderem Libre Office und Open Office importieren. Wer dabei direkt die Datei mit der Endung DBF öffnet, landet im Tabellenmodul (Abbildung 12). Um die Dbase-Datei als Datenbank zu importieren, startet der Anwender das Datenbankmodul, entscheidet sich im Assistenten für den Punkt »Verbindung zu einer bestehenden Datenbank herstellen« und wählt »dBASE« aus.

Abbildung 12: Libre Office importiert Dbase-Dateien wie hier als Tabelle oder wahlweise im Datenbankmodul.

Abbildung 12: Libre Office importiert Dbase-Dateien wie hier als Tabelle oder wahlweise im Datenbankmodul.

Des Weiteren findet er in den Repositories der meisten Distributionen das Kommandozeilentool Dbview, das den Inhalt einer DBF-Datei auf der Konsole ausgibt. Programmierer dürfte zudem interessieren, dass zahlreiche Bibliotheken Dbase-Dateien lesen und manipulieren können. Für Python existiert beispielsweise das Modul Dbf [11].

Da viele Anwendungen Dbase-Dateien verarbeiten, bietet es sich auch als Austauschformat an. Wer etwa noch Access-Datenbanken verwendet, kann diese ins Dbase-Format exportieren und dann über Libre Office wieder einlesen. Auf einem anderen Weg lassen sich Access-Datenbanken derzeit unter Linux nicht mehr nutzen.

Dateien aus Photoshop 5, das 1997 auf dem Markt erschien, öffneten Krita und Gimp problemlos, selbst die Ebenen blieben erhalten (Abbildung 13). Eine Zeichnung im Windows Metafile Format mit der Endung WMF zeigte Karbon an, Inkscape verlor die Texte.

Abbildung 13: Alte Photoshop-Dateien bereiteten erstaunlich wenige Probleme. Hier ein Testposter in Krita.

Abbildung 13: Alte Photoshop-Dateien bereiteten erstaunlich wenige Probleme. Hier ein Testposter in Krita.

Corel-Draw-Dateien mit der Endung CDR kann die aktuelle Version von Libre Office öffnen. Da der Importfilter noch in den Kinderschuhen steckt, sind die Ergebnisse allerdings durchwachsen bis unbrauchbar. So fehlten in einem geöffneten Diagramm die kompletten Beschriftungen, eine andere Datei erzeugte einen »Allgemeinen Ein-/Ausgabefehler« .

Eine Alternative ist das Kommandozeilentool Uniconvertor [12], das viele Distributionen mitliefern. Das Programm kann Zeichnungen aus Corel Draw 7 und höher importieren und konvertiert sie in diverse andere Formate – darunter Postscript und SVG. Den Uniconvertor zieht übrigens auch Inkscape für den Import von Corel-Draw- sowie Adobe-Illustrator-5.5-Dateien mit der Endung AI heran. Beim Versuch, die den Testern vorliegenden Zeichnungen zu konvertieren, stürzte das Tool jedoch reproduzierbar ab.

Wer mit dem Illustrator geschriebene EPS-Dateien besitzt, kann sie mit den meisten Programmen betrachten, die Postscript verstehen, beispielsweise mit der Gnome-Dokumentenvorschau. Ubuntu Nautilus zeigt sogar passende Vorschausymbole an.

Zeitungsdruck

Dateien aus Microsofts DTP-Programm Publisher öffnet Libre Office offiziell seit Version 4 – zumindest versprechen das die Entwickler. Beim Versuch, ein älteres Publisher-Dokument mit der Endung PUB zu öffnen, brach Libre Office 4.2.4 jedoch reproduzierbar mit einem Ein-/Ausgabefehler ab. Eine weitere Möglichkeit, die Publisher-Dateien unter Linux zu konvertieren, hat das Linux-Magazin nicht gefunden.

Auch für Flussdiagramme aus Corel Flow und Dokumente aus dem DTP-Programm Serif Page Plus sieht es auf Linux-Rechnern schlecht aus – keine Lösung weit und breit, um die Dateien unter Linux zu öffnen. Die Versionen 5 und 9 von Serif Page Plus sind immerhin mit Wine [13] oder Crossover [14] startbar.

Passen mussten die Tester auch bei Dateien aus exotischen Windows-Anwendungen wie Open Edge Architect und bei Bilddateien im Fractal-Image-Format. Letzteres speichert fraktal komprimiert und sollte eigentlich Gif im Internet Konkurrenz machen. Ebenfalls nicht zu öffnen sind Dokumente der Tabellenkalkulation Supercalc (Endung CAL). Problemlos einbinden und nutzen ließen sich hingegen Truetype-Schriften aus den 1990er Jahren.

Fazit

Die Tests bestätigen die Faustregel: Je bekannter eine Anwendung war, desto wahrscheinlicher lassen sich ihre Dateien heute noch öffnen. Problemlos funktionieren offene und anerkannte Austauschformate. Das gilt etwa für reine Textdateien, Audiomaterial in unkomprimierten WAV-Dateien, Fotos als Jpeg, Tiff oder PNG und CSV-Tabellen, aber auch MP3-Musik oder Mpeg-2-Videos. Wer seine Dateien zukunftssicher speichern möchte, sollte daher direkt immer auch noch eine Kopie in einem solchen etablierten Format archivieren.

Notfallkoffer

Lässt sich ein Dokument überhaupt nicht mehr importieren, hilft mitunter ein Texteditor. Sehr wahrscheinlich erscheint darin ein langer Zeichensalat. Meist findet der Importeur in ihm die relevanten Texte und Daten, die sich dann über die Zwischenablage in ein neues Dokument retten lassen. Diese Arbeit ist allerdings etwas fummelig und braucht ein gutes Auge.

An den Inhalt von Dateien in den Formaten Openoffice.org XML und Open Document gelangt der Forschende im Notfall auch ohne Open Office: Da es sich um Zip-Archive handelt, muss er die Dateien entpacken. Zum Vorschein kommen XML-Dateien, deren eigentliche Inhalte in »content.xml« stecken.

Dienstleister

Im Internet bieten zahlreiche Dienste an, ältere Dokumente zu konvertieren. Conv2pdf [15] überführt etwa viele Microsoft-Formate in ein PDF. Der Dienst verdaut sogar Publisher- und alte Star-Office-Dokumente. Die Konvertierung ist kostenlos, solange die Dateien nicht größer als 6 MByte sind. Auf Multimedia hat sich der Konkurrent Zamzar [16] spezialisiert. Dort lassen sich sogar Zeichnungen aus älteren CAD-Programmen umwandeln.

Im Hinterkopf sollte der Nutzer dieser Dienste jedoch immer behalten, dass er möglicherweise vertrauliche Informationen an einen Unbekannten schickt. Niemand garantiert, dass der Dienst die Dateien nicht behält und auswertet – es sollte also eine Vertrauensverhältnis bestehen.

DIESEN ARTIKEL ALS PDF KAUFEN
EXPRESS-KAUF ALS PDFUmfang: 7 HeftseitenPreis €0,99
(inkl. 19% MwSt.)
LINUX-MAGAZIN KAUFEN
EINZELNE AUSGABE Print-Ausgaben Digitale Ausgaben
ABONNEMENTS Print-Abos Digitales Abo
TABLET & SMARTPHONE APPS Readly Logo
E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Inline Feedbacks
Alle Kommentare anzeigen
Nach oben