© Thomas Berg, Fotolia.com
PDF-Dateien unter Linux konvertieren und bearbeiten
PDF nach Maß
von Dr. Christoph Schäfer
Erschienen im Linux-Magazin
2009/07
In Sachen PDF-Bearbeitung gilt Adobe Acrobat als das Maß aller Dinge - das Programm gibt es aber, anders als den Adobe Reader, nur für Windows und Mac OS X. Zahlreiche leistungsfähige Werkzeuge bieten sich unter Linux als Alternativen an, um PDF-Dateien zu modifizieren.
Wer PDF-Dateien nur ansehen und drucken will, ist mit dem Adobe Reader vom PDF-Erfinder gut bedient. Fürs Bearbeiten sind aber andere Werkzeuge nötig, und das Standardprogramm Adobe Acrobat für diese Aufgabe gibt es nicht als Linux-Version. Hersteller Adobe bietet lediglich Serverversionen des Acrobat Distiller [1] sowie von Adobe Lifecycle [2] für Linux und verschiedene Unix-Varianten an. Eine Übersicht der unter Linux nutzbaren Alternativen gibt dieser Artikel.
Lesen mit dem Adobe Reader
Den Adobe Reader gibt es bereits seit Jahren als Linux-Version [3], auch wenn diese meist in einem gewissen zeitlichen Abstand zu den Varianten für Windows und Mac OS X erscheint. Der Einsatz des Programms ist nicht unumstritten, und zwar nicht nur, weil es sich um proprietäre Software handelt: Die Software ist für einen Dateibetrachter außergewöhnlich umfangreich und speicherhungrig und hat in jüngster Zeit vor allem Schlagzeilen wegen Sicherheitslücken in der Javascript-Engine gemacht. Trotzdem gilt: Wer ernsthaft mit PDF-Dateien arbeiten möchte, kommt um das Adobe-Produkt nicht herum.
Wenn es um das Betrachten von Dateien geht, gibt es zwar das ambitionierte Okular-Projekt [4], das neben PDF-Dateien Dokumente in zahlreichen weiteren Formaten darstellt. Für Anwender, welche die Korrektheit einer PDF-Datei visuell überprüfen wollen, gilt aber der Grundsatz, dass Darstellungsprobleme, die in anderen PDF-Betrachtern (und nicht im Adobe Reader) auftreten, auf Mängel im Alternativprogramm zurückzuführen sind, auch wenn das proprietäre Produkt selbst keineswegs fehlerfrei ist [5].
Zu den Kronjuwelen in Adobes Portfolio gehört die Adobe PDF Library, eine Bibliothek für Windows-, Mac OS, Linux und andere Unix-Versionen, deren Lizenzierung sich das Unternehmen mit Gold aufwiegen lässt und deren Funktionalität wenigstens teilweise auch im Reader verfügbar ist. Aus der Sicht der Endanwender verdienen hier vor allem zwei Funktionen Erwähnung: Das ist einmal die Fähigkeit, aus dem Reader heraus Booklets auf einem Bürodrucker auszugeben.
Wichtiger ist jedoch die Möglichkeit, eine geladene PDF-Datei ins Postscript-Format zu exportieren. Dies erfordert keinen langwierigen Start der grafischen Benutzeroberfläche, sondern lässt sich schnell über die Kommandozeile bewerkstelligen und daher auch in Skripten nutzen.
Der Wert dieser Konvertierungsoption im Vergleich zu freien Alternativen besteht in der Fähigkeit des Readers, Transparenzen in PDF-Dateien der Version 1.4 oder höher zu glätten (siehe Kasten "Transparenzen glätten").
|
In PDF-Dateien Transparenzen zu glätten, entspricht aus Anwendersicht dem "Verschmelzen" von transparenten Ebenen in einem Bildbearbeitungsprogramm und ist bei PDF- und Postscript-Dateien höchst komplex. Zahlreiche Druckereien sind bis heute nicht in der Lage, PDF-Dateien mit Transparenzen korrekt zu verarbeiten, jedenfalls nicht ohne Mithilfe von Acrobat. Kunden einer solchen Druckerei können eine PDF-Datei in den Reader laden, als Postscript-Datei ausgeben und anschließend mit Hilfe des »ps2pdf13«-Skripts aus dem Ghostscript-Paket [6] ins PDF-Format zurückverwandeln: Das Ergebnis hat dann perfekt geglättete Transparenzen.
|
PDF-Dateien wandeln
Sieht man von diesem Spezialfall ab, sind PDF-Dateien seit langem mit Kommandozeilenwerkzeugen, wie sie Ghostscript und XPDF [7] mitbringen, konvertierbar, häufig auch auf dem Umweg über Postscript, zum Beispiel mit »pstoedit« [8]. Wer es lieber grafisch mag, greift zu GSView [9], das ursprünglich ein Windows-Programm war und daher unter Linux optisch ein wenig altbacken daherkommt. Etwas komfortabler ist der KDE-Druckmanager KPrinter [10], eine moderne und anwenderzentrierte Oberfläche für CUPS [11], die Zugriff auf sämtliche Postscript-Optionen bietet.
Obwohl es ursprünglich als eine Art elektronisches Papier gedacht war, hat Adobe dem PDF-Format im Laufe der Jahre immer mehr Funktionen hinzugefügt. Angesichts der Allgegenwärtigkeit des Formats entstand so der Wunsch vieler Anwender, PDF-Dateien zu bearbeiten, obwohl es eigentlich ihr großer Vorteil ist, "statisch" zu sein. Die Bearbeitungswünsche sind dabei höchst verschieden und reichen vom Ändern der Seitenanordnung bis hin zu Textkorrekturen.
Viele Anwender und Programmierer wissen gar nicht, dass es freie Bibliotheken gibt, die (abgesehen von dem angesprochenen Transparenzproblem) den Vergleich mit der Adobe PDF Library nicht zu scheuen brauchen. Sie würden es sogar erlauben, ein Acrobat vergleichbares Programmpaket mit grafischer Benutzeroberfläche zu schnüren. Dies ist jedoch bis heute nicht geschehen, weshalb man unter Linux auf die Kombination zahlreicher Insellösungen angewiesen ist, die unterschiedlich effektiv sind.
Neben den bereits genannten Werkzeugen für die Kommandzeile gibt es außerordentlich mächtige Programmsammlungen für die Shell, die teilweise sehr einfach zu bedienen sind. Die Multivalent-Tools [12] und »pdftk« [13] sind robuste Java-Programme, die sich auch in der kritischen professionellen Druckpraxis bewährt haben. Im Funktionsumfang sind sich beide recht ähnlich, so dass die Wahl Geschmackssache ist. Beide erlauben es, PDF-Dateien zusammenzufügen, Seiten zu extrahieren, die Seitenausrichtung zu ändern, Dokumente zu verschlüsseln oder dies rückgängig zu machen, und auch, beschädigte Dateien zu reparieren.
Wer nur schnell einige Seiten hinzufügen, entfernen, drehen oder die Seitenreihenfolge ändern möchte, ist mit PDF-Shuffler [14] (Abbildung 1) gut bedient, das unter der Haube mit der Py-PDF-Bibliothek [15] arbeitet. Das GTK+-Programm hat eine spartanische, aber sehr intuitiv zu bedienende Oberfläche, die zahlreiche Mausoperationen mit visuellem Feedback anbietet.

|
Abbildung 1: PDF-Shuffler eignet sich besonders für kleinere Änderungen an einer PDF-Datei, etwa das Entfernen einzelner Seiten.
|
| Whitepaper |
|
Daten Migration - Eine Publikation von Bloor Research
Datenmigrationsprojekte überschreiten häufig das Budget, neigen zu Verzögerung und werden unter Umständen komplett abgebrochen. Bloor Research ist eines der weltweit führenden IT-Forschungs-, Analyse- und Beratungsunternehmen und wird in dem vorliegenden White Paper die wichtigsten Aspekte dieser Problematik näher beleuchten. Ferner werden praktische Empfehlungen für erfolgreiche Migrationsprojekte gegeben, die Sie auf Ihr nächstes Projekt übertragen können.
Download PDF (Registrierung erforderlich)
|
|
Open Source Datenintegration in der Praxis: Fallstudien und Anwendungsbeispiele
Über die letzten Jahre hinweg haben sich Open Source Lösungen als fester Bestandteil des gesamten Datenintegrationsmarktes etabliert. Viele Unternehmen haben bereits das Open Source Modell für Ihre Datenintegrationsprojekte aufgegriffen. Das vorliegende White Paper illustriert anhand ausgewählter Fallstudien und Anwendungsbeispiele die Implementierung von Open Source Datenintegration in der Praxis und benennt die daraus resultierenden Vorteile.
Download PDF (Registrierung erforderlich)
|
Dieser Online-Artikel kann Links enthalten, die auf nicht mehr vorhandene Seiten verweisen. Wir ändern solche "broken links"
nur in wenigen Ausnahmefällen. Der Online-Artikel soll möglichst unverändert der gedrucken Fassung entsprechen.
|