Open Source im professionellen Einsatz

© cybernautin, photocase.com

Bücher scannen und in Google Drive speichern

Papierbuch am Ende

Mit einer chinesischen Guillotine und einem Einzugsscanner bewaffnet geht Perlmeister Michael Schilli diesmal seinen Büchern an den Leim. Die Grundlage seiner bibliophoben Tat liefert Google Drive, das mit 5 GByte genug Speicherplatz für ein Online-PDF-Lager mit eingescannten Büchern bietet.

Noch zieren sich die deutschen Verlage etwas mit der Umstellung auf digitale Bücher, doch die Weichen sind längst gestellt. Wer hat schon Lust, ein paar Kilo Bücher mit in den Urlaub zu schleppen, wenn Übergepäck Unsummen kostet? Warum zu Hause Regale mit staubfangenden Büchern zustellen, die kein Digital Native mehr rauszieht?!

Der Blick zurück ist aber nötig: Ich hatte in meinem früheren, Papier-basierten Leseleben jahrelang Regale mit ungelesenen Papierbüchern gefüllt – und die möchte ich nun nicht alle neu im Digitalformat kaufen. Es geht mir dabei nicht nur ums Geld, sondern auch um die Tatsache, dass die meisten älteren Werke wohl nie digital erscheinen werden.

Zur Vergangenheitsbewältigung habe ich mir deshalb einen 400 Dollar teuren Wunderscanner von Fujitsu angeschafft. Die zweite Digitalisier-Gerätschaft arbeitet rein mechanisch und trägt den jakobinischen Namen "Guillotine": Ein etwa 20 Kilo schweres Papiermesser (Abbildung 1), erworben für 150 Dollar in einem großen Internet-Auktionshaus), mit dem ich Wälzer bis zu etwa 600 Seiten von Umschlag und Bindung befreie.

Mit einem Teppichmesser trenne ich zunächst Hardcover vom Buchrumpf (Abbildung 2) und halbiere 1000-Seiten-Wälzer, damit sie in die Guillotine aus chinesischer Produktion passen. Das Fallbeil schneidet dann den geklebten oder gebundenen Buchrücken ab und die entstandene Loseblattsammlung zieht anschließend der Fujitsu S1500 ein (Abbildung 3), fährt eine OCR-Zeichenerkennung auf das Digitalformat und speichert das Buch als PDF ab.

Abbildung 1: Eine so genannte Guillotine schneidet ritsch-ratsch den geklebten Buchrücken ab.

Abbildung 2: Mit einem Teppichmesser geht es dem Umschlagdeckel an den Kragen.

Abbildung 2: Mit einem Teppichmesser geht es dem Umschlagdeckel an den Kragen.

Abbildung 3: Der Scanner Fujitsu S1500 zieht die losen Buchseiten ein und führt einen OCR-Lauf aus.

Google Drive vs. Dropbox

Ein dicker Wälzer wie "Algorithmen in C++" schlägt bei mir als PDF mit 200 bis 300 MByte (im Doppelsinn) zu Buche. Damit der User das Nachschlagewerk auf allen Geräten, vom Heim-PC bis zum iPad im Urlaub, parat hat, bieten Firmen wie Dropbox Applikationen an, die einmal gespeicherte Dateien magisch über das Netz verteilen, ohne dass der Anwender dies groß anordnen muss.

Google ist mit "Drive" [2] relativ neu in diesem Onlinestorage-Geschäft. Die für PC, Mac, iPad, Android-Geräte und Webbrowser verfügbaren Applikationen sind noch nicht so ausgereift wie die von Platzhirsch Dropbox, funktionieren aber. Eine native Drive-Applikation für Linux fehlt, Google liefert sie hoffentlich irgendwann nach. Beide Konkurrenten stellen interessierten Bastlern hervorragend dokumentierte APIs zur Verfügung, um nach Herzenslust selbst Applikationen zu zaubern.

PDFs online speichern

Abbildung 4 zeigt die auf Google Drive hochgeladenen PDF-Dateien in einem Chrome-Browser, Google unterstützt aber auch Firefox. Ein Mausklick auf eine Datei löst einen Download aus, einige Zeit später springt der PDF-Reader an und zeigt das gescannte Buch an. Im iPad speichert die Applikation Google Drive (Abbildung 5) die PDF-Daten zwischen, bis zu einer einstellbaren Grenze. Beim Downloaden der App ist darauf zu achten, dass man das Original von Google erwischt, es sind einige minderwertige Klone von Drittfirmen im Umlauf.

Abbildung 4: Im Webbrowser bringt Google Drive die gespeicherten PDF-Dateien zur Ansicht.

Abbildung 4: Im Webbrowser bringt Google Drive die gespeicherten PDF-Dateien zur Ansicht.

Abbildung 5: Die Drive-App auf dem iPad, die ebenfalls die gescannten Papierbücher als PDFs anzeigt.

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 5 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

Als digitales Abo

Als PDF im Abo bestellen

comments powered by Disqus

Ausgabe 07/2013

Preis € 6,40

Insecurity Bulletin

Insecurity Bulletin

Im Insecurity Bulletin widmet sich Mark Vogelsberger aktuellen Sicherheitslücken sowie Hintergründen und Security-Grundlagen. mehr...

Linux-Magazin auf Facebook