Open Source im professionellen Einsatz

News auf den Palm bringen mit Site Scooper

Scoop the Site

Slashdot, Freshmeat & Co. locken täglich mit Informationen - aber wann soll man sie lesen? Wer einen Palm Pilot oder kompatiblen PDA hat, wird mit Site Scooper und einigen Tools etwas flexibler beim News-Konsum.

Mit den beiden Tools Site Scooper und iSilo ziehen Sie die aktuellen News Ihrer bevorzugten Informationsquellen aus dem Internet, konvertieren die (HTML-)Daten in ein Palm-Dateiformat und übertragen dieses schließlich mit einem Sync-Tool (etwa kPilot). Dabei wird ein Cache angelegt, so dass bei täglichen Abrufen dieser Seiten nur neue Artikel gezogen werden. Um sich auf den unterschiedlich aufgebauten Webseiten zurechtzufinden, verwendet Site Scooper Templates, die die Struktur der Seiten beschreiben. Hier steht eine lange Liste, allein für Linux sind es zirka 20 Sites.

Site Scooper ist ein Perl-Skript, erfordert also keine aufwendige Kompilierung. Allerdings werden noch weitere Tools benötigt, darunter auch der als Freeware verfügbare Palm-Dokument-Viewer iSilo. Erster Schritt bei der Installation ist die Aktualisierung von Perl. Wechseln Sie als Root in ein neu angelegtes Installationsverzeichnis, das Sie später komplett löschen können.

Perl aktualisieren

Prüfen Sie, ob die Perl-Module HTML::Parser und HTML::Tagset auf Ihrem System vorhanden sind. Bei der für den Test verwendeten Distribution Red Hat 6.2 zum Beispiel fehlten sie. Der nächste Schritt ist nur nötig, falls die genannten Module nicht vorhanden sind: Sie finden HTML::Tagset und HTML::Parser wie üblich im CPAN, auch die Installationsprozedur ist Standard. Beachten Sie, dass das Tagset-Paket vor dem Parser-Paket installiert werden muss. Das komplette Vorgehen zeigt Listing 1.

Site Scooper installieren

Wenn Sie eine RPM-basierte Linux-Distribution verwenden, können Sie einfach die folgenden beiden Pakete ziehen und installieren:

wget http://sitescooper.org/released/ 
sitescooper-3.0.2-1.noarch.rpm
wget http://sitescooper.org/released/ 
sitescooper-sites-20010109-1.noarch.rpm
rpm -i sitescooper-3.0.2-1.noarch.rpm  
sitescooper-sites-20010109-1.noarch.rpm

Ein Debian-Archiv ist laut Information auf den Site-Scooper-Seiten zur Zeit nicht verfügbar. Für Debianer gilt also das Gleiche wie für alle, die lieber auf den Einsatz von RPM verzichten: Verwenden Sie stattdessen das Tar.gz-Archiv http://sitescooper.org/released/sitescooper-full.tar.gz.

Listing 1: Vorbereitung der Installation

wget http://www.cpan.org/authors/id/S/SB/SBURKE/HTML-Tagset-3.03.tar.gz
wget http://www.cpan.org/authors/id/GAAS/HTML-Parser-3.15.tar.gz
tar xzf HTML-Tagset-3.03.tar.gz
tar xzf HTML-Parser-3.15.tar.gz

HTML-Tagset installieren:

cd HTML-Tagset-3.03
perl Makefile.PL
make
make test
make install
cd ..
rm -rf HTML-Tagset-3.03

HTML-Parser installieren:

cd HTML-Parser-3.15
perl Makefile.PL
make
make test
cd ..
rm -rf HTML-Parser-3.15

Diesen Artikel als PDF kaufen

Als digitales Abo

Als PDF im Abo bestellen

comments powered by Disqus

Ausgabe 07/2013

Preis € 6,40

Insecurity Bulletin

Insecurity Bulletin

Im Insecurity Bulletin widmet sich Mark Vogelsberger aktuellen Sicherheitslücken sowie Hintergründen und Security-Grundlagen. mehr...

Linux-Magazin auf Facebook