Open Source im professionellen Einsatz

Newsletter abonnieren
Seite durchsuchen

HEFTARCHIV | NEWS | E-BIBLIOTHEK | VIDEO | BLOGS | WHITEPAPER | EVENTS | ACADEMY | ABO | SHOP

user friendly

  Home  »  Heft & Abo  »  Heftarchiv  »  2001  »  05  »  Scoop the Site  

RSS-Feed der aktuellen News von Linux-Magazin Online Folgen Sie Linux-Magazin Online auf Twitter
Diesen Artikel druckenDiesen Artikel weiterempfehlen Diesen Artikel kommentieren Newsletter abonnieren
Share/Bookmark

News auf den Palm bringen mit Site Scooper

Scoop the Site

von Hans-Georg Eßer
Erschienen im Linux-Magazin 2001/05

Slashdot, Freshmeat & Co. locken täglich mit Informationen - aber wann soll man sie lesen? Wer einen Palm Pilot oder kompatiblen PDA hat, wird mit Site Scooper und einigen Tools etwas flexibler beim News-Konsum.

Mit den beiden Tools Site Scooper und iSilo ziehen Sie die aktuellen News Ihrer bevorzugten Informationsquellen aus dem Internet, konvertieren die (HTML-)Daten in ein Palm-Dateiformat und übertragen dieses schließlich mit einem Sync-Tool (etwa kPilot). Dabei wird ein Cache angelegt, so dass bei täglichen Abrufen dieser Seiten nur neue Artikel gezogen werden. Um sich auf den unterschiedlich aufgebauten Webseiten zurechtzufinden, verwendet Site Scooper Templates, die die Struktur der Seiten beschreiben. Hier steht eine lange Liste, allein für Linux sind es zirka 20 Sites.

Site Scooper ist ein Perl-Skript, erfordert also keine aufwendige Kompilierung. Allerdings werden noch weitere Tools benötigt, darunter auch der als Freeware verfügbare Palm-Dokument-Viewer iSilo. Erster Schritt bei der Installation ist die Aktualisierung von Perl. Wechseln Sie als Root in ein neu angelegtes Installationsverzeichnis, das Sie später komplett löschen können.

Perl aktualisieren

Prüfen Sie, ob die Perl-Module HTML::Parser und HTML::Tagset auf Ihrem System vorhanden sind. Bei der für den Test verwendeten Distribution Red Hat 6.2 zum Beispiel fehlten sie. Der nächste Schritt ist nur nötig, falls die genannten Module nicht vorhanden sind: Sie finden HTML::Tagset und HTML::Parser wie üblich im CPAN, auch die Installationsprozedur ist Standard. Beachten Sie, dass das Tagset-Paket vor dem Parser-Paket installiert werden muss. Das komplette Vorgehen zeigt Listing 1.

Site Scooper installieren

Wenn Sie eine RPM-basierte Linux-Distribution verwenden, können Sie einfach die folgenden beiden Pakete ziehen und installieren:

wget http://sitescooper.org/released/ 
sitescooper-3.0.2-1.noarch.rpm
wget http://sitescooper.org/released/ 
sitescooper-sites-20010109-1.noarch.rpm
rpm -i sitescooper-3.0.2-1.noarch.rpm  
sitescooper-sites-20010109-1.noarch.rpm

Ein Debian-Archiv ist laut Information auf den Site-Scooper-Seiten zur Zeit nicht verfügbar. Für Debianer gilt also das Gleiche wie für alle, die lieber auf den Einsatz von RPM verzichten: Verwenden Sie stattdessen das Tar.gz-Archiv http://sitescooper.org/released/sitescooper-full.tar.gz.

Listing 1: Vorbereitung der Installation
wget http://www.cpan.org/authors/id/S/SB/SBURKE/HTML-Tagset-3.03.tar.gz
wget http://www.cpan.org/authors/id/GAAS/HTML-Parser-3.15.tar.gz
tar xzf HTML-Tagset-3.03.tar.gz
tar xzf HTML-Parser-3.15.tar.gz

HTML-Tagset installieren:

cd HTML-Tagset-3.03
perl Makefile.PL
make
make test
make install
cd ..
rm -rf HTML-Tagset-3.03

HTML-Parser installieren:

cd HTML-Parser-3.15
perl Makefile.PL
make
make test
cd ..
rm -rf HTML-Parser-3.15
Diesen Artikel druckenDiesen Artikel weiterempfehlen Diesen Artikel kommentieren Newsletter abonnieren
Share/Bookmark
Whitepaper
Usage Landscape Enterprise Open Source Data Integration

Die Nachfrage nach Datenintegrationslösungen für Unternehmen ist zunehmend gestiegen und vor allem das Interesse an Open Source Technologien wird immer größer. Doch wie und von wem werden Open Source Datenintegrationslösungen genutzt und welches Nutzungsverhalten lässt sich daraus ableiten? Das vorliegende White Paper präsentiert die Erfahrungswerte von über 1000 Open Source Nutzern und liefert fundierte Antworten auf diese Fragen.

Download PDF (Registrierung erforderlich)
Daten Migration - Eine Publikation von Bloor Research

Datenmigrationsprojekte überschreiten häufig das Budget, neigen zu Verzögerung und werden unter Umständen komplett abgebrochen. Bloor Research ist eines der weltweit führenden IT-Forschungs-, Analyse- und Beratungsunternehmen und wird in dem vorliegenden White Paper die wichtigsten Aspekte dieser Problematik näher beleuchten. Ferner werden praktische Empfehlungen für erfolgreiche Migrationsprojekte gegeben, die Sie auf Ihr nächstes Projekt übertragen können.

Download PDF (Registrierung erforderlich)
Kommentare (0)