News auf den Palm bringen mit Site Scooper
Scoop the Site
von Hans-Georg Eßer
Erschienen im Linux-Magazin
2001/05
Slashdot, Freshmeat & Co. locken täglich mit Informationen - aber wann soll man sie lesen? Wer einen Palm Pilot oder kompatiblen PDA hat, wird mit Site Scooper und einigen Tools etwas flexibler beim News-Konsum.
Mit den beiden Tools Site Scooper und iSilo ziehen Sie die aktuellen News Ihrer bevorzugten Informationsquellen aus dem Internet, konvertieren die (HTML-)Daten in ein Palm-Dateiformat und übertragen dieses schließlich mit einem Sync-Tool (etwa kPilot). Dabei wird ein Cache angelegt, so dass bei täglichen Abrufen dieser Seiten nur neue Artikel gezogen werden. Um sich auf den unterschiedlich aufgebauten Webseiten zurechtzufinden, verwendet Site Scooper Templates, die die Struktur der Seiten beschreiben. Hier steht eine lange Liste, allein für Linux sind es zirka 20 Sites.
Site Scooper ist ein Perl-Skript, erfordert also keine aufwendige Kompilierung. Allerdings werden noch weitere Tools benötigt, darunter auch der als Freeware verfügbare Palm-Dokument-Viewer iSilo. Erster Schritt bei der Installation ist die Aktualisierung von Perl. Wechseln Sie als Root in ein neu angelegtes Installationsverzeichnis, das Sie später komplett löschen können.
Perl aktualisieren
Prüfen Sie, ob die Perl-Module HTML::Parser und HTML::Tagset auf Ihrem System vorhanden sind. Bei der für den Test verwendeten Distribution Red Hat 6.2 zum Beispiel fehlten sie. Der nächste Schritt ist nur nötig, falls die genannten Module nicht vorhanden sind: Sie finden HTML::Tagset und HTML::Parser wie üblich im CPAN, auch die Installationsprozedur ist Standard. Beachten Sie, dass das Tagset-Paket vor dem Parser-Paket installiert werden muss. Das komplette Vorgehen zeigt Listing 1.
Site Scooper installieren
Wenn Sie eine RPM-basierte Linux-Distribution verwenden, können Sie einfach die folgenden beiden Pakete ziehen und installieren:
wget http://sitescooper.org/released/
sitescooper-3.0.2-1.noarch.rpm
wget http://sitescooper.org/released/
sitescooper-sites-20010109-1.noarch.rpm
rpm -i sitescooper-3.0.2-1.noarch.rpm
sitescooper-sites-20010109-1.noarch.rpm
Ein Debian-Archiv ist laut Information auf den Site-Scooper-Seiten zur Zeit nicht verfügbar. Für Debianer gilt also das Gleiche wie für alle, die lieber auf den Einsatz von RPM verzichten: Verwenden Sie stattdessen das Tar.gz-Archiv http://sitescooper.org/released/sitescooper-full.tar.gz.
Listing 1: Vorbereitung der Installation
|
wget http://www.cpan.org/authors/id/S/SB/SBURKE/HTML-Tagset-3.03.tar.gz
wget http://www.cpan.org/authors/id/GAAS/HTML-Parser-3.15.tar.gz
tar xzf HTML-Tagset-3.03.tar.gz
tar xzf HTML-Parser-3.15.tar.gz
HTML-Tagset installieren:
cd HTML-Tagset-3.03
perl Makefile.PL
make
make test
make install
cd ..
rm -rf HTML-Tagset-3.03
HTML-Parser installieren:
cd HTML-Parser-3.15
perl Makefile.PL
make
make test
cd ..
rm -rf HTML-Parser-3.15
|
| Whitepaper |
|
Usage Landscape Enterprise Open Source Data Integration
Die Nachfrage nach Datenintegrationslösungen für Unternehmen ist zunehmend gestiegen und vor allem das Interesse an Open Source Technologien wird immer größer. Doch wie und von wem werden Open Source Datenintegrationslösungen genutzt und welches Nutzungsverhalten lässt sich daraus ableiten? Das vorliegende White Paper präsentiert die Erfahrungswerte von über 1000 Open Source Nutzern und liefert fundierte Antworten auf diese Fragen.
Download PDF (Registrierung erforderlich)
|
|
Daten Migration - Eine Publikation von Bloor Research
Datenmigrationsprojekte überschreiten häufig das Budget, neigen zu Verzögerung und werden unter Umständen komplett abgebrochen. Bloor Research ist eines der weltweit führenden IT-Forschungs-, Analyse- und Beratungsunternehmen und wird in dem vorliegenden White Paper die wichtigsten Aspekte dieser Problematik näher beleuchten. Ferner werden praktische Empfehlungen für erfolgreiche Migrationsprojekte gegeben, die Sie auf Ihr nächstes Projekt übertragen können.
Download PDF (Registrierung erforderlich)
|
Dieser Online-Artikel kann Links enthalten, die auf nicht mehr vorhandene Seiten verweisen. Wir ändern solche "broken links"
nur in wenigen Ausnahmefällen. Der Online-Artikel soll möglichst unverändert der gedrucken Fassung entsprechen.
|