Die monatliche GNU-Kolumne
Brave GNU World
von Georg C.F. Greve
Erschienen im Linux-Magazin
2005/04
Die Kolumne berichtet aus der Perspektive von GNU-Projekt und FSF über Projekte und aktuelle Geschehnisse im Umfeld freier Software. Diese Ausgabe stellt den Mbox-Cleaner vor und berichten über das Weltsozialforum in Porto Alegre.

|
Abbildung 1: Das Weltsozialforum in Porto Alegre, Brasilien, stand auch in diesem Jahr wieder im Zeichen freier Software.
|

|
Abbildung 1: Das Weltsozialforum in Porto Alegre, Brasilien, stand auch in diesem Jahr wieder im Zeichen freier Software.
|

|
Abbildung 1: Das Weltsozialforum in Porto Alegre, Brasilien, stand auch in diesem Jahr wieder im Zeichen freier Software.
|
Willkommen zu einer weiteren Ausgabe der Brave GNU World, diesmal geschrieben im sommerlichen Sao Paulo kurz nach dem Besuch des World Social Forum in Porto Alegre, doch dazu mehr gegen Ende der Kolumne.
Die letzte Ausgabe brachte unter anderem das Thema Spam und Methoden zu seiner Bekämpfung zur Sprache. Verständlicherweise gibt es dagegen keine Patentrezepte, aber viele Tools können dabei helfen, die Mailflut unter Kontrolle zu bringen.
Flottes Tool
Mbox-Cleaner von Oliver Bandel ist ein solches Programm[5]: Es säubert eine Mailbox-Datei im Mbox-Format von allen Dubletten. Dabei vergleicht es ganz einfach die Inhalte der Mails miteinander und behält bei identischen Nachrichten jeweils ein Exemplar zurück. Für einen Durchgang durch ein 9-MByte-File benötigt die Software zirka vier Sekunden auf einem Powerbook G4 mit 400-MHz-Prozessor. Das ist eine ordentliche Performance für ein Tool, das in einer Skriptsprache implementiert ist.
Die Idee dazu hatte Oliver, als er sich mit der Skriptsprache Ocaml[6] und dem Umgang mit den Ocamllex-Tools vertraut machen wollte. Er erinnerte sich dabei an ein Perl-Skript, das er geschrieben hatte, um eine Mbox-Datei in mehrere Files mit jeweils einer E-Mail zu zerlegen. Er implementierte es nun in Ocaml neu. Ein anderer User bat ihn daraufhin um eine Erweiterung, die diese Dateien durchsucht, Duplikate löscht und das Ergebnis wieder in einer einzigen Datei zusammenfasst.
Ein besonders nützliches Feature des Programms: Es liest die Daten von der Standardeingabe und schreibt sie in die Standardausgabe. Somit kann es als Filter in einer Pipeline zum Einsatz kommen. Die Integration einer verbesserten Spam-Erkennung steht derzeit ganz oben auf der Todo-Liste.
Oliver beschloss aufgrund des Interesses an seinem Skript, die Entwicklung von vornherein allgemein verfügbar zu machen, und veröffentlichte es als freie Software unter der General Public License (GPL). Nach einer Codebereinigung im Januar 2005 schickte er einen Hinweis an die Brave GNU World.
Ebenfalls für viel Diskussion sorgten die Gedankenspiele zum Sinn und Unsinn von Blacklists in der letzten Ausgabe. Ich greife das Thema daher an dieser Stelle noch einmal auf, um einen weiteren Aspekt zu beleuchten.
Blacklists
Kurz zusammengefasst für alle, die sich erst jetzt für das Thema interessieren: Blacklists sind Listen von IP-Adressen, die sich potenziellen Spam-Versendern zuordnen lassen. Solche Listen werden an mehreren Stellen geführt. Manche Mailserver verweigern die Annahme von Nachrichten, wenn die Absenderadresse auf einer solchen Liste steht. Andere Server markieren Nachrichten in solchen Fällen automatisch als Spam. Manche Administratoren gehen sogar so weit, gleich die Kommunikation mit allen dynamischen IP-Adressen zu verweigern - also fast allen Nutzern, die sich über einen Anbieter einwählen.
Klingt zunächst nach einer guten Idee, bestraft aber vor allem Unschuldige mit einer Kommunikationssperre - für die Missetaten anderer. Denn häufig benutzen Spammer die Rechner mit dynamischen Adressen ohne Wissen des eigentlichen Besitzers, um ihre Nachrichten zu versenden. Als Gegenmaßnahme schlagen viele Nutzer vor, den Smarthost des Internet-Providers zu nutzen und somit nicht unter das Blacklisting dynamischer IP-Adressen zu fallen. Der Smarthost als zentraler Maildienst eines Providers verwendet üblicherweise eine feste IP-Adresse.
| Whitepaper |
|
Daten Migration - Eine Publikation von Bloor Research
Datenmigrationsprojekte überschreiten häufig das Budget, neigen zu Verzögerung und werden unter Umständen komplett abgebrochen. Bloor Research ist eines der weltweit führenden IT-Forschungs-, Analyse- und Beratungsunternehmen und wird in dem vorliegenden White Paper die wichtigsten Aspekte dieser Problematik näher beleuchten. Ferner werden praktische Empfehlungen für erfolgreiche Migrationsprojekte gegeben, die Sie auf Ihr nächstes Projekt übertragen können.
Download PDF (Registrierung erforderlich)
|
|
Open Source Datenintegration in der Praxis: Fallstudien und Anwendungsbeispiele
Über die letzten Jahre hinweg haben sich Open Source Lösungen als fester Bestandteil des gesamten Datenintegrationsmarktes etabliert. Viele Unternehmen haben bereits das Open Source Modell für Ihre Datenintegrationsprojekte aufgegriffen. Das vorliegende White Paper illustriert anhand ausgewählter Fallstudien und Anwendungsbeispiele die Implementierung von Open Source Datenintegration in der Praxis und benennt die daraus resultierenden Vorteile.
Download PDF (Registrierung erforderlich)
|
Dieser Online-Artikel kann Links enthalten, die auf nicht mehr vorhandene Seiten verweisen. Wir ändern solche "broken links"
nur in wenigen Ausnahmefällen. Der Online-Artikel soll möglichst unverändert der gedrucken Fassung entsprechen.
|