Abbildung 1: Das Weltsozialforum in Porto Alegre, Brasilien, stand auch in diesem Jahr wieder im Zeichen freier Software.
Abbildung 1: Das Weltsozialforum in Porto Alegre, Brasilien, stand auch in diesem Jahr wieder im Zeichen freier Software.
Abbildung 1: Das Weltsozialforum in Porto Alegre, Brasilien, stand auch in diesem Jahr wieder im Zeichen freier Software.
Willkommen zu einer weiteren Ausgabe der Brave GNU World, diesmal geschrieben im sommerlichen Sao Paulo kurz nach dem Besuch des World Social Forum in Porto Alegre, doch dazu mehr gegen Ende der Kolumne.
Die letzte Ausgabe brachte unter anderem das Thema Spam und Methoden zu seiner Bekämpfung zur Sprache. Verständlicherweise gibt es dagegen keine Patentrezepte, aber viele Tools können dabei helfen, die Mailflut unter Kontrolle zu bringen.
Flottes Tool
Mbox-Cleaner von Oliver Bandel ist ein solches Programm[5]: Es säubert eine Mailbox-Datei im Mbox-Format von allen Dubletten. Dabei vergleicht es ganz einfach die Inhalte der Mails miteinander und behält bei identischen Nachrichten jeweils ein Exemplar zurück. Für einen Durchgang durch ein 9-MByte-File benötigt die Software zirka vier Sekunden auf einem Powerbook G4 mit 400-MHz-Prozessor. Das ist eine ordentliche Performance für ein Tool, das in einer Skriptsprache implementiert ist.
Die Idee dazu hatte Oliver, als er sich mit der Skriptsprache Ocaml[6] und dem Umgang mit den Ocamllex-Tools vertraut machen wollte. Er erinnerte sich dabei an ein Perl-Skript, das er geschrieben hatte, um eine Mbox-Datei in mehrere Files mit jeweils einer E-Mail zu zerlegen. Er implementierte es nun in Ocaml neu. Ein anderer User bat ihn daraufhin um eine Erweiterung, die diese Dateien durchsucht, Duplikate löscht und das Ergebnis wieder in einer einzigen Datei zusammenfasst.
Ein besonders nützliches Feature des Programms: Es liest die Daten von der Standardeingabe und schreibt sie in die Standardausgabe. Somit kann es als Filter in einer Pipeline zum Einsatz kommen. Die Integration einer verbesserten Spam-Erkennung steht derzeit ganz oben auf der Todo-Liste.
Oliver beschloss aufgrund des Interesses an seinem Skript, die Entwicklung von vornherein allgemein verfügbar zu machen, und veröffentlichte es als freie Software unter der General Public License (GPL). Nach einer Codebereinigung im Januar 2005 schickte er einen Hinweis an die Brave GNU World.
Ebenfalls für viel Diskussion sorgten die Gedankenspiele zum Sinn und Unsinn von Blacklists in der letzten Ausgabe. Ich greife das Thema daher an dieser Stelle noch einmal auf, um einen weiteren Aspekt zu beleuchten.
Blacklists
Kurz zusammengefasst für alle, die sich erst jetzt für das Thema interessieren: Blacklists sind Listen von IP-Adressen, die sich potenziellen Spam-Versendern zuordnen lassen. Solche Listen werden an mehreren Stellen geführt. Manche Mailserver verweigern die Annahme von Nachrichten, wenn die Absenderadresse auf einer solchen Liste steht. Andere Server markieren Nachrichten in solchen Fällen automatisch als Spam. Manche Administratoren gehen sogar so weit, gleich die Kommunikation mit allen dynamischen IP-Adressen zu verweigern - also fast allen Nutzern, die sich über einen Anbieter einwählen.
Klingt zunächst nach einer guten Idee, bestraft aber vor allem Unschuldige mit einer Kommunikationssperre - für die Missetaten anderer. Denn häufig benutzen Spammer die Rechner mit dynamischen Adressen ohne Wissen des eigentlichen Besitzers, um ihre Nachrichten zu versenden. Als Gegenmaßnahme schlagen viele Nutzer vor, den Smarthost des Internet-Providers zu nutzen und somit nicht unter das Blacklisting dynamischer IP-Adressen zu fallen. Der Smarthost als zentraler Maildienst eines Providers verwendet üblicherweise eine feste IP-Adresse.