Open Source im professionellen Einsatz

Newsletter abonnieren
Seite durchsuchen

HEFTARCHIV | NEWS | E-BIBLIOTHEK | VIDEO | BLOGS | WHITEPAPER | EVENTS | ACADEMY | ABO | SHOP

user friendly

  Home  »  Heft & Abo  »  Heftarchiv  »  2006  »  10  »  Projekteküche  

RSS-Feed der aktuellen News von Linux-Magazin Online Folgen Sie Linux-Magazin Online auf Twitter
Diesen Artikel druckenDiesen Artikel weiterempfehlen Diesen Artikel kommentieren Newsletter abonnieren
Share/Bookmark

Sauberes Home

Paketmanagement hin oder her, irgendetwas bleibt immer liegen. Bei der Suche nach unnötig gewordenen Dateien bastelt sich wohl jeder seine eigenen kleinen Helferskripte. Pawel Stolowskis Kleansweep [5] vereint mehrere Mechanismen, um Karteileichen aufzuspüren (Abbildung 3).


Abbildung 3: Kleansweep fahndet nach nicht mehr benötigten Dateien.

Das Programm durchkämmt ausgewählte Verzeichnisse nach frei wählbaren Kriterien. Es kann nach leeren Files und Verzeichnissen, ungültigen symbolischen Links, Thumbnails und Sicherungsdateien von Texteditoren fahnden. Abschließend zeigt Kleansweep eine Liste der gefundenen Dateien, sortiert in Tabs, aus denen zu erkennen ist, aus welchem Grund sie das Programm als überflüssig eingestuft hat. Nun wählt der Benutzer jene Einträge aus der Liste, die Kleansweep löschen soll.

Im nächsten Schritt bietet das Programm an, die ausgewählten Dateien vor dem Löschen in einem komprimierten Archiv zu speichern, um voreilig entfernte Dateien wiederherstellen zu können. Die Backups löscht man dann nach einer selbst gewählten Zeit, wenn feststeht, dass die enthaltenen Daten wirklich überflüssig sind.

Textkompression

Effiziente Kompression spielt auch in Zeiten großer Datenträger eine wichtige Rolle, denn außer den Festplattenkapazitäten steigen auch die Datenmengen. Der Superstar unter den Kompressionsalgorithmen heißt MP3. Dieses verfahren verkleinert Audiodaten so stark, dass sie sich in kurzer Zeit auch via Internet übertragen lassen. Mit unkomprimierten Rohdaten wäre dies selbst mit Breitbandanbindungen im inzwischen üblichen Maßstab undenkbar - auch wenn das Ausbleiben dieses Fortschritts der Musikindustrie gefallen hätte.

MP3 wirft für den Menschen kaum oder gar nicht hörbare Frequenzen einfach weg, um Platz zu gewinnen. Mit diesem und anderen Mitteln schrumpfen Tondateien durchschnittlich um etwa 90 Prozent. Reiner Text lässt sich auch ohne datentypspezifische Methoden platzsparend speichern, wenn das Kompressionsverfahren vor allem nach Wiederholungen Ausschau hält. Zip erreicht eine Verkleinerung um etwa 70 Prozent.

Da Ascii-Dateien ohnehin gut komprimierbar sind, gibt es nur wenige auf Texte spezialisierte Kompressionsverfahren. Der Verkleinerungsfaktor ließe sich durch Algorithmen verbessern, die den Text inhaltlich analysieren; hier überschneidet sich dieses Forschungsfeld mit dem zur künstlichen Intelligenz. Das Weglassen von Informationen wie bei MP3 (verlustbehaftete Kompression) ist bei der Textkompression aber gewöhnlich nicht hinnehmbar.

Um Programmierer zu motivieren, bessere Kompressionsalgorithmen für Texte zu entwickeln, hat der Künstliche-Intelligenz-Forscher Marcus Hutter ein Preisgeld von 50000 Euro für jenen ausgesetzt, der eine Textdatei am stärksten verkleinert [6]. Als Testfall kommen dabei die ersten 100 MByte der englischen Wikipedia auf dem Stand vom 3. März zum Einsatz; der Wettbewerb läuft deshalb unter dem Motto "Compressing Human Knowledge". Die Bestmarke lag bei Redaktionsschluss bei einem Kompressionsfaktor von etwa 82 Prozent.

Diesen Artikel druckenDiesen Artikel weiterempfehlen Diesen Artikel kommentieren Newsletter abonnieren
Share/Bookmark
Ähnliche Artikel
Ein Herr der Flammen Nero für Linux 3.0 im Test
Brave GNU World Die monatliche GNU-Kolumne
Tooltipps Werkzeuge im Kurztest
Fingerspitzengefühl Besuch bei einem blinden Programmierer
Recht einfach Leser fragen, der Linux-Magazin-Ratgeber antwortet
Junge Pinguinbande Linux Tools für Eclipse
Whitepaper
Usage Landscape Enterprise Open Source Data Integration

Die Nachfrage nach Datenintegrationslösungen für Unternehmen ist zunehmend gestiegen und vor allem das Interesse an Open Source Technologien wird immer größer. Doch wie und von wem werden Open Source Datenintegrationslösungen genutzt und welches Nutzungsverhalten lässt sich daraus ableiten? Das vorliegende White Paper präsentiert die Erfahrungswerte von über 1000 Open Source Nutzern und liefert fundierte Antworten auf diese Fragen.

Download PDF (Registrierung erforderlich)
Daten Migration - Eine Publikation von Bloor Research

Datenmigrationsprojekte überschreiten häufig das Budget, neigen zu Verzögerung und werden unter Umständen komplett abgebrochen. Bloor Research ist eines der weltweit führenden IT-Forschungs-, Analyse- und Beratungsunternehmen und wird in dem vorliegenden White Paper die wichtigsten Aspekte dieser Problematik näher beleuchten. Ferner werden praktische Empfehlungen für erfolgreiche Migrationsprojekte gegeben, die Sie auf Ihr nächstes Projekt übertragen können.

Download PDF (Registrierung erforderlich)
Kommentare (0)