Open Source im professionellen Einsatz

Newsletter abonnieren
Seite durchsuchen

HEFTARCHIV | NEWS | E-BIBLIOTHEK | VIDEO | BLOGS | WHITEPAPER | EVENTS | ACADEMY | ABO | SHOP

user friendly

  Home  »  Heft & Abo  »  Heftarchiv  »  2005  »  10  »  Ordnung im Chaos  

RSS-Feed der aktuellen News von Linux-Magazin Online Folgen Sie Linux-Magazin Online auf Twitter
Diesen Artikel druckenDiesen Artikel weiterempfehlen Diesen Artikel kommentieren Newsletter abonnieren
Share/Bookmark

13 Desktop-Suchsysteme im Vergleich

Ordnung im Chaos

von Steffen Leich
Erschienen im Linux-Magazin 2005/10

Jeden Tag plagen sich Computernutzer mit der wachsenden Menge an Daten herum: E-Mails, Chat-Protokolle, Office-Dokumente, Urlaubsfotos, Musikdateien. Desktop-Suchmaschinen treten an, um in dem Chaos die gesuchten Informationen zu finden. Dieser Artikel zeigt, ob sie es schaffen.

Seit Urzeiten gehört das Sammeln zu den überlebensnotwendigen Aufgaben des Menschen. Mittlerweile ist bei vielen die Sammelwut jedoch derart ausgeprägt, dass sie beim Wiederfinden Hilfe benötigen. Computer-Messies bilden da keine Ausnahme: Täglich suchen sie auf ihren Festplatten Dokumente, Musikdateien oder E-Mails.

Desktop-Suchsysteme sollen dabei helfen, den Überblick zu behalten. Ironischerweise müssen Anwender aber erst das richtige System auftreiben. Denn neben Produkten von Google und Microsoft (die beide relativ neu in diesem Geschäft sind) gibt es viele weitere Werkzeuge. Linux muss sich hier nicht hinter Windows oder Mac OS verstecken; Anwender erwartet ein ähnlich umfangreiches Angebot wie bei der Konkurrenz.

Die Programme basieren im Grunde alle auf derselben Technik: Ein Index speichert für sämtliche Ressourcen interne Metadaten (ID3-Tags bei MP3-Dateien oder Autor und Seitenzahl eines Office-Dokuments), externe Metadaten (Dateiname, Mailordner) sowie die eigentlichen Inhalte (Text einer Office-Datei).

Aufgabenteilung

Abbildung 1 zeigt exemplarisch das Zusammenspiel der verschiedenen Komponenten einer Desktopsuche. Als Watcher dient beispielsweise ein Kerneltreiber, etwa das I-Notify-Modul. Einige Systeme besitzen keinen Watcher, der Crawler oderIndexer läuft dann im Hintergrund per Scheduler oder die Anwender starten ihn manuell. Die hohe Modularisierung der Suchmaschinen ermöglicht es Benutzern und Entwicklern, dem System über Plugins im Crawler weitere Dateitypen bekannt zu machen.

Die Systeme haben neben der reinen Suche im Dateibaum auch die Aufgabe, Daten aus speziellen Applikationen aufzunehmen. Darunter fallen Bookmarks des Webbrowsers, E-Mails, Chatprotokolle und Adressbücher. Jede Applikation hat zwar meist eine eigene Suchfunktion, doch ergeben sich daraus zwei Nachteile: Das Benutzerinterface sieht stets unterschiedlich aus und der Anwender erreicht die Suche nicht aus anderen Bereichen des Desktops heraus.

Integration der Daten

Der Benutzer will in erster Linie nicht nur erfahren, dass sich die gesuchten Daten auf seinem System befinden, sondern - basierend auf Datentyp sowie externen und internen Metadaten - in welchem Zusammenhang sie auf dem Computer entstanden, wo sie liegen und wie man sie betrachtet beziehungsweise anderweitig nutzt:

  • Wann und an wen wurde eine Mail mit einem bestimmten Inhalt
    geschickt?
  • In welchem Ordner welches Mailclients befindet sie sich?
  • Wann und mit wem wurde über ein bestimmtes Thema
    gechattet?
  • Wo liegt eine Datei mit bestimmtem Inhalt, wann wurde sie
    erstellt und mit welchem Programm?

Die gefundenen Daten zeigt ein Suchsystem entweder vollständig an oder wenigstens eine Referenz darauf, eventuell versehen mit Auszügen aus dem Inhalt. Die Behandlung der Ergebnisdaten gerät zur Herausforderung für die Suchprogramme, wenn es sich um aggregierte Dateneinheiten handelt, etwa eine Mbox-Datei oder eine Datenbank. Die Klassifikation in Tabelle 1 bewertet, wie gut Suchsysteme Daten integrieren und wie sie sich in das System einbinden.


Abbildung 1: Desktop- Suchsysteme bestehen aus mehreren Komponenten. Ein Watcher überwacht das Dateisystem auf Veränderungen und informiert den Crawler. Dieser sucht alle Metadaten aus den Dateien zusammen und übergibt sie an den Indexer, der sie in eine Datenbank einträgt.

Diesen Artikel druckenDiesen Artikel weiterempfehlen Diesen Artikel kommentieren Newsletter abonnieren
Share/Bookmark
Ähnliche Artikel
Bewölkte Fenster Cloud Computing für den Desktop
A la Giraffe Open-Source-Mapi und Active Sync mit Zarafa 6.40
Austria Open Auflösung des (schweren) Winterrätsels
Langsame Baustellen Online-Textverarbeitungen im Vergleich
Nur für Spezialisten Benutzbarkeit von Sicherheitssoftware in der Kritik - Teil 1
Doping fürs X Schlanke Terminalservices mit NX
Whitepaper
Usage Landscape Enterprise Open Source Data Integration

Die Nachfrage nach Datenintegrationslösungen für Unternehmen ist zunehmend gestiegen und vor allem das Interesse an Open Source Technologien wird immer größer. Doch wie und von wem werden Open Source Datenintegrationslösungen genutzt und welches Nutzungsverhalten lässt sich daraus ableiten? Das vorliegende White Paper präsentiert die Erfahrungswerte von über 1000 Open Source Nutzern und liefert fundierte Antworten auf diese Fragen.

Download PDF (Registrierung erforderlich)
Daten Migration - Eine Publikation von Bloor Research

Datenmigrationsprojekte überschreiten häufig das Budget, neigen zu Verzögerung und werden unter Umständen komplett abgebrochen. Bloor Research ist eines der weltweit führenden IT-Forschungs-, Analyse- und Beratungsunternehmen und wird in dem vorliegenden White Paper die wichtigsten Aspekte dieser Problematik näher beleuchten. Ferner werden praktische Empfehlungen für erfolgreiche Migrationsprojekte gegeben, die Sie auf Ihr nächstes Projekt übertragen können.

Download PDF (Registrierung erforderlich)
Kommentare (0)