Talend-Tool findet Blindgänger in Datenbanken
Der französische Spezialist für Datenintegration Talend hat das GPL-Tool Open Profiler 1.0 als ersten Release-Kandidaten veröffentlicht.
Das Tool sucht Datenbankstrukturen nach Typen und Eigenschaften ab. Findet es unvollständige oder fehlerhafte Datensätze, zeigt es an, an welchen Orten sie liegen. So können Datenbank-Administratoren die Daten auf Richtigkeit prüfen, ehe sie sie migrieren oder ins Backup spielen.
Der neue Open Profiler übernimmt die Aufgabe des Daten-Profiling. Er überprüft die Indikatoren der Datenbank auf ihre Werte, beispielsweise Telefonnummern oder Postleitzahlen. Unstimmige Bereiche zeigt der Profiler dem Admin an, so dass dieser an der richtigen Stelle die Daten überprüfen kann.
Talend hat den Open Profiler jetzt nach den internen Tests in der Version 1.0.0-rc1 veröffentlicht, um ihn einem öffentlichen Review-Prozesses zu unterziehen. In einigen Wochen will das französische Unternehmen das Tool in der finalen Version freigeben, sagte der Marketing-Chef von Talend, Yves de Montcheuil, im Gespräch mit Linux-Magazin Online.
Datenintegration bestehe aus zwei Aspekten, erklärte de Montcheuil weiter. Auf der einen Seite gilt es, Datenprofile zu erstellen, um zu wissen welche Daten vorliegen (Data Profiling). Auf der anderen Seite müssen diese Daten von Zeit zu Zeit bereinigt werden, weil sie unvollständig, fehlerhaft oder überflüssig sind (Data Cleaning). Der Open Profiler übernehme aber nur die Aufgabe des ersten Aspekts. Für die Datenbereinigung dienen andere Tools. Dafür schlägt der Marketing-Chef natürlich die Datenintegration-Suite Open Studio aus dem eigenen Hause vor.
Talend ist eine französische Gründung aus dem Jahr 2005. Zwei Systemintegratoren begannen um 2003 die freie Datenintegrationslösung Open Studio zu schreiben und veröffentlichten sie erstmal 2006. Seit 2007 ist Talend neben Niederlassungen in den USA und China auch in Deutschland ansässig. Die Firma mit weltweit rund 60 Mitarbeitern arbeitet in den Bereichen Datenmanagement und Business Intelligence zum Beispiel mit EnterpriseDB, SAP, Sugar und Ingres zusammen. Für ihre Produkte verwendet sie Java und die Eclipse-Entwicklungsumgebung sowie Perl und MySQL. Laut Selbstdarstellung arbeitet sie mit Open-Source-Software wegen des öffentlichen Test- und Erweiterungsprozesses sowie zu Gunsten von Robustheit und Flexibilität.
Die aktuelle Version des Open Studios 2.4.0 datiert von Anfang Juni 2008. Sie und der Open Profiler befinden sich als Binary GPLv2-lizenziert auf der Download-Seite des Unternehmens. Der Quellcode ist nur via Trac zugänglich. Beide Anwendungen sind auf Windows, Unix und Linux lauffähig, wobei Talend die Linuxe auf Gtk-Versionen einschränkt.





