Open Source im professionellen Einsatz

Daten-Profis finden sich schnell zurecht

Eigene Quelltexte lassen sich direkt in den Ablauf bei den Komponenten einbauen. Den automatisch erzeugten Code zu erweitern, ist nicht empfehlenswert, denn ihn generiert das Werkzeug ja bei jeder Änderung des Jobs neu. Für den Einstieg in die umfangreichen Möglichkeiten gibt es auf der Website des Herstellers eine Reihe von kostenlosen Tutorien, Videos und Webinars. Wer sich bislang mit SQL-Abfragen oder Konvertierungsskripten auskannte und den Umgang mit der Maus nicht scheut, findet sich hier nach kurzer Einarbeitung schnell zurecht.

Der Hersteller wirbt gelegentlich auch damit, die "Datenqualität" mit seinen Werkzeugen zu verbessern. Dazu gibt es unter gleichen Lizenzbedingngen das Programm Open Profiler, das jedoch primär technische Aspekte wie Häufigkeitsverteilungen oder Anzahl von exakten Doubletten bestimmt.

Anwender, die eine Datenquelle aufwerten und auch dauerhaft konsistent halten wollen, müssen hier selbst Hand anlegen. Denn Talend liefert zwar die bequemen Werkzeuge, aber kaum fertige Komponenten oder Sub-Jobs, die zum Beispiel mehrere »Meyer« und »Mair« an der gleichen Adresse aufspüren und dann aus dem Datenbestand eliminieren. Eine Hilfe kann die wachsende Community des Werkzeugs sein, die eigene Lösungen austauscht [2].

So erschließt sich der größte Produktivitätsgewinn erst dann, wenn eine komplette Abteilung geschlossen die Anwendung verwendet. Wichtig ist die einzelnen Jobs gut zu dokumentieren und auch konsequent einzusetzen. Dazu bietet die Software Hilfen an.

Grafische Skriptverwaltung

Technisch betrachtet kann Open Studio nicht viel mehr als ein Perl-Konverter mit DBI-Anbindung. Den Unterschied macht die Oberfläche, die es IT-Abteilungen effizienter erlaubt, "mal eben" für ihre Fachabteilungen Auswertungen und Listen zu erzeugen - und sie auch einen Monat später noch zu verstehen. Wer sich hingegen ein Tool erhofft, das selbstständig die Strukturen im Modell des eigenen Datengrabes erkennt, wird zwangsläufig enttäuscht.

Infos

[1] Talend Open Studio:[http://www.talend.com/download.php]

[2] Open-Studio-Blog von Maik Böttcher: [http://www.bob-team.de/wordpress/tag/talend-open-studio]

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 2 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

Als digitales Abo

Als PDF im Abo bestellen

comments powered by Disqus

Ausgabe 07/2013

Preis € 6,40

Insecurity Bulletin

Insecurity Bulletin

Im Insecurity Bulletin widmet sich Mark Vogelsberger aktuellen Sicherheitslücken sowie Hintergründen und Security-Grundlagen. mehr...

Linux-Magazin auf Facebook