© Andrzej Bardyszewski, Fotolia.com
Talend Open Studio konvertiert per Mausklick Daten und Formate
Universell verbinden
von Nils Magnus
Erschienen im Linux-Magazin
2009/06
Preislisten aus Warenwirtschaftssystemen oder Adresslisten aus der Human-Ressources-Datenbank erzeugen: Dafür gibt es in vielen Unternehmen ein Kartenhaus an Skripten, Batchjobs und langen SQL-Abfragen. Ärgerlich, wenn sich niemand mehr an ihre Funktion erinnert. Open Studio will Übersicht schaffen.
Datenintegration ist einer der Lieblingsbegriffe der Marketingabteilung des französischen Softwarehauses Talend. Letztlich adressiert der Anbieter damit ein banales, aber essenzielles Problem, mit dem sich viele Unternehmen konfrontiert sehen: Ein Tool soll irgendwelche Daten in irgendwelchen Formaten in andere Daten in andere Formate umwandeln. Talend Studio tritt an, das umzusetzen.
Die Software kommt als ZIP-Archiv von 239 MByte daher und enthält fast alle Funktionen des kommerziellen Schwesterproduktes Talend Integration Suite [1]. Die kommerzielle Version schließt jedoch technischen Support ein und ermöglicht, die Integrationsjobs auf einem zentralen Server zu verwalten. Um die Funktionsweise von Talend Open Studio kennen zu lernen reicht die Open-Source-Version jedoch vollkommen aus.
Die Anwendung ist in Java auf Basis des Eclipse Rich Client Toolkit geschrieben. Wer das Archiv entpackt, belegt weitere 344 MByte Plattenplatz. Dann findet er im obersten Verzeichnis das Binary »TalendOpenStudio-linux-gtk-x86« und macht es mit »chmod +x« ausführbar. Andere Executables starten das Programm auf einem 64-Bit- oder PowerPC-System oder auch wahlweise unter Open Solaris, MacOS X oder Windows. Aktuell ist Version 3.0.4, die Quellen lassen sich per Subversion auschecken.
Nach einem Splash-Screen gilt es, die GPLv2 als Lizenz zu akzeptieren. Zunächst klickt der Anwender rechts neben die Schaltfläche »Verbindung« (siehe Abbildung 1). Im neuen Fenster ist nur eine der Form nach gültige E-Mail-Adresse in »User eMail« einzutragen und mit »Ok« zu bestätigen (siehe Abbildung 2). Anschließend bietet das Eingangsfenster im unteren Auswahlmenu die Option »Create a new local project«, die der Anwender mit »Go!« quittiert. Benutzer, die Beispiele der umfangreichen Dokumentation durcharbeiten möchten, wählen alternativ »Importiere Demo-Projekt«, um einige Objekte vorzudefinieren.

|
Abbildung 1: Im Startfenster legt der Anwender zunächst eine neue Verbindung an, erzeugt dann ein leeres Projekt und darf sich schließlich einloggen.
|

|
Abbildung 2: Für eine neue Verbindung ist es ausreichend, eine der Form nach gültige E-Mail-Adresse einzugeben.
|
Mächtige Intelligenz
Nun sind nur noch ein Projektname zu vergeben und die Sprache auszuwählen, die Talend Open Studio für die zu definierenden Jobs erzeugt. Zur Auswahl stehen Perl und Java, letztlich ist die Wahl aber für reine Talend-Anwender bedeutungslos, da sie kaum mit dem Code in Berührung kommen. Der Anbieter und seine Community scheinen Java etwas besser zu unterstützen. Hat der Anwender diese Auswahl bestätigt, öffnet er im Startfenster das neue Projekt mit »Open«. Zum Abschluss der Konfiguration erfragt die Software noch nach E-Mail-Adresse und das Land für einen freiwilligen Newsletter mit Update-Service.
Endlich öffnet sich eine Oberfläche auf Basis der Eclipse-RCP, nachdem der Anwender noch den Welcome-Tab geschlossen hat (siehe Abbildung 3). Im linken Teilfenster verwaltet er seine Datenquellen. Diese Hauptfunktion unterstützt die Software mit sehr umfangreichen und bequemen Hilfsmitteln. Auf diese Weise kann sie mit XML-, Text- oder Excel-Dateien genauso umgehen wie mit praktisch jeder gebräuchlichen Datenbank. Für jeden Eingabetyp stellt Open Studio bequeme Wizards bereit, die diese Quellen für den späteren Gebrauch einrichten (siehe Abbildung 4). Weitere Einträge dienen dazu, die Quellen zu strukturieren, zu versionieren und zu verwalten.

|
Abbildung 3: Die Oberfläche von Open Studio fußt auf Eclipse-RCP. Im linken Bereich verwalten Anwender Datenquellen, die sie im mittleren Hauptfenster per Maus zu Jobs verbinden. Im unteren Bereich überwachen sie deren Ausführung.
|

|
Abbildung 4: Open Studio bietet eine Menge an nützlichen Vorgaben, um etwa eine »/etc/passwd« mit den richtigen Trennzeichen zu versehen. Im unteren Teil des Fensters passt es nach Klick auf »Aktualisieren« die Datenfelder an.
|
Per Maus skripten
Um einen Konvertierungsjob zu entwerfen zieht der Anwender nun Datenquellen auf die Arbeitsfläche in der Mitte und verbindet sie mit Filtern oder anderen Elementen. Zentral ist die Rolle der Komponente »tMap«, die einem Join in SQL entspricht, sich aber komplett per Maus bedienen lässt. Auf diese Weise verknüpft der User beispielsweise Attribute eines Datensatzes wie einen Ortsnamen mit einer Postleitzahlenliste, wenn nur die PLZ vorliegt. Zusätzlich dürfen Anwender hier eigene Filter definieren.
Als Ergebnisse steht eine ähnliche Vielfalt an Formaten und Datenspeichern zur Verfügung. Ist ein Job fertig entworfen, erzeugt Open Studio durch Klick auf den »Run«-Button im Job-Fenster, das im unteren Bereich der Arbeitsoberfläche liegt, den Code in der eingangs gewählten Zielsprache. Umfangreiche Einzelschrittausführungen und Debugging-Optionen stehen dem Anwender dabei zur Seite.
| Whitepaper |
|
Daten Migration - Eine Publikation von Bloor Research
Datenmigrationsprojekte überschreiten häufig das Budget, neigen zu Verzögerung und werden unter Umständen komplett abgebrochen. Bloor Research ist eines der weltweit führenden IT-Forschungs-, Analyse- und Beratungsunternehmen und wird in dem vorliegenden White Paper die wichtigsten Aspekte dieser Problematik näher beleuchten. Ferner werden praktische Empfehlungen für erfolgreiche Migrationsprojekte gegeben, die Sie auf Ihr nächstes Projekt übertragen können.
Download PDF (Registrierung erforderlich)
|
|
Open Source Datenintegration in der Praxis: Fallstudien und Anwendungsbeispiele
Über die letzten Jahre hinweg haben sich Open Source Lösungen als fester Bestandteil des gesamten Datenintegrationsmarktes etabliert. Viele Unternehmen haben bereits das Open Source Modell für Ihre Datenintegrationsprojekte aufgegriffen. Das vorliegende White Paper illustriert anhand ausgewählter Fallstudien und Anwendungsbeispiele die Implementierung von Open Source Datenintegration in der Praxis und benennt die daraus resultierenden Vorteile.
Download PDF (Registrierung erforderlich)
|
Dieser Online-Artikel kann Links enthalten, die auf nicht mehr vorhandene Seiten verweisen. Wir ändern solche "broken links"
nur in wenigen Ausnahmefällen. Der Online-Artikel soll möglichst unverändert der gedrucken Fassung entsprechen.
|