Die monatliche GNU-Kolumne
Brave GNU World
von Georg C.F. Greve
Erschienen im Linux-Magazin
2005/05
Diese Kolumne berichtet aus der Perspektive von GNU-Projekt und FSF über Themen und aktuelle Ereignisse im Umfeld freier Software. In dieser Ausgabe stehen die Software Comspari sowie die Entscheidung der EU zu Softwarepatenten im Mittelpunkt.
Der Einsatz proprietärer Software in der Forschung widerspricht den Ansprüchen an wissenschaftliche Methoden, da sie wegen ihrer geschlossenen Datenformate und unbekannten Algorithmen keine Möglichkeiten für die Überprüfung bietet. Freie Software ist eine Alternative - ein gutes Beispiel dafür ist das Tool Comspari.

|
Abbildung 1: Auf dem Europäischen Parlament beruht nun die ganze Hoffnung der Softwarepatent-Gegner. Dort verhandeln die Volksvertreter in zweiter Lesung über die Regelungen.
|
Comspari
Comspari[1] entwickelte sich als freie Software aus einem wissenschaftlichen Projekt. Der Name ist eine Abkürzung für Comparison of Spectral and Retention Information. Es geht dabei um Vergleiche von Spektralinformationen, etwa aus der Massenspektrometrie, die speziell in der analytischen Chemie und Biochemie zum Einsatz kommt.
Regelmäßig stehen Wissenschaftler vor der Aufgabe, dass sie zwei Proben miteinander vergleichen müssen, die nur geringe qualitative Unterschiede aufweisen. So feine Abweichungen in den Spektren lassen sich nur schwer aus Rechenoperationen erkennen. Ein Graph ist da viel praktischer. Komplexe Datensätze können schnell und intuitiv bearbeitet werden, kleinste Unterschiede kommen ans Tageslicht. Die Aufbereitung der Messdaten für eine solche Darstellung ist die Aufgabe von Comspari, es erfreut sich bei den Anwendern auch bereits großer Beliebtheit.
Entwickelt wurde Comspari in C, wobei es für die Darstellung der Graphen auf Gnuplot[2] zurückgreift. Dieses Programm ist im wissenschaftlichen Umfeld weit verbreitet und unterstützt zahlreiche Plattformen. Comspari läuft ebenfalls auf allen Plattformen, die Gnuplot unterstützt. Das schließt Linux und andere Unix-Varianten sowie OS/2, Mac OS und Microsoft Windows ein.
Jonathan Katz und Jörg Hau, die beiden Autoren von Comspari, machten ihr Projekt der Allgemeinheit als freie Software unter der General Public License (GPL) zugänglich. Zudem publizierten es die Autoren gemeinsam mit D. S. Dumlao und S. Clarke im "Journal of the American Society for Mass Spectrometry", der Zeitschrift der amerikanischen Gesellschaft für Massenspektrometrie. Unter dem Titel "A New Technique (COMSPARI) to Facilitate the Identification of Minor Compounds in Complex Mixtures by GC/MS and LC/MS: Tools for the Visualisation of Matched Datasets" hielt diese Software Einzug in die wissenschaftlichen Archive. Der Artikel steht als Veröffentlichung online[3] bereit.
Probleme
Problematisch sind für John und Jörg vor allem Zeitmangel und kaputte Datenfiles. Beide Entwickler arbeiten Vollzeit in der industriellen Forschung. Jörg kann zwar seinen Aufwand dadurch rechtfertigen, dass er mehr Zeit spart, als er für die Entwicklung aufwendet. Aber oft führt dies dazu, dass er nur jene Dinge implementiert, die er für aktuelle Versuche braucht.
Der Ärger mit unbrauchbaren Datenfiles macht ein grundsätzliches Problem deutlich: Wesentliche Voraussetzung für die Arbeit mit Datensätzen in der Wissenschaft ist die Verwendung offener Formate. Hierfür gibt es im Prinzip zwar den Net-CDF-Standard. In der Praxis benutzen die Hersteller der Massenspektrometer jedoch aus unterschiedlichen Gründen proprietäre Formate. Das zwingt die Wissenschaftler dazu, den Auswertungsprogrammen der Hersteller blind zu trauen ohne die Resultate ihrer eigenen oder fremder Versuche wirklich überprüfen zu können. Somit ist eine notwendige Bedingung für wissenschaftliches Arbeiten nicht erfüllt.
Obendrein erschwert die proprietäre Software zum Teil erheblich die Untersuchung von Fragen, die ihr Hersteller nicht vorsieht. So lässt sich den Laboratorien mehr oder weniger direkt vorschreiben, auf welchen Gebieten sie arbeiten dürfen. Auf Druck der Wissenschaftler bieten die Hersteller mitunter Konvertierungsprogramme ins Net-CDF-Format an. Leider implementieren sie den Standard eher schlecht, was oft zu Problemen bei der Auswertung führt. Das Programm Comspari benützt das von Jörg Hau geschriebene freie Software-Werkzeug »cdfread«[4] zum Einlesen solcher Dateien.
| Whitepaper |
|
Open Source Datenintegration in der Praxis: Fallstudien und Anwendungsbeispiele
Über die letzten Jahre hinweg haben sich Open Source Lösungen als fester Bestandteil des gesamten Datenintegrationsmarktes etabliert. Viele Unternehmen haben bereits das Open Source Modell für Ihre Datenintegrationsprojekte aufgegriffen. Das vorliegende White Paper illustriert anhand ausgewählter Fallstudien und Anwendungsbeispiele die Implementierung von Open Source Datenintegration in der Praxis und benennt die daraus resultierenden Vorteile.
Download PDF (Registrierung erforderlich)
|
|
The Role of Open Source in Data Integration
Obwohl in den letzten Jahren viele technische Fortschritte erzielt werden konnten, verfügen die meisten Datenintegrationsprozesse nach wie vor nur über eine sehr begrenzte Automatisierung. Das vorliegende White Paper von dem Industry Analyst Mark Madson wird zunächst ein grundlegendes Verständnis von Daten Integration vermitteln, die Vorzüge von Open Source Lösungen für Daten Integration erläutern und Ihnen professionelle Empfehlungen geben, damit Sie Ihre Integrationsjobs noch einfacher und produktiver gestalten können.
Download PDF (Registrierung erforderlich)
|
Dieser Online-Artikel kann Links enthalten, die auf nicht mehr vorhandene Seiten verweisen. Wir ändern solche "broken links"
nur in wenigen Ausnahmefällen. Der Online-Artikel soll möglichst unverändert der gedrucken Fassung entsprechen.
|