Open Source im professionellen Einsatz

Die monatliche GNU-Kolumne

Brave GNU World

Diese Kolumne berichtet aus der Perspektive von GNU-Projekt und FSF über Themen und aktuelle Ereignisse im Umfeld freier Software. In dieser Ausgabe stehen die Software Comspari sowie die Entscheidung der EU zu Softwarepatenten im Mittelpunkt.

Der Einsatz proprietärer Software in der Forschung widerspricht den Ansprüchen an wissenschaftliche Methoden, da sie wegen ihrer geschlossenen Datenformate und unbekannten Algorithmen keine Möglichkeiten für die Überprüfung bietet. Freie Software ist eine Alternative - ein gutes Beispiel dafür ist das Tool Comspari.

Abbildung 1: Auf dem Europäischen Parlament beruht nun die ganze Hoffnung der Softwarepatent-Gegner. Dort verhandeln die Volksvertreter in zweiter Lesung über die Regelungen.

Abbildung 1: Auf dem Europäischen Parlament beruht nun die ganze Hoffnung der Softwarepatent-Gegner. Dort verhandeln die Volksvertreter in zweiter Lesung über die Regelungen.

Comspari

Comspari[1] entwickelte sich als freie Software aus einem wissenschaftlichen Projekt. Der Name ist eine Abkürzung für Comparison of Spectral and Retention Information. Es geht dabei um Vergleiche von Spektralinformationen, etwa aus der Massenspektrometrie, die speziell in der analytischen Chemie und Biochemie zum Einsatz kommt.

Regelmäßig stehen Wissenschaftler vor der Aufgabe, dass sie zwei Proben miteinander vergleichen müssen, die nur geringe qualitative Unterschiede aufweisen. So feine Abweichungen in den Spektren lassen sich nur schwer aus Rechenoperationen erkennen. Ein Graph ist da viel praktischer. Komplexe Datensätze können schnell und intuitiv bearbeitet werden, kleinste Unterschiede kommen ans Tageslicht. Die Aufbereitung der Messdaten für eine solche Darstellung ist die Aufgabe von Comspari, es erfreut sich bei den Anwendern auch bereits großer Beliebtheit.

Entwickelt wurde Comspari in C, wobei es für die Darstellung der Graphen auf Gnuplot[2] zurückgreift. Dieses Programm ist im wissenschaftlichen Umfeld weit verbreitet und unterstützt zahlreiche Plattformen. Comspari läuft ebenfalls auf allen Plattformen, die Gnuplot unterstützt. Das schließt Linux und andere Unix-Varianten sowie OS/2, Mac OS und Microsoft Windows ein.

Jonathan Katz und Jörg Hau, die beiden Autoren von Comspari, machten ihr Projekt der Allgemeinheit als freie Software unter der General Public License (GPL) zugänglich. Zudem publizierten es die Autoren gemeinsam mit D. S. Dumlao und S. Clarke im "Journal of the American Society for Mass Spectrometry", der Zeitschrift der amerikanischen Gesellschaft für Massenspektrometrie. Unter dem Titel "A New Technique (COMSPARI) to Facilitate the Identification of Minor Compounds in Complex Mixtures by GC/MS and LC/MS: Tools for the Visualisation of Matched Datasets" hielt diese Software Einzug in die wissenschaftlichen Archive. Der Artikel steht als Veröffentlichung online[3] bereit.

Probleme

Problematisch sind für John und Jörg vor allem Zeitmangel und kaputte Datenfiles. Beide Entwickler arbeiten Vollzeit in der industriellen Forschung. Jörg kann zwar seinen Aufwand dadurch rechtfertigen, dass er mehr Zeit spart, als er für die Entwicklung aufwendet. Aber oft führt dies dazu, dass er nur jene Dinge implementiert, die er für aktuelle Versuche braucht.

Der Ärger mit unbrauchbaren Datenfiles macht ein grundsätzliches Problem deutlich: Wesentliche Voraussetzung für die Arbeit mit Datensätzen in der Wissenschaft ist die Verwendung offener Formate. Hierfür gibt es im Prinzip zwar den Net-CDF-Standard. In der Praxis benutzen die Hersteller der Massenspektrometer jedoch aus unterschiedlichen Gründen proprietäre Formate. Das zwingt die Wissenschaftler dazu, den Auswertungsprogrammen der Hersteller blind zu trauen ohne die Resultate ihrer eigenen oder fremder Versuche wirklich überprüfen zu können. Somit ist eine notwendige Bedingung für wissenschaftliches Arbeiten nicht erfüllt.

Obendrein erschwert die proprietäre Software zum Teil erheblich die Untersuchung von Fragen, die ihr Hersteller nicht vorsieht. So lässt sich den Laboratorien mehr oder weniger direkt vorschreiben, auf welchen Gebieten sie arbeiten dürfen. Auf Druck der Wissenschaftler bieten die Hersteller mitunter Konvertierungsprogramme ins Net-CDF-Format an. Leider implementieren sie den Standard eher schlecht, was oft zu Problemen bei der Auswertung führt. Das Programm Comspari benützt das von Jörg Hau geschriebene freie Software-Werkzeug »cdfread«[4] zum Einlesen solcher Dateien.

Fragen und
Anregungen

Für Ideen, Anregungen und Kommentare zur Brave GNU World steht die Adresse [column@brave-gnu-world.org]. Georgs Kolumne "Brave GNU World" steht online unter [http://brave-gnu-world.org] und die Initiative "We run GNU" betreibt eine Webseite unter: [http://www.gnu.org/brave-gnu-world/rungnu/rungnu.de.html]

Diesen Artikel als PDF kaufen

Als digitales Abo

Als PDF im Abo bestellen

comments powered by Disqus

Ausgabe 07/2013

Preis € 6,40

Insecurity Bulletin

Insecurity Bulletin

Im Insecurity Bulletin widmet sich Mark Vogelsberger aktuellen Sicherheitslücken sowie Hintergründen und Security-Grundlagen. mehr...

Linux-Magazin auf Facebook