Open Source im professionellen Einsatz

Bioclipse

In Bioclipse, einer Eclipse-basierten Arbeitsplattform für Bioinformatiker, Biologen und Chemoinformatiker hat sich ein CDK-Plugin [7] mittlerweile einen festen Platz erobert (Abbildung 1). Doch nicht nur die Java-Welt profitiert von der Bibliothek. Recht weit gediehen ist das Cinfony-Projekt [8], das Python-Schnittstellen zu CDK und anderen Chemoinformatik-Werkzeugen bereitstellt. Ruby-CDK [9] war einige Zeit verwaist, hat aber zwei Tage vor Redaktionsschluss mit einem neuen Maintainer wieder Fahrt aufgenommen. Komplett sprachneutral wird der Zugriff auf die Software, wenn sie als REST-basierter Webservice implementiert ist [10].

Abbildung 1: Das CDK-Plugin in Bioclipse bei der Darstellung von Butan.

Abbildung 1: Das CDK-Plugin in Bioclipse bei der Darstellung von Butan.

CDK-Taverna

Ein gutes Beispiel, wie das CDK seinen Weg in andere Projekte findet, ist die Integration in das Workflow-System Taverna. Workflow-Systeme dienen dazu, Arbeitsabläufe ganzer Organisationen, Arbeitsgruppen oder Einzelpersonen zu formalisieren. Wichtige Ziele sind, wiederkehrende Fehler zu vermeiden, die Abläufe definiert zu dokumentieren und aus vorhandenen Abläufen neue zu erzeugen. In Unternehmen kommen verschiedene Workflow-Systeme zum Festlegen der Geschäftslogik zum Einsatz.

Doch besonders dann, wenn es um die Verarbeitung großer Datenmengen aus unterschiedlichen Quellen und in vielen verschiedenen Formaten geht, sind Workflow-Systeme auch für die Wissenschaft interessant. Taverna [11] ist eine Software, die ein Team des European Bioinformatics Institute (EBI) und mehrerer britischer Universitäten speziell für diesen Anwenderkreis entwickelt hat. Ursprünglich für die Bioinformatik gedacht, finden sich inzwischen auch Anwender aus den Gesellschaftswissenschaften und der Chemoinformatik.

Workflows lassen sich in Taverna mit einer grafischen Oberfläche, der Workbench, definieren (Abbildung 2). Die Abarbeitung des Workflow, also die Verarbeitung der Daten, obliegt einer Vielzahl so genannter Prozessoren, deren Zusammenwirken von einer Zwischenschicht mittels eines SCUFL-Modells gesteuert wird. SCUFL steht für Simple Conceptual Unified Flow Language, einer XML-basierten Sprache, um Workflows zu repräsentieren.

Abbildung 2: Das grafische Programm Taverna Workbench dient zur Modellierung von Workflows. Hier entsteht ein kleiner Arbeitsablauf, der Pflanzenbilder und Anmerkungen aus der Datenbank Biomoby holt.

Abbildung 2: Das grafische Programm Taverna Workbench dient zur Modellierung von Workflows. Hier entsteht ein kleiner Arbeitsablauf, der Pflanzenbilder und Anmerkungen aus der Datenbank Biomoby holt.

Wer sich für die - recht komplexen - Details und Hintergründe von Taverna interessiert, kann außer auf der Projekt-Website auch aus Thomas Kuhns Dissertation [12] an der Uni Köln Näheres erfahren. Sie beschreibt CDK-Taverna, ein Plugin, dass es ermöglicht, mit Taverna Probleme der Chemoinformatik zu bearbeiten. Thomas Kuhn hat dafür etwa 160 Prozessoren geschrieben, die CDK-Methoden nutzen, um Moleküldaten aus Datenbanken zu holen, QSAR-Methoden darauf anzuwenden und die Ergebnisdaten zu präsentieren. Damit hat er unter anderem eine Diversitätsanalyse an über 200000 Molekülen durchgeführt, also eine automatische Klassifizierung von Substanzen nach bestimmten - in diesem Fall molekularen - Eigenschaften.

CDK-Taverna macht nach Abschluss dieser Dissertation einen etwas verwaisten Eindruck. Nach Auskunft von Professor Achim Zielesny von der FH Gelsenkirchen, einem der Initiatoren des Projekts, soll die Entwicklung demnächst weitergehen, zunächst mit einer Portierung auf Taverna 2. Immerhin gebe es bereits einige Anwender der Software im Bereich der Forschung und der Industrie.

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 5 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

Als digitales Abo

Als PDF im Abo bestellen

comments powered by Disqus

Ausgabe 07/2013

Preis € 6,40

Insecurity Bulletin

Insecurity Bulletin

Im Insecurity Bulletin widmet sich Mark Vogelsberger aktuellen Sicherheitslücken sowie Hintergründen und Security-Grundlagen. mehr...

Linux-Magazin auf Facebook