Edlich (Beuth Hochschule für Technik Berlin) betreibt die Website nosql-databases.org, die rund 220 der modernen Datenbanken listet und hat Fachbücher und Artikel in diesem Bereich veröffentlicht. In den letzten Jahren beobachtet der Hochschullehrer auf dem Arbeitsmarkt eine rapid ansteigende Nachfrage nach Personal mit NoSQL-Fachwissen. Als interessante Website empfiehlt er zudem die NoSQL-Tapes, die Interviews mit Entwicklern und Anwendern sammeln.

Zunächst gab Edlich einen Überblick über die verfügbaren NoSQL-Datenbanken, die er in in die Familien Wide Column (SimpleDB, HBase), dokumentenorientiert (CouchDB, MongoDB), Key-Value-Stores (Redis) und Graphendatenbanken (Sones) einteilte. Für die Persistenz verwenden Sie die Festplatte, laden alles in den Arbeitsspeicher oder verwenden ein Hybrid dieser beiden Speicherarten. Zu den Programmierschnittstellen zählen REST, APIs für zahlreiche Programmiersoprachen, Map-Reduce, Get-Put sowie Thrift. Letzteres sieht der Professor allerdings am Sterben. Als Ersatz empfiehlt er Apache Avro, das etwas seit einem halben Jahr existiert. Es verwendet JSON, binäre Datenübertragung, automatische RPC-Generierung, und Client und Server tauschen das Schmema aus, wenn es sich ändert.

Beim Einsatz von NoSQL-Datenbanken in der Cloud ist laut Professor Edlich gutes Monitoring entscheidend. Er berichtete von einem mehr als eintägigen Ausfall von Foursquare, einem standortbasierten Empfehlungsdienst für Jugendliche. Das System lief auf 2 Amazon-EC2-Instanzen, die beide über 66 GByte RAM verfügten. Als die Datenmenge allerdings diese Größe überstieg, wanderte der Index auf die Festplatte, was eine Verlangsamung bis zum Ausfall der Dienste verursachte.

Die weiteren Empfehlungen des NoSQL-Spezialisten an das Publikum: Setzen sie auf die Datenhaltung in RAM und SSDs! In Kalifornien seien bereits viele NoSQL-Installationen mit über einem Petabyte Arbeitsspeicher im Betrieb, kolportierte er. Auch die Strategie des Branchenriesen SAP sei derzeit, alles ins RAM und in die Cloud zu verlagern - und Anwendungen für Smartphones anzubieten.

Allerdings berge der NoSQL-Einsatz die Gefahr, in eine Lock-In-Situation zu geraten, warnte Edlich, da sich die Abfragemethoden zwischen den einzelnen Softwareprodukten stark unterscheiden. Hier hofft er auf die Entwicklung einer Meta-Abfragesprache, die für möglichst viele Datenbanken funktioniert.

Außerdem sieht der Forscher einen Trend zu hybriden Datenbanksystemen, etwa MongoDB plus MySQL. Dabei lassen sich beispielsweise die Daten in kritische (die in MySQL gespeichert werden) und unkritische (die hochperformant von CouchDB geliefert werden) trennen. Als Architektur der Zukunft beschrieb der Professor Verbünde mit mehreren Abfrage- und Datenhaltungsmodellen, die eine "polyglotte Datenbank" realisieren.

Sein Tipp zum Abschluss. "Sehen Sie sich Membase.org an!" Diese Datenbank läuft beim Unternehmen Zygna, das die Facebook-Spiele hostet. Sie skaliere gut, sei erprobt, biete allerdings nur ein eingeschränktes Protokoll zum Abfragen an.