Open Source im professionellen Einsatz

XML-Content-Management mit Infozone und Prowler

Inhaltsschwer

, ,

Der Begriff Content Management wird heute übermäßig beansprucht. Es gibt ein unübersichtliches Spektrum von Anbietern und Produkten, die sich vor allem mit Speziallösungen zu profilieren suchen. Im Folgenden wird der Ansatz des Open-Source-Projekts Infozone näher erläutert.

Das Content Management ist sehr stark mit der Entwicklung von großen Websites und den dabei auftretenden Problemen verbunden. Die schiere Menge an Daten, die Komplexität der Strukturen und des damit verbundenen Workflows macht den Einsatz von Software-Werkzeugen erforderlich.

Da die Website eines Unternehmens zunehmend strategische Bedeutung für das eigentliche Geschäft erlangt, ergeben sich für die Anbieter von entsprechenden Werkzeugen langfristige Perspektiven, die diesen neu entstandenen Markt sehr attraktiv machen. Viele große und noch mehr kleine Unternehmen wollen etwas vom Kuchen abhaben und führen deshalb ihre Produkte und Technologien unter Content Management.

Das macht den Markt zurzeit zwar etwas unübersichtlich, aber auch sehr dynamisch und interessant - vor allem da über die künftige Entwicklung keinesfalls Einigkeit herrscht und jeder Akzente setzen möchte.

Einer dieser Unterscheidungspunkte ist die Fähigkeit der einzelnen Produkte, sich in bestehende IT-Strukturen integrieren zu lassen. Hier wird auch der Anspruch des jeweiligen Anbieters deutlich. Während sich kleine Anbieter auf die Verwaltung von Websites konzentrieren, können und müssen größere Unternehmen auch die Integration mit bestehenden Softwaresystemen wie ERP, Dokumenten-Management oder Messaging-Lösungen leisten.

Websites werden dabei nicht mehr nur als Präsentationsmedium begriffen und eingesetzt, sondern zunehmend zur zentralen Informationsplattform im Unternehmen ausgebaut. Dadurch entstehen auch ganz neue Anforderungen an das Content Management: Neben redaktionellen Inhalten müssen nun auch Daten aus anderen Quellen mit einbezogen und verwaltet werden.

Infozone und Prowler

Ein sehr genereller Ansatz zum Thema Content Management kommt aus der Open-Source-Szene. Das Infozone-Projekt [1] (siehe Kasten "Das Infozone-Framework") hat sich die Entwicklung und Integration von Komponenten für den Aufbau von Unternehmensportalen (Enterprise-Information-Portal - EIP) zur Aufgabe gemacht. Das Content-Management-Framework Prowler spielt dabei eine zentrale Rolle.

Das Infozone-Framework: Rationalisierung durch Integration

Infozone wurde im Juni 2000 ins Leben gerufen. Das unter Apache-Lizenz veröffentlichte Projekt ist ein Java/XML-Komponenten-Framework für die professionelle Erstellung von komplexen Enterprise-Information-Portals (EIP). Es erlaubt die Erschließung der unterschiedlichsten elektronischen Datenquellen durch Integration. EIPs sollen in größeren Unternehmen und Organisationen durch die Kanalisierung der Informationsflüsse Rationalisierungseffekte auslösen.

In diesem Kontext stellt Infozone den Mitarbeitern eines Unternehmens einen personalisierten, Browser-basierten Zugang zu allen geschäftsrelevanten Informationen bereit. Aber auch andere Bezugsgruppen wie Kunden, Lieferanten und Partner können auf alle für sie freigegebenen Datenquellen des Unternehmens zugreifen.

Im Framework selbst werden einige sehr zentrale Komponenten direkt im Rahmen der Infozone-Group entwickelt. Andere stammen aus dem Apache-Projekt und werden für den Einsatz in Infozone ausgewählt und angepasst. In Abbildung 2 ist die Architektur von Infozone dargestellt. Bislang werden folgende Komponenten verwendet:

  • Web-Server/Servlet-Engine - Apache/Tomcat
  • XML-Publishing-Framework - Cocoon
  • XML-Content-Management-Engine - Prowler
  • Objektorientiertes-XML-Datenbanksystem - ozone/XML
  • Maskengenerator - SchemoX

Für die Zukunft plant die Infozone-Group die Integration und Entwicklung einer Reihe weiterer Module. Ganz oben auf der Liste steht dabei Jetspeed [7] von Apache XML, das die Erstellung von personalisierten Web-Applikationen erleichtern soll.

Prowler ist im Gegensatz zu anderen Systemen keine fertige Anwendung, sondern ein Java-Framework, dessen API sich am Java-Servlet-Modell orientiert. Dieses Framework stellt wichtige Content-Management-Funktionen wie Nutzer-, Rechte-, Versions- und Transaktionsverwaltung bereit, lässt dem Programmierer darüber hinaus aber die Möglichkeit, eigene Funktionen und Erweiterungen zu integrieren.

Transaktionales XML-File-System

Der Kern von Prowler ist ein transaktionales XML-File-System, das es ermöglicht, in eine hierarchische Struktur an beliebiger Stelle die Inhalte der zugrunde liegenden Datenquellen einzufügen. Grundsätzlich sind alle möglichen Systeme als Datenquellen integrierbar, etwa Applikations-Server, ERP-Systeme, Mail- oder Groupware-Server, RDBMS, OODBMS und was sonst noch eine Rolle in der Unternehmens-IT spielt.

Abb. 1: Die Architektur von Prowler.

Abb. 1: Die Architektur von Prowler.

Im Unterschied zu normalen File-Systemen verwendet Prowler zur Darstellung der Daten aber XML und ist transaktionssicher. Daten aus Quellen, die von sich aus kein XML liefern können, werden über spezielle Content-Adapter automatisch in XML gewandelt. Somit entsteht eine einheitliche XML-Sicht auf alle Daten, was den Aufwand für die Präsentation via Cocoon [6] und SchemoX [1] (siehe Kasten "Das Infozone-Framework") sowie das Suchen und Weiterverarbeiten der Daten erheblich vermindert.

Neben der durchgehenden Verwendung von XML ist die Integration eines JTA/XA-konformen Transaktions-Managers [2] eine weitere Besonderheit von Prowler. Dieser macht den Zugriff auf verschiedene transaktionale Datenquellen möglich, zum Beispiel Datenbanken oder Applikations-Server, innerhalb einer globalen Transaktion oder einer HTML-Seite. Die Konsistenz der Daten wird vom Transaktions-Manager über Zwei-Phase-Commit sichergestellt.

Darüber hinaus ist er für die flexible Zuordnung von Transaktionen zu Server-Threads verantwortlich und deshalb gerade für Web-Applikationen mit Tausenden gleichzeitigen Nutzern ein wichtiger Faktor für deren Skalierbarkeit [3].

Prowler ist also kein erweitertes Redaktionssystem, sondern eine Datenintegrations-Technologie, die den transaktionalen Zugriff auf den Inhalt verschiedenster Datenquellen über eine XML-Schnittstelle ermöglicht.

Diesen Artikel als PDF kaufen

Als digitales Abo

Als PDF im Abo bestellen

comments powered by Disqus

Ausgabe 07/2013

Preis € 6,40

Insecurity Bulletin

Insecurity Bulletin

Im Insecurity Bulletin widmet sich Mark Vogelsberger aktuellen Sicherheitslücken sowie Hintergründen und Security-Grundlagen. mehr...

Linux-Magazin auf Facebook