Open Source im professionellen Einsatz

Newsletter abonnieren
Seite durchsuchen

HEFTARCHIV | NEWS | E-BIBLIOTHEK | VIDEO | BLOGS | WHITEPAPER | EVENTS | ACADEMY | ABO | SHOP

user friendly

  Home  »  Heft & Abo  »  Heftarchiv  »  2002  »  01  »  Globale Rechenscheibe  

RSS-Feed der aktuellen News von Linux-Magazin Online Folgen Sie Linux-Magazin Online auf Twitter
Diesen Artikel druckenDiesen Artikel weiterempfehlen Diesen Artikel kommentieren Newsletter abonnieren
Share/Bookmark

GRID-Computing, eine Chance für verteilte Linux-Server

Globale Rechenscheibe

von Rüdiger Berlich, Marcel Kunze
Erschienen im Linux-Magazin 2002/01

GRID-Computing ist eine neue Methode, um Daten und Rechenleistung dezentral zu verteilen. Zunächst eigentlich als Hilfsmittel für Teilchenphysiker und Forscher erdacht, sehen mittlerweile auch IBM & Co. in GRID ein enormes Potenzial.

Um den Teilchenphysikern des Europäischen Kernforschungszentrum CERN ein Mittel zum effizienten Informationsaustausch in die Hand zu geben, wurde Anfang der 90er Jahre an eben diesem CERN in Genf das World Wide Web aus der Taufe gehoben[1]. Eine große Zahl an den Experimenten beteiligter Physiker musste eng zusammenarbeiten, wobei die Partner üblicherweise über die gesamte Erdkugel verteilt waren. An den verschiedenen Teilchen- und Kernphysik-Experimenten des CERN sind insgesamt mehr als 10000 Physiker aus zurzeit 20 Mitgliedsstaaten sowie vielen anderen Ländern beteiligt.

Neben anderen Instituten steht jetzt das CERN wieder im Zentrum einer Entwicklung, die in gewisser Weise die Fortsetzung des WWW ist, jedoch ist nicht mehr der reine Austausch von Informa-tionen die zentrale Aufgabe, sondern die Verarbeitung großer Datenmengen.

Die meisten Experimente der Teilchenphysiker erzeugen gewöhnlich eine gewaltige Menge an Daten, daher ist es nicht verwunderlich, dass die Rechen- und Speicherkapazitäten dieser Großforschungseinrichtung bereits in absehbarer Zeit zur Bewältigung des stetig wachsenden Da- tenaufkommens nicht mehr ausreichen.

Spätestens mit der für 2006 geplanten Inbetriebnahme der vier großen Experimente des Speicherrings im Large Hadron Collider (LHC) wird diese Situation eintreten. Die Kollision hoch energetischer Protonen wird dann innerhalb kurzer Zeit zu einem Datenaufkommen im Petabyte-Bereich (Millionen Gigabyte) führen. Das ist eine Größenordnung, bei der die Daten unmöglich lokal an einem Ort verarbeitet und gespeichert werden können.

Gut verteilte Petabytes

Ein möglicher Ausweg aus dem Dilemma besteht darin, die freien Kapazitäten anderer beteiligter Forschungsinstitute nutzbar zu machen. Dieser an sich einleuchtende Ansatz wirft jedoch eine Reihe neuer Fragen auf, die zu einer regen Forschungstätigkeit über die Grenzen der Teilchenphysik hinaus geführt haben. In Erweiterung des ursprünglichen Gedankens geht die Zielvorstellung der Forscher dieses Themenbereichs heute eher in Richtung eines Konzepts "Rechenzeit aus der Daten-Steckdose". In Anlehnung an das Stromnetz (Power Grid) spricht man deshalb heute in diesem Zusammenhang auch vom Computing Grid oder einfach GRID.

Rechenleistung aus der Steckdose

Die damit verbundene Vorstellung bedeutet eine Demokratisierung von Computerressourcen. Eine weltweite, funktionierende GRID-Infrastruktur würde ohne Ansehen der Person jedem einen transparenten Zugang auch zu den Riesen unter den Höchstleistungsrechnern geben - allerdings nicht notwendigerweise ohne Kosten.

Wie schon beim World Wide Web gehen viele der Impulse in diesem neuen Forschungsbereich vom CERN aus. Das ist nicht verwunderlich, da GRID unter anderem der Bereitstellung hinreichender, weltweit verteilter Mengen an Speicher- und Rechenkapazität dienen soll. Nicht nur aufgrund der Analogie im Namen kann man das GRID-Computing deshalb als logische Fortsetzung des World Wide Web betrachten.

Ein weiterer wichtiger Aspekt des GRID ist die Zusammenführung verteilter Informationen. Etwa im Falle der Entschlüsselung des Genoms arbeiten unterschiedliche Forschergruppen unabhängig voneinander an verschiedenen Gattungen. Meist sind ihre Datenbanken offen einsehbar, jedoch ist das lokale Vorhalten aller verfügbaren Informationen besonders wegen der schnellen Updatezyklen ziemlich schwierig. Die Lösung des Problems besteht darin, eine verteilte Datenbank mit parallelen Suchalgorithmen oder Software-Agenten zu verwenden.

Diesen Artikel druckenDiesen Artikel weiterempfehlen Diesen Artikel kommentieren Newsletter abonnieren
Share/Bookmark
Whitepaper
Daten Migration - Eine Publikation von Bloor Research

Datenmigrationsprojekte überschreiten häufig das Budget, neigen zu Verzögerung und werden unter Umständen komplett abgebrochen. Bloor Research ist eines der weltweit führenden IT-Forschungs-, Analyse- und Beratungsunternehmen und wird in dem vorliegenden White Paper die wichtigsten Aspekte dieser Problematik näher beleuchten. Ferner werden praktische Empfehlungen für erfolgreiche Migrationsprojekte gegeben, die Sie auf Ihr nächstes Projekt übertragen können.

Download PDF (Registrierung erforderlich)
Open Source Datenintegration in der Praxis: Fallstudien und Anwendungsbeispiele

Über die letzten Jahre hinweg haben sich Open Source Lösungen als fester Bestandteil des gesamten Datenintegrationsmarktes etabliert. Viele Unternehmen haben bereits das Open Source Modell für Ihre Datenintegrationsprojekte aufgegriffen. Das vorliegende White Paper illustriert anhand ausgewählter Fallstudien und Anwendungsbeispiele die Implementierung von Open Source Datenintegration in der Praxis und benennt die daraus resultierenden Vorteile.

Download PDF (Registrierung erforderlich)
Kommentare (0)