Als Gesprächsthema taugt das Wetter immer – dabei kann die Kunst, es vorherzusagen, durchaus mithalten. Der Deutsche Wetterdienst setzt zwei Linux-Cluster ein, um den neuen Vektorrechner geschickt in Szene zu setzen. Mit bewusster Ungenauigkeit wollen die Wetterexperten ihre Vorhersagen verbessern .
“Kachelfrosch hat eine Warnung für Südhessen herausgegeben”, brüllt der Supervisor hinter seiner Phalanx aus einem Dutzend Flatscreens hervor. “Was sagen wir?” Geschäftigkeit bricht im Vorhersageraum des Deutschen Wetterdienstes [1] aus, Meteorologen beugen sich über Monitore, die Temperaturen, Satellitenbilder, Hochs und Tiefs zeigen: “Der übertreibt mal wieder, unser Modell sagt nur moderate Niederschläge voraus”, kommt die Antwort – tatsächlich ist es in Offenbach, der Zentrale des DWD, zwar wolkenverhangen, aber noch trocken.
Die dem Verkehrsministerium nachgeordnete Behörde steht bei Wettervorhersagen mit privaten Vorhersagediensten, wie etwa dem von Jörg Kachelmann gegründeten Meteomedia [2] im Wettbewerb. In anderen Bereichen ist der DWD jedoch ohne Konkurrenz – etwa bei der numerischen Wettervorhersage (NVW). So nennen die Meteorologen und Ingenieure die Deutung des Wetters durch Computer [3]. Beim DWD spielt dabei Linux eine wichtige Rolle.
Langjährige Nutzer
Auf vielen Tischen der Mitarbeiter stehen Linux-Workstations, oft mit Dual-Head-Grafikadaptern, um Karten und Daten gleichzeit im Blick zu behalten. Das Institut prüft gerade, ob es an einem Pilotbetrieb im Verkehrsministerium zur Open-Office-Migration teilnehmen will, und in einigen Visualisierungkomponenten für Kunden wie dem Wetterbericht der Tagesschau werkelt ebenfalls ein Tux.
Seit der erstmaligen Linux-Einführung 2001 hält der DWD viel Know-how in seinen eigenen Reihen. Bei Basisaufgaben lässt er sich von Hard- und Softwarelieferanten beraten, etwa von FSC und Novell, denn der Dienst setzt weitgehend auf Open Suse und SLES. “Unsere vielen, zumeist wissenschaftlichen Anwendungen kommen gut mit Linux zurecht”, erklärt Alexander Harth, Leiter der Anwenderunterstützung. “Wenn wir eine Anwendung selbst betreuen, setzen wir eine freie Distribution ein, andernfalls verlassen wir uns auf den Herstellersupport.” Harth ist zufrieden mit der Wahl, erklärt sie aber keineswegs zum Dogma: “Einige Hersteller unterstützen offiziell nur Suse, andere nur Red Hat. Letztlich läuft das meiste aber überall.”
“Viele unserer Mitarbeiter arbeiten gerne hier, weil sie anspruchsvolle Aufgaben in einem technisch interessanten Umfeld lösen”, berichtet der Abteilungsleiter stolz. So nehmen die Mitarbeiter auch am Open-Source-Leben teil, reichen regelmäßig Patches ein und haben sogar das eigene Werkzeug Automatic File Distributor (AFD) zur Verteilung großer Datenmengen in HA-Umgebungen unter eine freie Lizenz gestellt [4].
Der DWD bewegt täglich rund 11 TByte Rohdaten in 11 Millionen Dateien durch sein deutschlandweites Netz. Allein eine einzelne Simulation benötigt rund 500 MByte an Messwerten und weitere 18 GByte Anfangsdaten aus vorhergehenden Simulationen. Als Ergebnis eines Durchlaufs entstehen 40 GByte. Für zukünftige Analysearten planen die Ingenieure heute schon einmal mit 2,4 TByte großen Resultaten pro Tag.
Blick in die Zukunft
Von diesen Modellen berechnet der DWD nicht nur eines, sondern gleich drei: Die drei Simulationen GME, COSMO-EU und COSMO-DE berechnen ausgehend von vielfältigen Messwerten das vermutliche Wetter der kommenden Tage. Dabei überzieht das erste Modell GME die ganze Erde mit einem mehrschichtigen Dreiecksgitter einer Kantenlänge von aktuell 40 Kilometern und deutet bis zu eine Woche in die Zukunft. An jedem Knoten stehen meteorologische Daten wie Temperatur, Luftdruck, Windrichtung und -geschwindigkeit sowie mehrere Luftfeuchtewerte, die im standardisierten GRIB-Format vorliegen [5]. Die weiteren Modelle funktionieren nach einem ähnlichen Ansatz. Sie decken aber nur Europa, dafür aber mit einer Gitterlänge von 7 Kilometern (COSMO-EU) sowie Deutschland mit einer Gitterlänge von 2,8 Kilometern ab (COSMO-DE).
Die Modelle bauen aufeinander auf: Die europäische Vorhersage verwendet Daten aus dem Global-Godell, die Simulation für Deutschland bedient sich aus dem Europa-Modell. Ein Durchlauf der Simulation benötigt zwischen zwei und vier Stunden, täglich berechnen die Cluster des DWD bis zu achtmal das jeweilige Modell (siehe Abbildung 1). “Wichtig für unsere Aufgaben sind die präzisen Abgabetermine”, betont Thomas Hanisch aus der Forschungsabteilung Numerische Modelle. Er betreut ihren Betrieb.

Abbildung 1: Die Berechnungen der Vorhersagemodelle sind rund um die Uhr verteilt. Im äußeren Ring läuft die globale Simulation GME. Sie liefert ihre Daten an das europäische Modell COSMO-EU weiter im zweiten Ring. Die Deutschland-Vorhersage (COSMO-DE) spuckt der Rechner im dritten Ring alle drei Stunden aus. (Bild: Quelle: DWD)
Die Berechnungen sind nach wie vor in Fortran verfasst, denn “Java oder C++ sind da einfach nicht stabil genug”, schmunzelt der Diplom-Physiker, der Linux noch von Disketteninstallationen kennt. In seinem Büro mit einer ansehnlichen Sammlung von Überraschungseiern erläutert er, dass rund 100000 Zeilen Korn-Skripte die einzelnen Programmteile und ihre Abhängigkeiten steuern. “Das ist ziemlich portabel. Wir haben schon mehrfach die Hardware-Architektur gewechselt, aber die Skripte funktionieren weiter”, berichtet Hanisch.
Die numerischen Berechnungen führen 224 Vektorprozessoren eines SX-9-Rechners von NEC mit insgesamt nominal 23 Teraflops durch, der erst seit wenigen Monaten beim DWD steht und noch nicht mit der vollen Leistung fährt [6]. Aber bereits jetzt dürfte die Maschine unter den Top-Ten der leistungsfähigsten Rechner in Deutschland rangieren, in der internationalen Wertung sollte ein zweistelliger Platz drin sein, hoffen die Systembetreuer.
Geballte Rechenleistung
Auf die Maschine selbst hat nur eine handverlesene Zahl Entwickler Zugriff. Sie läuft unter der auf den Vektorbetrieb spezialisierten Unix-Variante Super-UX [7], auch wenn es Entwickler gibt, die gegenwärtig damit experimentieren, einen Linux-Kernel auf der Architektur zu booten. Die reine Rechenleistung zu erbringen ist eher eine Frage des Geldes, nicht der Technik. Viel schwieriger scheint zu sein, die Daten möglichst schnell zur Vektoreinheit zu transportieren und die bereits berechneten Roh-Ergebnisse von dort wieder abzuholen und aufzubereiten.
Dazu dienen zwei Cluster von insgesamt 960 Opteron-Kernen mit 1920 GByte Hauptspeicher pro Cluster. Die Hardware stammt von Sun, als Betriebssystem dient SLES von Novell. Linux-Cluster und Vektoreinheit sind über ein Infiniband-Speichernetz verbunden, Altix-Systeme von SGI koordinieren die hochverfügbare Datenhaltung in Oracle-Datenbanken. Auf dem Linux-Cluster befindet sich ein Großteil der Logik der Vorhersage, hier arbeiten die Wissenschaftler, die die Verlässlichkeit alter Modelle verifizieren und neue ausprobieren.
Was wäre, wenn …?
“Wettervorsagen haben in der Öffentlichkeit eher einen gemischten Ruf”, bedauert Michael Buchhold, Referatsleiter Verifikation und Interpretation im DWD, “aber objektiv sind wir in den vergangenen Jahren viel besser geworden.” Der Diplom-Meteorologe, der bereits 1980 als Diplomarbeit ein erstes numerisches Vorhersagemodell implementierte, plant als Schnittstelle zwischen Wetterleuten und Systemtechnikern die Vorhersagen für morgen. “Es gibt Parameter, etwa die Temperatur, die wir gut vorhersagen können”, ist sich Buchhold sicher, schränkt aber ein: “Bestimmte Formen von Niederschlag vorherzusagen ist viel schwieriger.”
Neuere Computer können zwar die Gitterabstände immer weiter verkleinern, etwa von 40 auf 20 Kilometer für das globale Modell. Aber bereits 1962 wies Edward N. Lorenz vom MIT auf die Grenzen des rein numerischen Ansatzes hin [8]. Daher arbeiten die Forscher des DWD nun daran, die gleiche Simulation mehrfach mit kleinen Änderungen der Anfangswerte und etwas voneinander abweichenden Parametern der physikalischen Simulation durchzuführen.
Dieses Ensemble von Ergebnissen bewerten die Mitarbeiter dann unter propabilistischen Gesichtspunkten. “In Zukunft werden wir dazu übergehen, Wahrscheinlichkeiten für ein gewisses Ereignis anzugeben, etwa dass es zu 80 Prozent mindestens 25 Grad warm wird”, erläutert Buchold das Ziel.
Kräftiger Kern
Deutlich kühler ist es im Ostflügel des DMRZ, dem Deutschen Meteorologischen Rechenzentrum – dafür aber wesentlich lauter. In klimatisierten Maschinensälen stehen drei Reihen der SX-9 (siehe Abbildung 2) neben einigen Racks der Linux-Cluster (Abbildung 3) und umfangreichen Speichersystemen von Plattenschränken. Ein Bandroboter verwaltet bis zu 40 PByte Daten, das entspricht etwa vier Millionen DVDs.

Abbildung 2: Der Vektorrechner SX-9 von NEC bildet das Herz der Vorhersagemodelle des DWD. Der leistungsstarke Computer gehört mit 23 Teraflops Nominalleistung und 7 TByte Hauptspeicher zu den Top-Ten in Deutschland.

Abbildung 3: Zwei Racks beherbergen 960 Opteron-Kerne und knapp 4 TByte Hauptspeicher. Maschinensaalleiter Hans Mayr zeigt, wo unter SLES die wissenschaftlichen Anwendungen die eigentliche Modellrechnung steuern.
“Das Archiv enthält sämtliche Wetteraufzeichnungen aus Deutschland, die ersten weit über hundert Jahre alt”, schreit Hans Mayr gegen den Lärm an. Er ist seit 1968 Operateur beim DWD und überwacht die Systeme. Heute ist er praktisch der Hausherr des Maschinensaals. “Alle Systeme gibt es noch einmal im baulich getrennten Westflügel”, erläutert er das HA-Konzept: “Sollte unser Produktivsystem ausfallen, rechnen wir auf dem identischen Testsystem weiter.”
Mensch und Maschine
Trotz immer präziserer Verfahren steht am Ende der meisten Wettervorhersagen immer noch der Mensch. Im Vorhersageraum sitzt ein halbes Dutzend Experten und beobachtet über Monitore die Entwicklung des Wetters. Berichte und besonders Wetterwarnungen stellen sie bis heute händisch zusammen, teilweise noch mit Bleistift und Pauspapier.
Eine Java-Oberfläche (Abbildung 4) gibt den Meteorologen alle wichtigen Daten an die Hand: Sie können unter den eigenen Modellen, Ergebnissen europäischer Partner oder Messwerten wählen. Auf dieser Grundlage geben sie bei entsprechender Wetterlage Warnungen für einzelne Gemeinden heraus, woraufhin sich beispielsweise Feuerwehr oder technisches Hilfswerk in Bereitschaft versetzen. Südhessen bleibt aber trotz Kachelfroschs Unken an diesem Tag verschont, mittlerweile scheint gar wieder die Sonne.

Abbildung 4: Eine Java-Oberfläche stellt den Meteorologen alle Ergebnisse alternativer Voraussagen auf einem Bildschirm dar. Daraus lesen sie Wetterlagen ab und erstellen eventuell Warnungen.
|
Infos |
|---|
|
[1] Deutscher Wetterdienst: [http://dwd.de] [2] Meteomedia: [http://kachelmannwetter.de] [3] Numerische Wettervorhersage: [http://euromet.meteo.fr/euromet/german/navig/] [4] Automatic File Distributor (AFD):[http://www.dwd.de/AFD] [5] Open-Source-API zum Gridded Binary Datenformat (GRIB): [http://www.ecmwf.int/products/data/software/grib_api.html] [6] Datenblatt NEC SX-9:[http://nec.de/hpc/hardware/sx-series/] [7] Super-UX: [http://www.nec.de/hpc/software/super-ux/] [8] Edward N. Lorenz, “Deterministic Nonperiodic Flow”: Journal of the Athmospheric Schiences, 1962 |





