
Abbildung 1: Roadrunner, der schnellste Rechner der Welt, bringt es unter Linux auf etwas mehr als 1 Petaflop Linpack-Performance. In ihm rechnen neben fast 7000 Dualcore-Opterons von AMD auch über 12000 Chips, die ähnlich in der Playstation 3 Verwendung finden.
Die Hochleistungsrechner haben eine neue Benchmark-Schallmauer durchbrochen, von nun an leben wir im Petaflop-Zeitalter. In die Euphorie mischen sich allerdings auch nachdenkliche Stimmen das High Performance Computing steht vor neuen Herausforderungen.
Eine neue Vorsilbe für die Maßeinheit Flop (Floating Point Operations) in der Benchmark-Statistik ist nur einmal im Jahrzehnt fällig. Kein Wunder, dass dieser Durchbruch auch eines der dominierenden Gesprächsthemen auf Europas wichtigstem Event im Kalender des Hochleistungsrechnens war, der International Supercomputing Conference Mitte Juni in Dresden, zu der sich mehr als 1300 Experten für High Performance Computing (HPC) aus 46 Ländern zusammenfanden.
Top 500
Der schnellste Computer der Welt, ein von IBM für das Los Alamos National Laboratory in den USA konstruiertes Hybridsystem namens Roadrunner (Abbildung 1), erreicht mit seinen 6480 AMD-Opteron-Dualcore-Chips, denen noch einmal doppelt so viele IBM-PowerXCell-8i-CPUs als Beschleuniger zur Seite stehen, erstmals beständig 1026 Teraflops pro Sekunde im Linpack-Benchmark.
Fast nebenbei stellt Roadrunner noch eine Reihe weiterer Rekorde auf, ist er doch das erste Nummer-1-System der Liste unter Linux, der erste Cluster aus handelsüblicher Hardware auf der Spitzenposition, der erste Weltmeister-Rechner, der Infiniband als Cluster-Interconnect einsetzt, und der erste Top-Platzierte, der Prozessoren verschiedener Familien verwendet.
Damit ist Roadrunner jetzt mehr als doppelt so schnell wie die Nummer zwei der Liste (ein Blue Gene/L im Lawrence Livermore National Laboratory, ebenfalls von IBM) mit 478 Teraflops. Beide Systeme nutzt vorrangig das Militär. Der schnellste zivile Supercomputer folgt mit 450 Teraflops auf Platz drei (Blue Gene/P, Argonne National Laboratory), der schnellste Computer der Industrie (Platz 10) gehört einer französischen Ölgesellschaft.
Wollte man die Rechenleistung von Roadrunner mit den leistungsfähigsten der heute gebräuchlichen Laptops erreichen, wären 100 000 Stück erforderlich, die übereinandergestapelt fast die Höhe der Zugspitze erreichen. Die Performance des Spitzenreiters ist dem Durchschnitt der Top 500 um sechs bis acht Jahre voraus, deren Rechenpower wiederum hält ihrerseits acht bis zehn Jahre Vorsprung gegenüber einem heutigen Oberklasse-Laptop.
Zahlenspiele
Ein näherer Blick auf die Statistik zeigt, dass bei den Prozessorproduzenten Intel mit 75 Prozent Anteil die Liste dominiert, bei den Systemherstellern führt IBM mit 42 Prozent etwas weniger deutlich vor HP (37 Prozent), Dell (5 Prozent), SGI und Cray. Die ersten fünf und weitere 252 der schnellsten Computer sind in den USA beheimatet. Deutschland, Nummer zwei in Europa, rangiert auch weltweit mit 46 Superrechnern in der Spitzengruppe.
Insgesamt ist die Top-500-Dynamik derzeit so hoch wie nie zuvor: Noch nie verzeichnete die Liste, so wie im zurückliegenden Halbjahr, mehr als 300 Zu- und Abgänge. Unter den Betriebssystemen führt Linux souverän mit 85 Prozent. Microsoft bringt es trotz großer Anstrengungen, die auch auf der Konferenz zu spüren waren, gerade mal auf ein Prozent.
Energiefrage
Zum ersten Mal weist die neue, auf der Konferenz vorgestellte Top-500-Liste den Energieverbrauch der Boliden aus. Der nämlich entwickelt sich mehr und mehr zu einem Prüfstein der künftigen Entwicklung. Ändert sich nichts, verzehren die größten Stromfresser unter den Superrechnern bereits in absehbarer Zeit 100 Megawatt und mehr, darunter 20 Megawatt allein für das Memory.
Die nächste Generation erfordert dann nicht nur kleine Kraftwerke neben den Rechenzentren, es wäre auch kaum mehr möglich, die resultierende Abwärme abzuführen. Nicht zuletzt sind natürlich auch steigende Energiepreise ein wichtiger Faktor, haben sie doch zur Folge, dass die Supercomputing-Center für Strom und Kühlung sehr bald mehr bezahlen als für den Superrechner selbst.
Eine höhere Packungsdichte der Transistoren auf dem Prozessorchip und eine höhere Taktfrequenz – beide waren bisher Motoren für die Entwicklung immer schnellerer Rechner. Beide erhöhen aber auch die Energiedichte innerhalb des Prozessors, für die es eine Grenze gibt.
Grenzen in Sicht
Interpoliert man die Benchmark-Historie der Superrechner, so kam das neue Petaflop-System etwas früher, als es der Trend erwarten ließ. Ob es aber tatsächlich einen Exa-flop-Rechner bis 2019 oder gar ein Zetaflop-System bis 2030 geben wird, scheint fraglich. Zumindest sind entscheidende Innovationen nötig.
Als Reaktion auf diese Entwicklung gibt es unter anderem die Green-500-Liste der Energie-effizientesten Supercomputer, angeführt von einem Rechner, der 357,23 Megaflops pro Watt und Sekunde liefert, wogegen es der Durchschnitt der Top 500 nur auf 122 Megaflops/s pro Watt bringt. Ob das allerdings der Maßstab sein soll oder ob man sich am absoluten Verbrauch oder an Watt pro Core oder pro Node orientieren soll, ist bislang eine offene Frage. Wie im Rest der IT-Welt erkennt sich nahezu jeder den Umweltengel selber zu.
Auch war die Meinung zu hören, Energie-effizientere Rechner würden zu mehr Megaflops führen, aber nicht zu weniger Watt. John Gustafson, ein bekannter HPC-Experte, bringt es auf den Punkt: Das High Performance Computing wird grün, nicht um den CO2-Ausstoß zu verringern, sondern um eine bestimmte Rechenleistung mit einem festen Energiebudget zu erreichen.
Herausforderungen
Das Hochleistungsrechnen steht zudem noch vor weiteren Herausforderungen (Abbildung 2). So sind effizientere Algorithmen nebst Tools und Techniken für die Parallelprogrammierung gefragt, um die enormen Rechenleistungen ausnutzen zu können. Andere Rechnerkomponenten, die keine annähernd so rasante Entwicklung nahmen wie die Prozessoren, müssen nachziehen. Die Konferenz diskutierte bereits erste Erfahrungen mit 40-GBit/s-Infiniband-Clustern – 2011 soll die Marke bei 80 GBit/s liegen.

Abbildung 2: Die größten Herausforderungen an das Hochleistungsrechnen aus der Sicht von IDG. Ganz oben rangiert auch hier das Energieproblem.
Fünf der zehn Schnellsten nutzen Infiniband für die Verbindung von Rechenknoten und Speicher, weil es im Durchsatz den schnellsten Fibre-Channel-Standard um den Faktor vier übertrifft. Der Rest verwendet eine proprietäre Technik – das derzeitige 10-GBit-Ethernet ist jedem unter den ersten 50 zu langsam. Allerdings befindet sich 100-GBit-Ethernet bereits im Prozess der Standardisierung und so war Fibre Channel over Ethernet bereits als Zukunftstechnik im Gespräch.
Tage für Millisekunden
Wofür ist diese enorme Rechenleistung gut? Neben bekannten Gebieten wie Klimaforschung, Luft- und Raumfahrt, Militär, Finanzwesen oder der Erkundung von Bodenschätzen gab John Salmon ein eindrucksvolles Beispiel aus der Biochemie. Seine Firma D. E. Research berechnet das Verhalten komplexer Moleküle durch Vorhersagen für die Bewegung jedes einzelnen Atoms. Die Ergebnisse sind für die Arzneimittelforschung wichtig.
Für sinnvolle Aussagen müssen die Forscher mindestens eine Millisekunde im Leben des Moleküls simulieren, doch selbst ein speziell auf diese eine Aufgabe zugeschnittener massiv paralleler Höchstleistungsrechner schafft es derzeit nicht, mehr als ein paar Hundert Nanosekunden pro Tag zu berechnen.




