Ein Flop, das ist die kleinste Münze der Leitwährung für Rechenleistung, eine Floatingpoint-Operation pro Sekunde. Für die Ermittlung der Werte hat sich ein normalerweise in Fortran geschriebener Benchmark namens Linpack [1] seit vielen Jahren etabliert, der einen Satz linearer Gleichungen numerisch löst. Ein halbwegs aktuelles 64-Bit-Dualcore-System mit 2,66 MHz Taktfrequenz bringt es auf rund 25 Gigaflops, also 25 mal 109 Gleitkomma-Operationen pro Sekunde. Ein PC-Bolide mit Intels Core-i7-CPU kommt auf rund 33 Gigaflops.
Auch die Königsklasse des Supercomputings, deren Adelsregister die zwei Mal im Jahr erscheinende Top-500-Liste ist, unterwirft sich dem Flop-Ranking. Aktuell benötigen die schnellsten Rechner der Welt den Einheitenvorsatz Peta für eine Billiarde (1015) Operationen.
Aus eins mach viele
Diese Marke erreichte im Jahr 2008 erstmals das von IBM und dem Los Alamaos Lab gemeinsam entwickelte Hybridsystem Roadrunner, das mit 6120 AMD-Opteron-Dualcore-Prozessoren sowie einer Power-Xcell-CPU pro Core rechnet [2]. Das Blade-System, auf dem RHEL läuft, kam damit auf 1026 Teraflops, also gut ein Petaflop. Die nächste Stufe auf der Leiter der Maßeinheiten wäre der Exaflop mit 1018 Fließkomma-Operationen, die kein Rechner nach heutiger Prognose vor dem Jahr 2020 erreichen wird.
Wer gerade die Millionen Euro oder Dollar für solche Boliden nicht zur Hand hat, braucht sich nicht zu grämen - es sei denn, er will die Detonation einer Atombombe simulieren oder ähnliche Extremrechnungen anstellen. Denn auch ganz normale Server und Workstations der jüngsten Generation weisen Rechenleistungen auf, die sich bei komplexen Aufgaben durchaus sehen lassen dürfen.
Der technische Fortschritt bei den Prozessorherstellern bringt nämlich Techniken in den Mainstream, die eine Art Abfallprodukt des High Performance Computing sind, Multicore und schnelle CPU-interne Bussysteme beispielsweise. Vierkern-Prozessoren wie der Athlon X4 sind für rund 100 Euro zu haben. Intels "Gulftown"-Core i7 980 und der Phenom II X6 von AMD eröffnen derzeit die Sechskern-Ära im Desktopsektor. Weitere Informationen über aktuelle Multicore-Prozessoren enthält der Beitrag von Daniel Kottmair in diesem "Mehr rausholen"-Spezial.
Shoppingtour bei IBM & Co.
Wer Anwendungen mit hohem Rechenleistungsbedarf benutzt und keinen modernen Rechner im Rack oder unterm Schreibtisch stehen hat, muss shoppen gehen. Das Linux-Magazin hat beispielhaft bei vier namhaften Herstellen angefragt, was sie aus ihrem Portfolio zum Numbercrunching empfehlen, wenn der Kunde weniger als 10 000 Euro ausgeben will (siehe Tabelle 1). IBM findet diese Zielgruppe interessant. "Supercomputing ist nicht mehr der Spitzenforschung vorbehalten. Zahlreiche Fachabteilungen und Mittelständler setzen heute HPC-Lösungen ein, von den größten Wissenschaftszentren der Welt bis hin zu Ingenieurbüros", weiß Stephanie Kühdorf, Leiterin des Supercomputing-Bereichs.
Natürlich haben die Stuttgarter gleich die passenden Systeme im Angebot: Neben den Power-Unix-Servern gibts x86-Systeme und das Highend-Cluster-Produkt I-Data-Plex. Wer nach einer HPC-Lösung unter 10 000 Euro fragt, den empfielt IBM die EX5-Familie (zwei 19-Zoll-Modelle, [3]) oder HX5-Blades. Für letztere braucht man freilich noch ein Bladecenter (alle in Abbildung 1). Die Blades führt IBM als 2- oder 4-Sockel-Einschübe. Mit den so möglichen 16 Xeon-Cores erreicht der Käufer eine ansehnliche Rechendichte, bis zu 640 GByte RAM und maximal 100 GByte internem Plattenplatz. Hot-swappable Harddisks sind bei dem Preis leider nicht drin. Immerhin kann der Kunde aber auf den optionalen Embedded Hypervisor zurückgreifen.
Abbildung 1: Das kleine IBM-Familienbild zeigt (von oben nach unten) zwei HX5-Blades, einen 2-Socket-Server und den 4-Socket-Server der EX5-Serie.