Open Source im professionellen Einsatz
Linux-Magazin 07/2010
© clafouti, Photocase.com© Vision Lab, Universität Antwerpen

© clafouti, Photocase.com© Vision Lab, Universität Antwerpen

Gigaflops, bezahlbare Hardware, GPU-Computing, Compilerfarmen

Rechenleistung für alle

, , ,

Wer gerade die Millionen für 'nen Super-Boliden nicht zur Hand hat, nimmt eben eine oder mehrere Standardkisten und Linux. Das mag übertrieben sein, doch aktuelle Systeme bedienen sich vieler Techniken des High Performance Computing.

548

Ein Flop, das ist die kleinste Münze der Leitwährung für Rechenleistung, eine Floatingpoint-Operation pro Sekunde. Für die Ermittlung der Werte hat sich ein normalerweise in Fortran geschriebener Benchmark namens Linpack [1] seit vielen Jahren etabliert, der einen Satz linearer Gleichungen numerisch löst. Ein halbwegs aktuelles 64-Bit-Dualcore-System mit 2,66 MHz Taktfrequenz bringt es auf rund 25 Gigaflops, also 25 mal 109 Gleitkomma-Operationen pro Sekunde. Ein PC-Bolide mit Intels Core-i7-CPU kommt auf rund 33 Gigaflops.

Auch die Königsklasse des Supercomputings, deren Adelsregister die zwei Mal im Jahr erscheinende Top-500-Liste ist, unterwirft sich dem Flop-Ranking. Aktuell benötigen die schnellsten Rechner der Welt den Einheitenvorsatz Peta für eine Billiarde (1015) Operationen.

Aus eins mach viele

Diese Marke erreichte im Jahr 2008 erstmals das von IBM und dem Los Alamaos Lab gemeinsam entwickelte Hybridsystem Roadrunner, das mit 6120 AMD-Opteron-Dualcore-Prozessoren sowie einer Power-Xcell-CPU pro Core rechnet [2]. Das Blade-System, auf dem RHEL läuft, kam damit auf 1026 Teraflops, also gut ein Petaflop. Die nächste Stufe auf der Leiter der Maßeinheiten wäre der Exaflop mit 1018 Fließkomma-Operationen, die kein Rechner nach heutiger Prognose vor dem Jahr 2020 erreichen wird.

Wer gerade die Millionen Euro oder Dollar für solche Boliden nicht zur Hand hat, braucht sich nicht zu grämen - es sei denn, er will die Detonation einer Atombombe simulieren oder ähnliche Extremrechnungen anstellen. Denn auch ganz normale Server und Workstations der jüngsten Generation weisen Rechenleistungen auf, die sich bei komplexen Aufgaben durchaus sehen lassen dürfen.

Der technische Fortschritt bei den Prozessorherstellern bringt nämlich Techniken in den Mainstream, die eine Art Abfallprodukt des High Performance Computing sind, Multicore und schnelle CPU-interne Bussysteme beispielsweise. Vierkern-Prozessoren wie der Athlon X4 sind für rund 100 Euro zu haben. Intels "Gulftown"-Core i7 980 und der Phenom II X6 von AMD eröffnen derzeit die Sechskern-Ära im Desktopsektor. Weitere Informationen über aktuelle Multicore-Prozessoren enthält der Beitrag von Daniel Kottmair in diesem "Mehr rausholen"-Spezial.

Shoppingtour bei IBM & Co.

Wer Anwendungen mit hohem Rechenleistungsbedarf benutzt und keinen modernen Rechner im Rack oder unterm Schreibtisch stehen hat, muss shoppen gehen. Das Linux-Magazin hat beispielhaft bei vier namhaften Herstellen angefragt, was sie aus ihrem Portfolio zum Numbercrunching empfehlen, wenn der Kunde weniger als 10 000 Euro ausgeben will (siehe Tabelle 1). IBM findet diese Zielgruppe interessant. "Supercomputing ist nicht mehr der Spitzenforschung vorbehalten. Zahlreiche Fachabteilungen und Mittelständler setzen heute HPC-Lösungen ein, von den größten Wissenschaftszentren der Welt bis hin zu Ingenieurbüros", weiß Stephanie Kühdorf, Leiterin des Supercomputing-Bereichs.


Natürlich haben die Stuttgarter gleich die passenden Systeme im Angebot: Neben den Power-Unix-Servern gibts x86-Systeme und das Highend-Cluster-Produkt I-Data-Plex. Wer nach einer HPC-Lösung unter 10 000 Euro fragt, den empfielt IBM die EX5-Familie (zwei 19-Zoll-Modelle, [3]) oder HX5-Blades. Für letztere braucht man freilich noch ein Bladecenter (alle in Abbildung 1). Die Blades führt IBM als 2- oder 4-Sockel-Einschübe. Mit den so möglichen 16 Xeon-Cores erreicht der Käufer eine ansehnliche Rechendichte, bis zu 640 GByte RAM und maximal 100 GByte internem Plattenplatz. Hot-swappable Harddisks sind bei dem Preis leider nicht drin. Immerhin kann der Kunde aber auf den optionalen Embedded Hypervisor zurückgreifen.

Abbildung 1: Das kleine IBM-Familienbild zeigt (von oben nach unten) zwei HX5-Blades, einen 2-Socket-Server und den 4-Socket-Server der EX5-Serie.

Linux-Magazin kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Chips frisch

    Multicore-CPUs und GPUs modernster Bauart rechnen frühere Chipgenerationen in Grund und Boden - und das zum gleichen Preis und mit weniger Energie. Der folgende Blick auf aktuelle und demnächst kommende Rechenmeister macht klar: Numbercrunching verliert den Status des Reiche-Leute-Sports.

  • Xeon Phi

    Mit der Beschleunigerkarte Xeon Phi geht Intel einen Sonderweg: Anstelle einer GPU rechnen auf dem Coprozessor zahlreiche CPU-Kerne, was die Programmierung erleichtert.

  • ISC 2010: Nebulae - Chinas Supercomputer im Vormarsch

    Auf den zweiten Platz in der Rangliste der 500 weltschnellsten Computer, die im Rahmen der International Supercomputing Conference in Hamburg veröffentlicht wurde, hat sich erstmals ein Rechner aus China geschoben.

  • Neuer HPC-Server von Dell

    Der neue PowerEdge C4130 von Dell ist der einzige Server mit Intel Xeon E5-2600v3-Prozessoren und bis zu vier GPU-Beschleunigern in einem 1HE-Gehäuse. Er kann damit eine Leistung von mehr als 7,2 Teraflops erreichen.

  • Big Sur: Facebook macht AI-Hardware zu Open Source

    Facebook Artificial Intelligence Research (FAIR) will das Design seiner für AI-Anwendungen verwendeten Hardware als Open Source unter dem Dach des Open Compute Projects (OCP) veröffentlichen.

comments powered by Disqus

Stellenmarkt

Artikelserien und interessante Workshops aus dem Magazin können Sie hier als Bundle erwerben.