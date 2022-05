Nachdem es auf der Liste der Top500-Systeme aus dem November 2021 noch keinerlei Exascale-System gab, hat es der Frontier der Oak Ridge Leadership Computing Facility des US-Energieministeriums nun geschafft. Er liefert eine Linepack-Rechenleistung (doppelte Genauigkeit - FP64) von 1,1 EFLOPS (ExaFLOPS). Allerdings soll es bereits Ende der vergangenen Jahres Systeme mit einer solchen Rechenleistung gegeben haben. Diese aber stehen in China und haben offiziell kein Ergebnis für die Top500-Liste eingereicht.

Frontier ist nun also das erste offizielle Exascale-System und arbeitet mit EPYC-Prozessoren (Milan, 64 Kerne) von AMD sowie Instinct-MI250X-Beschleunigern, ebenfalls von AMD. Insgesamt setzt sich Frontier aus 74 Cabinets (Cray EX) zusammen, die von HPE geliefert werden. In diesen befinden sich 9.472 Rechenknoten mit jeweils einem EPYC-Prozessor und vier GPUs. Das Speichersystem kommt auf 700 PB und Transferraten von 5 TB/s. Die Rechenknoten mittels Slingshot-11-Interconnect miteinnander verbunden. Die gesamte Kabellänge beträgt 145 km.

Frontier nutzt also 9.472 Prozessoren und 37.888 Instinct MI250X um auf die Rechenleistung von 1,1 ExaFLOPS zu kommen. Diese wurde mittels des Linpack-HPL-Benchmarks ermittelt. Rein rechnerisch sollten alleine die GPU-Beschleuniger auf deutlich mehr kommen. Bei idealer Skalierung kommen alleine diese auf 1,8 ExaFLOPS. Allerdings hat das OLCF einige Abwägungen getroffen und in der Praxis gibt es eben keine ideale Skalierung über tausende Rechenknoten. So betreibt man das System nicht an der Leistungsgrenze. Aus Effizienzgründen takten die einzelnen Komponenten niedriger, als dies notwendig wäre. Somit besetzt der Frontier mit 52,23 GFLOPS/W auch in der Green500-Liste die Spitzenposition. Der bisherige Spitzenreiter kam auf 39,38 GFLOPS/W. Zudem erreicht Frontier mit einem Skalierungsfaktor von 83 % zwar einen guten Wert, hier zeigt sich aber recht deutlich, dass die Rechenleistung der Einzelkomponenten sich nicht einfach aufaddieren lässt.

Aber nicht nur in der für die meisten wissenschaftlichen Berechnungen wichtigen doppelten Genauigkeit sowie der Energieeffizienz ist Frontier der neue Spitzenreiter, sondern auch im HPL-AI-Benchmark, also der Rechenleistung für niedrigere Genauigkeiten, wie sie für AI-Anwendungen wichtig ist. Hier erreicht das System 6,88 ExaFLOPS. Die bisherige Nummer eins Fugaku des japanischen RIKEN kommt auf 2 ExaFLOPS. Zum Vergleich: Das AI Research SuperCluster (RSC) des Facebook-Mutterkonzerns Meta soll mit 16.000 A100-GPUs von NVIDIA auf etwa 5 ExaFLOPS kommen. NVIDIAs eigener Supercomputer Selene kommt auf 2,8 ExaFLOPS an AI-Rechenleistung. 2023 soll der ALPS des Swiss National Supercomputing Center auf 20 ExaFLOPS kommen. Er wird eines der ersten Systeme sein, welches mit den neuen Grace- und Grace-Hopper-Superchips ausgestattet ist.

Noch ein paar Hintergrundinformationen zu Frontier. Die Leistungsaufnahme des Systems liegt bei 21,1 MW. Die Infrastruktur samt der Kühlung wurde auf 29 MW ausgelegt. Das OLCF als Betreiber lässt sich hier aber noch etwas Luft, um eventuell weitere Ausbaustufen umzusetzen – sowohl in der Versorgung, als auch beim Platzbedarf für die Cabinets. Wird der Linpack-Benchmark gestartet, steigt der Verbrauch des Systems von einem nicht genannten Idle-Wert um 15 MW an – so viel wie eine Kleinstadt verbraucht.

Das OLCF und HPE zeigen sich von den Möglichkeiten der Hardware beeindruckt. AMD hat hier offenbar einen großen Wurf gemacht und dies wird sich auch in den Umsetzungen weiterer Supercomputer zeigen, die mit der heutigen Top500-Liste neu auftauchen. Auch wenn es im Vergleich zu den ursprünglichen Plänen ab wann Frontier verfügbar sein soll größere Verzögerungen gab, so ist man dennoch glücklich dies nun in Zeiten der Lieferengpässe in der Form umgesetzt zu haben.

HPE als Lieferant des Systems ist natürlich besonders stolz auf die Umsetzung in Form der wassergekühlten Cabinets. Diese können natürlich auch andere Hardware beherbergen und sind zu 100 % wassergekühlt. Für Frontier wurde damit die hohe Energieeffizienz erreicht. Im Betrieb soll sich Frontier aber auch durch eine geringe Lautstärke auszeichnen – mitunter sicherlich kein allzu wichtiger Faktor in diesem Segment.