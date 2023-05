Werbung

Der Aurora-Supercomputer soll das erste System sein, welches eine Rechenleistung von 2 ExaFLOPS erreicht. Das Prestigeobjekt von Intel hat jedoch längst einige Kratzer bekommen. Ursprünglich mal mit Xeon-Phi-Beschleunigern geplant, musste Aurora schon mehrfach verschoben werden. In diesem Jahr soll es nun endlich soweit sein. Intel verkündete im Rahmen der ISC den finalen Ausbau der Hardware. Bisher war nur eine grobe Anzahl an Nodes bekannt.

Ausgestattet ist Aurora mit Prozessoren aus der Xeon-CPU-Max-Serie auf Basis des Sapphire-Rapids-Designs, die mit HBM2e-Speicher ausgestattet sind, sowie den Data-Center-GPUs Max 1550 alias Ponte Vecchio. Pro Node kommen zwei Prozessoren und vier GPUs zum Einsatz. Insgesamt wird Aurora über 10.624 Nodes und somit 21.248 Prozessoren und 63.744 GPUs verfügen. Zum Vergleich: Der aktuelle Spitzenreiter und das erste Exascale-System Frontier kommt auf 9.472 EPYC-Prozessoren und 37.888 GPUs.

Die weiteren Daten von Aurora lauten 2,21 PB/s an Spitzendatenübertragung über den Fabric-Interconnect sowie das Vorhandensein von 1,36 PB an HBM2e-Speicher bei den Prozessoren, 8,16 PB an HBM2e-Speicher bei den GPUs sowie 10,9 PB an DDR5-Speicherkapazität. Theoretisch sind alle Prozessoren und GPUs in der Lage, über ihren HBM2e-Speicher eine Bandbreite von 30,5, bzw. 208,9 PB/s zu erreichen. Dies sind jedoch nur theoretisch Zahlen.

Das dazugehörige Speicher-Subsystem DOAS (Distributed Asynchronous Object Storage) bietet eine Kapazität von 230 PB und ist auf 1.024 Nodes verteilt. Die theoretische Datenübertragungsrate liegt hier bei 31 TB/s.

Intel erwartet auf Basis von Hochrechnungen der Leistung, dass man die 2 ExaFLOPS erreichen wird. Man verweist außerdem auf die gute Skalierung bei wenigen Nodes, beispielsweise im Vergleich zu ähnlich ausgestatteten Test-Systemen wie Polaris oder Crusher. Die Hardware von Aurora steht, nun geht es darum, das System skaliert hochfahren zu können und mehr und mehr Nodes einzubinden.

Wir hatten im vergangenen Jahr die Gelegenheit, Borealis – das Testsystem für Aurora – bei Intel zu besichtigen. Borealis besteht aus 128 Nodes und war anfangs nicht mit den Prozessoren aus der Xeon-CPU-Max-Serie bestückt, sondern mit solchen ohne HBM2e-Speicher. Im Artikel werfen wir einen ausführlichen Blick auf die Art und Weise wie Intel und das Argonne National Laboratory sich auf den Aufbau von Aurora vorbereitet haben. Neben dem Borealis-System bei Intel gab es das baugleiche Sunspot-System, welches für die Hochrechnungen der Leistung verwendet wurde.

Wann genau Aurora nun vollständig in den Betrieb geht, ist noch nicht bekannt. Die endlose Geschichte sollte allerdings in den kommenden Wochen und Monaten ihr Ende finden.