> > > > Deutscher Wetterdienst setzt auf Vektorbeschleuniger von NEC

Deutscher Wetterdienst setzt auf Vektorbeschleuniger von NEC

Veröffentlicht am: von

dwdZur International Supercomputing Conference gibt es eine interessante Ankündigung des Deutschen Wetterdienstes. Dort hat man einen über fünf Jahre laufenden Vertrag mit NEC unterschrieben und wird in diesem Zeitraum deren Vektorbeschleuniger namens NEC SX-Aurora TSUBASA nutzen, um die Vorhersagen zu verbessern, bzw. zu beschleunigen. Das Gesamtvolumen des Kaufs von NEC-Hardware beläuft sich auf 50 Millionen US-Dollar.

Gegen Ende des Jahres will NEC ein System mit den SX-Aurora-TSUBASA-Karten aufgebaut haben, welches gleichwertig zum aktuellen Supercomputer des DWD ist. Beim aktuellen Hauptsystem des DWD zum Einsatz kommen 1.296, bzw. 1.104 Intel Xeon E5-2670v2 respektive E5-2680v3 mit einer Rechenleistung von 1.459, bzw. 1.227 TFLOPS. Zum Vergleich: Damit gelänge gerade so der Einstieg in die Top500-Liste der Supercomputer. Gegen Ende 2020 will NEC das System derart ausgebaut haben, dass es dreimal so leistungsfähig wie das aktuelle ist. In der finalen Phase in 2022 soll dann die nächste Generation der SX-Aurora-TSUBASA-Karten zum Einsatz kommen.

Bei den SX-Aurora-TSUBASA-Karten handelt es sich um spezielle Hardware, deren Chips in der Grundfunktion nicht mit einem Prozessor oder einer GPU zu vergleichen sind. Stattdessen wird die Hardware zur Berechnung von Matrizenoperationen verwendet. Die Vektorprozessoren auf den SX-Aurora-TSUBASA-Karten besitzen acht Kerne und teilen sich einen 16 MB großen Cache. Jeder der acht Kerne hat 64 Vektor-Register, welche die Funktionseinheiten mit Rechenaufgaben versorgen und Ergebnisse zurückbekommen.

Jeder Kern besitzt zudem drei FMA-Einheiten (Floating-Point Multiply Add, diese können Gleichungen wie A x B + C lösen) sowie je eine Einheit für das Teilen und Quadrieren. Jede Pipeline der FMA-Einheiten kann 32 parallele Berechnungen durchführen. Somit kommen wir auf  3 x 2 x 32 = 192 Fließkommaberechnungen mit doppelter Genauigkeit pro Takt für einen Kern.

Je nach Ausbau und Kühlung der Karte erreicht diese einen Takt von 1,4 bis 1,6 GHz. Die Rechenleistung bewegt sich zwischen 2,15 bis 2,45 TFLOPS. Um die aktuell knapp 2,7 TFLOPS der beiden bestehenden Systeme zu erreichen, genügt also schon eine SX-Aurora-TSUBASA-Karte. Allerdings kann der DWD nicht alle Berechnungen auf den Vektorbeschleunigern ausführen und ist auch noch auf andere Hardware angewiesen. Dieser Hybrid-Ansatz soll in den Berechnungen aber deutlich flexibler sein. Interessant an den SX-Aurora-TSUBASA-Karten ist zudem ihr Speicher. Hier kam erstmals HBM2 in großen Kapazitäten zum Einsatz. In sechs Speicherstacks sind bis zu 48 GB pro Karte verbaut, die eine Speicherbandbreite von 1,2 TB/s erreichen.

NEC hat die SX-Aurora-TSUBASA-Karten bereits im Februar 2018 auf den Markt gebracht. Die Preise beginnen ab etwa 6.000 US-Dollar für das kleinste Modell.

Neuer DLR-Supercomputer ebenfalls von NEC

Im gleichen Zuge präsentierte NEC mit dem Deutschen Zentrum für Luft- und Raumfahrt (DLR) einen weiteren Partner. Hier soll ebenfalls ein HPC-System aufgebaut werden. Allerdings werden keine Vektorbeschleuniger zum Einsatz kommen, sondern 4.600 AMD EPYC 7601 mit zusammengenommen 147.200 Kernen. Der Vertrag hat ein Volumen von 20 Millionen Euro.

Gekühlt werden sollen die Prozessoren mittels einer Direct-Liquid Cooled (DLC) bezeichneten Wasserkühlung, die mit Warmwasser arbeitet. Sie Eingangstemperatur des Wassers soll im Rack bei 35 °C liegen. CoolIT Systems ist der Hersteller der Wasserkühlung. Die gesamte Arbeitsspeicherkapazität soll 58 TB betragen. An Gesamtspeicher für alle Daten vorhanden sind 17 PB. Neben den Compute- und Speichernotes sind auch noch 20 Visualization-Nodes mit jeweils zwei NVIDIA Quadro P5000.