Zur Computex 2022 stellt NVIDIA, genauer gesagt die Datacenter-Sparte, unter anderem die ersten Referenzdesigns für zukünftige HGX-Systeme vor und will mit wassergekühlten A100- und H100-PCIe-Karten die Effizienz der dazugehörigen Server steigern.

Auf der diesjährigen GPU Technology Conference gab NVIDIA weitere Details zum Grace-CPU-Superchip bestehend aus zwei ARM-Chips mit jeweils 72 Kernen und dem Grace-Hopper-Superchip als Kombination aus Grace-CPU plus Hopper-GPU bekannt. Einzelne Systeme sollen noch 2022 an Kunden ausgeliefert werden, bis alle OEMs auf die neue Hardware von NVIDIA umgestellt haben, wird es aber sicherlich noch etwas länger dauern. In Vorbereitung auf die Einführung bei mehr und mehr Partnern kündigt NVIDIA ein Referenzdesign für HGX Grace und HGX Grace Hopper an. OEMs können die Blades bzw. deren Design verwenden, um sie wiederum in ihre eigenen Systeme bzw. das Serverangebot zu integrieren.

Das Referenz-Blade für HGX Grace besteht aus einem Half-Height-Blade mit einem Chip bei einer Gesamt-TDP von 500 W. Bis zu 84 dieser Blades können theoretisch in einem Rack untergebracht werden. Je nach Infrastruktur des Datacenters kann die Kühlung mittels Luft oder Wasser erfolgen.

Die Blades mit HGX Grace Hopper kommen auf eine TDP von 1.000 W. Auch sie können mittels Luft und Wasser gekühlt werden. Bei doppelter Höhe halbiert sich die Anzahl der Blades pro Rack auf 42.

2023 wird für NVIDIA ein wichtiges Jahr, wenn es um die Umsetzung der gesamten Grace-Strategie geht. Die ARM-Chips werden überall zu finden sein, teilweise werden die Systeme komplett auf GPUs verzichten und nur auf den CPUs laufen. Andere wiederum werden mit Grace Hopper den kombinierten Weg wählen.

A100 und H100 kommen wassergekühlt als PCIe-Karte

Neben den SMX3/4- und luftgekühlten PCI-Express-Varianten wird im im dritten Quartal 2022 auch noch ein wassergekühltes Modell der A100 in den Markt eingeführt werden. Als Single-Slot-Karte liegen die Vorteile hier einerseits im geringen Platzbedarf, aber auch in der Effizienz, denn es ist keine aufwendige Gehäusekühlung notwendig, was laut NVIDIA für eine um 30 % reduzierte Leistungsaufnahme des Datacenters sorgen soll.

Nach der Ampere-basierten A100 soll auch die PCI-Express-Variante der H100 in einer wassergekühlten Variante erscheinen. Dies wird aber erst Anfang 2023 der Fall sein.