Bereits recht früh hatte NVIDIA verstanden, dass ein einzelner leistungsstarker Chip auch darauf angewiesen ist, seine Daten möglichst schnell austauschen zu können. Im HPC- und AI-Bereich ist eine gute Skalierung der Systeme über mehreren tausend Beschleuniger und Knoten darauf angewiesen, dass eine entsprechend schnelle Verbindung zwischen den Knoten und Beschleunigern besteht – am besten natürlich über eine direkte Verbindung aller Knoten untereinander.

Die aktuell vierte Generation von NVLink kommt auf eine bidirektionale Bandbreite von 900 GB/s. Zusammen mit der Blackwell-Architektur stellt man nun die fünfte Generation des NVLink-Interconnects vor, welche die Bandbreite auf 1,8 TB/s verdoppelt.

Zusammen mit der Weiterentwicklung des NVLink-Interconnects präsentierte NVIDIA einen dedizierten NVLink Switch auf Basis eines eigens entwickelten Chips. Diese wird nun in der vierten Generation vorgestellt.

Der neue NVLink Switch stellt einzelne Verbindungen zu den Beschleunigern mit der vollen NVLink-Bandbreite von 1,8 TB/s bereit. Ausgehend von acht GPUs, die in einem Knoten per NVLink-Switch miteinander verbunden werden können, sprechen wir von 14,4 PB/s an Bandbreite, die zur Verfügung gestellt wird. Der Vorgänger kam auf die Hälfte.

NVIDIA fertigt den NVLink Switch in 4N bei TSMC. Der Chip kommt auf 50 Milliarden Transistoren und hat zudem 3,6 TFLOPS an Netzwerk-Compute-Leistung, da auch die Netzwerke auf eine gewisse Intelligenz angewiesen sind.

Zum Einsatz kommen die neuen NVLink Switches für die GB200 NVL72 Compute-Nodes. Hier sitzen gleich zwei NVLink Switches in einem Rack.

Quantum-X800 InfiniBand und Spectrum-X800 Ethernet

Außerdem vorgestellt werden die neuen Switches Quantum-X800 InfiniBand und Spectrum-X800 Ethernet für InfiniBand- und Ethernet-Verbindungen.

Der Quantum-X800 InfiniBand unterstützt 64 Ports mit jeweils 800 GBit/s mit RoCE Adaptive Routing. Die BlueField-3 SuperNICs sind das entsprechende Gegenstück auf Client-Seite. Der Spectrum-X800 Ethernet stellt 144x 800 GBit/s zur Verfügung und bietet intern 14,4 TFLOPs an Netzwerk-Compute-Leistung. Hier nennt sich das entsprechende Gegenstück ConnectX -8 SuperNIC.