Auf einer Präsentation auf der Supercomputing-Konferenz hat NVIDIA einen weiteren Partner für das NVLink-Fusion-Ökosystem angekündigt. Neben Intel, Fujitsu und Qualcomm wird auch ARM die notwendige Infrastruktur bereitstellen, damit Kunden einer ARM-Lizenz den Interconnect via NVLink Fusion nutzen können.

Im Frühsommer kündigte NVIDIA an, dass NVLink externen Kunden zugänglich gemacht werden soll – entweder für Custom-CPUs oder als Bestandteil von Beschleunigern zur Anbindung an einen Host-Prozessor von NVIDIA. Eine von beiden Komponenten muss immer direkt von NVIDIA stammen. Zur Hot Chips im Sommer gab es einige technische Details:

NVLink Fusion wird in der Praxis folgendermaßen umgesetzt: Soll ein kundenspezifischer KI-Beschleuniger mit einer NVIDIA-CPU verbunden werden, kommt die Universal Chiplet Interconnect Express (UCIe) IP samt zugehörigem Interface zum Einsatz. Die Vera-CPU verfügt bereits über ein NVLink-C2C-Interface, das mit einem NVLink-Chiplet gekoppelt ist. Dieses Chiplet befindet sich zusammen mit dem KI-Beschleuniger auf einem gemeinsamen Package. Wird hingegen eine kundenspezifische CPU mit einem KI-Beschleuniger von NVIDIA kombiniert, nutzt das CPU-Design direkt die NVLink-C2C-IP. Sie stellt die physikalische Verbindung zwischen CPU und Beschleuniger her. Ein separates NVLink-Chiplet wird in diesem Fall nicht benötigt.

NVIDIA behält bei NVLink weiterhin eine gewisse Kontrolle und öffnet die Schnittstelle nicht in dem Maße, dass Konkurrenten wie AMD sie für Verbindungen zwischen eigenen Prozessoren und Beschleunigern nutzen könnten. Eine der beteiligten Hauptkomponenten muss stets von NVIDIA stammen.



Intel und NVIDIA sowie NVIDIA und das RIKEN haben bereits mehr oder weniger konkrete Produkte bzw. Entwicklungsrichtungen angekündigt, in denen NVLink Fusion zum Einsatz kommen soll.

ARM entwickelt sich im Rechenzentrum von einem reinen IP-Anbieter zu einem Partner, der Unternehmen bei der Umsetzung eigener Chiplösungen auf Basis des CSS-Programms unterstützt. Dadurch entsteht ein breites Ökosystem, das die Entwicklung neuer Prozessoren erleichtert. Im Rahmen dieser Strategie integriert Arm sein AMBA-CHI-C2C-Interface in NVLink Fusion, was vor allem für Hyperscaler interessant ist, die eigene Arm-Chips als CPUs für KI-Cluster mit NVIDIA-GPUs einsetzen wollen.

Parallel dazu standardisiert NVIDIA zentrale Komponenten seiner KI-Systeme, um Zuverlässigkeit und Betriebszeit zu erhöhen. Die kommende Vera-Generation soll dabei auf speziell angepasste ARM-Kerne anstelle der bisher genutzten Neoverse-V2-Architektur setzen.

Mehr Details zur Vera-CPU

Bisher bekannt ist nur, dass der Vera-Prozessor von NVIDIA über 88 CPU-Kerne verfügen wird. In der Präsentation auf der Supercomputing zeigte NVIDIA ein paar weitere Details. So soll die Vera-CPU um den Faktor zwei schneller als der Vorgänger Grace sein. Der LPDDR5X-Speicher kommt auf eine Speicherbandbreite von 1,2 TB/s. Je nach Speicherausstattung kommt die Grace-CPU auf 384 oder 512 GB/s. Demnach hat NVIDIA die Speicherbandbreite bei der Vera-CPU mehr als verdoppelt.

Verdoppeln wird sich auch die Bandbreite des NVLink-Interconnects. Dieser kommt bidirektional aktuell auf 900 GB/s und wird mit der Vera-Rubin-Generation auf 1.800 GB/s beschleunigt.