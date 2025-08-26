Werbung

Einiges ist zum GB10 Grace Blackwell Superchip von NVIDIA bereits bekannt. Der Chip soll im DGX Spark sogar ähnlichen Systemen der OEM-Partner zum Einsatz kommen und die Forschung und Entwicklung an lokalen KI-Modellen fördern. Bereits bekannt war der Einsatz einer CPU von MediaTek in Kombination mit der Blackwell-GPU von NVIDIA. Auf der Hot-Chips-Konferenz hat NVIDIA die Details aufgedeckt.

NVIDIA bezeichnet die beiden Komponenten als S-Dielet oder kurz S-Die (CPU, Memory Subsystem, etc.) und G-Dielet, kurz G-Die (Blackwell-GPU), die in einem Advanced 2.5D Packaging zusammengebracht werden. Beide Chips sollen bei TSMC in 3 nm gefertigt werden.

Die CPU bietet die bereits bekannten 20 Kerne auf Basis der ARM-9.2-ISA. Organisiert sind die Kerne in zwei Clustern mit jeweils zehn Kernen. Jedes Cluster verfügt über 16 MB an L3-Cache. Direkt an der CPU angebunden sind 128 GB an LPDDR5X-9400. Die Anbindung erfolgt über ein 256 Bit breites Speicherinterface und erreicht eine Speicherbandbreite von 301 GB/s. High-Speed I/O-Funktionen (HSIO) sitzen ebenfalls am CPU-Chip. Hier umgesetzt werden PCI-Express, USB und Ethernet über PCI-Express. Unterstützt wird ein PCI-Express 5.0, aber auch die Netzwerkkarte (ConnectX-7) ist über acht Lanes angebunden. Die Anbindung der NVMe-SSD findet ebenfalls über PCI-Express statt.

Über ein C2C-Interface, welches ebenfalls von NVIDIA bereitgestellt wird, ist die Blackwell-GPU angebunden. Diese erreicht laut NVIDIA eine Rechenleistung von 31 TFLOPS für FP32-Berechnungen und 1.000 AI-TOPS (NVFP4). Damit kommt die Blackwell-GPU im GB10 Grace Blackwell Superchip auf die gleiche Rechenleistung wie eine GeForce RTX 5070 auf Basis der GB205-GPU.

Im GPU-Chip vorhanden sind zudem ein L2-Cache mit 24 MB, der auch den CPU-Kernen als L4-Cache zur Verfügung steht und damit ein kohärenter Cache zwischen den beiden Komponenten ist. Das C2C-Interface zwischen den beiden Chips kommt laut NVIDIA auf eine Bandbreite von 600 GB/s.

Die Display-Engine sitzt im CPU-Chip und kann bis zu vier Displays ansteuern. Möglich wären viermal DisplayPort im Alt-Mode 4K @ 120 Hz, einmal HDMI 2.1a (FLR/12G + TDMS) in 8K @ 120Hz SDR/HDR.

Auf der Konferenz wurde eine Aufteilung der IP gezeigt, welche von NVIDIA und welche von MediaTek stammt. Zudem spricht NVIDIA von einer aufwändigen Modellierung des GPU-Speichers über das Speicher-Subsystem von MediaTek. Außerdem soll es große Abhängigkeiten in der Emulation der Hardware der beiden Anbieter sowie der Firmware und Software gegeben haben.

MediaTek und NVIDIA geben eine TDP von 140 W für den GB10 Grace Blackwell Superchip vor.

Eigentlich hätte der NVIDIA DGX Spark längst ausgeliefert werden sollen. Allerdings gab es Meldungen zu Problemen bei der Consumer-Variante N1X, die eng mit dem GB10 Grace Blackwell Superchip verwandt sein soll. Ob es hier allerdings einen direkten Zusammenhang gibt, wurde seitens NVIDIA nie bestätigt. Den DGX Spark bei NVIDIA zu reservieren führt aktuell zu einer Fehlermeldung. Offiziell ruft NVIDIA einen Preis von 3.999 US-Dollar aus.