Eines der größten operativen Probleme für NVIDIA oder besser der Kunden besteht darin, dass die neueste Hardware entweder nur schwer zu bekommen oder extrem teuer und auf Hyperscaler ausgerichtet ist – möglicherweise trifft auch beides zu. Gerade für den Einstieg in die Arbeit mit KI-Modellen, für kleine Unternehmen oder im Universitätsumfeld bzw. in der Forschung, stellen erschwingliche und dennoch leistungsstarke KI-Systeme aktuell einen großen Bedarf dar. Aber anstatt die aktuelle Blackwell-Architektur mit all ihren Vorteilen nutzen zu können, müssen solche Anwender meist ein bis drei Generationen zurückgehen und arbeiten eben mit H200-, H100- oder gar A100-Beschleunigern.

Dies sollen die kleinen KI-Systeme ändern und mit dem DGX Spark stellte NVIDIA schon mehrfach seine Umsetzung auf Basis des GB10 Grace Blackwell Superchips vor. Bisher ist abseits von 20 vorhandenen ARM-Kernen sowie eine per NVLink-2C2 angebundenen Blackwell-GPU wenig bekannt. 128 GB an Unified-Speicher sind noch eine Kernkomponente, damit möglichst große KI-Modelle auch schnell verarbeitet werden können. Immerhin gibt es seit der Computex eine Vermutung, in welche Richtung es bei der Ausbaustufe der GPU gehen könnte.

Aber nicht nur NVIDIA will ein solches System anbieten, sondern mit Gigabyte, Dell, Acer, MSI, ASUS, HP und Lenovo hat man entsprechende Partner gefunden, die ebenfalls ein Mini-System mit GB10-Chip auf den Markt bringen wollen. Auffällig dabei ist: Alle Systeme sehen in etwa gleich aus, haben ähnliche Abmessungen und bieten die gleichen Anschlüsse.

Dafür gibt es einen guten Grunde, denn allesamt verwenden sie das Referenzboard für den GB10 Grace Blackwell Superchip und auch dafür gibt es wiederum einen Grund:

Zur CES sagte NVIDIA CEO Jensen Huang, dass DGX Spark im ersten Quartal erhältlich sein werde. Auf der GTC im März hieß es dann, es sei in wenigen Wochen soweit. Auf der Computex haben wir mit einigen Herstellern eines solchen Systems gesprochen und von deren Seite ist nur noch von Sommer die Rede. Es gibt die finale Hardware einfach noch nicht und so nehmen alle Hersteller das Referenzboard – mitsamt GB10-Chip und der I/O-Konfiguration.

Dies sorgt natürlich auch für das Fehlen einer gewissen Differenzierung. Allesamt haben die Systeme viermal USBC-Typ-C, einmal HDMI, einmal Gigabit-Ethernet und zweimal 400-GBit/s-Ethernet. Die Abmessungen sind weitestgehend identisch, NVIDIA macht nur einige Vorgaben zur Kühlung.

Warum sich der GB10 Grace Blackwell Superchips derart verzögert hat, darüber kann nur spekuliert werden. Es gibt Gerüchte, die von einem Teildefekt einer Komponente sprechen, der wiederum dafür sorgt, dass der Chip nicht wie geplant in den Spark-Systemen eingesetzt werden kann. Ein Respin des Chips, als das Redesign, neuer Tape-Out, Validierung etc. kosten Monate und sorgen daher für Verzögerungen.

Mehr Freiheiten mit einer zweiten Generation

Und so warten die Hersteller sozusagen schon auf eine zweite Generation – auch wenn es die erste noch einmal zu kaufen gibt. Für eine zweite Generation geplant, ist eine größere Differenzierung zwischen den Systemen und die Hersteller können dann auch ihre Freiheiten nutzen, um beispielsweise bei den Anschlüssen etwas mehr Vielfalt anzubieten.

DGX Systeme mit GB300 Grace Blackwell Ultra

Ähnlich verhält es sich bei der DGX Station. Darin soll der NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip zum Einsatz kommen. Eine Grace-CPU und eine Blackwell-GPU teilen sich 784 GB an kohärentem Speicher. Alle auf der Computex gezeigten Systeme verwendeten das gleiche Board.