Werbung
Gemeinsam mit der Rubin-Plattform stellte NVIDIA auf der GTC 2026 die Groq 3 LPU 3 als zusätzlichen Beschleuniger vor, der dafür sorgen soll, dass auch bei großen Modellen und Kontextfenstern noch ein effizientes Inferencing möglich ist. Für die Rubin-Generation ist dies der LP30-Chip (Groq 3). Mit Rubin Ultra soll dann schon der auf NVFP4 optimierte LP35 folgen.
Im vergangenen Jahr stellte NVIDIA mit dem Rubin CPX einen eigenen Beschleuniger vor, der einen ähnlichen Zweck erfüllen sollte. Rubin CPX bestand aus einer Rubin-GPU mit GDDR7-Speicherinterface. 128 GB des schnellen Grafikspeichers sollten hier verbaut sein.
Aber auf der diesjährigen GTC war von Rubin CPX nun nichts mehr zu hören. Ist Rubin CPX damit eingestellt worden, bevor der Zusatzbeschleuniger überhaupt angekommen ist?
In mehreren Fragerunden und Gesprächen wurde NVIDIA darauf angesprochen, wie NVIDIA mit dem Rubin CPX weiter fortfahren will. Laut CRN hat NVIDIA den Fokus von Rubin CPX auf die Groq 3 LPU verschoben. Ian Buck, Vizepräsident für Hyperscale und High Performance Computing bei NVIDIA, bestätigte einigen Reportern gegenüber, dass Rubin CPX nicht eingestellt sei. Stattdessen sei vorgesehen, dass eine solche Lösung mit der Feynman-Generation wieder ein Thema werden würde. Ob dann noch als Rubin CPX oder als Feynman CPX, geht aus dem Bericht nicht hervor.
Allerdings sieht NVIDIA mit der Feynman-Generation bereits einen LP40-Chip vor. Dabei handelt es sich um eine weitere Groq-Generation mit NVLink-Integration.