Rubin CPX - Hardwareluxx

Rubin CPX

GTC 2026: Groq LPU erhielt gegenüber Rubin CPX den Vorzug

Gemeinsam mit der Rubin-Plattform stellte NVIDIA auf der GTC 2026 die Groq 3 LPU 3 als zusätzlichen Beschleuniger vor, der dafür sorgen soll, dass auch bei großen Modellen und Kontextfenstern noch ein effizientes Inferencing möglich ist. Für die Rubin-Generation ist dies der LP30-Chip (Groq 3). Mit Rubin Ultra soll dann schon der auf NVFP4 optimierte LP35 folgen. Im vergangenen Jahr stellte NVIDIA mit dem Rubin CPX einen eigenen Beschleuniger... [mehr]

NVIDIA Rubin CPX: Größeres Kontext-Fenster für KI-Anwendungen der Zukunft

Mit dem Fortschritt von den ersten LLMs über feinabgestimmte Modelle (Fine-tuning), Mixture-of-Experts-Architekturen (MoEs) und den ersten Reasoning-Modellen hin zu leistungsfähigen KI-Agents werden Anfragen kontinuierlich komplexer. Die Aufgaben verlangen immer größere Kontextfenster, mehr Token und steigende Rechenleistung – wodurch der Energiebedarf der Systeme stetig wächst. Moderne KI-Modelle benötigen zunehmend längere Kontext-Fenster,... [mehr]