Rubin CPX
  • GTC 2026: Groq LPU erhielt gegenüber Rubin CPX den Vorzug

    Gemeinsam mit der Rubin-Plattform stellte NVIDIA auf der GTC 2026 die Groq 3 LPU 3 als zusätzlichen Beschleuniger vor, der dafür sorgen soll, dass auch bei großen Modellen und Kontextfenstern noch ein effizientes Inferencing möglich ist. Für die Rubin-Generation ist dies der LP30-Chip (Groq 3). Mit Rubin Ultra soll dann schon der auf NVFP4 optimierte LP35 folgen. Im vergangenen Jahr stellte NVIDIA mit dem Rubin CPX einen eigenen Beschleuniger... [mehr]


  • NVIDIA Rubin CPX: Größeres Kontext-Fenster für KI-Anwendungen der Zukunft

    Mit dem Fortschritt von den ersten LLMs über feinabgestimmte Modelle (Fine-tuning), Mixture-of-Experts-Architekturen (MoEs) und den ersten Reasoning-Modellen hin zu leistungsfähigen KI-Agents werden Anfragen kontinuierlich komplexer. Die Aufgaben verlangen immer größere Kontextfenster, mehr Token und steigende Rechenleistung – wodurch der Energiebedarf der Systeme stetig wächst. Moderne KI-Modelle benötigen zunehmend längere Kontext-Fenster,... [mehr]


Back to top