NEWS

Advancing AI 2025

AMD nennt erste Details zum Instinct-MI400-Beschleuniger

Portrait des Authors


AMD nennt erste Details zum Instinct-MI400-Beschleuniger
0

Werbung

Neben der Vorstellung der Instinct-MI350-Familie auf Basis der CDNA-4-Architektur gab AMD auf den "Advancing AI 2025"-Event einen Ausblick auf das, was danach kommen soll. Dabei hält AMD an der Kadenz von etwa zwölf Monaten für immer neue Instinct-Generationen fest, denn schon 2026 sollen die Instinct-MI400-Beschleuniger auf den Markt kommen.

Bisher kann AMD seine Beschleuniger nur in Gruppen von bis zu acht GPUs über Infinity Fabric miteinander verbinden; darüber hinaus war eine Kommunikation nur über Ethernet möglich. Der zunehmende Trend zu vollständigen Racklösungen hat AMD dazu bewegt, ZT Systems zu übernehmen. Erste Ergebnisse dieser Strategie sollen sich ab dem Instinct-MI400-Beschleuniger zeigen, der als direkte Antwort auf NVIDIAs VR200 NVL144 positioniert ist.

AMD machte für die Instinct-MI400-Serie nun folgende Angaben:

So soll die nächste Beschleuniger-Generation auf HBM4 setzen und eine Kapazität von 432 GB erreichen. Bei einer Kapazität von vermutlich 36 GB je HBM4-Stack werden für die Instinct-MI400-Beschleuniger demnach zwölf HBM4-Stacks zum Einsatz kommen. Diese erreichen eine Speicherbandbreite von 19,6 TB/s. Demnach werden die ersten HBM4-Stacks nicht ganz die 2 TB/s pro Stack erreichen können und landen eher bei 1,6 TB/s.

Die FP8/FP4-Rechenleistung der Instinct-MI400-Beschleuniger gibt AMD mit 20, bzw. 40 PFLOPS an. Der Instinct-MI355X-Beschleuniger kommt hier auf 5, bzw. 10 PFLOPS ohne Sparsity und mit auf 10, bzw. 20 PFLOPS. Wir gehen daher davon aus, dass die nächste Generation die Rechenleistung in diesem Bereich noch einmal verdoppelt.

Zudem scheint sich die Bandbreite des Infinity Fabrik noch einmal zu verdoppeln, denn AMD gibt eine "Scale out"-Bandbreite von 300 GB/s an, während es für die Instinct-MI350-Beschleuniger aktuell 153,6 GB/s für einen Infinity-Fabric-Link sind.

Racklösungen im Blick

Im kommenden Jahr sollen die Instinct-MI400-Beschleuniger ausgeliefert werden und dabei setzt AMD verstärkt auf komplette Racklösungen.

Gezeigt wurde unter anderem eine komplette KI-Infrastruktur-Lösung namens "Helios", die AMDs kommende EPYC-Generation Venice zusammen mit den Beschleunigern der Instinct-MI400-Serie einsetzen soll. Hinzu kommen die Netzwerklösungen der nächsten Generation.

Dabei wagt AMD zumindest schon einmal eine Projektion, bzw. einen Vergleich mit Vera Rubin von NVIDIA. 72 GPUs befinden sich in der Helios-Racklösung und AMD geht davon aus, dass man in Sachen Rechenleistung ebenbürtig sein wird. Da NVIDIA bereits angekündigt hat, dass die Vera-Rubin-Beschleuniger 288 GB an HBM4 verwenden werden, sieht sich AMD mit den 432 GB, die zudem schneller sind, besser aufgestellt. Der von AMD herangezogene Vergleich bezieht sich auf die bisher von NVIDIA veröffentlichten Details zu Vera Rubin.

Wie genau AMD die 72 GPUs miteinander verbindet und ob 300 GB/s Scale-Out-Bandbreite hier ausreichend sind, ist die entscheidende Frage. Gerüchte sprechen schon von einem Rack-System namens MI450X IF128, welches in der zweiten Jahreshälfte 2026 erscheinen soll. Die Bezeichnung "IF128" verweist auf den Einsatz von Infinity Fabric und gibt die Anzahl der direkt verbundenen GPUs an. Dabei erreicht der Infinity-Fabric-Interconnect eine bidirektionale Bandbreite von 1,8 TB/s. Das Konkurrenzmodell VR200 NVL144 verknüpft 72 GPUs miteinander, wobei jeweils zwei Rubin-GPUs in einem Package stecken.

Laut SemiAnalysis wird AMD innerhalb der Racklösung verschiedene Varianten anbieten, bei denen pro GPU eine unterschiedliche Anzahl an Pensando 800GbE-Netzwerkkarten zum Einsatz kommt. Abhängig von der gewählten Konfiguration lassen sich so die vollen 1,8 TB/s Bandbreite zwischen den GPUs realisieren.

Neben der vollen Ausbaustufe von MI450X IF128 mit 128 GPUs wird AMD laut SemiAnalysis eine Single-Rack-Variante alias MI450X IF64 mit 64 GPUs anbieten. Innerhalb eines Racks und in der IF128-Konfiguration über zwei Racks nutzt AMD eine Flat-Copper-Technologie mit passiven Komponenten.

AMD EPYC Verano

Wenngleich sicherlich noch etwas früh wirft AMD sogar noch einen Blick über das Jahr 2026 hinaus und will 2027 dann mit der jährlichen Kadenz fortfahren. Die Instinct-MI500-Serie soll dann mit den EPYC-Prozessoren mit dem Codenamen Verano kombiniert werden.

Quellen und weitere Links KOMMENTARE (0) VGWort
Back to top