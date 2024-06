Werbung

Ein Update der Instinct 325X mit HBM3e ist aber nicht alles, was AMD auf der Computex im Hinblick auf die Datacenter-Produkte zu verkünden hat. Für das kommende Jahr gibt es eine Vorschau auf die nächste Generation der Instinct-Beschleuniger, die dann auf der CDNA-4-Architektur basieren werden.

Zunächst einmal aber wird es im vierten Quartal den Instinct MI325X geben, der auf HBM3e setzen wird. Der Beschleuniger bieten dementsprechend 288 GB an Speicherkapazität und 6 TB/s an Speicherbandbreite (ausgehend davon, dass die gleiche Anzahl an HBM3e-Chips an einem 8.192 Bit breiten Speicherinterface zum Einsatz kommt). Die Compute-Chiplets sind zum Instinct MI300X identisch und basieren noch auf der CDNA-3-Architektur.

Die CDNA-4-Architektur wird dann im kommenden Jahr folgen und konzentriert sich auf Datentypen wie FP4 und FP6. Als Fertigung will AMD auf einen nicht näher spezifizierten 3-nm-Prozess wechseln – vermutlich TSMC N3P. Dies wird aber nur für den Compute-Die gelten, wie AMD im Vorfeld erläuterte. In welcher Fertigung der darunterliegende I/O-Tile gefertigt wird, ist nicht bekannt.

AMD geht einen ähnlichen Weg wie NVIDIA. Man will seine KI-Beschleuniger auf einen jährlichen Zyklus bringen. Die Instinct 325X Ende diesen Jahres und die Instinct-MI350-Serie auf Basis von CDNA 4 im kommenden Jahr sollen ein Baustein dieser Strategie sein, die 2026 mit einer Instinct-MI400-Serie und der "CDNA Next"-Architektur fortgesetzt wird.

Auf Basis von eigenen Projektionen und denen von NVIDIA zum B200-Beschleuniger geht AMD davon aus, dass man die Inferencing-Leistung im hauseigenen Vergleich um den Faktor 35 steigern kann und auch gegen die Konkurrenz aus dem Hause NVIDIA gut aufgestellt ist.

AMD wird diese Zahlen aber einmal mehr auch durch bessere Verkaufszahlen und eine größere Marktrelevanz belegen müssen. Für die Instinct-MI300-Serie tut man sich noch etwas schwer, unabhängige Benchmarks gibt es kaum und zum Start lieferten sich AMD und NVIDIA eine Benchmark-Schlacht inklusive der Diskussionen über die Deutungshoheit optimierter Software.