NEWS

OCP Summit

Epyc Venice bis 1.400 W und Packages zukünftig mit mehreren Kilowatt

Portrait des Authors


Epyc Venice bis 1.400 W und Packages zukünftig mit mehreren Kilowatt
0

Werbung

Anfang August hat in Taiwan die asiatische Ausgabe des OCP Summit stattgefunden. In gleich mehreren Präsentationen finden sich dabei einige interessante Annahmen und Projektionen, wie die Kühlung zukünftiger CPU- und GPU-Packages umgesetzt werden soll.

Während die Thermal Design Power (TDP) bei den Server-Prozessoren sowohl bei AMD, wie auch Intel, aktuell bei maximal etwa 500 W festgesetzt ist, dürfen sich die KI-Beschleuniger inzwischen bis zu 1.400 W (AMD Instinct MI355X und NVIDIA GB300 Grace Blackwell Ultra) genehmigen – Tendenz weiter steigend.

Die Server-Racks der KI-Systeme müssen mit immer höherer elektrischer Leistung versorgt und eine entsprechende Abwärme abgeführt werden. Klassische luftgekühlte Racks kommen auf etwa 55 kW und bewegen sich damit im Bereich dessen, was ein Standard-Rechenzentrum auch noch bewerkstelligen kann. Die NVL72-Systeme auf Basis von Blackwell und Blackwell Ultra kommen schon auf 132 kW je Rack. Mit Vera Rubin und den Kyper-Racks, der nächsten Generation der KI-Beschleuniger bei NVIDIA, sollen mehr als 300 kW je Rack erreicht werden, für Vera Rubin Ultra gar mehr als 600 kW.

Die Leistungsaufnahme der Packages steigt und wird in den kommenden Jahren ungeahnte Höheren erreichen, wie eine Projektion auf dem OCP zeigt. Mehr als 4 kW je GPU-Package sagt man hier im Jahre 2034 voraus. Neben den Herausforderungen für die Kühlung bedeutet dies auch, dass die Stromversorgung angepasst werden muss. NVIDIA sprach sich erst kürzlich für eine 800-V-Versorgung aus, die Querschnitte reduzieren und damit den Aufbau der Infrastruktur vereinfachen soll.

AMDs SP7 auf 700 bis 1.400 W ausgelegt

Während wir bei 4 kW je Package noch weit in die Zukunft blicken, wird AMD im kommenden Jahr den Sockel SP7 vorstellen, auf dem die nächsten Epyc-Prozessoren Venice mit Zen-6-Kernen zum Einsatz kommen. Eben zu diesem SP7 werden die Folien auf dem OCP schon deutlich konkreter.

Konkret gezeigt wird das Konzept für ein "kW-Level-Cooling", bei dem es zwei Kühlkreisläufe geben soll. Die Cold Plate nimmt die Abwärme direkt vom Package auf. Ein Reservoir puffert die Abwärme etwas ab. In einem Wärmetauscher gibt der primäre Kreislauf seine Abwärme an einen sekundären Kreislauf ab, der wiederum durch einen Chiller kühl gehalten wird. Somit wird die Temperatur des primären Kreislaufs und das Reservoir auf möglichst niedriger Temperatur gehalten.

Offenbar hat man das Konzept im Zusammenhang mit dem SP7 für eine Abwärme zwischen 700 und 1.400 W getestet. Ob wir nun aber auch im kommenden Jahr Epyc-Prozessoren mit 1.000 W und mehr sehen werden, ist fraglich. Mehr als 500 W sind aber mehr als wahrscheinlich.

Auf der einen Seite können die CPU-Hersteller den Leistungsaufnahme einzelner Kerne durch eine immer weiter verbesserte Fertigung immer weiter reduzieren, inzwischen sprechen wir aber auch von 256 oder 288 Kernen in einem Package. Das Verhältnis, in dem die Anzahl der Kerne gesteigert wird, übersteigt die Fortschritte in der Fertigung und somit steigt die Leistungsaufnahme der CPUs immer weiter.

Back to top