1. Hardwareluxx
  2. >
  3. News
  4. >
  5. Hardware
  6. >
  7. Prozessoren
  8. >
  9. Cerebras CS-1: AI-Riesenchip in 15U mit aufwändiger Kühlung

Cerebras CS-1: AI-Riesenchip in 15U mit aufwändiger Kühlung

Veröffentlicht am: von

cerebras-wseNach der Ankündigung des gigantischen Chips im Sommer und dem Blick auf die Herausforderungen in der Fertigung hat Cerebras nun ein erstes konkretes System vorgestellt, welches die Wafer Scale Engine (WSE) verwendet. 46.225 mm², 1,2 Billionen Transistoren, über 400.000 AI-Kerne und 18 GB an SRAM auf einem Chip machen die Dimensionen deutlich.

Das CS-1 getaufte System hat eine Höhe von 15U. Es belegt damit etwa ein Drittel eines standardmäßigen Datacenter-Racks. Die Außenanbindung findet über 12x 100 Gigabit-Ethernet-Schnittstellen (100GBase-SR4) statt. Ein solches CS-1-System beherberg dabei nur eine einzige WSE. Das Gesamtgewicht des Systems beträgt 254 kg. 

Gekühlt wird der WSE durch eine interne Wasserkühlung. Nach außen geführt wird das Warmwasser also nicht. Rund ein Achtel des gesamten Bauvolumens ist für zwei Pumpen vorgesehen. Diese arbeiten redundant und können im laufenden Betrieb gewechselt werden. Welches Wasservolumen diese Pumpen befördern können, ist nicht bekannt. Das warme Wasser wird in einen großen Radiator geführt, welcher sich im hinteren Bereich des Systems befindet. Vorne sind vier große Lüfter verbaut. Diese können ebenfalls im laufenden Betrieb getauscht bzw. herausgenommen werden, um beispielsweise die Lüfter zu tauschen oder zu reinigen. Jeweils drei Lüfter müssen immer im System verbleiben, einer kann demnach ausgetauscht werden. Die vier Lüfter fördern 0,95 m3/s.

Der obere Bereich des CS-1 dient der Stromversorgung sowie der Ein- und Anbindung der eigentlichen Hardware – dem WSE. Ganz oben sind die zwölf 100-Gigabit-Ethernet-Schnittstellen zu erkennen. Darunter sind 6+6 Netzteile verbaut, die ebenfalls in einer redundanten Form vorliegen und demnach im laufenden Betrieb getauscht werden können. Die Leistungsaufnahme soll bei etwa 20 kW liegen.

Eine NVIDIA DGX-2 kommt auf 10U und besitzt 16 Tesla V100, die per NVLink miteinander verbunden sind. Ein solches System hat eine Leistungsaufnahme von 10 kW und wird ebenfalls intern, also ohne einen externen Wärmetauscher gekühlt. 10 oder 13 kW sind auf 10 oder gar 15U also keine Besonderheit und dennoch ist die Kühlung des CS-1 besonders aufwändig, weil sich die Abwärme fast ausschließlich auf die WSE beschränkt und damit extrem konzentriert ist.

Die Magie findet dann im hinteren, oberen Bereich im Engine Block statt. Die Stromversorgung und Kühlung bzw. das kühle Wasser werden hier zusammengeführt. Mehr als die Hälfte des Engine Blocks dient der Stromversorgung bzw. der Zuführung der Versorgung zum PCB der WSE. Diese sitzt in einem passiven Block aus Aluminium, durch den das Kühlwasser geleitet wird. Die sechs Schnellanschlüsse der Wasserkühlung dienen jeweils zweimal den Pumpen und einmal dem Radiator.

Ein CS-1-System als solches ist bereits ein beeindruckendes Stück Hardware – nicht nur weil hier ein riesiger Chip verbaut ist, sondern auch weil der Aufwand der Kühlung und die Stromversorgung enorm sind. Nun bietet ein solches System bereits eine herausragende Leistung – zumindest auf dem Papier. Es besteht außerdem die Möglichkeit, mehrere der CS-1-Systeme in einem Cluster zusammenzuführen. Die dazu notwendige Anbindung für einen Interconnect ist bereits vorhanden.

Nun muss Cerebras noch an der Software arbeiten, um die Sparse Linear Algebra Compute (SLAC) Cores vollständig nutzen zu können. ML-Frameworks wie TensorFlow und PyTorch werden bereits unterstützt. Es gibt auch bereits einen Cerebras Graph Compiler (CGC), um benutzerspezifische Daten auf ein ML-Netzwerk zu überführen. Die Software soll neben der extremen Bandbreite des Interconnects dafür sorgen, dass die Auslastung der Hardware extrem hoch ist und die Rechenleistung dementsprechend ihr Maximum erreicht.

Hinsichtlich der Rechenleistung soll ein CS-1-System in etwa die gleiche AI-Leistung (vermutlich INT8 oder geringer) wie 1.000 NVIDIA Tesla V100 besitzen. Gegenüber einem TPU 2 Pod soll ein einzelnes System in etwa die dreifache Rechenleistung besitzen. Nun gilt es diese Zahlen durch externe Institutionen zu bestätigen. Das Argonne National Laboratory ist eines der ersten Institute, welches ein CS-1 testen wird.

Unbekannt ist der Preis eines CS-1 mit dem WSE-Chip. Ein NVIDIA DGX-2 kostet etwa 400.000 US-Dollar. Erste Informationen zum WSE gab es zur Hotchips im Sommer. Erst kürzlich haben wir die Hürden in einer Fertigung eines solches Chips genauer beleuchtet.

Welche ist die beste CPU?

Unsere Kaufberatung zu den aktuellen Intel- und AMD-Prozessoren hilft dabei, die Übersicht nicht zu verlieren. Dort zeigen wir, welche Prozessoren aktuell die beste Wahl darstellen - egal, ob es um die reine Leistungsfähigkeit oder das Preis-Leistungs-Verhältnis geht.


Social Links

Das könnte Sie auch interessieren:

  • AMD Ryzen 5 3600 im Test: Ohne X noch viel besser

    Logo von IMAGES/STORIES/2017/AMD_RYZEN_5_3600_TEST-TEST

    Gegenüber dem AMD Ryzen 5 3600X aus unserem letzten Test, der trotz seiner Einstufung in die Mittelklasse ältere Topmodelle schlägt, ist der AMD Ryzen 3600 ohne das X-Kürzel nur 200 bis 300 MHz niedriger getaktet und mit einer TDP von 65 W sparsamer klassifiziert, was einen... [mehr]

  • AMD Ryzen 5 3600X im Test: 265-Euro-CPU schlägt ältere Flaggschiff-Modelle

    Logo von IMAGES/STORIES/2017/RYZEN_5_3600X_REVIEW-TEASER

    Mit dem Ryzen 9 3900X und dem Ryzen 7 3700X ist AMD seinem Konkurrenten wieder mächtig auf die Pelle gerückt und macht ihm selbst im High-End-Bereich mit einer hohen Anwendungs- und Spiele-Leistung zu einem deutlich günstigeren Preis das Leben schwer. Doch auch in den unteren Preis- und... [mehr]

  • AMD Ryzen 5 3400G im Test: Weniger Änderungen als erwartet

    Logo von IMAGES/STORIES/2017/AMD_RYZEN_5_3400G-TEASER

    Im letzten Jahr erwiesen sich die Raven-Ridge-APUs als gute Alternative, wenn man sich einen sparsamen und günstigen Office-Rechner zusammenbauen wollte. Die Kombination aus Zen-Prozessor und Vega-Grafiklösung erwies sich als durchaus leistungsfähig für den Alltag. Ob dies auch für die... [mehr]

  • AMD Ryzen 7 3800X im Test: Ein hungriger Lückenfüller

    Logo von IMAGES/STORIES/2017/AMDRYZEN93900X

    Kurz vor dem Start des lange ersehnten AMD Ryzen 9 3950X und der kommenden Threadripper-Modelle schließen wir eine weitere Lücke in unserer Testdatenbank und stellen den AMD Ryzen 7 3800X auf den Prüfstand, der über acht Kerne verfügt, gegenüber seinem kleinen Schwestermodell jedoch in einer... [mehr]

  • In Spielen König, sonst eher ein kleiner Prinz: Intel Core i5-10600K und Core...

    Logo von IMAGES/STORIES/2017/INTEL-CML-S

    Heute ist es soweit und wir dürfen die ersten Leistungsdaten des Core i5-10600K und des Core i9-10900K präsentieren. Damit öffnet Intel seine Comet-Lake-Prozessoren für den Markt, denn ab heute sind die ersten Modelle im Handel verfügbar. Die Kernkompetenzen der neuen Prozessoren liegen vor... [mehr]

  • AMD hängt Intel weiter ab: Der Ryzen 9 3950X im Test

    Logo von IMAGES/STORIES/2017/RYZEN-3950X

    Besser spät als nie – so ließe sich das Timing für unseren Test des Ryzen 9 3950X wohl am besten zusammenfassen. Zum Ursprünglichen Termin der Tests konnte uns AMD kein Sample zur Verfügung stellen und so mussten wir uns etwas gedulden, bis auch wir den 16-Kerner testen konnten. Der... [mehr]