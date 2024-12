Werbung

Stolz präsentierten xAI, NVIDIA und Supermicro im Sommer den KI-Supercomputer Colossus, der in 122 Tagen aufgebaut wurde und 100.000 H100-beschleuniger verwendet. Erst vor wenigen Tagen kündigte AWS in Zusammenarbeit mit Anthropic den Aufbau eines KI-Clusters mit 400.000 Trainium2-Chips an. Dem will xAI offenbar in nichts nachstehen und so arbeitet man seinerseits an einer Erweiterung von Colossus, wenngleich dies kein Geheimnis ist, denn bereits mit der Fertigstellung war die Rede davon, dass nun ebenso viele H200-Beschleuniger hinzukommen sollen.

Aber die Pläne von xAI sind offenbar noch viel größer. Laut eines Berichts der Financial Times hat die Erweiterung bereits begonnen. NVIDIA, Dell und Supermicro haben eigene Mitarbeiter und Arbeitsbereiche in und am Rechenzentrum bei Memphis, um den aktuellen Betrieb und die Erweiterung zu unterstützen. Die Rede ist hier von "xAI special operations teams".

Welcher Endausbau vorgesehen ist, ist nicht bekannt. Mehr als eine Million Beschleuniger scheinen aber geplant zu sein, so dass wir hier von zehnmal mehr Beschleunigern sprechen, als aktuell verbaut sind. Eines der größten Probleme dürfte die Stromversorgung sein. Um die etwa 155 MW an Leistungsaufnahme decken zu können, musste xAI riesige Generatoren mit jeweils 2,5 MW einsetzen, da der Netzanschluss des Gebäudes den Bedarf allein nicht decken konnte. Inzwischen stehen dort auch riesige Akkus, genauer mehrere Megapacks von Tesla. Mit einem Ausbau auf eine Million Beschleuniger wird auch der Stromverbrauch mitwachsen.

Große Rechenzentren in direkter Nähe zur Energieversorgung, bzw. Kraftwerken zu errichten, ist bei der enormen Leistungsaufnahme dieser ein neuer Trend. Amazon und Microsoft haben sich dazu bereits Kapazitäten bei Betreibern von Kernkraftwerken gekauft und diese sehen Flächen für Rechenzentren in direkter Nähe zu ihren Kraftwerken vor.

Der Ausbau von Colossus mit einer Million Beschleunigern dürfte die Leistungsaufnahme des Rechenzentrums dort auf 1.500 MW nach oben treiben. In diesem Bereich bewegt sich auch ein neues KI-Rechenzentrum, welches Meta gestern ankündigte. 10 Milliarden US-Dollar veranschlagt der Mutterkonzern von Facebook, Instagram und WhatsApp dafür.