Microsoft entwickelt Supercomputer im eigenen Azure-Cloud-Netzwerk

Veröffentlicht am: von

microsoft 2Im Rahmen der aktuellen Build 2020 hat Microsoft Pläne für einen neuen Supercomputer vorgestellt. Es wird sich allerdings nicht um ein dediziertes System handeln, welches ausschließlich zu diesem Zweck eingesetzt wird, sondern um einen Teil der eigenen Azure-Cloudinfrastruktur.

Der neue Supercomputer soll auf massive AI-Modelle ausgelegt sein. Lange Zeit dachte man, viele kleine AI-Modelle könnten die Aufgaben besser und schneller erledigen. Für eine Bildersuche oder Übersetzungen trifft dies auch zu, allerdings hat sich inzwischen herausgestellt, dass solch singuläre Modelle eben nur für diesen einen Zweck gut einsetzbar sind. Untereinander verknüpfbar sind sie nicht. Große AI-Modelle können Zusammenhänge allerdings über verschiedene Aspekte hinweg besser erfassen, da sie über Querverweise verfügen.

Mit den Microsoft-Turing-Modellen geht Microsoft nun einen anderen Weg und arbeitet unter anderem mit OpenAI zusammen. Hinter OpenAI verbirgt sich ein Team, welches unter anderem schon künstliche Intelligenzen entwickelt hat, die in eSports-Titeln wie DOTA 2 besser als menschliche Spieler sind.

» zur Galerie

Um diese großen Modelle verarbeiten zu können, will Microsoft sich einen eigenen Supercomputer aufbauen. Da man bereits ein Netzwerk an Azure-Rechenzentren betreibt, fällt die Wahl natürlich nicht auf ein dediziertes System, sondern man will die Ressourcen aus der Azure-Cloudinfrastruktur nehmen. Dennoch wird es einen gewissen Anteil an dedizierter Hardware geben müssen, denn einen schnellen Interconnect wird man kaum zwischen zwei oder mehr Rechenzentren bewerkstelligen können, sondern nur innerhalb eines dieser Zentren.

Microsoft spricht von einem System bestehend aus  285.000 CPU-Kernen, 10.000 GPUs und einem Netzwerk mit einer Bandbreite von 400 GBit/s. Zum Vergleich: Die neue Nummer eins der Supercomputer, der Fugaku, der in Japan steht, kommt auf 7,36 Millionen CPU-Kerne, hat aber keine GPUs. Der Summit-Supercomputer verwendet 27.648 Tesla V100 auf Basis der Volta-Architektur. Insofern muss man die von Microsoft veröffentlichten Zahlen etwas relativieren. Der von Microsoft verwendete Supercomputer soll in den Top5 der schnellsten Supercomputer zu finden sein.

Welche Hardware Microsoft hier genau einsetzen wird, ist derzeit nicht bekannt. In der eigenen Azure-Cloudinfrastruktur setzt Microsoft unterschiedliche Intel- und AMD-Prozessoren ein. Auch bei den GPU-Beschleunigern gibt es unterschiedliche Instanzen.

Neben der Hardware gibt es noch eine Software-Ebene. Hier gibt es ebenfalls zahlreiche Neuigkeiten. Diese fasst Microsoft in einem Blogbeitrag zusammen.