1. Hardwareluxx
  2. >
  3. News
  4. >
  5. Hardware
  6. >
  7. Prozessoren
  8. >
  9. China hat das Rennen um den ersten ExaFLOPS-Supercomputer bereits gewonnen

China hat das Rennen um den ersten ExaFLOPS-Supercomputer bereits gewonnen

Veröffentlicht am: von

supercomputerDie Veröffentlichung der Top500-Liste hat es bereits offenbart: Offiziell hat noch kein Supercomputer die Schwelle von einem ExaFLOPS erreicht, aber der Elefant im Raum ist die Tatsache, dass China dies wohl bereits mit zwei Systemen gelungen ist, man sich hier nur bedeckt hält und es wohl auch keinen Grund gibt, ein solches Ergebnis offiziell zu machen.

Auf der Supercomputing 2021 wurden einige Vorträge zu den beiden Systemen gehalten, sodass sich daraus zumindest die wichtigsten technischen Details ableiten lassen. Darüber berichtet haben unter anderem die Kollegen von Golem. Das Ocean Light nutzt RISC-Designs, die vom Shanghai High Performance IC Design Center entwickelt wurden. Ohnehin setzte China für seine schnellsten Systeme bereits auf eigene Hardware – auch weil die USA einen Import bestimmter Technologien untersagt hat und China daher gezwungen wurde, sich hier eigenständig zu machen. Dies ist offenbar mehr als gut gelungen wie die Ergebnisse zeigen.

Die SW26010 Pro bezeichneten Chips besitzen 384 anstatt wie bisher 260 Kerne. Die Vektoreinheiten werden von 256 auf 512 Bit verbreitert und die Caches deutlich größer. Um die Kerne mit Daten versorgen zu können, steigt die Speicherbandbreite für den angebundenen DDR4 von 136 auf 307 GB/s. Die Kapazität pro Chip liegt bei 96 GB. Die im HPC-Bereich wichtige FP64-Rechenleistung steigt pro Chip von 3,1 auf 14 TFLOPS.

In 108.960 Nodes arbeiten schlussendlich rund 42 Millionen Kernen und sollen 1,05 ExaFLOPS im für die Top500-Liste relevanten Linpack schaffen. Damit läge man an der Spitze und hätte auch das erste ExaFLOPS-System.

Der Tianhe-3 ist das zweite System, welches die Schwelle von einem ExaFLOPS bereits gerissen hat. Über die verwendete Hardware ist hier etwas weniger bekannt. Vermutlich setzt man auf eigens entwickelte Arm-Prozessoren, die zusammen mit speziellen Matrix-Beschleunigern (Matrix-2000+) arbeiten. Theoretisch soll der Tianhe-3 auf 1,7 ExaFLOPS kommen, in einem Testdurchlaufen sollen bereits 1,3 ExaFLOPS erreicht worden sein.

Für China scheint es keine Anreize zu geben, sich an der Liste der Top500 zu beteiligen. Einerseits hat man nun auch über die eigene Zurückhaltung ausreichend Aufmerksamkeit erlangt, zum anderen kann man so auch im kommenden Jahr noch von einer eventuellen Spitzenposition wieder vertrieben werden, denn mit Frontier, Aurora und El Capitan haben die USA gleich drei Systeme in Aussicht, die womöglich schneller sein werden.