1. Hardwareluxx
  2. >
  3. News
  4. >
  5. Hardware
  6. >
  7. Grafikkarten
  8. >
  9. NVIDIA nennt MLPerf-Leistungsdaten für den A100-Beschleuniger

NVIDIA nennt MLPerf-Leistungsdaten für den A100-Beschleuniger

Veröffentlicht am: von

nvidia-a100In Zusammenarbeit mit MLPerf hat NVIDIA nun erste Leistungsdaten des A100-Beschleunigers auf Basis der Ampere-Architektur bzw. der GA100-GPU veröffentlicht. Vorgestellt hatte man diesen auf der GPU Technology Conference Mitte Mai. Neben der Datacenter- gibt es inzwischen auch eine PCI-Express-Variante.

MLPerf soll eine Vergleichbarkeit zwischen den verschiedenen Machine-Learning-Systemen ermöglichen, denn echte Benchmarks wie wir sie von unseren Tests kennen, gibt es nicht. Dies liegt vor allem daran, dass entsprechende Anwendungen an die Hard- und Software hochangepasst sind – dies macht eine Vergleichbarkeit nicht einfach.

Alle großen Chip-Hersteller arbeiten mit MLPerf zusammen. Auch die OEMs beteiligen sich daran. Ergebnisse können bei MLPerf nicht einfach nur eingereicht werden, sondern es gibt auch ein sogenanntes "Peer Review", bei dem mehrere Augen auf die Ergebnisse schauen und diese gegebenenfalls noch einmal testen, um sie zu belegen. Es gibt aber noch weitere Bedingungen, an die die Einreichung von Ergebnissen geknüpft ist. So muss es eine Möglichkeit geben, dass Kunden auf die Hardware Zugriff haben – sei es über Cloud-Instanzen oder aber man kann die Hardware direkt erwerben. Bei den A100-Beschleunigern gibt es sowohl die Möglichkeit die Hardware in der Cloud zu verwenden, die auch DGX-A100-Systeme zu erstehen.

MLPerf stellt in der Version 0.7 eine Reihe Benchmarks zusammen. Insgesamt vorhanden sind 16 Benchmarks – in allen sieht sich NVIDIA mit dem A100-Beschleuniger nun in führender Position. Die betrifft sowohl den Betrieb eines einzelnen A100-Beschleunigers, als auch hochskalierte Systeme wie den DGX SuperPOD. Es handelt sich dabei erst einmal nur im Trainings-Benchmarks, in denen Deep-Learning-Syteme trainiert werden. Der andere Bereich, das Inferencing, spielt für MLPerf 0.7 zunächst einmal keine Rolle.

Kommen wir nun zu den weiteren Systemen, die in den Vergleichen herangezogen werden. Dies wäre ein V100-Beschleuniger aus eigenem Hause, also der direkte Vorgänger, aber auch ein Huawei-Ascend-System sowie ein Google TPU der dritten Generation.

Die eigene V100-Lösung als Referenzwert genommen soll ein System mit A100-Beschleunigern um den Faktor 1,5 bis 2,5 schneller sein. Die Konkurrenzsysteme bewegen sich in einem ähnlichen Bereich wie die Vorgängerlösung V100 (Faktor 0,7 bzw. 1,2), werden aber alle vom A100-System überflügelt. Allerdings sei an dieser Stelle erwähnt, dass die Konkurrenzsysteme teilweise keine Ergebnisse eingereicht haben.

Auch einen Blick in die Zukunft wagt NVIDIA, da auch Preview-Daten einpflegt werden können. Hier bezieht man dann auch Intels Xeon-Prozessoren der 3. Generation alias Cooper Lake mit ein. Auch die 4. Generation der TPUs von Google werden projeziert und liegen je nach Benchmarks mal auf Niveau des A100-Systems, mal sind sie aber auch deutlich langsamer oder leicht schneller. In den Fußnoten wird erläutert, ob die Leistungsdaten auf einen Chip normalisiert wurden oder ob hier eine Skalierung auf 8, 32, 64 oder gar 512 Beschleuniger vorgenommen wurde.

Die Leistungswerte im Vergleich richtig einordnen zu können, ist nicht immer ganz einfach. Man muss sich schon sehr genau anschauen, welche Werte hier im Rahmen der Erhebung durch MLPerf miteinander verglichen werden. Zumindest mittels der Leistungsdaten der vorherigen MLPerf-Tests mit eigener Hardware kann NVIDIA für sich proklamieren, dass die Leistung in den vergangenen 18 Monaten um den Faktor vier gestiegen ist.

Werte zum Inferencing liefert MLPerf 0.7 nicht. Auch hier soll der A100-Beschleuniger von NVIDIA durch die Tensor Cores der 3. Generation besonders schnell sein. Die Structural Sparsity kann hier neben den reinen Leistungswerten durch eine entsprechende Optimierungen einen weiteren Leistungsschub bedeuten.

MLPerf will neuer Standard werden

Anhand der Lücken in den Diagrammen ist zu erkennen, dass es zunächst einmal noch etwas dauern wird, bis die Vergleichsbasis flächendeckend ist. MLPerf gibt in der Version 0.7 aber schon einmal die Richtung vor. Für den A100-Beschleuniger kann NVIDIA die Leistung der Systeme verdoppeln bis vervierfachen – je nach Anwendung. Der Vergleich zur Konkurrenz ist jedoch nicht immer ganz einfach, da hier eben noch die Daten fehlen.

Auf www.mlperf.org können aktuell die Ergebnisse der Version 0.6 eingesehen werden. In Kürze dürften auch die Zahlen aus 0.7 komplett veröffentlicht werden.

Welche ist die beste Grafikkarte (GPU)?

Unsere Kaufberatung zu den aktuellen NVIDIA- und AMD-Grafikkarten hilft dabei, die Übersicht nicht zu verlieren. Dort zeigen wir, welche Grafikkarten aktuell die beste Wahl darstellen – egal, ob es um die reine Leistungsfähigkeit oder das Preis-Leistungs-Verhältnis geht.


Social Links

Das könnte Sie auch interessieren:

  • Sapphire Nitro+ Radeon RX 5700 XT 8G im Test

    Logo von IMAGES/STORIES/2017/SAPPHIRE-NITRO-RADEONRX5700XT

    Der erste Schwung der Custom-Modelle für die Navi-Karten von AMD ist verfügbar. Aber noch längst nicht alle der wichtigsten Modelle haben wir uns angeschaut. Die Sapphire Nitro+ Radeon RX 5700 XT ist laut diverser Empfehlungen eine dieser Varianten, auf die man einen genauen Blick... [mehr]

  • NVIDIA dreht an der Ampere-Schraube: Die GeForce RTX 3080 Founders Edition im...

    Logo von IMAGES/STORIES/2017/GEFORCE-RTX-3080

    Heute ist es endlich soweit. Mit der GeForce RTX 3080 in der Founders Edition schauen wir uns die erste Karte der neuen Ampere-Generation an. Die wichtigsten Details zur Architektur haben wir bereits behandelt und in der vergangenen Woche konnten wir euch die ersten Fotos der GeForce RTX 3080... [mehr]

  • Bandbreiten-Test: Was der Umstieg auf PCIe 4.0 bringt

    Logo von IMAGES/STORIES/2017/AMD_RX5500XT_PCI3VS4-TEASER

    Gegenüber dem 3.0-Standard verdoppelt PCI Express 4.0 die maximal mögliche Bandbreite auf bis zu 32 GB/s. Aktuell kann der neue Standard jedoch nur in Verbindung mit einem Ryzen-Prozessor auf Zen-2-Basis sowie einer Navi-Grafikkarte und einem X570-Mainboard genutzt werden – wenn man von... [mehr]

  • Erstes Custom-Modell: Gigabyte GeForce RTX 3080 Eagle OC 10G im Test

    Logo von IMAGES/STORIES/2017/GIGABYTE-GEFORCE-RTX-3080-EAGLE-OC

    Nach dem gestrigen Test der GeForce RTX 3080 Founders Edition von NVIDIA können wir heute den ersten Test eines Custom-Modells präsentieren. Die GeForce RTX 3080 Eagle OC 10G von Gigabyte ist dabei eines von vier Modellen des taiwanesischen Herstellers und bewegt sich etwas unterhalb der... [mehr]

  • Verdammt leise unter Last: MSI GeForce RTX 3080 Gaming X Trio 10G im Test

    Logo von IMAGES/STORIES/2017/MSI-GEFORCE-RTX-3080-GAMING-TRIO

    Nach und nach erreichen uns weitere Partner-Karten der GeForce RTX 3080. Heute im Test sehen wir die MSI GeForce RTX 3080 Gaming X Trio 10G. Um sich von der Founders Edition abzusetzen, bleibt den Herstellern ein kleines Leistungsplus sowie eine effektivere Kühlung. Da aber auch NVIDIA hier... [mehr]

  • Endlich wieder ein Duell auf Augenhöhe: Radeon RX 6800 und Radeon RX 6800 XT...

    Logo von IMAGES/STORIES/2017/RADEON-6800

    Heute ist es endlich so weit! Die vor wenigen Wochen vorgestellte Radeon-RX-6800-Serie macht mit zwei Big-Navi-Modellen den Anfang. Wir schauen uns also die Referenzversionen der Radeon RX 6800 und Radeon RX 6800 XT an. Damit werden wir nach dem Test auch wissen, ob AMD die eigenen Versprechen... [mehr]