1. Hardwareluxx
  2. >
  3. News
  4. >
  5. Hardware
  6. >
  7. Grafikkarten
  8. >
  9. Ampere-Architektur Deep-Dive: GA100 ohne RT-Kerne und Details zum neuen NVSwitch

Ampere-Architektur Deep-Dive: GA100 ohne RT-Kerne und Details zum neuen NVSwitch

Veröffentlicht am: von

nvidia-a100In einem sogenannten Deep Dive hat Jonah Alben, Senior Vice President des GPU-Engineering bei NVIDIA einige weitere Fragen und Details zur Ampere-Architektur beantwortet. Alle wichtigen Details zur Ampere-Architektur haben wir uns bereits angeschaut. Darüber hinaus haben wir uns bereits in einer Analyse damit beschäftigt, wie viel GeForce in der GA100-GPU steckt.

Wer sich neue Erkenntnisse zu einer möglichen nächsten Generation der GeForce-Karten erwartete, wird allerdings enttäuscht sein, denn NVIDIA spricht aktuell ausschließlich über die A100 Tensor Core GPU bzw. die GA100-GPU in der Ausführung, wie sie für A100 zum Einsatz kommt.

Zunächst einmal bleibt festzuhalten, dass sich die Ampere- und Volta-Architektur ähnlicher sind, als dies auf den ersten Blick den Eindruck macht. So verzichtet auch die GA100-GPU auf die RT Cores, kann also keine Hardwarebeschleunigung für Raytracing-Berechnungen bieten. Zudem bestätigte Alben, dass insgesamt 48 MB an L2-Cache vorhanden sind, aber nur 40 MB angesprochen werden – analog zur Nutzung von nur 108 der 128 für den Vollausbau vorgesehenen SMs. In der Topologie sieht NVIDIA acht sogenannte Slices mit jeweils 512 kB pro Speichercontroller vor. 8 x 512 kB x 12 Speichercontroller entspricht 49.152 kB und demzufolge 48 MB an L2 Cache insgesamt.

Dies führt uns zum Speicher. NVIDIA verwendet für die A100 Tensor Core GPU 40 GB an HBM2 – 5x 8 GB. Das eigentlich 6.144 Bit breite Speicherinterface ist aufgrund der Nutzung von nur fünf der sechs Speicherstacks nur 5.120 Bit breit. Beim sechsten Speicherstack handelt es sich nicht um einen Dummy, sondern einen funktionstüchtigen Speicherchip, der allerdings einfach nicht genutzt wird.

Zusammengenommen lässt NVIDIA hier einen Großteil der zur Verfügung stehenden Ressourcen brach liegen. Dies wird man allerdings nicht ohne Grund tun, denn die Ausbeute in der Fertigung wird einfach nicht gut genug sein, um eine höhere Ausbaustufe als 108 SMs gewährleisten zu können. 

Um die Thermal Design Power bei 400 W einhalten zu können beschränkt NVIDIA den GPU-Takt bei gegebener Rechenleistung auf 1.410 MHz. Dies kann aber ebenfalls nicht als Indikator für einen GeForce-Ableger der Ampere-Architektur herhalten, da wir hier bereits in der Chipgröße ganz andere Voraussetzungen sehen werden.

Bis auf weiteres wird es keine PCI-Express-Variante der A100 Tensor Core GPU gehen. NVIDIA liefert nur die HGX A100 bestehend aus vier direkt per NVLink miteinander verbundenen SMX4-Modulen sowie die DGX-Varianten mit acht oder 16 SMX4-Modulen, die dann den NVSwitch der dritten Generation verwenden.

NVSwitch 2.0: 6 Milliarden Transistoren in 7FF gefertigt

Eine große Bedeutung in der Infrastruktur der A100 Tensor Core GPUs kommt NVLink und den neuen NVSwitches zu. Direkt miteinander verbunden erreichen die A100-Beschleuniger eine NVLink-Datenrate von 100 GB/s zueinander. Bei mehr als vier GPUs kommen die neuen NVSwitches zum Einsatz.

Diese werden bei TSMC in 7FF gefertigt und besitzen 6 Milliarden Transistoren. Die ersten NVSwitches wurden noch in 12 nm gefertigt und kommen auf zwei Milliarden Transistoren. Die Komplexität ist also um den Faktor drei angestiegen. Jeder der NVSwitches verfügt über 36 NVLink-Ports mit einer bidirektionalen Datenrate von 25 GB/s pro Port.

Jeder der NVSwitches bietet in den A100-Systemen eine GPU-GPU-Bandbreite von 600 GB/s. Dies bedeutet eine Verdopplung der Bandbreite gegenüber den Tesla V100. Die 600 GB/s pro GPU werden über 12 NVLink-Ports realisiert.

Welche ist die beste Grafikkarte (GPU)?

Unsere Kaufberatung zu den aktuellen NVIDIA- und AMD-Grafikkarten hilft dabei, die Übersicht nicht zu verlieren. Dort zeigen wir, welche Grafikkarten aktuell die beste Wahl darstellen – egal, ob es um die reine Leistungsfähigkeit oder das Preis-Leistungs-Verhältnis geht.


Social Links

Das könnte Sie auch interessieren:

  • Sapphire Nitro+ Radeon RX 5700 XT 8G im Test

    Logo von IMAGES/STORIES/2017/SAPPHIRE-NITRO-RADEONRX5700XT

    Der erste Schwung der Custom-Modelle für die Navi-Karten von AMD ist verfügbar. Aber noch längst nicht alle der wichtigsten Modelle haben wir uns angeschaut. Die Sapphire Nitro+ Radeon RX 5700 XT ist laut diverser Empfehlungen eine dieser Varianten, auf die man einen genauen Blick... [mehr]

  • NVIDIA dreht an der Ampere-Schraube: Die GeForce RTX 3080 Founders Edition im...

    Logo von IMAGES/STORIES/2017/GEFORCE-RTX-3080

    Heute ist es endlich soweit. Mit der GeForce RTX 3080 in der Founders Edition schauen wir uns die erste Karte der neuen Ampere-Generation an. Die wichtigsten Details zur Architektur haben wir bereits behandelt und in der vergangenen Woche konnten wir euch die ersten Fotos der GeForce RTX 3080... [mehr]

  • Bandbreiten-Test: Was der Umstieg auf PCIe 4.0 bringt

    Logo von IMAGES/STORIES/2017/AMD_RX5500XT_PCI3VS4-TEASER

    Gegenüber dem 3.0-Standard verdoppelt PCI Express 4.0 die maximal mögliche Bandbreite auf bis zu 32 GB/s. Aktuell kann der neue Standard jedoch nur in Verbindung mit einem Ryzen-Prozessor auf Zen-2-Basis sowie einer Navi-Grafikkarte und einem X570-Mainboard genutzt werden – wenn man von... [mehr]

  • Erstes Custom-Modell: Gigabyte GeForce RTX 3080 Eagle OC 10G im Test

    Logo von IMAGES/STORIES/2017/GIGABYTE-GEFORCE-RTX-3080-EAGLE-OC

    Nach dem gestrigen Test der GeForce RTX 3080 Founders Edition von NVIDIA können wir heute den ersten Test eines Custom-Modells präsentieren. Die GeForce RTX 3080 Eagle OC 10G von Gigabyte ist dabei eines von vier Modellen des taiwanesischen Herstellers und bewegt sich etwas unterhalb der... [mehr]

  • Verdammt leise unter Last: MSI GeForce RTX 3080 Gaming X Trio 10G im Test

    Logo von IMAGES/STORIES/2017/MSI-GEFORCE-RTX-3080-GAMING-TRIO

    Nach und nach erreichen uns weitere Partner-Karten der GeForce RTX 3080. Heute im Test sehen wir die MSI GeForce RTX 3080 Gaming X Trio 10G. Um sich von der Founders Edition abzusetzen, bleibt den Herstellern ein kleines Leistungsplus sowie eine effektivere Kühlung. Da aber auch NVIDIA hier... [mehr]

  • Ein fast perfekter Allrounder: ASUS TUF Gaming GeForce RTX 3080 OC im Test

    Logo von IMAGES/STORIES/2017/ASUS-TUF-RTX-3080

    Eigentlich sollte uns die ASUS TUF Gaming GeForce RTX 3080 OC schon deutlich früher erreichen, aber aus verschiedenen Gründen hat sie es zum Start nicht zu uns geschafft. Es deutet sich inzwischen an, dass dieses Modell mit zu den besten gehören könnte, welches neben den... [mehr]