Seite 2: Die Vega-20-GPU im Detail

Auch wenn es auf den ersten Blick keine großen Änderungen zur Vega-GPU der Radeon-RX-Generation gibt, wollen wir über die Änderungen der Vega-20-GPU auf der Radeon VII sprechen.

Die Überschrift einer der Präsentationsfolien zur Radeon VII beschreibt die Situation rund um die Vega-20-GPU ganz gut. Wir sprechen also weiterhin über die Vega-Architektur, aber mit dem Zusatz "Supercharged", was so viel wie "aufgeladen" bedeutet. Bei der zweifachen Neuauflage der Polaris-Architektur verwendete AMD noch Begriffe wie "Refined", was man "veredelt" oder "verfeinert" übersetzen kann. Es gibt im Vergleich zum Polaris-Shrink aber Änderungen zwischen der Vega-10- und Vega-20-GPU.

Durch die Fertigung in 7 nm schrumpft die Vega-GPU von 484 mm² auf 331 mm². Dies entspricht einer um 46 % kleineren Chipfläche. Zugleich bringt AMD aber ein paar Millionen zusätzliche Transistoren darin unter. Deren Anzahl steigt von 12,5 auf 13,28 Milliarden an. Wo diese verwendet werden, schlüsselt AMD nicht auf. Allerdings gibt es zusätzliche FP64-Recheneinheiten, die auch mit INT8- und INT4-Daten umgehen können.

In der Vega-20-GPU der Radeon VII sind aber nicht alle FP64-Recheneinheiten aktiv. Dies bleibt der Radeon Instinct MI60 und MI50 vorbehalten, die im Datacenter zum Einsatz kommen. Das Verhältnis der Rechenleistung liegt bei diesen beiden Karten bei 1:2. Laut AMD liegt das Verhältnis der Rechenleistung bei der Radeon VII bei 1:4, bei der Radeon-RX-Generation liegt sie bei 1:16.

Rechenleistung der Radeon VII

Radeon VIIRadeon RX Vega 64Radeon Instinct MI60
FP64 3,46 TFLOPS0,84 TFLOPS7,4 TFLOPS
FP32 13,8 TFLOPS13,4 TFLOPS14,7 TFLOPS
FP16 27,7 TFLOPS26,7 TFLOPS29,5 TFLOPS
INT8 55,3 TOPS53,4 TOPS59 TOPS
INT4 110,7 TOPS106,8 TOPS118 TOPS

Nichts getan hat sich am grundsätzlichen Aufbau einer GPU auf Basis der Vega-Architektur. Die Vega-20-GPU bietet bis zu 64 Next Generation Compute Units, die allerdings bisher nur auf der Radeon Instinct MI60 allesamt aktiv sind. Bei der Radeon VII sind nur 60 der Next-Gen-CUs aktiv. Pro CU vorhanden sind 64 Shadereinheiten, was für die Radeon VII 3.840 Shadereinheiten insgesamt bedeutet. Hinzu kommen 240 Textureinheiten und weiterhin 64 Render Backends.

Neben dem schon erwähnten vier HBM2-Speicherstacks mit jeweils 4 GB verbaut AMD auf der Vega-20-GPU auch noch über die Chip verteilte 45 MB an SRAM und einen L2-Cache mit 4 MB.

Wir haben sowohl ein Package der Vega-20-GPU (links) als auch eines der Vega-10-GPU (rechts) und hier wird der unterschiedliche Aufbau auch noch einmal deutlich. Der große GPU-Die schrumpft deutlich und macht damit Platz für zwei weitere HBM2-Speicherstacks.

Neue interne Temperatursensoren

Bislang setzen die meisten Chiphersteller auf eine oder mehrere "einfache" thermische Sensoren. Deren Werte werden dann dazu verwendet, um Informationen für den Boost-Mechanismus oder die Lüftersteuerung zu liefern. Die Vega-20-GPU besitzt nun ein ganzes Netzwerk an Temperatursensoren. Insgesamt 64 Sensoren befinden sich in allen Bereichen des Chips. Bei der Vega-10-GPU waren es bereits 32 Sensoren.

Die Ausgaben der 64 Temperatur-Dioden werden als Junction Temperature zusammengefasst und im WattMan auch angezeigt. Während die "alte" GPU-Temperatur einen Wert von 63 bis 65 °C auf der Radeon VII erreicht, sehen wir für die Junction Temperature Werte von über 110 °C. Halbleiterchips werden unter Last mehr als 100 °C war, egal ob es sich dabei um eine GPU oder eine CPU handelt. Typischerweise wird ein Wert von 105 °C als Abschalttemperatur für CPUs und GPU verwendet. Die Drosselung über den "alten" Wert der GPU-Temperatur bei 90, 85 oder 80 °C entspricht ebenfalls einer höheren "internen" Temperatur, wurde so aber bisher nicht angezeigt.

Das Heranführen der Junction Temperature an den Boost-Mechanismus oder die Lüftersteuerung hat laut AMD einige Vorteile. So soll die Leistung der Karte um etwa 2 % gesteigert werden können, da die GPU ihr volles Potenzial ausschöpfen kann und nicht durch ungenaue Messungen vorher schon ausgebremst wird. Die Lüftersteuerung soll zudem genauer auf die Änderungen in der Last reagieren können, was letztendlich dazu führt, dass die GPU länger ihren Boost-Takt halten kann.