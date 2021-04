Neben einem neuen Datacenter-ARM-Prozessor namens Grace sowie einer weiteren DPU-Generation Bluefield-3 stellt NVIDIA auch neue RTX-GPUs, die in mobilen und Desktop-Worktstations zum Einsatz kommen sollen.

Die bisher als einzige mit einer Ampere-GPU ausgestattete NVIDIA RTX A6000, die bereits im Oktober des vergangenen Jahres vorgestellt wurde, wird um die Modelle A4000 und A5000 ergänzt. Außerdem gibt es eine ganze Reihe neuer GPUs für den Einsatz in Notebooks. Allesamt basieren die neuen Karten bzw. GPUs auf den bestehenden Desktop-Lösungen. Zum Einsatz kommen die bekannten GA106, GA104 und GA102-GPUs – allerdings teilweise in anderen Ausbaustufen als bisher.

Den Anfang sollen die beiden Desktop-Lösungen A4000 und A5000 machen.

Gegenüberstellung der Karten RTX A6000 RTX A5000 RTX A4000 GPU GA102 GA102 GA104 Transistoren 28 Milliarden 28 Milliarden 17,4 Milliarden Fertigung 8 nm 8 nm 8 nm Chipgröße 628,4 mm² 628,4 mm² 392,5 mm² FP32-ALUs 10.752 8.192 6.144 INT32-ALUs 5.376 4.096 3.072 SMs 84 64 48 Tensor Cores 336 256 192 RT Cores 84 64 48 FP32-Leistung 38,7 TFLOPS 27,8 TFLOPS 19,2 TFLOPS RT-Leistung 75,6 TFLOPS 54,2 TFLOPS 37,4 TFLOPS Tensor-Leistung 309,7 TFLOPS 222,2 TFLOPS 153,4 TFLOPS Speicherkapazität 48 GB 24 GB 16 GB Speichertyp GDDR6 GDDR6 GDDR6 Speicherinterface 384 Bit 384 Bit 256 Bit Speicherbandbreite 768 GB/s 768 GB/s 448 GB/s TDP 300 W 230 W 140 W Preis 6.999 Euro - -

NVIDIA hebt die gesamte RTX-Reihe an. Die RTX A5000 ist in etwa dort positioniert, wo zuvor die RTX 6000 zu finden war. Analog gilt dies für die RTX A4000. Die FP32-Rechenleistung wird bei der RTX A5000 mehr als verdoppelt, der Speicher wächst von 16 auf 24 GB an. Die Leistungsaufnahme liegt grob auf gleichem Niveau. Aufgrund des breites Speicherinterfaces steigt auch die Speicherbandbreite des angebundenen GDDR6-Speichers.



Bei der RTX A4000 sehen wir ein ähnliches Phänomen. Die Anzahl der FP32-Recheneinheiten steigt allerdings "nur" um 50 %. Die Speicherausstattung wird von 8 auf 16 GB verdoppelt. Beide Karten unterstützen PCI-Express 4.0, aber nur die RTX A5000 NVLink und auch nur hier gibt es neben GPU Passthrough die Unterstützung für Single Root Input/Output Virtualization (SR-IOV).

Für die RTX A5000 sieht NVIDIA einen Radiallüfter im Dual-Slot-Design am hinteren Ende der Karte vor. Die warme Luft tritt an der Slotblended aus. Die warme Luft verbleibt also nicht in der Workstation. Die RTX A4000 kommt mit einem Slot an Bauhöhe aus.

Sowohl die RTX A4000 als auch die RTX A6000 sollen noch im April verfügbar sein.

Von Ampere bis Turing im Notebook

Bei den Notebooks gibt es gleich vier Modelle auf Basis der Ampere-Architektur und zwei weitere, die noch GPUs mit Turing-Architektur verwenden. In der Übersicht stellt sich dies wie folgt dar:

Gegenüberstellung der Karten RTX A2000 RTX A3000 RTX A4000 RTX A5000 GPU GA106 GA104 GA104 GA102 Transistoren 12 Milliarden

17,4 Milliarden 17,4 Milliarden 28 Milliarden Fertigung 8 nm 8 nm 8 nm 8 nm Chipgröße 276 mm²

392,5 mm² 392,5 mm² 628,4 mm² FP32-ALUs 2.560 4.096 5.120 6.144 INT32-ALUs 1.280 2.048 2.560 3.072 SMs 20 32 40 48 Tensor Cores 80 128 160 192 RT Cores 20 32 40 48 FP32-Leistung 9,3 TFLOPS 12,8 TFLOPS 17,8 TFLOPS 21,7 TFLOPS RT-Leistung 18,2 TFLOPS 25,0 TFLOPS 34,8 TFLOPS 75,6 TFLOPS Tensor-Leistung 74,7 TFLOPS 102,2 TFLOPS 142,5 TFLOPS 174,0 TFLOPS Speicherkapazität 4 GB 6 GB 8 GB 16 GB Speichertyp GDDR6 GDDR6 GDDR6 GDDR6 Speicherinterface 128 Bit 192 Bit 256 Bit 256 Bit Speicherbandbreite 192 GB/s 264 GB/s 384 GB/s 448 GB/s TDP 35 - 95 W 60 - 130 W 80 - 140 W 80 - 165 W

Für die mobilen RTX-GPUs auf Basis der Ampere-Architektur schöpft NVIDIA die gesamte Breite des Angebotes aus – von der GA106 bis zur GA102. Entsprechend sehen wir 20 bis 48 SMs und eine Rechenleistung von 10 bis über 20 TFLOPS für FP32-Berechnungen. Die Speicherausstattung reicht von 4 bis 16 GB. Im Notebook kann die TDP der GPUs entsprechend der zur Verfügung stehenden Kühlung konfiguriert werden. Von 35 bis 95 W für das kleinste Modell, bis hin zu 80 bis 165 W für die RTX A5000 sind im Notebook möglich.

Daneben gibt es auch noch zwei neue Turing-GPUs für mobile Workstations.

Gegenüberstellung der Karten T600 T1200 FP32-ALUs 896 1.024 INT32-ALUs 896 1.024 SMs 14 16 Tensor Cores - - RT Cores - - FP32-Leistung 2,5 TFLOPS 3,7 TFLOPS RT-Leistung - - Tensor-Leistung - - Speicherkapazität 4 GB 4 GB Speichertyp GDDR6 GDDR6 Speicherinterface 128 Bit 128 Bit Speicherbandbreite 160 GB/s 192 GB/s TDP 25 W 35 - 95 W

Bei den beiden Turing-basierten GPUs handelt es sich um absolute Einsteigerlösungen, die zudem auch noch um ihre RT- und Tensor-Core-Funktionalität beschnitten wurden. Beide bieten auch nur 4 GB an Grafikspeicher, der aber immerhin unterschiedlich schnell angebunden ist.

Alle neuen mobilen RTX-Workstation-Lösungen sollen ab dem zweiten Quartal durch die OEMs in Notebooks angeboten werden. Die Preise variieren natürlich entsprechend der weiteren Ausstattung.