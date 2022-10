Werbung

Mit der GeForce RTX 4090 gehen wir heute in die nächste Runde des heißen Herbst 2022. Die Ryzen-7000-Prozessoren machten den Anfang, danach folgten die ARC-Grafikkarten von Intel. Heute NVIDIA legt nach und darauf folgen werden noch Raptor Lake von Intel und die RDNA-3-Karten wiederum von AMD. NVIDIA legt mit der GeForce RTX 4090 im High-End-Segment los – im Grunde wie auch schon bei der Vorgänger-Generation. Um mehrere Faktoren schneller sollen die neuen Karten sein. Raytracing, DLSS und viele kleine Neurungen im Design werden die Themen der folgenden Seiten sein.

NVIDIA wählt für den Start der GeForce-RTX-40-Serie eine leicht abgeänderte Strategie. Den Anfang macht die GeForce RTX 4090, die recht nahe am Vollausbau der verwendeten AD102-GPU operiert. Mit 24 GB an Grafikspeicher und einem Power-Limit von 450 W zieht NVIDIA die Produktpalette von oben auf. Vermutlich will man sich bzw. dem Markt somit auch noch etwas Luft lassen die restlichen Modelle der GeForce-RTX-30-Serie verkaufen zu können.

Ab November sollen dann auch die weiteren beiden Modelle erhältlich sein. Die GeForce RTX 4080 16 GB und eine weitere GeForce RTX 4080 mit 12 GB, die ehrlicherweise wohl besser den Modellnahmen GeForce RTX 4070 getragen hätte. Aber zu diesem Thema kommen wir noch.

Ohne größere Umschweife zu den technischen Daten.

Gegenüberstellung der Karten GeForce RTX 4080 12 GB GeForce RTX 4080 16 GB GeForce RTX 4090 GPU AD104

AD103 AD102

Transistoren - - 76 Milliarden Fertigung 4 nm 4 nm 4 nm Chipgröße - - 608,3 mm² FP32-ALUs 7.680 9.728 16.384 INT32-ALUs - - - SMs 60 76 128 Tensor Cores 240 304 512 RT Cores 60 76 128 Basis-Takt 2.310 MHz 2.210 MHz 2.230 MHz Boost-Takt 2.610 MHz 2.505 MHz 2.520 MHz Speicherkapazität 12 GB 16 GB 24 GB Speichertyp GDDR6X GDDR6X GDDR6X

Speicherinterface 192 Bit 256 Bit 384 Bit Speichertakt - - - Speicherbandbreite 504 GB/s 720 GB/s 1.008 GB/s TDP 285 W 325 W 450 W Preis 1.099 Euro 1.469 Euro 1.949 Euro

Das Spitzenmodell und im Fokus des heutigen Tests ist die GeForce RTX 4090. Sie basiert auf der Ada102-GPU und bringt es auf 128 SMs, was gleichbedeutend mit 16.384 FP32-Recheneinheiten ist. Ebenfalls Bestandteil der GPU sind 512 Tensor Cores der 4. Generation sowie 128 RT Cores der 3. Generation. Die Tensor und RT Cores wurden weiter verbessert und sollen schneller sowie effizienter sein.

Den Basis-Takt der GeForce RTX 4090 gibt NVIDIA mit 2.230 MHz an. Per Boost soll sie 2.520 MHz erreichen können – vermutlich wird der Takt in der Praxis noch einmal deutlich darüber liegen – aber auch dazu später mehr. Die 24 GB an GDDR6X-Speicher sind über ein 384 Bit breites Speicherinterface angebunden und kommen auf eine Speicherbandbreite von 1.008 GB/s. Die TDP liegt bei 450 W. Für die Founders-Edition ruft NVIDIA einen Preis von 1.949 Euro auf.

Die beiden Varianten der GeForce RTX 4080 beleuchten wir heute nicht weiter. Dazu dann im November mehr.

Gegenüberstellung der Karten GeForce Titan RTX GeForce RTX 3090 GeForce RTX 4090 GPU TU102 GA102 AD102

Transistoren 18,6 Milliarden 28,3 Milliarden 76 Milliarden Fertigung 12 nm 8 nm 4 nm Chipgröße 754 mm² 628 mm² 608,3 mm² FP32-ALUs 4.608 10.496 16.384 INT32-ALUs - 5.248 - SMs 72 82 128 Tensor Cores 576 328 512 RT Cores 72 82 128 Basis-Takt 1.350 MHz 1.410 MHz 2.230 MHz Boost-Takt 1.770 MHz 1.695 MHz 2.520 MHz Speicherkapazität 24 GB 24 GB 24 GB Speichertyp GDDR6 GDDR6X GDDR6X

Speicherinterface 384 Bit 384 Bit 384 Bit Speichertakt 1.750 MHz 1.219 MHz 1.313 MHz Speicherbandbreite 672 GB/s 936 GB/s 1.008 GB/s TDP 280 W 350 W 450 W Preis 2.699 Euro 1.599 Euro 1.949 Euro

In der direkten Gegenüberstellung zeigt sich die Entwicklung der XX90-Serie recht deutlich. Wir haben hier die Titan RTX als Vertreter oberhalb der RTX-2080-Ti in der Turing-Generation herangezogen. Der Speicherausbau ist über die drei Generationen mit 24 GB identisch, allerdings erhöht sich dessen Bandbreite stetig. Die Anzahl der Recheneinheiten hat sich im gleichen Zuge verdreifacht, wenngleich dies mit Ampere und Ada Lovelace und 128 FP32-Recheneinheiten pro SM auch ein anderer Aufbau ist.

Von der GeForce RTX 3090 ausgehend, legt die GeForce RTX 4090 im Ausbau der GPU eine ordentliche Schippe drauf. Wir sprechen hier von 60 % mehr FP32- und INT32-Recheneinheiten. Hinzu kommt eine Steigerung der vorhandenen RT und Tensor Cores im gleichen Maße. NVIDIA kann sich für Ada Lovelace auch auf TSMC verlassen und hat gemeinsam mit dem Auftragsfertiger einen optimierten 5-nm-Prozess namens 4N für NVIDIA entwickelt. 76 Milliarden Transistoren werden auf eine Fläche von 608,3 mm² gepackt. Die Fertigung ermöglicht es NVIDIA auch den Takt auf 2.500 MHz und mehr zu steigern.

Wer an der Fertigung und den weiteren Kenngrößen der neuen GPUs interessiert ist, für den haben wir folgende Tabelle zusammengestellt:

Gegenüberstellung der Ada-Lovelace-GPUs

AD102 AD103 AD104 Die-Größe 608,3 mm² 378,6 mm² 294,5 mm² Anzahl der Transistoren 76 Milliarden 45,9 Milliarden 35,8 Milliarden Transistordichte 124,9 MTr/mm² 121,2 MTr/mm² 121,6 MTr/mm² SMs 144 80 60 FP32-Recheneinheiten 18.432 10.240 7.680 RT Cores 144 80 60 Tensor Cores 576 320 240 L2-Cache 96 MB 64 MB 48 MB ROPs 192 112 80 Speicherinterface 384 Bit 256 Bit 192 Bit

Die Abstufungen für die einzelnen Ada-Lovelace-GPUs und deren Ausbaustufen folgen einem fast linearen Verlauf. Wir sprechen hier immer vom Vollausbau, der auf den GeForce-Karten so aber nicht vorkommt. Einzig die AD104-GPU wird 1:1 so auf der GeForce RTX 4080 mit 12 GB verwendet. Als kleinster Chip scheint die Ausbeute hier gut genug zu sein. Die Transistordichte liegt bei knapp über 120 Millionen Transistoren pro Quadratmillimeter.