Seite 1: NVIDIA dreht an der Ampere-Schraube: Die GeForce RTX 3080 Founders Edition im Test

geforce-rtx-3080Heute ist es endlich soweit. Mit der GeForce RTX 3080 in der Founders Edition schauen wir uns die erste Karte der neuen Ampere-Generation an. Die wichtigsten Details zur Architektur haben wir bereits behandelt und in der vergangenen Woche konnten wir euch die ersten Fotos der GeForce RTX 3080 Founders Edition zeigen. Heute geht es nun also um die Leistung, den Stromverbrauch, die Kühlung und weitere Vergleiche wie die Effizienz oder die Verbesserungen in der Raytracing- und DLSS-Leistung.

Im Zuge des Neustarts bei den Grafikkarten, neben NVIDIA und der GeForce-RTX-30-Serie werden wir in wenigen Wochen auch die nächste Radeon-RX-Generation alias Big Navi sehen, haben wir auch unser Testsystem komplett erneuert – sowohl im Hinblick auf die Hardware als auch hinsichtlich der verwendeten Spiele. Dazu aber dann später etwas mehr.

Auch wenn wir bereits viele Details der GeForce RTX 3080 Founders Edition und der GeForce-RTX-30-Serie behandelt haben, wollen wir dennoch auf ein paar weitere Kleinigkeiten eingehen.

Zunächst einmal aber schauen wir uns die drei neuen Modelle im Vergleich an:

Gegenüberstellung der Karten
  GeForce RTX 3090 GeForce RTX 3080GeForce RTX 2080 GeForce RTX 3070
GPU Ampere (GA102) Ampere (GA102)Turing (TU104) Ampere (GA104)
Transistoren 28 Milliarden 28 Milliarden13,6 Milliarden 17,4 Milliarden
Fertigung 8 nm 8 nm12 nm 8 nm
Chipgröße 628,4 mm²
628,4 mm²
545 mm² 392,5 mm²
FP32-ALUs 10.496 8.7042.944 5.888
INT32-ALUs 5.248 4.3522.944 2.944
SMs 82 6846 46
Tensor Cores 328 272368 184
RT Cores 82 6846 46
Basis-Takt 1.400 MHz 1.440 MHz1.515 MHz 1.500 MHz
Boost-Takt 1.700 MHz 1.710 MHz1.800 MHz 1.730 MHz
Speicherkapazität 24 GB 10 GB8 GB 8 GB
Speichertyp GDDR6X
19,5 GBit/s
GDDR6X
19 GBit/s
GDDR6 GDDR6
14 GBit/s
Speicherinterface 384 Bit 320 Bit256 Bit 256 Bit
Speicherbandbreite 936 GB/s
760 GB/s448 GB/s 448 GB/s
TDP 350 W 320 W225 W 220 W
Preis 1.499 Euro 699 Euro- 499 Euro
Verfügbarkeit 24. September 17. September- Oktober

Die GeForce RTX 3080 und GeForce RTX 3090 basieren auf der GA102-GPU, allerdings in unterschiedlichen Ausbaustufen. Die GeForce RTX 3070 wird die GA104-GPU verwenden. Dazu werden wir aber zum Start der Karte weitere Details nennen können. Allesamt werden die neuen GPUs in 8 nm bei Samsung gefertigt. Laut NVIDIA hat man zusammen mit Samsung entsprechende Anpassungen am Fertigungsprozess vorgenommen, sodass dieser für die GPUs optimiert arbeiten kann. Die GA102-GPU kommt auf eine Fläche von 628,4 mm² und beinhaltet 28 Milliarden Transistoren. Die GA104-GPU bietet 17,4 Milliarden Transistoren auf einer Fläche von 392,5 mm².

Für die GeForce RTX 3080 steigt die Anzahl der FP32-Einheiten gegenüber der GeForce RTX 2080 von 2.944 auf 8.704. Für die INT32-Recheneinheiten geht es von ebenfalls 2.944 auf 4.352. Die Anzahl der Tensor Cores sinkt von 368 auf 272, aber dies hat auch einen guten Grund, zu dem wir noch kommen werden. Die Zahl der RT Cores steigt von 46 auf 68. Wir sehen hier also einen deutlichen Ausbau der Architektur. Wie sich dies in einem vermeintlichen Leistungsplus auswirken wird, werden wir später sehen. Wenig Bewegung gibt es beim Takt der GPUs. Der Boost-Takt fällt auf dem Papier sogar um 100 MHz geringer aus.

Die Breite des Speicherinterface wächst von 256 auf 320 Bit. zusammen mit dem schnelleren GDDR6X-Speicher steigt die Speicherbandbreite von 448 auf 760 GB/s. Auf dem Papier bietet der Wechsel von der GeForce RTX 2080 auf die GeForce RTX 3080 also ein deutliches Leistungsplus.

Interessant ist nun der Vergleich der Fertigung in 8 nm bei Samsung gegenüber der Fertigung in 12 nm bei TSMC für die Turing-Generation.

Gegenüberstellung der GPUs

GA102 TU102GA104TU104GA100
Transistoren 28 Milliarden 18,6 Milliarden17,4 Milliarden13,6 Milliarden54 Milliarden
Chipgröße 628,4 mm² 754 mm²392,5 mm²545 mm²826 mm²
Fertigung Samsung 8 nm TSMC 12 nmSamsung 8 nmTSMC 12 nmTSMC 7 nm
Transistordichte 44,56 MT/mm²
24,67 MT/mm²44,33 MT/mm²24,95 MT/mm²65,37 MT/mm²

Durch die Angabe der Anzahl der Transistoren plus die Chipgröße können wir die Transistordichte errechnen. Die Transistordichte der GA102-GPU liegt bei 44,6 MT/mm². Für die GA104-GPU sind es 44,3 MT/mm². Die Turing-GPUs erreichten einen Wert von 25 MT/mm², waren also nur in etwa halb so dicht gepackt. Die GA100-GPU für den A100-GPU-Beschleuniger lässt NVIDIA bei TSMC in 7 nm fertigen. Hier liegt die Transistordichte bei 65,37 MT/mm².

Für die Ampere-GPUs kann NVIDIA also deutlich mehr Transistoren auf eine kleinere Fläche packen. Mit fast 630 mm² ist die GA102-GPU nicht wirklich klein, aber kleiner als der Vorgänger. Die höhere Packdichte nutzt NVIDIA um den Ausbau der GPU-Architektur zu vergrößern. Wir sehen deutlich mehr FP32-Einheiten in den GPUs und dies soll sich entsprechend in der Leistung niederschlagen.

Auf den folgenden Seiten gehen wir nun auf die Details der Ampere-Architektur, das neue Kühldesign und die neuen Funktionen der Hardware ein.

Kein Fokus des Tests wird die Software sein. Mit Reflex möchte NVIDIA beispielsweise dem kompetitiven Spieler ein Werkzeug an die Hand geben, welches die Latenzen zwischen Eingabe über Maus und Tastatur mit einer möglichst schnellen Darstellung auf dem Monitor zusammenbringt. Eine entsprechende Schnittstelle soll es Entwicklern ermöglichen ihre Spiele entsprechend anzupassen.

NVIDIA Broadcast soll das zentrale Element für Streamer werden. Virtuelle Bildschirmhintergründe, automatisch folgende Kameraausschnitte und eine Verbesserung der Audio-Qualität mittels RTX Voice sind hier die zentralen Themen.