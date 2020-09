Seite 1: NVIDIA dreht an der Ampere-Schraube: Die GeForce RTX 3080 Founders Edition im Test

Heute ist es endlich soweit. Mit der GeForce RTX 3080 in der Founders Edition schauen wir uns die erste Karte der neuen Ampere-Generation an. Die wichtigsten Details zur Architektur haben wir bereits behandelt und in der vergangenen Woche konnten wir euch die ersten Fotos der GeForce RTX 3080 Founders Edition zeigen. Heute geht es nun also um die Leistung, den Stromverbrauch, die Kühlung und weitere Vergleiche wie die Effizienz oder die Verbesserungen in der Raytracing- und DLSS-Leistung.

Im Zuge des Neustarts bei den Grafikkarten, neben NVIDIA und der GeForce-RTX-30-Serie werden wir in wenigen Wochen auch die nächste Radeon-RX-Generation alias Big Navi sehen, haben wir auch unser Testsystem komplett erneuert – sowohl im Hinblick auf die Hardware als auch hinsichtlich der verwendeten Spiele. Dazu aber dann später etwas mehr.

Auch wenn wir bereits viele Details der GeForce RTX 3080 Founders Edition und der GeForce-RTX-30-Serie behandelt haben, wollen wir dennoch auf ein paar weitere Kleinigkeiten eingehen.

Zunächst einmal aber schauen wir uns die drei neuen Modelle im Vergleich an:

Gegenüberstellung der Karten GeForce RTX 3090 GeForce RTX 3080 GeForce RTX 2080 GeForce RTX 3070 GPU Ampere (GA102) Ampere (GA102) Turing (TU104) Ampere (GA104) Transistoren 28 Milliarden 28 Milliarden 13,6 Milliarden 17,4 Milliarden Fertigung 8 nm 8 nm 12 nm 8 nm Chipgröße 628,4 mm²

628,4 mm²

545 mm² 392,5 mm² FP32-ALUs 10.496 8.704 2.944 5.888 INT32-ALUs 5.248 4.352 2.944 2.944 SMs 82 68 46 46 Tensor Cores 328 272 368 184 RT Cores 82 68 46 46 Basis-Takt 1.400 MHz 1.440 MHz 1.515 MHz 1.500 MHz Boost-Takt 1.700 MHz 1.710 MHz 1.800 MHz 1.730 MHz Speicherkapazität 24 GB 10 GB 8 GB 8 GB Speichertyp GDDR6X

19,5 GBit/s

GDDR6X

19 GBit/s GDDR6 GDDR6

14 GBit/s Speicherinterface 384 Bit 320 Bit 256 Bit 256 Bit Speicherbandbreite 936 GB/s

760 GB/s 448 GB/s 448 GB/s TDP 350 W 320 W 225 W 220 W Preis 1.499 Euro 699 Euro - 499 Euro Verfügbarkeit 24. September 17. September - Oktober

Die GeForce RTX 3080 und GeForce RTX 3090 basieren auf der GA102-GPU, allerdings in unterschiedlichen Ausbaustufen. Die GeForce RTX 3070 wird die GA104-GPU verwenden. Dazu werden wir aber zum Start der Karte weitere Details nennen können. Allesamt werden die neuen GPUs in 8 nm bei Samsung gefertigt. Laut NVIDIA hat man zusammen mit Samsung entsprechende Anpassungen am Fertigungsprozess vorgenommen, sodass dieser für die GPUs optimiert arbeiten kann. Die GA102-GPU kommt auf eine Fläche von 628,4 mm² und beinhaltet 28 Milliarden Transistoren. Die GA104-GPU bietet 17,4 Milliarden Transistoren auf einer Fläche von 392,5 mm².

Für die GeForce RTX 3080 steigt die Anzahl der FP32-Einheiten gegenüber der GeForce RTX 2080 von 2.944 auf 8.704. Für die INT32-Recheneinheiten geht es von ebenfalls 2.944 auf 4.352. Die Anzahl der Tensor Cores sinkt von 368 auf 272, aber dies hat auch einen guten Grund, zu dem wir noch kommen werden. Die Zahl der RT Cores steigt von 46 auf 68. Wir sehen hier also einen deutlichen Ausbau der Architektur. Wie sich dies in einem vermeintlichen Leistungsplus auswirken wird, werden wir später sehen. Wenig Bewegung gibt es beim Takt der GPUs. Der Boost-Takt fällt auf dem Papier sogar um 100 MHz geringer aus.

Die Breite des Speicherinterface wächst von 256 auf 320 Bit. zusammen mit dem schnelleren GDDR6X-Speicher steigt die Speicherbandbreite von 448 auf 760 GB/s. Auf dem Papier bietet der Wechsel von der GeForce RTX 2080 auf die GeForce RTX 3080 also ein deutliches Leistungsplus.

Interessant ist nun der Vergleich der Fertigung in 8 nm bei Samsung gegenüber der Fertigung in 12 nm bei TSMC für die Turing-Generation.

Gegenüberstellung der GPUs

GA102 TU102 GA104 TU104 GA100 Transistoren 28 Milliarden 18,6 Milliarden 17,4 Milliarden 13,6 Milliarden 54 Milliarden Chipgröße 628,4 mm² 754 mm² 392,5 mm² 545 mm² 826 mm² Fertigung Samsung 8 nm TSMC 12 nm Samsung 8 nm TSMC 12 nm TSMC 7 nm Transistordichte 44,56 MT/mm²

24,67 MT/mm² 44,33 MT/mm² 24,95 MT/mm² 65,37 MT/mm²

Durch die Angabe der Anzahl der Transistoren plus die Chipgröße können wir die Transistordichte errechnen. Die Transistordichte der GA102-GPU liegt bei 44,6 MT/mm². Für die GA104-GPU sind es 44,3 MT/mm². Die Turing-GPUs erreichten einen Wert von 25 MT/mm², waren also nur in etwa halb so dicht gepackt. Die GA100-GPU für den A100-GPU-Beschleuniger lässt NVIDIA bei TSMC in 7 nm fertigen. Hier liegt die Transistordichte bei 65,37 MT/mm².



Für die Ampere-GPUs kann NVIDIA also deutlich mehr Transistoren auf eine kleinere Fläche packen. Mit fast 630 mm² ist die GA102-GPU nicht wirklich klein, aber kleiner als der Vorgänger. Die höhere Packdichte nutzt NVIDIA um den Ausbau der GPU-Architektur zu vergrößern. Wir sehen deutlich mehr FP32-Einheiten in den GPUs und dies soll sich entsprechend in der Leistung niederschlagen.

Auf den folgenden Seiten gehen wir nun auf die Details der Ampere-Architektur, das neue Kühldesign und die neuen Funktionen der Hardware ein.

Kein Fokus des Tests wird die Software sein. Mit Reflex möchte NVIDIA beispielsweise dem kompetitiven Spieler ein Werkzeug an die Hand geben, welches die Latenzen zwischen Eingabe über Maus und Tastatur mit einer möglichst schnellen Darstellung auf dem Monitor zusammenbringt. Eine entsprechende Schnittstelle soll es Entwicklern ermöglichen ihre Spiele entsprechend anzupassen.

NVIDIA Broadcast soll das zentrale Element für Streamer werden. Virtuelle Bildschirmhintergründe, automatisch folgende Kameraausschnitte und eine Verbesserung der Audio-Qualität mittels RTX Voice sind hier die zentralen Themen.