NEWS

#NVIDIA #GeForce #GeForce-RTX #Ampere

Grafikkarten

Alle Details zur neuen GeForce-RTX-Generation auf Ampere-Basis

Von Andreas Schilling
Dienstag, 01.09.2020 um 18:56 Uhr

Alle Details zur neuen GeForce-RTX-Generation auf Ampere-Basis

3237

Auf dem heutigen GeForce Special Event hat NVIDIA die nächste GeForce-RTX-Generation auf Basis der Ampere-Architektur angekündigt. Diese folgt fast genau zwei Jahre nach den ersten GeForce-RTX-Karten mit Turing-GPUs. Doch bevor NVIDIA die neue Hardware vorgestellt hat, sprach Jen-Hsen Huang, CEO von NVIDIA, über das Gaming-Ökosystem.

Als erstes Highlight, je nach Sichtweise natürlich, wurde Fortnite mit Raytracing-Effekten und DLSS angekündigt. Ab wann Fortnite mit den neuen Effekten und dem AI-Upscaling verfügbar sein wird, ist allerdings noch nicht bekannt. Außerdem sprach NVIDIA über die Reflex-Technologie, die zusammen mit Panels, die besonders hohe Bildwiederholfrequenzen bieten, noch kürzere Reaktionszeiten erreichen soll und Details darstellen kann, die bei niedrigen Bildwiederholfrequenzen einfach nicht dargestellt werden.

Nun aber zur Hardware und dabei spielt das Thema Raytracing natürlich eine wichtige Rolle. Mit der Turing-Architektur hat man den Stein ins Rollen gebracht, mit der Ampere-Architektur will man nun den nächsten Schritt machen. Auch AMD wird mit den RDNA-2-GPUs, genau wie Intel mit der Xe-HPG-Architektur, ebenfalls eine hardwarebeschleunigte Raytracing-Berechnung ermöglichen.

DLSS ist der zweite Bausteine, der nach der Turing-Architektur auch für die Ampere-Architektur eine wichtige Rolle spielt.

Die Shaderleistung will NVIDIA von 11 auf 30 TFLOPS erhöht haben. Die RT Cores steigen die Leistung von 34 auf 58 RT-TFLOPS und auch die Tensor Cores werden schneller – von 89 auf 238 Tensor-TFLOPS. Die entspricht den Faktoren, 2,7x für die Shader, 1,7x für die RT Cores und 2,7x für die Tensor Cores.

Gefertigt werden die Ampere-GPUs in 8 nm bei Samsung. Die Anzahl der Transistoren liegt bei 28 Milliarden. Damit sind alle Gerüchte rund um eine Fertigung in 7LPP Geschichte, NVIDIA setzt tatsächlich auf die Fertigung in 8 nm bei Samsung.

Die Hardware

Auf der Produktseite wurden inzwischen einige Daten hinzugefügt, aber nicht in dem Detail, wie man sie sich sicherlich wünscht.

Gegenüberstellung der Karten
	GeForce RTX 3090	GeForce RTX 3080	GeForce RTX 3070
GPU	Ampere	Ampere	Ampere
Fertigung	8 nm	8 nm	8 nm
Shadereinheiten	10.496	8.704	5.888
Basis-Takt	1.400 MHz	1.440 MHz	1.500 MHz
Boost-Takt	1.700 MHz	1.710 MHz	1.730 MHz
Shaderleistung	36 TFLOPS	30 TFLOPS	20 TFLOPS
Tensor-Leistung	285 TFLOPS	238 TFLOPS	163 TFLOPS
RT-Leistung	69 TFLOPS	58 TFLOPS	40 TFLOPS
Speicherkapazität	24 GB	10 GB	8 GB
Speichertyp	GDDR6X	GDDR6X	GDDR6
Speicherinterface	384 Bit	320 Bit	256 Bit
TDP	350 W	320 W	220 W
Preis	1.499 Euro	699 Euro	499 Euro
Verfügbarkeit	24. September	17. September	Oktober

Eine GeForce RTX 3070 soll dabei schneller als eine GeForce RTX 2080 Ti sein. Die GeForce RTX 3090 sogar deutlich darüber liegen. Die Anzahl der Shadereinheiten entspricht den Angaben aus den letzten Gerüchten. NVIDIA gibt auf der Produktseite die FP und INT-Einheiten getrennt an und kommt daher auf die doppelte Anzahl.

Derzeit fehlen uns noch die Angaben zur Anzahl der RT und Tensor Cores. Dafür kennen wir die Leistungsaufnahme. Diese liegt bei 350 W für die GeForce RTX 3090, 320 W für die GeForce RTX 3080 und 220 W für die GeForce RTX 3070. NVIDIA realisiert dies über den neuen 12-Pin-Anschluss, der über einen Adapter von 2x 8-Pin umgesetzt wird.

Allen neuen Karten haben die Unterstützung von PCI-Express 4.0 gemeinsam. Nutzen lässt sich dies aktuell nur mit den aktuellen Ryzen-Prozessoren. PCI-Express 4.0 auf dem Desktop wird es von Intel erst im kommenden Jahr geben.

Die GeForce RTX 3090 wird ab dem 24. September für 1.499 US-Dollar verfügbar sein. Etwas früher, am 17. September erscheint die GeForce RTX 3080 für 699 US-Dollar. Im Oktober wird die GeForce RTX 3070 für 499 US-Dollar folgen. Deutsche Preise kennen wir noch nicht.

GDDR6X mit PAM4

Immer schnellerer Speicher stellt auch gewisse Herausforderungen für die Signalübertragung dar. Auch darauf geht NVIDIA bei der Präsentation der neuen Karten ein.

Für den bisherigen GDDR6-Speicher wird eine Non-Return-to-Zero (NRZ) Pulsamplitudenmodulation verwendet. Zwischen "0" und "1" wird durch einen Unterschied in der High- und Low-Spannung unterschieden.

Für die Pulsamplitudenmodulation PAM4 wird das Trägersignal in vier Spannungslevel pro Taktzyklus unterteilt. Die einzelnen Schritte betragen gerade einmal 250 mV. Das PAM4 kommt bei immer mehr Übertragungsstandards zum Einsatz. Auch PCI-Express 5.0 und DDR6 werden auf PAM4 setzen.

Erste Benchmarks

NVIDIA liefert erste eigene Leistungswerte, die zumindest eine grobe Einschätzung zulassen. So ist eine GeForce RTX 3080 wie gesagt schneller als eine GeForce RTX 2080 Ti und soll in etwa auf Niveau zweier GeForce RTX 2080 liegen. Auch die GeForce RTX 3070 soll noch schneller als das bisherige Spitzenmodell sein. NVIDIA setzt sie in etwa auf eine Stufe mit der GeForce RTX 2080 Ti. Die GeForce RTX 3090 soll dann alles bisher Dagewesene in den Schatten stellen, wenngleich NVIDIA hier noch keine grobe Einschätzung möglich macht, aber davon spricht, dass die Karte auch ein Gaming in 8K ermöglichen soll.

Einen großen Sprung sollen die neuen Karten in der Raytracing-Leistung machen. In unterstützen Spielen und Anwendungen vergleicht NVIDIA die Turing- und Ampere-Generation miteinander, ohne dabei ein konkretes Modell an Grafikkarte oder GPU zu nennen. Zwischen Faktor x1,6 und mehr als x2 soll das Leistungsplus aber liegen. Wie sich dies darstellen wird, werden wir uns zum Start sicherlich anschauen und eigene Benchmarks machen. Der reine Einfluss der RT-Kerne und deren verbesserter Leistung wird sich womöglich aber schwer abschätzen lassen.

Auch einige wenige allgemeingehaltene Benchmarks liefert NVIDIA bereits. Aber auch hier tauchen nur die GeForce RTX 3070 und GeForce RTX 3080 auf.

Für die GeForce RTX 3090 zeigt NVIDIA einige Werte für das Gaming in 8K – mit und ohne DLSS. NVIDIA konzentriert sich hier allerdings auf die weniger anspruchsvollen Spiele und führt keine AAA-Titel auf. Selbst eine GeForce RTX 3090 dürfte für die neuesten Spiele in 8K einfach nicht schnell genug sein.

Das Design wird bestätigt

Keinerlei Zweifel mehr gab es am Design der neuen Karten. Mit den GeForce-RTX-Karten auf Basis der Ampere-Architektur versucht sich NVIDIA einmal mehr an einem neuen Ansatz, nachdem man für die Turing-Generation und die eigenen Founders Editionen bereits auf ein Dual-Axial-Design wechselte.

In der Präsentation zeigt NVIDIA nun das neue Konzept, welches das Ansaugen von kühler Luft unter der Grafikkarte vorsieht, wobei ein Teil dann direkt über die Slotblende wieder herausgeblasen wird. Die zweite Hälfte des Luftstroms wird durch einen Axiallüfter am hinteren Ende der Karte angesaugt, durch den Kühler gedrückt und tritt oberhalb der Karte wieder aus – daher auch die Öffnung, bzw. das kurze PCB mit einem darüber positionierten zweiten Axiallüfter. Die warme Luft tritt dann vor dem Prozessor-Kühler aus und wird von diesem in den hinteren Bereich des Gehäuses geblasen, wo üblicherweise ein Gehäuselüfter die warme Luft aus dem Gehäuse drückt.

Welcher Anteil der Abwärme direkt über die Slotblende austritt und wie viel warme Luft sozusagen als Abfallprodukt für den Prozessor-Kühler übrig bleibt, wird man abwarten müssen.

Gegenüberstellung der Karten
	GeForce RTX 3090	GeForce RTX 3080	GeForce RTX 3070
Länge	313 mm	285 mm	242 mm
Breite	138 mm	112 mm	112 mm
Dicke	3 Slots	2 Slots	2 Slots

Hinsichtlich der Abmessungen der Karten ist NVIDIA vor allem bei der GeForce RTX 3090 in neue Dimensionen vorgestoßen. Sie kommt auf eine Länge von 313 mm und eine Höhe von 138 mm. Insgesamt werden vom Kühler drei Slots belegt. Bei der GeForce RTX 3080 sprechen wir von 285 x 114 mm und zwei Slots – also eher übliche Abmessungen. Die GeForce RTX 3070 ist mit 242 x 112 mm bei zwei Slots geradezu winzig.

Weitere Informationen zum 12-Pin-Stecker

Wir haben weitere Informationen zum neuen 12-Pin-Stecker (NVIDIA 12-Pin PCIe Molex Micro-Fit 3.0), den NVIDIA zumindest auf der GeForce RTX 3090 und GeForce RTX 3080 einsetzen wird. Dieser liefert 2x 8-Pin als 1x 12-Pin an die Karten. Im Falle des uns vorliegenden Adapters von Seasonic sind der Sense1-Kontakt (Pin 4) und einer der Masse-Kontakte (Pin 8) nicht bestückt. Physikalisch handelt es sich aber um einen 8-Pin-Stecker. Während der Sense1-Kontakt auf Seiten des Netzteils keinerlei Verwendung hat, wäre ein dritter Masse-Kontakt aber sicherlich nicht weiter hinderlich gewesen.

Von den zwei 8-Pin-Anschlüssen führen also jeweils dreimal +12 V, zweimal Masse und einmal Sense0 in den 12-Pin-Stecker. Insgesamt werden hier also sechsmal +12 V, viermal Masse und zwei Sense-Kontakt zusammengeführt. Die drei 12-V-Kontakte können laut Spezifikation jeweils 9 A führen. Drei Leiter bei 9 A und 12 V ergeben eine theoretische Leistungsaufnahme von 324 W. Zumindest die GeForce RTX 3090 muss sich also noch ein paar Watt aus dem PCI-Express-Slot beziehen.

Der 12-Pin-Anschluss soll zudem auf 25 An- und Absteck-Vorgänge ausgelegt sein. Allzu häufig wird man seine Karte also nicht wechseln bzw. ein/ausbauen können, wenn dann auch der Stecker getrennt werden muss.

RTX IO

NVIDIA RTX IO arbeitet mit Microsofts kommende DirectStorage-API zusammen. Dabei handelt es sich um eine Speicherarchitektur der nächsten Generation, die speziell für Gaming-PCs mit NVMe-SSDs ausgelegt wurde. DirectStorage-API bzw. RTX IO sind optimierte und parallelisierte APIs, die speziell auf Spiele zugeschnitten wurden, was eine drastische Reduzierung des IO-Overhead bedeuten soll.

RTX IO ermöglicht eine GPU-basierte, verlustfreie Dekomprimierung, sodass Lesevorgänge über DirectStorage komprimiert bleiben, während sie zur Dekomprimierung an den Grafikprozessor weitergeleitet werden. Dadurch wird der Prozessor entlastet, die Daten werden von der SSD in komprimierter Form auf den Grafikprozessor übertragen. Laut NVIDIA sind die neuen GPUs in der Lage eine Dekomprimierungsleistung zu erzielen, die sogar die Grenzen von PCIe-4.0-SSDs übertrifft. Somit sollen dutzende CPU-Kernen entlastet werden, um eine maximale Gesamtsystemleistung für Spiele der nächsten Generation zu erzielen.

Mit RTX IO sollen 14 GB/s von der SSD in den Grafikspeicher übertragen werden können. Zum Vergleich: Sonys PlayStation 5 kommt auf 8 bis 9 GB/s und die Microsoft Xbox Series X auf 4,8 GB/s. Man darf gespannt sein, ob AMD für Big Navi ebenfalls an einer Unterstützung von DirectStorage arbeitet.

Wir werden diese News in den kommenden Stunden immer wieder aktualisieren und neue Informationen hinzufügen.

Quellen und weitere Links