> > > > NVIDIA GeForce GTX 980 und 970 mit Maxwell-Architektur im XXL-Test

NVIDIA GeForce GTX 980 und 970 mit Maxwell-Architektur im XXL-Test

DruckenE-Mail
Erstellt am: von

Seite 1: NVIDIA GeForce GTX 980 und 970 mit Maxwell-Architektur im XXL-Test

geforce-gtx-980-logoMit der Veröffentlichung der GeForce GTX 750 und GTX 750 Ti sowie der Präsentation der Maxwell-Architektur der ersten Generation war klar, dass eine zweite folgen würde und diese vermutlich den High-End-Markt bedienen wird - das passiert nun mit GeForce GTX 980 und 970. Bei gleicher Leistungsaufnahme wurde die Leistung stark verbessert - das Performance/Watt-Verhältnis machte einen deutlichen Sprung. Ähnliches ist nun auch von der GeForce GTX 980 und GTX 970 zu erwarten, die ebenfalls auf der Maxwell-Architektur aufbauen, aber noch einmal kleine Verbesserungen erhalten haben. Endresultat sollen die bisher schnellsten und sparsamsten Karten aus dem Hause NVIDIA sein. Wir haben das Referenzmodell der GeForce GTX 980 sowie eines der ersten Retail-Modelle der GeForce GTX 970 genauer unter die Lupe genommen.

An dieser Stelle geht unser Dank zunächst einmal an NVIDIA für die Teststellung der GeForce GTX 980 im Referenzdesign sowie an EVGA für die GeForce GTX 970 Superclocked. NVIDIA verspricht zusammen mit seinen Partnern eine sofortige Verfügbarkeit beider Modelle. Während die GeForce GTX 970 von Anfang an in zahlreichen Custom-Designs angeboten wird, müssen Käufer einer GeForce GTX 980 zunächst einmal wohl noch häufiger eine Referenzkarte kaufen, denn nicht jeder Hersteller hat vom Start weg sein Custom-Design fertig.

Als kleine Vorbereitung auf diesen Artikel wollen wir nicht unerwähnt lassen, dass es sich dabei nicht um ein klassisches Launch-Review handelt, sondern dass wir einen großen Teil Theorie haben mit einfließen lassen. Dazu gehört nicht nur die genaue Erläuterung der Maxwell-Architektur, sondern auch die Erklärung der neuen Render- und Filter-Technologien wie DSR, MFAA und VXGI. Ebenfalls genauer beleuchten wollen wir die DirectX-12-Features, denn mit der GeForce GTX 980 und GeForce GTX 970 sehen wir die ersten Karten mit DirectX-12-Hardwareunterstützung. Zahlreiche weitere Features spielen ebenfalls eine Rolle.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 mit Maxwell-GPU

Nach dem ersten kleinen Inhaltsverzeichnis steigen wir aber nun direkt in die technischen Details der beiden Karten ein und vergleichen sie gegen die Vorgänger sowie die direkte Konkurrenz. In der Folge wird dann die Architektur die Hauptrolle spielen.

Architektonische Eckdaten

NVIDIA GeForce GTX 980 im Vergleich
ModellGeForce GTX 980Radeon R9 290XGeForce GTX 680GeForce GTX 780 Ti
Straßenpreis etwa 539 Euro etwa 395 Euro etwa 379 Euro etwa 499 Euro
Homepage www.nvidia.de www.amd.com/de www.nvidia.de www.nvidia.de
Technische Daten
GPU Maxwell (GM204) Hawaii Kepler (GK104) Kepler (GK110)
Fertigung 28 nm 28 nm 28 nm 28 nm
Transistoren 5,2 Milliarden 6,2 Milliarden 3,54 Milliarden 7,1 Milliarden
GPU-Takt (Base Clock) 1.126 MHz - 1.006 MHz 876 MHz
GPU-Takt (Boost Clock) 1.216 MHz 1.000 MHz 1.058 MHz 928 MHz
Speichertakt 1.750 MHz 1.250 MHz 1.500 MHz 1.750 MHz
Speichertyp GDDR5 GDDR5 GDDR5 GDDR5
Speichergröße 4.096 MB 4.096 MB 2.048 MB 3.072 MB
Speicherinterface 256 Bit 512 Bit 256 Bit 384 Bit
Speicherbandbreite 224,0 GB/s 320,0 GB/s 192,3 GB/s 336,0 GB/s
Shadereinheiten 2.048 2.816 1.536 2.880
Textur Units 128 176 128 240
ROPs 64 64 32 48
TDP 165 Watt > 250 Watt 195 Watt 250 Watt
SLI/CrossFire SLI CrossFire SLI SLI

Alle aktuellen High-End-GPUs und auch deren Vorgänger werden weiterhin in 28 nm gefertigt. Lange wurden darüber spekuliert, ob TSMC nicht doch die Fertigung in 20 nm in den Griff bekommen würde, offenbar aber waren sowohl NVIDIA wie auch AMD nicht von den Fertigkeiten bzw. der Ausbeute überzeugt und bleiben dem 28-nm-Prozess vorerst treu. Sowohl auf der GeForce GTX 980 wie auch auf der GeForce GTX 970 kommt die Maxwell-GPU mit Codenamen GM204 zum Einsatz. Diese besitzt 5,2 Milliarden Transistoren und ist damit weniger komplex als die Hawaii- oder große Kepler-GPUs. Im Vergleich zu GK104, dem eigentlichen Vorgänger, ist die Anzahl der Transistoren aber dennoch stark angewachsen.

Bisher musste NVIDIA beim Takt seiner GPUs in Abhängigkeit zur Komplexität der GPU immer konservativer agieren. Mit der GeForce GTX 980 und der darauf verbauten Maxwell-GPU kann NVIDIA offenbar wieder stärker an der Taktschraube drehen und lässt die 2.048 Shadereinheiten mit 1.126 MHz im Basis-Takt arbeiten. Unter Last und bei ausreichender Kühlung sollen mindestens 1.216 MHz möglich sein - die Karte kann aber noch deutlich höher takten als diese Boost-Vorgabe. Der GPU zur Seite stehen 4.096 MB GDDR5-Grafikspeicher, die mit einem Takt von 1.750 MHz angesprochen werden. Damit verwendet NVIDIA die aktuell schnellsten GDDR5-Speicherchips. Angebunden sind diese aber mit nur 256 Bit. Das könnte im Vergleich zu den 512 Bit der Radeon R9 290X und den zumindest 384 Bit der GeForce GTX 780 Ti zur größten Schwachstelle der GeForce GTX 980 werden. Dazu aber später mehr, wir halten an dieser Stelle nur die 224 GB pro Sekunde an Speicherbandbreite fest, was im Vergleich zur High-End-Konkurrenz sicherlich zunächst einmal recht ernüchternd klingt.

Auf die Details der Architektur kommen wir zwar später noch einmal, die 2.048 Shadereinheiten ergeben sich aber dennoch aus 16 Maxwell-Streaming-Multiprozessoren, die aus jeweils 128 ALUs bestehen. Aus dieser Zusammensetzung ergeben sich grundsätzlich auch die 128 Textureinheiten sowie die 64  ROPs - dazu aber wie gesagt später etwas mehr. Das wohl erstaunlichste technische Detail sind die 165 Watt für die Thermal Design Power (TDP). Bei gleicher Fertigung, mit einer komplexeren GPU (im Vergleich zu GK104) und einem höheren Takt will NVIDIA die Leistungsaufnahme dennoch deutlich reduziert haben. Dies dürfte auf spannende Messungen bei der Leistungsaufnahme hindeuten.

NVIDIA GeForce GTX 970 im Vergleich
ModellGeForce GTX 970Radeon R9 290GeForce GTX 670GeForce GTX 770
Straßenpreis etwa 319 Euro etwa 270 Euro etwa 329 Euro etwa 255 Euro
Homepage www.nvidia.de www.amd.com/de www.nvidia.de www.nvidia.de
Technische Daten
GPU Maxwell (GM204) Hawaii Kepler (GK104) Kepler (GK104)
Fertigung 28 nm 28 nm 28 nm 28 nm
Transistoren 5,2 Milliarden 6,2 Milliarden 3,54 Milliarden 3,54 Milliarden
GPU-Takt (Base Clock) 1.050 MHz - 915 MHz 1.046 MHz
GPU-Takt (Boost Clock) 1.178 MHz 947 MHz 980 MHz 1.085 MHz
Speichertakt 1.750 MHz 1.250 MHz 1.500 MHz 1.750 MHz
Speichertyp GDDR5 GDDR5 GDDR5 GDDR5
Speichergröße 4.096 MB 4.096 MB 2.048 MB 2.048 MB
Speicherinterface 224 + 32 Bit 512 Bit 256 Bit 256 Bit
Speicherbandbreite 224,0 GB/s 320,0 GB/s 192,3 GB/s 224,4 GB/s
Shadereinheiten 1.664 2.560 1.344 1.536
Textur Units 104 160 112 128
ROPs 64 64 32 32
TDP 145 Watt 250 Watt 170 Watt 230 Watt
SLI/CrossFire SLI CrossFire SLI SLI

Auch die GeForce GTX 970 muss sich der Konkurrenz aus eigenem Hause sowie von AMD stellen. Hier kommt mit GM204 die gleiche GPU zum Einsatz. Wir sprechen also auch hier von 5,2 Milliarden Transistoren und einer Fertigung in 28 nm. Allerdings hat NVIDIA drei SMM deaktiviert, wodurch wir nur noch auf 1.664 Shadereinheiten und 104 Texturheinheiten kommen. Im Vergleich zur GeForce GTX 980 bleibt die Anzahl der ROPs mit 64 identisch. Auch beim Takt gibt es zur GeForce GTX 980 einen Unterschied, denn als Basis-Takt gibt NVIDIA 1.050 MHz an, während es unter Last mindestens 1.178 MHz sein sollen. Der GeForce GTX 970 wird also etwas mehr Taktspielraum eingeräumt und wir bewegen uns wieder etwas mehr im Bereich knapp über der 1-GHz-Marke.

Keinerlei Unterschied gibt es beim Speicherausbau, denn auch auf der GeForce GTX 970 sind 4.096 MB GDDR5-Speicher verbaut, die ebenfalls mit 1.750 MHz angesprochen werden. Allerdings bleibt es auch hier natürlich beim 256 Bit breiten Speicherinterface, sodass die Speicherbandbreite mit 224 GB/Sek. auf etwa dem Niveau der GeForce GTX 770 zu finden ist. Ob dies ein Nachteil sein muss, klären wir später. Bei der GeForce GTX 970 gibt NVIDIA eine TDP von 145 Watt an, so dass die Leistungsmessungen auch hier spannend werden dürften.

Nachtrag:

Aufgrund fehlerhafter Angaben hat NVIDIA die Breite des Speicherinterfaces auf 224 + 32 Bit korrigiert. Ebenfalls reduziert wurde die Anzahl der ROPs von 64 auf 56 und die Größe des L2-Caches von 2.048 auf 1.792 kB. Genauere Details zu den weiteren Auswirkungen findet ihr in einem ausführlichen Artikel dazu.