> > > > NVIDIA GeForce GTX 1080 mit Pascal-Architektur im XXL-Test

NVIDIA GeForce GTX 1080 mit Pascal-Architektur im XXL-Test

DruckenE-Mail
Erstellt am: von

Seite 2: GDDR5X aus dem Hause Micron

Ende des vergangenen Jahres präsentierte Micron die finalen Spezifikationen zu GDDR5X. Demnach sieht Micron GDDR5X als Lückenfüller zwischen GDDR5 und HBM der ersten und zweiten Generation bzw. legt den Speicher auf bestimmte Einsatzgebiete aus. Um die Leistung des Speichers zu erhöhen, wird beispielsweise der Prefetch von 32 auf 64 Bit verdoppelt. Dadurch verdoppelt sich auch die Anzahl der Datenwörter pro Zugriff von 8 auf 16. Die Datenraten pro Pin am Speicherchip liegen aktuell bei 8 GBit/s bei den erwähnten GDDRX5-Varianten mit 1.000 MHz. Micron arbeitet in der aktuellen Ausführung von GDDR5X mit 10 bis 12 GBit/s, plant aber mit bis zu 16 GBit/s. Laut Micron sorgen die geringen Unterschiede zwischen GDDR5 und GDDR5X dafür, dass nur wenige Änderungen beim Design der Speichercontroller vorgenommen werden müssen, was AMD und NVIDIA sicherlich entgegenkommt.

Besitzt eine GPU aktuell ein Speicherinterface mit 256 Bit, so steigert der Einsatz von GDDR5X bei 12 GBit/s die Speicherbandbreite von 256 auf 384 GB/s (bei einem angenommenen Chiptakt von 1.000 MHz). Bei 16 GBit/s wäre sogar eine Verdopplung auf 512 GB/s möglich. Damit läge man schon auf Niveau der aktuellen HBM-Generation. An dieser Stelle muss aber auch erwähnt werden, dass ein GDDR5X mit 16 GBit/s derzeit noch nicht realisierbar ist. NVIDIA setzt bei der GeForce GTX 1080 auf GDDR5X-Speicher mit einem Takt von 2.500 MHz und kommt damit auf eine Speicherbandbreite von 320 GB/s. Damit ist die Speicherbandbreite gerade so auf Niveau des direkten Vorgängers GeForce GTX 980 und langsamer als bei der GeForce GTX 980 Ti. NVIDIA will dies aber mit einer verbesserten Delta-Farbkompression ausgleichen können.

Briefing von Micron zu GDDR5XBriefing von Micron zu GDDR5X

Briefing von Micron zu GDDR5X

Zunächst einmal schaut es danach aus, als seien sich GDDR5 und GDDR5X sehr ähnlich - dem ist auch so. Allerdings gibt es einige Einschränkungen. So verfügen die GDDR5X-Speicherchips über 190 anstatt 170 Kontakte im BGA. Die Abmessungen der Speicherchips spielen mit 14 x 10 mm wohl kaum eine Rolle. High Bandwidth Memory ist die zukünftige Speichertechnologie, soviel steht wohl bereits jetzt fest. Gerade der nächste Entwicklungsschritt auf die 2. Generation zeigt ein enormes Potenzial und wird von NVIDIA auf das Tesla P100 sogar schon verbaut. Aber HBM wird nicht über eine komplette Produktpalette eingeführt werden können - NVIDIA macht dies aktuell vor und AMD wird bei den kommenden GPUs auf Basis der Polaris-Architektur sicherlich auch (noch) nicht auf HBM2 setzen können. GDDR5X besitzt also seine Daseinsberechtigung, zumal die Entwicklung hier ebenfalls voranschreitet und die Integration bzw. die Anbindung an bestehende Speichercontroller recht einfach ist (ähnliche/identische Timings und Clocks). Netter Nebeneffekt ist die Senkung der Speicherspannung von aktuell 1,5 auf 1,35 V.

Delta-Farbkompression

Das nur 256 Bit breite Speicherinterface wirkt im Vergleich zu den 512 Bit der Hawaii-GPUs oder 4.096 Bit der ersten Karten mit HBM bzw. HBM2 von AMD und NVIDIA recht schmal. NVIDIA will über eine neue Speicherkomprimierung dennoch eine vergleichbare Performance in diesem Bereich bieten. Eine Delta-Farbkompression hat sich inzwischen bei GPUs von AMD und NVIDIA seit einigen Generationen durchgesetzt. Bei NVIDIA handelt es sich um die 4. Generation eines solchen Kompressionsverfahrens. AMD verwendet diese bereits mit der Tonga-GPU der Radeon R9 295. Erst kürzlich sprach AMD noch einmal über die Delta-Farbkompression, wie sie in der GCN-Architektur implementiert ist. Wichtig dabei ist, dass es sich um ein verlustloses Kompressionsverfahren handelt. Es gehen also keiner Daten verloren und Entwickler können sich auf das Verfahren verlassen, ohne speziell darauf angepasst zu entwickeln.

Delta-Farbkompression in der Pascal-Architektur
Delta-Farbkompression in der Pascal-Architektur

NVIDIA verwendet für die Speicherkomprimierung eine sogenannte Delta Color Compression. Dabei wird nur der Basispixelwert gespeichert und für die umliegenden Pixel in einer 8x8-Matrix nur noch der Unterschied (das Delta) gespeichert. Da das Delta ein deutlich kleinerer Wert ist, kann dieser schneller gespeichert werden und benötigt auch weniger Platz im Speicher. Es müssen also weniger Daten in den VRAM geschrieben und daraus gelesen werden. Komprimiert werden kann aber auch der einzelne Farbwert, so dass auch hier Speicherplatz oder besser Speicherbandbreite eingespart werden kann. Ein Beispiel für die Kompression ist ein vollständiges Schwarz und Weiß, deren Wert üblicherweise als {1.0, 0.0, 0.0, 0.0} oder {0.0, 1.0, 1.0, 1.0} im Speicher abgelegt wird. In einem einfachen Verfahren reichen aber auch die Werte 0.0 oder 1.0 aus, um dies eindeutig zu beschreiben.

Delta-Farbkompression in der Pascal-Architektur
Delta-Farbkompression in der Pascal-Architektur

Delta-Farbkompression in der Pascal-ArchitekturDelta-Farbkompression in der Pascal-Architektur

Delta-Farbkompression in der Pascal-Architektur

NVIDIA hat die Verfahren zur Detektion der komprimierbaren Bildinhalte verbessert. Das bereits bekannte 2:1 Verhältnis kann also schneller angewendet werden und ist zudem auf einen größeren Datenbestand anwendbar. Neu hinzugekommen sind die Kompressionen um den Faktor 4:1 und 8:1. Am Beispiel von ProjectCARS spricht NVIDIA von einer Reduzierung der benötigten Speicherbandbreite um die Hälfte, während es im Schnitt in etwa der Faktor 1,2 sein soll. Diese Werte auf die Speicherbandbreite von 320 GB/s angewendet, erreicht die GeForce GTX 1080 damit theoretische Bandbreiten von 384 bis 480 GB/s. Natürlich sind das rein theoretische Werte, die sich aufgrund der Komprimierung ergeben. Es ist auch schwierig den Einfluss der Delta-Farbkompression zu testen, da das Verfahren in der Hardware selbst durchgeführt wird und nicht ausgeschaltet werden kann.