TEST

Kompromisslose Leistung

NVIDIA Titan X im SLI-Test

Von Andreas Schilling
Freitag, 12.08.2016 um 09:46 Uhr

Seite 1: Kompromisslose Leistung: NVIDIA Titan X im SLI-Test

Etwas überraschend kündigte NVIDIA vor einigen Wochen die Titan X als schnellste Single-GPU-Grafikkarte für das Training von Deep-Learning-Netzwerken und auch die Verwendung bei Spielen an. Die Titan-Serie fokussiert damit endgültig neben den Spielen auch das professionelle Umfeld und entsprechend hat NVIDIA auch die Namensgebung geändert. Wir haben gleich zwei dieser Karten durch den Benchmark-Parcours geschickt und schauen uns die Leistung einmal etwas genauer an.

Bereits seit dem Launch der ersten Pascal-Karten in Form der GeForce GTX 1080 und GeForce GTX 1070 wurde vermutete, dass es zwischen der GP104-GPU und der GP100-GPU des GPU-Beschleunigers Tesla P100 auch noch einen Zwischenschritt in Form der GP102-GPU geben wird. Ob es sich dabei jedoch um auch um eine GPU handeln wird, die auch im Consumer-Segment eine Rolle spielen könnte, war bisher unklar.

Mit der Titan X hat NVIDIA die GP102-GPU in gleich zweierlei Bereichen beheimatet. Die Quadro P6000 verwendet sogar den Vollausbau dieser GPU mit 3.840 Shadereinheiten und bringt es dabei auf 24 GB. Aber die Quadro-Karten sind auch einem klaren Marktsegment zugeordnet und zudem im Falle der P6000 auch erst ab Oktober verfügbar. Es fehlt auch noch an den Angaben zu den finalen Taktraten, so dass die Leistung noch nicht vollständig eingeschätzt werden kann. Die Titan X hingegen ist ab sofort verfügbar und dürfte auch nur rund ein Viertel einer Quadro P6000 kosten. Universitäten und Unternehmen, die sich mit der Forschung künstlicher Intelligenzen beschäftigen sollen der Hauptabsatzmarkt für die Titan X sein. Aber natürlich wird sich auch der ein oder andere Spieler, der 1.299 Euro bei Seite gelegt hat, für eine solche Karte interessieren. FP32 und INT8 liegen für die Titan X also im Fokus und damit Deep-Learning-Anwendungen sowie das klassische Rendering/Gaming-Segment.

{jphoto image=101566}

Im weiteren Verlauf des Artikels bleiben wir auch bei der Bezeichnung Titan X ohne den Pascal-Zusatz. Nur wenn wir auf die ältere Titan X mit Maxwell-Architektur referenzieren, werden wir dies entsprechend kennzeichnen.

Die technischen Daten der Titan X im Überblick
Modell	NVIDIA Titan X	NVIDIA GeForce GTX 1080	AMD Radeon R9 Fury X
Straßenpreis	1.299 Euro	789 Euro	ab 615 Euro
Homepage	www.nvidia.de	www.nvidia.de	www.amd.de
Technische Daten
GPU	GP102	GP104	Fiji XT
Fertigung	16 nm	16 nm	28 nm
Transistoren	12 Milliarden	7,2 Milliarden	8,9 Milliarden
GPU-Takt (Base Clock)	1.417 MHz	1.607 MHz	-
GPU-Takt (Boost Clock)	1.531 MHz	1.733 MHz	1.050 MHz
Speichertakt	2.500 MHz	2.500 MHz	500 MHz
Speichertyp	GDDR5X	GDDR5X	HBM
Speichergröße	12 GB	8 GB	4 GB
Speicherinterface	384 Bit	256 Bit	4.096 Bit
Speicherbandbreite	480 GB/s	320 GB/s	512,0 GB/Sek.
DirectX-Version	12	12	12
Shadereinheiten	3.584	2.560	4.096
Textureinheiten	224	160	256
ROPs	96	64	64
Typische Boardpower	250 W	180 W	275 W
SLI/CrossFire	SLI	SLI	CrossFire

Zu den technischen Daten der NVIDIA Titan X: 3.584 Shadereinheiten, die mit einem Takt von bis zu 1.531 MHz arbeiten. Die Rechenleistung beläuft sich auf 11 TFLOPs. Zudem stehen der GPU 12 GB an GDDR5X-Speicher zur Seite. Die GP102-GPU wird natürlich in 16 nm FinFET gefertigt und kommt auf 12 Milliarden Transistoren. Dei GP102 hat in etwa 40 % mehr Shadereineiten als die GP104-GPU der GeForce GTX 1080 bei einem etwas niedrigeren Takt. Der Basis-Takt liegt bei 1.417 MHz, während via GPU-Boost 1.531 MHz erreicht werden sollen. Die Rechenleistung von 11 TFLOPs der neuen Titan X liegt 34 % über der GeForce GTX 1080 und in ähnlicher Form ist damit eine Steigerung bei der Spieleleistung zu erwarten. Wer sich einen genaueren Eindruck von der Pascal-Architektur verschaffen möchte, kann dies im Launch-Artikel zur GeForce GTX 1080 Founders Edition tun.

Die 12 GB GDDR5X-Grafikspeicher sind über ein 384 Bit breites Speicherinterface angebunden. Damit kommen wir auf eine Speicherbandbreite von 480 GB/s. Mit einem derart breiten Speicherinterface liegt die Karte sogar auf Niveau der ersten Grafikkarten mit HBM-Speicher. Für die ROPs ergibt dies bei acht an der Zahl pro 32-Bit-Speicherblock eine Gesamtzahl von 96. Bei den Textureinheiten ergibt sich aufgrund des architektonisches Aufbaus der Pascal-Architektur eine Anzahl von 224 Textureinheiten. Die Thermal Design Power der neuen GeForce GTX Titan X beläuft sich auf 250 W.

Blockdiagramm der GP102-GPU auf der Titan X

Vergleicht man die GP100- und die GP102-GPU, kann folgendes festgehalten werden. Die GP102-GPU ist mit 471 mm² immerhin 139 mm² kleiner, als die GP100-GPU, die auf 610 mm² kommt. Beide GPUs kommen im Vollausbau auf 3.840 Shadereinheiten, wenngleich die Tesla P100 und die Titan X hier jeweils nur 3.584 Shadereinheiten verwenden und nur die Quadro P6000 ab Oktober die vollen 3.840 Shadereinheiten nutzen soll.

Die Einsparung in der Chipfläche kommt durch verschiedene Maßnahmen zustande. So verzichtet die GP102-GPU auf NVLink, eine schnelle FP64/FP16-Unterstützung sowie größere Register. Diese Aufteilung zwischen HPC- und Gaming/Workstation macht für NVIDIA wirtschaftlich Sinn, denn man kann die GP102-GPU deutlich günstiger fertigen (geringere Chipgröße und bessere Ausbeute). Dies war nicht möglich, so lange beide Produktsparten zumindest teilweise auf der identischen GPU basierten.

Rechenleistung und Ausbaustufen im Überblick
Modell	NVIDIA Tesla P100	NVDIDIA Quadro P6000	NVIDIA Titan X
GPU	GP100	GP102	GP102
FP64	5,3 TFLOPS	-	343 GFLOPS
FP32	10,6 TFLOPS	-	11 TFLOPS
FP16	21,2 TFLOPS	-	172 GFLOPS
FP64-Verhältnis	1/2	1/32	1/32
FP16-Verhältnis	2/1	1/64	1/64
INT8-Verhältnis	4:1	4:1	4:1
Speichertyp	HBM2	GDDR5X	GDDR5X
Speichergröße	16 GB	24 GB	12 GB
Speicherinterface	4.096 Bit	384 Bit	384 Bit
Speicherbandbreite	720 GB/s	480 GB/s	480 GB/s
Shadereinheiten	3.584	3.840	3.584

Auch wenn viele Spieler sicherlich nach der Titan X gieren werden, NVIDIA sieht die Karte eher im Compute-Bereich – dort wo FP32- und INT8-Berechnungen eine wichtige Rolle spielen. Daher verzichtet man auch auf den Namenszusatz "GeForce" und "GTX". Zwar waren auch die vorherigen Titan-Karten sowohl für den Gaming- wie auch den Compute-Bereich vorgesehen, hier jedoch sah NVIDIA das Gaming in vorderster Reihe. Man erkannte bei NVIDIA jedoch recht schnell, dass die Titan-, Titan-X und Titan-Z-Karten zur Mehrheit für das Computing und als günstige Alternative zu den Quadro- und Tesla-Karten eingesetzt wurden. Dem trägt man mit der neuen Titan X auf Basis der Pascal-GPU nun Rechnung.

Seite 1: Kompromisslose Leistung: NVIDIA Titan X im SLI-Test

Seite 2: NVIDIA Titan X in der Praxis

Quellen und weitere Links

Unterforum: Grafikkarten

KOMMENTARE (50)

{{{_source.title}}} {{#_source.showPrice}} {{{_source.displayPrice}}} {{/_source.showPrice}}

Kompromisslose Leistung NVIDIA Titan X im SLI-Test

Kompromisslose Leistung

NVIDIA Titan X im SLI-Test