Seite 1: Kompromisslose Leistung: NVIDIA Titan X im SLI-Test

Etwas überraschend kündigte NVIDIA vor einigen Wochen die Titan X als schnellste Single-GPU-Grafikkarte für das Training von Deep-Learning-Netzwerken und auch die Verwendung bei Spielen an. Die Titan-Serie fokussiert damit endgültig neben den Spielen auch das professionelle Umfeld und entsprechend hat NVIDIA auch die Namensgebung geändert. Wir haben gleich zwei dieser Karten durch den Benchmark-Parcours geschickt und schauen uns die Leistung einmal etwas genauer an.

Bereits seit dem Launch der ersten Pascal-Karten in Form der GeForce GTX 1080 und GeForce GTX 1070 wurde vermutete, dass es zwischen der GP104-GPU und der GP100-GPU des GPU-Beschleunigers Tesla P100 auch noch einen Zwischenschritt in Form der GP102-GPU geben wird. Ob es sich dabei jedoch um auch um eine GPU handeln wird, die auch im Consumer-Segment eine Rolle spielen könnte, war bisher unklar.

Mit der Titan X hat NVIDIA die GP102-GPU in gleich zweierlei Bereichen beheimatet. Die Quadro P6000 verwendet sogar den Vollausbau dieser GPU mit 3.840 Shadereinheiten und bringt es dabei auf 24 GB. Aber die Quadro-Karten sind auch einem klaren Marktsegment zugeordnet und zudem im Falle der P6000 auch erst ab Oktober verfügbar. Es fehlt auch noch an den Angaben zu den finalen Taktraten, so dass die Leistung noch nicht vollständig eingeschätzt werden kann. Die Titan X hingegen ist ab sofort verfügbar und dürfte auch nur rund ein Viertel einer Quadro P6000 kosten. Universitäten und Unternehmen, die sich mit der Forschung künstlicher Intelligenzen beschäftigen sollen der Hauptabsatzmarkt für die Titan X sein. Aber natürlich wird sich auch der ein oder andere Spieler, der 1.299 Euro bei Seite gelegt hat, für eine solche Karte interessieren. FP32 und INT8 liegen für die Titan X also im Fokus und damit Deep-Learning-Anwendungen sowie das klassische Rendering/Gaming-Segment.

Im weiteren Verlauf des Artikels bleiben wir auch bei der Bezeichnung Titan X ohne den Pascal-Zusatz. Nur wenn wir auf die ältere Titan X mit Maxwell-Architektur referenzieren, werden wir dies entsprechend kennzeichnen.

Die technischen Daten der Titan X im Überblick
Modell NVIDIA Titan X NVIDIA GeForce GTX 1080 AMD Radeon R9 Fury X
Straßenpreis 1.299 Euro 789 Euro ab 615 Euro
Homepage www.nvidia.de www.nvidia.de www.amd.de
Technische Daten
GPU GP102 GP104 Fiji XT
Fertigung 16 nm 16 nm 28 nm
Transistoren 12 Milliarden 7,2 Milliarden 8,9 Milliarden
GPU-Takt (Base Clock) 1.417 MHz 1.607 MHz -
GPU-Takt (Boost Clock) 1.531 MHz 1.733 MHz 1.050 MHz
Speichertakt 2.500 MHz 2.500 MHz 500 MHz
Speichertyp GDDR5X GDDR5X HBM
Speichergröße 12 GB 8 GB 4 GB
Speicherinterface 384 Bit 256 Bit 4.096 Bit
Speicherbandbreite 480 GB/s 320 GB/s 512,0 GB/Sek.
DirectX-Version 12 12 12
Shadereinheiten 3.584 2.560 4.096
Textureinheiten 224 160 256
ROPs 96 64 64
Typische Boardpower 250 W 180 W 275 W
SLI/CrossFire SLI SLI CrossFire

Zu den technischen Daten der NVIDIA Titan X: 3.584 Shadereinheiten, die mit einem Takt von bis zu 1.531 MHz arbeiten. Die Rechenleistung beläuft sich auf 11 TFLOPs. Zudem stehen der GPU 12 GB an GDDR5X-Speicher zur Seite. Die GP102-GPU wird natürlich in 16 nm FinFET gefertigt und kommt auf 12 Milliarden Transistoren. Dei GP102 hat in etwa 40 % mehr Shadereineiten als die GP104-GPU der GeForce GTX 1080 bei einem etwas niedrigeren Takt. Der Basis-Takt liegt bei 1.417 MHz, während via GPU-Boost 1.531 MHz erreicht werden sollen. Die Rechenleistung von 11 TFLOPs der neuen Titan X liegt 34 % über der GeForce GTX 1080 und in ähnlicher Form ist damit eine Steigerung bei der Spieleleistung zu erwarten. Wer sich einen genaueren Eindruck von der Pascal-Architektur verschaffen möchte, kann dies im Launch-Artikel zur GeForce GTX 1080 Founders Edition tun.

Die 12 GB GDDR5X-Grafikspeicher sind über ein 384 Bit breites Speicherinterface angebunden. Damit kommen wir auf eine Speicherbandbreite von 480 GB/s. Mit einem derart breiten Speicherinterface liegt die Karte sogar auf Niveau der ersten Grafikkarten mit HBM-Speicher. Für die ROPs ergibt dies bei acht an der Zahl pro 32-Bit-Speicherblock eine Gesamtzahl von 96. Bei den Textureinheiten ergibt sich aufgrund des architektonisches Aufbaus der Pascal-Architektur eine Anzahl von 224 Textureinheiten. Die Thermal Design Power der neuen GeForce GTX Titan X beläuft sich auf 250 W.

Blockdiagramm der GP102-GPU auf der Titan X
Blockdiagramm der GP102-GPU auf der Titan X

Vergleicht man die GP100- und die GP102-GPU, kann folgendes festgehalten werden. Die GP102-GPU ist mit 471 mm² immerhin 139 mm² kleiner, als die GP100-GPU, die auf 610 mm² kommt. Beide GPUs kommen im Vollausbau auf 3.840 Shadereinheiten, wenngleich die Tesla P100 und die Titan X hier jeweils nur 3.584 Shadereinheiten verwenden und nur die Quadro P6000 ab Oktober die vollen 3.840 Shadereinheiten nutzen soll.

Die Einsparung in der Chipfläche kommt durch verschiedene Maßnahmen zustande. So verzichtet die GP102-GPU auf NVLink, eine schnelle FP64/FP16-Unterstützung sowie größere Register. Diese Aufteilung zwischen HPC- und Gaming/Workstation macht für NVIDIA wirtschaftlich Sinn, denn man kann die GP102-GPU deutlich günstiger fertigen (geringere Chipgröße und bessere Ausbeute). Dies war nicht möglich, so lange beide Produktsparten zumindest teilweise auf der identischen GPU basierten.

Rechenleistung und Ausbaustufen im Überblick
Modell NVIDIA Tesla P100 NVDIDIA Quadro P6000 NVIDIA Titan X
GPU GP100 GP102 GP102
FP64 5,3 TFLOPS - 343 GFLOPS
FP32 10,6 TFLOPS - 11 TFLOPS
FP16 21,2 TFLOPS - 172 GFLOPS
FP64-Verhältnis 1/2 1/32 1/32
FP16-Verhältnis 2/1 1/64 1/64
INT8-Verhältnis 4:1 4:1 4:1
Speichertyp HBM2 GDDR5X GDDR5X
Speichergröße 16 GB 24 GB 12 GB
Speicherinterface 4.096 Bit 384 Bit 384 Bit
Speicherbandbreite 720 GB/s 480 GB/s 480 GB/s
Shadereinheiten 3.584 3.840 3.584

Auch wenn viele Spieler sicherlich nach der Titan X gieren werden, NVIDIA sieht die Karte eher im Compute-Bereich – dort wo FP32- und INT8-Berechnungen eine wichtige Rolle spielen. Daher verzichtet man auch auf den Namenszusatz "GeForce" und "GTX". Zwar waren auch die vorherigen Titan-Karten sowohl für den Gaming- wie auch den Compute-Bereich vorgesehen, hier jedoch sah NVIDIA das Gaming in vorderster Reihe. Man erkannte bei NVIDIA jedoch recht schnell, dass die Titan-, Titan-X und Titan-Z-Karten zur Mehrheit für das Computing und als günstige Alternative zu den Quadro- und Tesla-Karten eingesetzt wurden. Dem trägt man mit der neuen Titan X auf Basis der Pascal-GPU nun Rechnung.