> > > > NVIDIA GeForce GTX Titan X im Test

NVIDIA GeForce GTX Titan X im Test

DruckenE-Mail
Erstellt am: von

Seite 2: Maxwell-Architektur und die GeForce GTX Titan X

Innerhalb der Architektur der SMMs hat NVIDIA im Vergleich zur "Kepler"-Architektur und damit der früheren Titan-Modelle einige Änderungen vorgenommen, die das Performance/Watt-Verhältnis um den Faktor zwei verbessern sollen. Dazu gehört, dass die mit "Kepler" eingeführten SMX-Cluster mit 192 Shadereinheiten (CUDA-Kerne) neu angeordnet wurden. Grund hierfür ist die Tatsache, dass eine Control Logic für 192 Shadereinheiten sehr komplex konstruiert werden muss. Mit "Maxwell" wird der Maxwell Streaming Multiprozessor, in der Folge auch SMM genannt in vier Blöcke zu jeweils 32 Shadereinheiten aufgeteilt. Insgesamt stehen als pro SMM 128 Shaderheinheiten zur Verfügung. Die weniger komplexe Control Logic sorgt auch dafür, dass einzelne Aufgaben effizienter an die Kerne verteilt werden können. Dies sorgt dafür, dass ein einzelner Shader bis zu 35 Prozent schneller arbeitet als sein Pendant auf "Kepler"-Basis. Als Testballon diente dazu die GM107-GPU, die man bereits vor einem Jahr auf der GeForce GTX 750 und GTX 750 Ti verbaute (Hardwareluxx-Artikel). Entsprechend auf die GM204- und GM206-GPU hochskaliert zeigte sich die gute Effizienz auch auf der GeForce GTX 980 und GTX 970 (Hardwareluxx-Artikel) sowie der erst kürzlich erschienen GeForce GTX 960 (Hardwareluxx-Artikel).

Die GM200-GPU der GeForce GTX Titan X bietet das sogenannte Full Feature Set der "Maxwell"-Architektur. Der Chip bietet also sämtliche geplanten Strukturen und Ausbaustufen. Dazu gehört neben den 3.072 Shadereinheiten auch ein 3 MB großer L2-Cache, der bei der GeForce GTX 980 2 MB groß ist und bei der GeForce GTX 970 aufgrund der Einschränkungen der Speicherbandbreite gar nur 1.792 kB misst. Verblieben ist man aber bei einer Bandbreite von 512 Byte pro Takt zu diesem Cache. Ebenfalls keinerlei Unterschiede gibt es bei der Double-Precision-Performance, die bei 1/32 der Single-Precision-Performance von 7 TFLOPS liegt. Dedizierte Double-Precision-Einheiten gibt es bei der jetzigen "Maxwell"-Implementierung also noch nicht. Die GTC 2015 wird zeigen, ob sich daran noch was ändern wir und eine eventuelle GM210-GPU hier entsprechende Änderungen vorzuweisen hat, die für Spieler aber keinerlei Rolle spielen.

Blockdiagramm der GM200-GPU
Blockdiagramm der GM200-GPU

Im Vergleich zur Maxwell-Architektur der 1. Generation leicht vergrößert hat man den Shared Memory eines jeden SMM. Dieser ist nun 96 kB und nicht mehr nur 64 kB groß. Ebenfalls eine Rolle spielen soll die Polymorph Engine in Version 3.0. Die PolyMorph-3.0-Engine ist maßgeblich verantwortlich für Vertex-Fetch, Tessellation, Attribute-Setup, Viewport-Transform und den Stream-Output. Sind die SMM-Cluster und die PolyMorph-3.0-Engine durchlaufen, wird das Ergebnis an die Raster-Engine weitergeleitet. In einem zweiten Schritt beginnt dann der Tessellator mit der Berechnung der benötigten Oberflächen-Positionen, die dafür sorgen, dass je nach Abstand der nötige Detailgrad ausgewählt wird. Die korrigierten Werte werden wiederum an das SMM-Cluster gesendet, wo der Domain-Shader und der Geometrie-Shader diese dann weiter ausführen. Der Domain-Shader berechnet die finale Position jedes Dreiecks, indem er die Daten des Hull-Shaders und des Tessellators zusammensetzt. An dieser Stelle wird dann auch das Displacement-Mapping durchgeführt. Der Geometrie-Shader vergleicht die errechneten Daten dann mit den letztendlich wirklich sichtbaren Objekten und sendet die Ergebnisse wieder an die Tessellation-Engine für einen finalen Durchlauf. Im letzten Schritt führt die PolyMorph-3.0-Engine die Viewport-Transformation und eine perspektivische Korrektur aus. Letztendlich werden die berechneten Daten über den Stream-Output ausgegeben, indem der Speicher diese für weitere Berechnungen freigibt. Mit diesem Prozess verbunden sind zahlreiche Render-Features, auf die wir auf den kommenden Seiten aber noch ausführlich kommen.

Noch einmal zurück auf die einzelnen SMM-Blöcke: Jedem 32er Block stehen ein Instruction Buffer und ein Warp Schedular zur Verfügung. Jeweils zwei Dispatch Units haben Zugriff auf 16.384 Register mit jeweils 32 Bit. Auch hier lohnt wieder ein Blick auf die "Kepler"-Architektur. 128 Shaderheinheiten werden mithilfe von vier Warp Schedulern und acht Dispatch Units über 65.536 Register bei ebenfalls 32 Bit die Daten bzw. Rechenaufgaben zugeteilt. Jeder Shadereinheit stehen bei Maxwell also theoretisch 512 Register zur Verfügung, während es bei Kepler nur rund 341 sind. Eben solche Maßnahmen sollen auch dazu führen, dass jeder Shader bis zu 35 Prozent schneller arbeiten kann. Weiterhin einen Einfluss hat auch das Verhältnis zwischen Shadereinheiten und den sogenannten Special Function Units (SFU). Während dies bei Kepler 6/1 beträgt, liegt das Verhältnis bei Maxwell bei 4/1. Gleiches gilt auch für die Load/Store Units (LD/ST).

Natürlich bietet die GeForce GTX Titan X aufgrund der Verwendung der "Maxwell"-Architektur auch sämtliche Features, die wir von der GeForce GTX 980, GTX 970 und GTX 960 kennen. Weitere Details dazu sind in den bisher erschienen Artikeln zu finden:

- 256 Bit Speichercontroller - Speicherkomprimierung
- DSR (Dynamic Super Resolution)
- MFAA (Multiframe Sampled Anti-Aliasing)
- VXGI (Voxel Global Illumination)
- DirectX 12
- GameWorks und PhysX
- VR Direct
- H.265 und 4K-Streaming

GeForce GTX Titan X im professionellen Umfeld

Die verschiedenen Modelle der GeForce GTX Titan wurden von NVIDIA auch immer für den professionellen Einsatz vorgesehen. Wer auf bestimmte Funktionen der Quadro- und Tesla-Treiber verzichten kann, kann hier auch viel Geld sparen. So verbauten nicht nur Privatpersonen de Varianten der GeForce GTX Titan in ihrem professionellen Arbeitsumfeld, sondern auch Unternehmen und Bildungseinrichtungen. Beispiele dazu sind zahlreich vorhanden, allerdings ist es schwer den Überblick zu behalten und NVIDIA macht keinerlei Angaben darüber, wie die Aufteilung zwischen Spieler- und Profi-Anwendung aussieht.

Der zur Verfügung stehende Speicher ist sicherlich ein entscheidendes Merkmal in diesem Bereich und hier ist die GeForce GTX Titan X mit ihren 12 GB Grafikspeicher sicherlich nicht schlecht aufgestellt. Wer aber besonderen Wert auf die Integrität der darin befindlichen Daten legt, wird ohne ECC auskommen müssen. Außerdem fehlt es der bisherigen "Maxwell"-Umsetzung an speziellen Double-Precision-Einheiten, welche Rechenaufgaben mit doppelter Genauigkeit ausführen können. NVIDIA gibt die Single-Precision-Performance mit 7 TFLOPS an. Bei einem Verhältnis von 24/1 für SP- zu DP-Einheiten liegt die Double-Precision-Performance bei nur 291 GFLOPS.

Vergleich der SP- und DP-Performance
Grafikkarte SP-Performance DP-Performance
GeForce GTX Titan X 7 TFLOPS 291 GFLOPS
GeForce GTX Titan Z 8,122 TFLOPS 2.707 GFLOPS
GeForce GTX Titan Black 5,121 TFLOPS 1.707 GFLOPS
GeForce GTX Titan 4,5 TFLOPS 1.500 GFLOPS
Quadro K6000 5,196 TFLOPS 1.732 GFLOPS
Tesla K40 4,291 TFLOPS 1.430 GFLOPS
Tesla K80 6,992 TFLOPS 2,91 GFLOPS
Radeon R9 290X 5,632 TFLOPS 320 GFLOPS
Radeon R9 295X2 11,466 TFLOPS 640 GFLOPS
FirePro W9100 5,237 TFLOPS 2618 GFLOPS

Hier hatte die "Kepler"-Architektur noch deutlich mehr anzubieten. Dies machte die GeForce GTX Titan (Black) und GeForce GTX Titan Z auch zu einer echten Alternative in diesem Bereich. Wer also weiterhin Wert auf eine hohe Leistung bei doppelter Genauigkeit legt, wird mit der aktuellen "Maxwell"-Umsetzung nicht glücklich werden. Denkbar ist aber, dass NVIDIA das Design entsprechend anpasst und als GM210-GPU auf den Markt wirft. Vielleicht werden wir bereits während der GTC 2015 mehr dazu hören. Wir erhoffen uns auch weitere Details zur Anwendung der GeForce GTX Titan X im professionellen Umfeld.

GPU-Z-Screenshot der GeForce GTX Titan X
GPU-Z-Screenshot der GeForce GTX Titan X

Der GPU-Z-Screenshot bestätigt die eben gemacht Angaben auch noch einmal. Aufgrund fehlender Datenbank-Einträge für die Karte bzw. unterschiedliche Teiler in der Hardware selbst kann es natürlich zu leicht veränderten Anzeigen in der Software kommen.

Gegenüberstellung von Temperatur und Takt
Spiel Temperatur Takt
The Elder Scrolls V Skyrim 82 °C 1.164 MHz
Company of Heroes 83 °C 1.151 MHz
Grid 2 82 °C 1.151 MHz
Metro: Last Light 83 °C 1.126 MHz
Crysis 3 82 °C 1.151 MHz
Battlefield 4 83 °C 1.138 MHz
Bioshock: Infinite 82 °C 1.164 MHz
Tomb Raider 83 °C 1.151 MHz

Wie üblich schauen wir uns das Taktverhalten der Karte auch in der Praxis etwas genauer an, denn mit Einführung von GPU-Boost und PowerTune auf Seiten von AMD sind die Angaben des Taktes immer nur ein Richtwert, die unter ganz bestimmten Bedingungen erreicht werden. Für die GeForce GTX Titan X bedeutet dies, dass sie vor allem mit dem Temperatur-Limit in Kontakt kommt. Dieses ist von NVIDIA mit 83 °C festgelegt. Erreicht die Karte dieses Limit, taktet sie herunter, um die Temperatur nicht weiter zu überschreiten. In den Meisten Benchmarks erreichen wir diese Temperatur nach einer Aufwärmphase auch, was dazu führt, dass wir unterschiedliche Taktraten sehen. Diese bewegen sich in unseren Tests zwischen 1.126 und 1.164 MHz. NVIDIA gibt einen Boost-Takt von 1.075 MHz an, so dass wir uns mindestens 50 MHz über den Angaben von NVIDIA bewegen.

Das Power-Limit von 250 Watt war zu keinem Zeitpunkt ein Problem. Laut verschiedenster Tools bewegt sich die Karte bei einer TDP-Auslastung von 90 - 95 Prozent während sie am Temperatur-Limit arbeitet. Sorgen wir durch Erhöhung der Lüfterdrehzahl dafür, dass die GPU unter ihr Temperatur-Ziel fällt bzw. erhöhen wir das Temperatur-Ziel selbst, taktet die Karte mit 1.177 MHz ohne ein manuelles Overclocking.

 

Social Links

Seitenübersicht

Kommentare (228)

#219
customavatars/avatar29323_1.gif
Registriert seit: 03.11.2005
Heidelberg
Kapitänleutnant
Beiträge: 1639


ein zweiter Mora zwischen den Titans und der CPU hätte es auch getan ;-)

[COLOR="red"]- - - Updated - - -[/COLOR]

Zitat xsiyahx;23304141
ja diese Karte scheint echt genug power zu haben mal sehen was 390X dagegen setzt


hehehe bin auch echt gespannt. Im Juli ist auf jedenfall eine fällig :-)
#220
customavatars/avatar34469_1.gif
Registriert seit: 30.01.2006
NRW
Admiral
Beiträge: 10505
Man bekommt fast vier GTX 970 gegenüber einer Titan. Wenn nur der Speicher größer wäre. Aber es gibt ja auch die 290x mit 8gb ;)

Gesendet von meinem GT-I9300 mit der Hardwareluxx App
#221
customavatars/avatar85061_1.gif
Registriert seit: 14.02.2008
In der Firewall
Flottillenadmiral
Beiträge: 5712
Zitat xsiyahx;23304291
der Raum scheint kühl zu sein :)


Ja, der raum ist extrem cool. Die Titan X kann ich ocen bis die Schwarte kracht:



Das Projekt von Naennon finde ich gut bis auf den gewählten Namen, denn er erinnert an das Nörchen von Thomas Anders. Im Gegensatz dazu verlangt aber keiner von Naennon, dass er eine Hundemarke wie Thomas Anders als Besitzabzeichen trägt:

#222
customavatars/avatar90476_1.gif
Registriert seit: 27.04.2008
AGBurg
Oberbootsmann
Beiträge: 970
Also hab i das jetzt richtig auf genommen 1150€ für nen vollausbau und die dp leistung is schlechter als bei ner tite black ähm ?!
Jetzt überspannen se den Bogen als nächstes kommt intel mit nem i6560 titan prozzi für 3000€ und Asus mit nem Titan extreme XX mit x200
chipsatz für 2000€ und ja corsair noch mit Ttan DDr5 4000 speicher für 1500€ und Mainstreme geht auf jetziges premium segmentpreis hoch
Nee Nee für soviel kohle hab i ne bessere verwendung, das ja lächerlich inzwischen klar braucht man sowas im Rechner auf jeden aber Preis /Nutzen - verhältniss passt jetzt gar nicht mehr also dann wars das wohl mit nem schönen Hobby die letzten Jahre und die Games sind inzwischen auch nicht mehr dasmwas sie mal waren mir fehlt schon lang wieder der wow-effekt bei grafik sowie bei gameplay also wieso noch 1150€ für ne Graka liegen lassen. Und wenn ich mal dampf brauch dann leih ich mir ne quaddro in der Firma aus und fertig
Aber solche Preistreibereien kann ich net unterstützen da bin i zu geizig aber die hardwareindustrie sollte sich net beschweren wenn die verkäufe immer weiter einbrechen. Vielleicht stoss ich irfendwann wieder dazu wenn es vernünftige VR-Brillen bzw. -Systeme gibt
Also wünsch euch allen hier was und fleissig weiter die Hardware Quälen bis es Qualmt :banana:
#223
customavatars/avatar101638_1.gif
Registriert seit: 30.10.2008
Dorsten
Kapitän zur See
Beiträge: 3869
Du brauchst das auch nicht unterstützen. Das machen andere schon für dich ;)

Gesendet von meinem SM-G900F mit der Hardwareluxx App
#224
customavatars/avatar11960_1.gif
Registriert seit: 18.07.2004
Vorarlberg/Österreich
Fregattenkapitän
Beiträge: 2675
Zitat xsiyahx;23304291
der Raum scheint kühl zu sein :)

aber ich kann nora noch einmal toppen habe 88L Aquarium als AGB und 2x Mora2 :)

Wassertemp= immer +2°C Raumtemp, mit 9x120mm +4x180mm [email protected]

aber meiste Zeit fahre Ich passiv bis Wassertemp 30°C erreicht

mit normalem surfen niemals erreichbar und beim Zocken erst nach 2 oder 3 Stunden später springen die Lüfter erst an:)


aber zurück zur TitanX das ding ist fast so schnell wie Stock 970SLI

Ohh schöne Idee!
Ich hätte noch so ein kleines 60l Aquarium irgendwo. :bigok:
Edit: OT. Die Titan X ist schon ein Biest aber die r9 295x2 liegt meist davor. Jetzt habe ich für 195 € eine 2. 290er gekauft. Dank Mora 2 habe ich noch genug Reserven. Ist einfach die billigere Lösung auch wenn es natürlich Multi-GPU ist. Bis Pascal sollte es reichen der ja Gerüchten zufolge einen ordentlichen Leistungsschub bringen soll.
#225
customavatars/avatar120848_1.gif
Registriert seit: 04.10.2009
Eisscholle hinten links
Korvettenkapitän
Beiträge: 2406
Zitat Chasaai;23293055
ja klar titan x auf 1.5ghz unter wasser,
das will ich erst mal sehen!

NVIDIA GTX TITAN X video card benchmark result - Intel Core i7-5960X,ASUSTeK COMPUTER INC. RAMPAGE V EXTREME

Besser so? Läuft beim Webmi.
#226
customavatars/avatar54828_1.gif
Registriert seit: 01.01.2007
Exil
Der Saft ist mit euch!
Beiträge: 8144
Die 1.5 sind doch letzte Woche sogar schon unter Luft gefallen oder habe ich mich da verlesen?
#227
customavatars/avatar189210_1.gif
Registriert seit: 27.02.2013
München
Admiral
Beiträge: 9310
#läuftbeiwebmi
#228
customavatars/avatar41359_1.gif
Registriert seit: 09.06.2006

Admiral
Beiträge: 27184
Zitat l0rd_helmchen;23312825
die 1.5 sind doch letzte woche sogar schon unter luft gefallen oder habe ich mich da verlesen?


pcgh raff
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Roundup: 5x GeForce GTX 1070 mit Custom-Design im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/5X-GTX1070/GTX1070_CUSTOM_ROUNDUP-TEASER

Nachdem wir bereits eine Reihe von Boardpartner-Karten der NVIDIA GeForce GTX 1080 ausführlich getestet haben, holen wir gleiches nun für das kleinere Schwestermodell nach, denn auch von der NVIDIA GeForce GTX 1070 gibt es viele Custom-Modelle mit höheren Taktraten, eigenen Kühlsystemen und... [mehr]

Drei Custom-Modelle der GeForce GTX 1060 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/3X-GTX1060/GTX1060_ROUNDUP_TEST-TEASER

Anders als bei der GeForce GTX 1080 und GeForce GTX 1070 trudelten wenige Stunden nach unserem Test zur Founders Edition der NVIDIA GeForce GTX 1060 schon die ersten Boardpartner-Karten mit teils höheren Taktraten, eigenem Kühlsystem und überarbeitetem Platinenlayout ein. Sie dürften... [mehr]

NVIDIA GeForce GTX 1080 mit Pascal-Architektur im XXL-Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Heute ist es soweit: NVIDIA läutet mit der GeForce GTX 1080 und GTX 1070 auf Basis der Pascal-Architektur den diesjährigen Neustart bei den Grafikkarten ein. In Kürze wird wohl auch AMD seinen Beitrag zu diesem Thema leisten. Vor zehn Tagen lud NVIDIA die gesammelte Fachpresse nach Austin ein... [mehr]

Roundup: 5x GeForce GTX 1080 im Custom-Design im Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Nachdem wir uns die Founders Edition der GeForce GTX 1080 und GeForce GTX 1070 bereits angeschaut haben, folgen nun fünf Retail-Modelle, die wir in aller Ausführlichkeit unter die Lupe nehmen wollen. Aus den vielen Boardpartnern und unterschiedlichen Modellen haben wir uns solche von ASUS, EVGA,... [mehr]

AMD Radeon RX 480 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/RADEON-RX480/RADEON-RX480-REFERENCE-LOGO

Es ist also soweit: AMD startet die großangelegte Zurückeroberung des Grafikkartenmarktes mit der Radeon RX 480, die als erste Grafikkarte der Polaris-Generation mit gleichnamiger Architektur erscheint und die wir uns genauer anschauen können. Dabei versucht sich AMD an einem anderen Ansatz im... [mehr]

PowerColor Radeon RX 480 Red Devil im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/POWERCOLOR-RX480/POWERCOLOR-RX480REDDEVIL-LOGO

Mit der Radeon RX 480 will AMD zurück zu alter Stärke und hat daher über Monate hinweg die PR-Trommel geschlagen. Letztendlich dabei herausgekommen ist eine sehr gute Karte für einen niedrigen Preis, die aber nicht in allen Bereichen zu überzeugen weiß. Wohl größtes Manko der Karte sollte... [mehr]