> > > > NVIDIA GeForce GTX 750 Ti im Test

NVIDIA GeForce GTX 750 Ti im Test

DruckenE-Mail
Erstellt am: von

Seite 2: Die Maxwell-Architektur

Auf der folgenden Seite wollen wir uns der "Maxwell"-Architektur etwas genauer widmen.

"Kepler" gegen "Maxwell"

"Maxwell" weist in zahlreichen Bereichen Verbesserungen gegenüber "Kepler" auf, die letztendlich dazu führen sollen, dass das Performance/Watt-Verhältnis um den Faktor zwei verbessert wurde. An diesem Schaubild werden auch gleich einige entscheidende Änderungen deutlich: Die mit "Kepler" eingeführten SMX-Cluster mit 192 Shadereinheiten (CUDA-Kerne) werden neu angeordnet. Grund hierfür ist die Tatsache, dass eine Control Logic für 192 Shadereinheiten sehr komplex konstruiert werden muss. Mit "Maxwell" wird der Streaming Multiprozessor, in der Folge auch SMM (Maxwell Streaming Multiprozessor) genannt, in vier Blöcke zu jeweils 32 Shadereinheiten aufgeteilt. Insgesamt stehen als pro SMM 128 Shaderheinheiten zur Verfügung.

Die weniger komplexe Control Logic sorgt auch dafür, dass einzelne Aufgaben effizienter an die Kerne verteilt werden können. Dies sorgt auch dafür, dass ein einzelner Shader bis zu 35 Prozent schneller arbeitet als sein Pendant auf "Kepler"-Basis. Natürlich werden hier auch noch weitere Verbesserungen eine Rolle spielen, auf die wir später noch eingehen werden. Über einige Details will NVIDIA zum aktuellen Zeitpunkt aber auch noch nicht sprechen.

GPU-Blockdiagramm der GM107-GPU mit
GPU-Blockdiagramm der GM107-GPU mit "Maxwell"-Architektur

Das Blockdiagramm der GM107-GPU mit "Maxwell"-Architektur zeigt folgenden Aufbau, der einer GPU mit "Kepler"-Architektur nicht unähnlich ist. Das PCI-Express-3.0-Interface, die Speichcontroller, der L2-Cache, die ROPs und die GigaThread-Engine sind weiterhin modular um das Graphics Processing Cluster angeordnet. Bis zu fünf SMMs sind in einem GPC vorhanden. Der Vollausbau der GM107-GPU kommt bei fünf Streaming Multiprozessoren somit auf insgesamt 640 Shadereinheiten. Jeder dieser Maxwell Streaming Multiprozessoren teilt sich wiederum in vier Blöcke zu je 32 Shadereinheiten auf. 4 x 32 x 5 ergeben beim Vollausbau die insgesamt 640 Shadereinheiten. Jeder SMM besitzt zusätzlich noch jeweils acht Textureinheiten. Somit kommt die GM107-GPU auf insgesamt 40 dieser Einheiten. Weiterhin vorhanden sind 16 ROPs und zwei Speichercontroller mit jeweils 64 Bit.

Die höhere Effizienz und damit Performance erreicht NVIDIA offenbar durch mehrere Maßnahmen. So hat man wohl den L2-Cache von 256 KB der "Kepler"-Architektur auf 2.048 KB bei "Maxwell" aufgebohrt. Es bleibt weiterhin bei einer Bandbreite von 512 Byte pro Takt. Ebenfalls verbessert wurde die Zuarbeit zu den Shadereinheiten (Scheduling, Balancing etc.), sodass auch jeder einzelne Shader etwas schneller arbeiten soll. Damit einher geht auch eine höhere Anzahl an Instruktionen, die pro Takt abgearbeitet werden können.

SMM-Blockdiagramm
SMM-Blockdiagramm

Neben der neuen Anordnung der Shadereinheiten hat sich grundsätzlich recht wenig am Design getan. Jeder SMM besitzt eine PolyMorph-2.0-Engine. Die PolyMorph-2.0-Engine ist maßgeblich verantwortlich für Vertex-Fetch, Tessellation, Attribute-Setup, Viewport-Transform und den Stream-Output. Sind die SMM-Cluster und die PolyMorph-2.0-Engine durchlaufen, wird das Ergebnis an die Raster-Engine weitergeleitet. In einem zweiten Schritt beginnt dann der Tessellator mit der Berechnung der benötigten Oberflächen-Positionen, die dafür sorgen, dass je nach Abstand der nötige Detailgrad ausgewählt wird. Die korrigierten Werte werden wiederum an das SMX-Cluster gesendet, wo der Domain-Shader und der Geometrie-Shader diese dann weiter ausführen. Der Domain-Shader berechnet die finale Position jedes Dreiecks, indem er die Daten des Hull-Shaders und des Tessellators zusammensetzt. An dieser Stelle wird dann auch das Displacement-Mapping durchgeführt. Der Geometrie-Shader vergleicht die errechneten Daten dann mit den letztendlich wirklich sichtbaren Objekten und sendet die Ergebnisse wieder an die Tessellation-Engine für einen finalen Durchlauf. Im letzten Schritt  führt die PolyMorph-2.0-Engine die Viewport-Transformation und eine perspektivische Korrektur aus. Letztendlich werden die berechneten Daten über den Stream-Output ausgegeben, indem der Speicher diese für weitere Berechnungen freigibt.

Jeweils zwei 32er Blöcke eines SMM teilen sich einen Texture- bzw. L1-Cache. Allen 128 Shadereinheiten steht ein 64 KB großer Shared Memory zur Verfügung. Auf die jeweils acht Textureinheiten pro SMM sind wir bereits eingegangen. Jedem 32er Block stehen ein Instruction Buffer und ein Warp Schedular zur Verfügung. Jeweils zwei Dispatch Units haben Zugriff auf 16.384 Register mit jeweils 32 Bit. Auch hier lohnt wieder ein Blick auf die "Kepler"-Architektur. 192 Shaderheinheiten werden mit Hilfe von vier Warp Schedularn und acht Dispatch Units über 65.536 Register bei ebenfalls 32 Bit die Daten bzw. Rechenaufgaben zugeteilt. Jeder Shadereinheit stehen bei "Maxwell" also theoretisch 512 Register zur Verfügung, während es bei "Kepler" nur rund 341 sind. Eben solche Maßnahmen sollen auch dazu führen, dass jeder Shader bis zu 35 Prozent schneller arbeiten kann. Weiterhin einen Einfluss hat vermutlich auch das Verhältnis zwischen Shadereinheiten und den sogenannten Special Function Units (SFU). Während dies bei "Kepler" 6/1 beträgt, liegt das Verhältnis bei "Maxwell" bei 4/1. Gleiches gilt auch für die Load/Store Units (LD/ST). Spezielle Double-Precision-Einheiten sind im Blockdiagramm nicht zu sehen. Laut NVIDIA beträgt das Single-Precision/Double-Preciusion-Verhältnis 1/24, so wie auch schon bei den ersten "Kepler"-Chips der ersten Generation (GK104).

Gegenüberstellung von "Kepler"- und "Maxwell"-Architektur
GPU GK107 GM107
Maximale Anzahl an Shader-Prozessoren 384 640
Basis-Takt 1.058 MHz 1.020 MHz
Boost-Takt - 1.085 MHz
GFLOPs 812,5 1305,6
Textureinheiten 32 40
Texelfüllrate 33,9 GTexel/Sek. 40,8 GTexel/Sek.
Speichertakt 1.250 MHz 1.350 MHz
Speicherbandbreite 80 GB/Sek. 86,4 GB/Sek.
ROPs 16 16
Größe L2-Cache 256 KB 2.048 KB
Anzahl der Transistoren 1,3 Milliarden 1,87 Milliarden
Chip-Größe 118 mm2 148 mm2
Fertigung 28 nm 28 nm
TDP 64 Watt 60 Watt

Die direkte Gegenüberstellung von GK107 ("Kepler") und GM107 ("Maxwell") macht die Änderungen der Architektur am deutlichsten. So ist die Chipfläche von 118 auf 148 mm2 um 25 Prozent angewachsen. Gleichzeitig steigt die Anzahl der Transistoren von 1,3 auf 1,87 Milliarden, was einem Plus von 49 Prozent entspricht. Hier wird am deutlichsten, was die Umbauten im Chipdesign für Auswirkungen haben. Im Vollausbau lassen sich 66 Prozent mehr Shadereinheiten unterbringen. Neben einigen Detailverbesserungen in der internen Struktur und dem Scheduling sorgt vor allem die schiere Anzahl an Shadereinheiten für das deutliche Performance-Plus - zunächst einmal aber nur auf dem Papier. Dies alles bei einem fast identischen theoretisch maximalen Verbrauch.

NVENC

Eine der größten Änderungen der "Kepler"-Architektur war die Einführung dedizierter Hardware, die das De- und Encoding von H.264 Videos übernommen hat. Dies macht unter anderem die Aufzeichnung per ShadowPlay in der GeForce-GTX-600- und 700-Serie möglich. Mit "Maxwell" hat NVIDIA den NVENC überarbeitet und die Performance weiter verbessert. Die neue Hardware ist in der Lage H.264-Content mit 6-8facher Realtime-Geschwindigkeit abzuspielen. Bei "Kepler" lag dieser Wert bei der 4fachen Geschwindigkeit. Ein lokaler Video-Cache und eine höhere Effizienz bei der Nutzung des Speichers sorgt unter anderem dafür, dass der Verbrauch bei Wiedergabe eines Videos reduziert werden konnte. Ein neuer "GC5" Power State ist ebenfalls neu bei "Maxwell" und soll die Verbrauch bei niedrigen Verbrauchsszenarien weiter reduzieren.

Die dedizierte Video-Hardware erlaubt auch die Unterstützung der Videoaufzeichnung via ShadowPlay, das als Teil der GeForce Experience nicht nur die lokale Aufzeichnung ermöglicht, sondern auch das direkte Streaming via Twitch. Weiterhin wird ein Streaming via Gamestream vom PC, auf die mobile Konsole Shield möglich. Gleiches gilt auch für den Konsolen Modus, bei dem die Shield genutzt wird das PC-Spiel auf dem heimischen Fernseher darzustellen.

Zukünftig auch bei Karten mit "Maxwell"-GPU eine Rolle spielen wird G-Sync. Passend zu Einführung der GeForce GTX 750 und GeForce GTX 750 Ti könnten in 1 bis 2 Wochen die ersten Monitore auf den Markt kommen, nicht dem "Referenzmodell" von ASUS entsprechen. Der fehlende DisplayPort auf einigen Modellen der GeForce GTX 750 und GeForce GTX 750 Ti macht den Einsatz von G-Sync allerdings unmöglich.

Unified Memory

Für die ersten beiden Desktop-Versionen in Form der GeForce GTX 750 Ti und GeForce GTX 750 noch kein Thema ist der Unified Memory, den NVIDIA erstmals vor einem Jahr im Zusammenhang mit der "Maxwell"-Architektur vorstellte. Mehr zu diesem Thema wollen wir euch aber in einer extra News anbieten.

 

Social Links

Seitenübersicht

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (60)

#51
customavatars/avatar73342_1.gif
Registriert seit: 22.09.2007

Admiral
Beiträge: 13374
jupp, die 750gtx dürfte jetzt keinen sprung zur 285gtx sein.

die cpu sollte ggf. leicht übertaktet werden...

für echtes gaming ist die sicherlich jetzt nicht der burner, aber da scheinst du ja eh eher schon von weg zu sein ;)

passt schon, udn spart etwa 180w strom unter vollast ;)

Edit:
laut HWcompare ist die 285 sogar noch schneller.

http://www.hwcompare.com/17385/geforce-gtx-285-1gb-vs-geforce-gtx-750-ti/
real dürfte das bei null unterschied landen, aber wenn du zuwachs willst, musst du schon zu ner nummer grüßer greifen
#52
customavatars/avatar132261_1.gif
Registriert seit: 29.03.2010
Rhein-Main
Moderator
Beiträge: 19654
Die 750 sollte schneller sein. nicht viel, aber schneller.
Die Zahlen auf der Seite kommen mir komisch vor.
#53
customavatars/avatar84710_1.gif
Registriert seit: 10.02.2008

Admiral
Beiträge: 15048
Man kann GPU-Leistung eh nicht stumpf auf solche Eckdaten reduzieren. ;)
#54
Registriert seit: 24.03.2014

Matrose
Beiträge: 2
Danke für die Antworten, dann werd ichs wohl mal probieren :)
bloß der Stromverbrauch kommt mir noch ein bisschen trügerisch vor ^^, ist doch arg weniger.
Wird aber bestimmt einiges besser laufen als mein ersatz die 9400GT :rolleyes:
#55
customavatars/avatar202850_1.gif
Registriert seit: 06.02.2014
Im sonnigen Süden
Admiral
Beiträge: 9452
Zitat Dietzenberch;22013686
Danke für die Antworten, dann werd ichs wohl mal probieren :)
bloß der Stromverbrauch kommt mir noch ein bisschen trügerisch vor ^^, ist doch arg weniger.
Wird aber bestimmt einiges besser laufen als mein ersatz die 9400GT :rolleyes:


Naja, es liegen ja auch 6 Jahre dazwischen!
Da hat sich unglaublich viel getan...
#56
customavatars/avatar73342_1.gif
Registriert seit: 22.09.2007

Admiral
Beiträge: 13374
ich grab mal aus.

meine 750 gtx von gainward wurde heute das erste mal zur bildausgabe genoetigt.

leistung wirkt auf mich im ersten step nicht so viel hoeher als meine hd5770, die hab ich aber auch gut geocct, wobei ich bei der gtx auch etwa 1300mhz boost hatte, dank erhoehtem powertarget :)

die gainward ist nebenbei leider nicht wirklich leise.
30% luefterdrehzahl ist im idle 24° und unter last kaum ueber 50°, da waeren im idle auch 10% genug gewesen.
#57
customavatars/avatar202850_1.gif
Registriert seit: 06.02.2014
Im sonnigen Süden
Admiral
Beiträge: 9452
Zitat [W2k]Shadow;22083175
die gainward ist nebenbei leider nicht wirklich leise.
30% luefterdrehzahl ist im idle 24° und unter last kaum ueber 50°, da waeren im idle auch 10% genug gewesen.


Lässt sich das nicht per Treiber ändern?
#58
customavatars/avatar203311_1.gif
Registriert seit: 17.02.2014

Obergefreiter
Beiträge: 83
Welche 750 Ti kann man am ehesten empfehlen (Lautstärke/Leistung)?
#59
customavatars/avatar73342_1.gif
Registriert seit: 22.09.2007

Admiral
Beiträge: 13374
Zitat DragonTear;22083341
Lässt sich das nicht per Treiber ändern?


leider nein, bios-bedingt ist die karte auf einen mindestluefterwert von 30% geblockt.

bios hab ich nicht getestet, aber mit afterburner gehts nicht.

thema leiseste 750ti:
nach pcgh vergleichstest ist wohl die msi gtx 750 ti extrem leise.
die nennen 0,2 sone idle und 0,3 sone last.
dafuer ist die msi full size-pcb, also nicht immer fuer itx-systeme geeignet.

meine gtx wird aber ja eh unter wasser kommen ;)
#60
Registriert seit: 03.06.2014

Matrose
Beiträge: 1
Hallo Shadow,
mich würde interessieren, was das Ergebnis deiner Bemühungen gebracht hat die 570 leise zu bekommen.
Ich habe die msi 750ti mit einem Lüfter und die ist idle nicht zu ertragen, wenn ich sie mit meiner 5770 vapor-x vergleiche. Ich habe noch einen gebrauchten lüfter einer 7770 vapor-x,aber da ist der Lüfteranschluß 4polig und nicht 2polig wie an der 570ti. Vielleicht haste ja einen Tipp...?
Grüße
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Roundup: 5x GeForce GTX 1070 mit Custom-Design im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/5X-GTX1070/GTX1070_CUSTOM_ROUNDUP-TEASER

Nachdem wir bereits eine Reihe von Boardpartner-Karten der NVIDIA GeForce GTX 1080 ausführlich getestet haben, holen wir gleiches nun für das kleinere Schwestermodell nach, denn auch von der NVIDIA GeForce GTX 1070 gibt es viele Custom-Modelle mit höheren Taktraten, eigenen Kühlsystemen und... [mehr]

Drei Custom-Modelle der GeForce GTX 1060 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/3X-GTX1060/GTX1060_ROUNDUP_TEST-TEASER

Anders als bei der GeForce GTX 1080 und GeForce GTX 1070 trudelten wenige Stunden nach unserem Test zur Founders Edition der NVIDIA GeForce GTX 1060 schon die ersten Boardpartner-Karten mit teils höheren Taktraten, eigenem Kühlsystem und überarbeitetem Platinenlayout ein. Sie dürften... [mehr]

NVIDIA GeForce GTX 1080 mit Pascal-Architektur im XXL-Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Heute ist es soweit: NVIDIA läutet mit der GeForce GTX 1080 und GTX 1070 auf Basis der Pascal-Architektur den diesjährigen Neustart bei den Grafikkarten ein. In Kürze wird wohl auch AMD seinen Beitrag zu diesem Thema leisten. Vor zehn Tagen lud NVIDIA die gesammelte Fachpresse nach Austin ein... [mehr]

Roundup: 5x GeForce GTX 1080 im Custom-Design im Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Nachdem wir uns die Founders Edition der GeForce GTX 1080 und GeForce GTX 1070 bereits angeschaut haben, folgen nun fünf Retail-Modelle, die wir in aller Ausführlichkeit unter die Lupe nehmen wollen. Aus den vielen Boardpartnern und unterschiedlichen Modellen haben wir uns solche von ASUS, EVGA,... [mehr]

AMD Radeon RX 480 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/RADEON-RX480/RADEON-RX480-REFERENCE-LOGO

Es ist also soweit: AMD startet die großangelegte Zurückeroberung des Grafikkartenmarktes mit der Radeon RX 480, die als erste Grafikkarte der Polaris-Generation mit gleichnamiger Architektur erscheint und die wir uns genauer anschauen können. Dabei versucht sich AMD an einem anderen Ansatz im... [mehr]

PowerColor Radeon RX 480 Red Devil im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/POWERCOLOR-RX480/POWERCOLOR-RX480REDDEVIL-LOGO

Mit der Radeon RX 480 will AMD zurück zu alter Stärke und hat daher über Monate hinweg die PR-Trommel geschlagen. Letztendlich dabei herausgekommen ist eine sehr gute Karte für einen niedrigen Preis, die aber nicht in allen Bereichen zu überzeugen weiß. Wohl größtes Manko der Karte sollte... [mehr]