stream prozessoren vs. shader alu

F117

Semiprofi
Thread Starter
Mitglied seit
08.12.2007
Beiträge
1.138
Eigentlich bin ich recht bewandert in sachen Hardware aber hier bin ich doch etwas verwirrt. Sind die Streamprozessoren von ATI vergleichbar mit den shader ALUs von Nvidia und wenn ja warum hat Ati viel mehr und ist doch langsamer? (320 vs. 128)
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Erstmal sind Streamprozessoren nicht dasselbe wie ALUs. ALUs sind nur ein Teil der Streamprozessoren, aber der Teil, der die Berechnungen durchführt und daher vermutlich am wichtigsten. Was du vergleichen kannst, sind die ALUs bei nVidia und bei ATi. Hier liegt der große Unterschied beim Takt: nVidias 128 ALUs laufen mit 1,5GHz (8800Ultra), ATis 320 nur mit 775 MHz (HD3870). Damit kommt die Radeon auf 496 GFLOPS, die 8800 auf 581 GFLOPS (Streitfall wegen dem zweiten MUL, aber das diskutier ich jetzt nicht). So groß ist der Unterschied in der theoretischen Arithmetikleistung hier noch nicht, allerdings sind ATis ALUs vollkommen anders aufgebaut als die von nVidia. Sie sind bedeutend schwerer auszulasten, es kommt häufig vor, dass Teile der ALU in einem Takt an nichts rechnen. Die Effizienz ist also bei nVidia höher.

Um aber deine eingehende Frage zu beantworten: Das ist trotzdem nicht der Grund, warum nVidia in dieser Generation schneller war. ;) Das liegt an anderen, mikroarchitekturellen Engpässen der RV670er-Chips, die der G80 nicht hatte. Stichwort hier: Texelfüllrate.
 
hey super erklärung!
klar hat nvidia doppelten takt, aber deutlich weniger als die hälfte an ALUs. wie kommst du dann auf eine höhere Arithmetikleistung bei nvidia?
danke
 
hey super erklärung!
klar hat nvidia doppelten takt, aber deutlich weniger als die hälfte an ALUs. wie kommst du dann auf eine höhere Arithmetikleistung bei nvidia?
danke
Der R670 hat 64 Unified Shader, welche 5D Shader sind. Diese werden aus Marketinggründen als 320 Streamprozessoren (64*5) vermarktet. Der Shadertakt ist gleich dem Chiptakt; 775MHz. Die 64 5D-Shader bringen es auf 10FLOPs. Daraus ergibt sich folgende Rechnung:

64 Shadereinheiten * 10FLOPS * 0,775GHz = 496GFLOPS​



Der G92 besitzt 128 Shadereinheiten, welche in 2 Vec8-MADD-ALU und 2 Vec8-MUL-ALU unterteilt sind. Daraus ergibt sich folgende Rechnung:

128 Shadereinheiten * 3FLOPS (2MADD+1MUL) * 1,688GHZ (Shadertakt) = ~648GFLOPS​



Ach mist, Ultra:
128 Shadereinheiten * 3FLOPS * 1,512GHz = ~580GFLOPS​

Gruß
:wink:
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh