> > > > NVIDIA GeForce 8800 GTX

NVIDIA GeForce 8800 GTX

DruckenE-Mail
Erstellt am: von

Seite 2: Die Architektur

Aktuelle GPUs besitzen u.a. zwei dedizierte Verarbeitungseinheiten, Vertex- und Pixelprozessoren. Grob zusammengefasst kann man sagen, dass die Vertex-Einheiten die Position von Vertices (Eckpunkte von Dreiecken) berechnen, wohingegen die Pixelprozessoren die entstandenen Dreiecke mit Texturen überziehen. Bereits in der Grafikeinheit der Xbox 360 findet ein alternatives System Verwendung, die Unified Shader Architektur. NVIDIA nennt die Unified-Shader-Einheiten "Stream Prozessoren". Die GeForce 8800GTX verfügt über 128 Stück (1350 MHz) davon, die GeForce 8800GTS über 96 (1200 MHz). Der Vorteil der Vereinheitlichung liegt auf der Hand: Während früher verschiedene Aufgaben explizit von Pixel- oder Vertexshadern ausgeführt wurden, kann ein Unified Shader beide Arten von Berechnungen durchführen. Bei einem ungleichen Verhältnis von Pixel- zu Vertexoperationen, kann es in einer nicht vereinheitlichten Architektur schnell vorkommen, dass etwa die Pixelshader ausgelastet werden, aber die Vertexeinheiten zum Großteil keine Berechnungen durchführen müssen. Die Stream-Prozessoren können solche Lastverhältnisse dynamisch ausgleichen und die Operationen auf eine große Anzahl an verarbeitenden Einheiten aufteilen. So entsteht eine gleichmäßige Lastverteilung

Die G80 Architektur als Schema

Der G80 bietet eine native DirectX-10-Unterstützung und auch eine volle Kompatibilität zu Shader Model 4.0. Die Spezifikationen von Microsofts neuer API enthalten auch den Anspruch an eine neue, programmierbare Shaderstufe. Die Stream-Prozessoren sind in der Lage, neben den Vertex- und Pixeloperationen zusätzlich auch Geometrieoperationen durchzuführen. Bisherige Geometriekalkulationen wurden unter zuhilfenahme der CPU mit den Vertexprozessoren berechnet. Ein Geometryshader ist nun in der Lage, die Koordinaten und Geometriedaten, die bisher die CPU anlieferte, selbst zu erzeugen und zu verändern und das sogar schneller als es eine CPU könnte. Außerdem entfällt der Übertragungsweg über den PCI-Express Bus, was sich auch in einem Geschwindigkeitsvorteil niederschlagen könnte. Aktuelle Spiele unterstützen dieses Feature natürlich nocht nicht, hier muss auf DirectX 10 gewartet werden. Auf dem Editor's Day zeigte NVIDIA den anwesenden Pressevertreter allerdings eine Techdemo, die die Fähigkeiten der Geometriemanipulatoren eindrucksvoll darstellte. Der Protagonist der "Frog Demo" ist ein Frosch, dessen Körperbau man nach Lust und Laune malträtieren kann. Alle Modifikationen werden natürlich in Echtzeit und mit den Geometryshadern berechnet.

 

 

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

Die Unified Shader Architektur ermöglicht es auch, die Prozesspalette um zusätzliche Bereiche zu erweitern. So profitieren vor allem Fließkomma-Berechnungen von der Geschwindigkeit der Grafikeinheiten. NVIDIA hebt hier besonders die Möglichkeit für Physik-Berechnungen hervor. Die aus der Taufe gehobene "Quantum-Effects™-Physik-Engine soll Naturgesetze effektiv und schnell berechnen, sowie einfach zu programmieren sein. Zusätzliche PPU-Karten könnten es in Zukunft noch schwerer haben. Doch auch völlig andere Anwendungen sind denkbar. Die "CUDA™ genannte Schnittstelle macht aus dem G80 eine GPGPU (General Purpose Graphic Processing Unit). ATI Karten führen seit einigen Monaten Berechnungen zur Faltung von Proteinen aus. In Zukunft soll dank CUDA noch eine Vielzahl weiterer Operationen auf den Grafikprozessoren verarbeitet werden. Wie CUDA funktioniert und welche Unterschiede es aufgrund der GPU zur ATI-Lösung gibt, zeigen wir ebenso im neuen Heft.