> > > > ATI Radeon HD 5870 - The Game has changed

ATI Radeon HD 5870 - The Game has changed

DruckenE-Mail
Erstellt am: von

Seite 6: ATI Radeon HD 5870 - RV870-Architektur (2)

5870_tec_01_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

Kommen wir nun zu den Details der Architektur. Die wohl wichtigste Neuerung ist der Umstieg auf die Fertigung in 40 nm. Mit 2,15 Milliarden Transistoren hat sich die Anzahl derer gegenüber dem RV770 mehr als verdoppelt. Die zusätzlichen Transistoren werden vor allem für eine größere Anzahl an Recheneinheiten verwendet, anders als bei den Prozessoren, wo  oftmals ein großer L3-Cache den Unterschied ausmacht.

5870_tec_02_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

Die 1600 Stream-Prozessoren teilen sich wie folgt in Thread-Prozessoren und SIMD-Einheiten (Single Instruction Multiple Data) auf: Insgesamt verfügt die RV870-GPU über 20 SIMD-Einheiten. Jede von diesen besteht aus 16 Thread-Prozessoren, die sich nochmals in jeweils 5 Stream-Prozessoren aufteilen. Jede SIMD-Einheit beinhaltet zudem noch vier Texture-Units, bei 20 SIMDs ergibt dies 80 Texture-Units.

5870_tec_03_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

Soweit ist dieser Aufbau auch schon von der RV770-GPU bekannt. AMD hat aber auch zahlreiche Optimierungen vorgenommen, welche neue Technologien wie Tesselation in 6. Generation, DirectX-11-Features und weitere grafische, sowie Performance-Verbesserungen mit sich bringen.

5870_tec_04_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

Wie oben bereits erwähnt, teilt sich jeder Thread-Prozessor in fünf Stream-Prozessoren auf. Bei vieren handelt es sich im flexible Stream-Prozessoren, die pro Takt sowohl eine MADD (Multiply-ADD), als auch eine MUL (Multiplikation) durchführen können. Unter bestimmten Bedingungen können auch beide Operationen in einem Takt berechnet werden. Dies ist ein großer Unterschied zur Vorgänger-Architektur, die nur eine Operation pro Takt erlaubte. Neben den vier Stream-Prozessoren befindet sich in einem Thread-Prozessor aber auch noch eine Special Function Unit (SFU). Sie berechnet mathematische Operationen wie Sinus-, Kosinus- und Logarithmus-Anweisungen. Eine Branche-Unit im Thread-Prozessor sorgt dafür, dass eine Sprunganweisung im Code ("if-Befehl") nicht eine MADD-Einheit belegt, sondern von einer gesonderten Funktionseinheit berechnet wird.

5870_tec_05_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

Jede SIMD-Einheit des RV870 verfügt auch über ein Textur-Cluster. Jedes Cluster besteht aus vier Textur-Einheiten. Aus dieser Zusammenstellung ergeben sich dann insgesamt 80 Texture-Units. Jede SIMD-Einheit verfügt über einen 8 kB großen L1-Cache, der wiederum mithilfe einer Crossbar mit dem L2-Cache verbunden ist. Dessen Kapazität hat AMD gegenüber dem RV770 auf 128 kB pro Speichercontroller verdoppelt. Der Einsatz der DirectX-11-Features sowie die erhöhte Anzahl an Texture-Units und deren Anbindung an den Speichercontroller erlauben eine maximale Texturgröße von 16.000 x 16.000 Pixeln.

Die neue 32- und 64-Bit HDR Block Compression Modes sind ein DirectX-11-Feature, auf das wir später noch eingehen werden.