> > > > AMD Radeon R9 Fury X im Test

AMD Radeon R9 Fury X im Test

DruckenE-Mail
Erstellt am: von

Seite 2: Die Fiji-Architektur

Das Blockdiagramm zeigt den architektonischen Aufbau der "Fiji"-GPU. In der Mitte sind die 64 Compute-Units zu sehen, welche jeweils noch einmal 64 Shadereinheiten beherbergen. Doch fangen wir im Blockdiagramm links an: Hier zu sehen sind die vier HBM-Chips, die jeweils mit 2x 512 Bit am Memory-Controller der GPU angebunden sind. Dahinter befindet sich der L2-Cache, der 2 MB groß ist. Wie auch bei "Hawaii" kommen bei "Fiji" acht Asynchronous Compute Engines zum Einsatz, die AMD unter anderem für die Asynchronous Shaders und ein beschleunigtes Rendering verwendet.

Pressematerial zur AMD Radeon R9 Fury X
Pressematerial zur AMD Radeon R9 Fury X

Über den Global Data Share bzw. die Shader Engines werden die Aufgaben auf die vier großen Blöcke von jeweils 16 Compute Units verteilt. Weiterhin mit an Bord sind eine TrueAudio-Engine, auch wenn AMD das Engagement weitestgehend eingestellt hat. Man wartet derzeit darauf, dass die Entwickler wieder vermehrt Wert auf die Audioqualität legen. Bisher ist Thief das einzige Spiel, welches TrueAudio im größeren Umfang verwendet.

Der Unified Video Decoder (UVD) ist auf dem gleichen Stand wie bei den aktuellen "Carrizo"-APUs und kommt somit auch mit H.265 HVEC zurecht. Der Eyefinity Display Controller ist für die Ansteuerung von bis zu sechs Displays verantwortlich. In diesem ist auch die fehlende Unterstützung von HDMI 2.0 begründet, die wir später noch besprechen werden. Bereits angesprochen haben wir die XDMA Engine, die unter anderem für ein funktionierendes CrossFire ohne Brücke sorgt. Das Interface zum restlichen System verbleibt natürlich bei PCI-Express 3.0 – dieses dürfte auch noch einige Zeit der aktuelle Standard bleiben.

Aufbau einer GCN-Compute-Unit
Aufbau einer GCN-Compute-Unit

AMD verwendet in der "Fiji"-GPU die GCN-Architektur der dritten Generation. Damit ist man auf Niveau der "Tonga"-GPU des letzten Jahres und verwendet auch die gleichen Optimierungen. Eine Möglichkeit, die Performance eines Chips bei gleichem Takt zu steigern, ist die Anzahl der Berechnungen pro Takt zu erhöhen. Im Vergleich zu den Vorgänger-Architekturen kann die "Fiji"-GPU vier sogenannte "Primitives", also einfache Additionen pro Takt berechnen. Dies entspricht einer Verdopplung gegenüber "Tahiti" und sorgt schon einmal für einen deutlichen Schub bei der Gesamtperformance. Damit liegt "Fiji" auf Niveau der "Hawaii"- und "Tonga"-GPUs. Auch bei der Tesselation-Performance macht "Fiji" einen Sprung auf Höhe von "Hawaii" und "Tonga" und soll im Vergleich zu "Tahiti" um den Faktor 2 bis 4 schneller sein. Um den nur 4 GB großen Grafikspeicher zumindest etwas zu kompensieren, hat AMD eine verlustlose Delta-Farbkorrektur entwickelt, welche in etwa 40 Prozent Speicherbandbreite einspart, da nicht mehr derart viele Informationen übertragen werden müssen, wie ohne dieses Kompressionsverfahren. Letztendlich soll der Speicherdurchsatz in vielerlei Hinsicht höher sein als bei klassischem GDDR5-Speicher.

Stark verbessert hat AMD aber auch das Verhalten beim GPU-Computing. Instruktionen für die parallele Bearbeitung können nun zwischen SIMD-Lanes ausgetauscht werden. Ebenfalls verbessert wurde das Task Scheduling, also die Methode zur Aufteilung von Rechenoperationen zwischen den Shadereinheiten. Neue 16-Bit-Fließkommainstruktionen sorgen zudem für eine effizientere Arbeitsweise im GPU-Computing und Media Processing. All dies ist Teil eines aktualisierten ISA (Instruction Set Architecture) Instruction Sets.