Test: AMD Radeon HD 7970

Veröffentlicht am: von

6970-logoEs ist soweit - AMD läutet eine neue Runde im Kampf um die GPU-Krone ein. Beide Hersteller, also sowohl AMD wie auch NVIDIA stehen vor neuen Herausforderungen. In gleich mehreren Bereichen müssen sich die beiden an neue Voraussetzungen und Gegebenheiten anpassen. Dies betrifft zum einen die neue Fertigungstechnologie in 28 nm. Hinzu kommt, dass nun auch klar ist, dass AMD eine völlig neue GPU-Architektur einsetzt. NVIDIA plant ebenfalls den Wechsel auf 28 nm und auch hier wird man in den kommenden Monaten über Details der neuen Architektur sprechen. Doch zunächst einmal ist AMD am Zuge und dürfte bei ausreichend guter Verfügbarkeit in den kommenden Monaten den Markt für sich haben. Wir haben uns den ersten Vertreter der neuen GPU-Generation in Form der AMD Radeon HD 7970 einmal etwas genauer angeschaut.

AMD sieht das PC-Gaming weiterhin im Aufwind und scheint dem PC in dieser Hinsicht unter die Arme zu greifen - gerade im Hinblick auf die Tatsache, dass bei den Konsolen erst mittelfristig mit Updates zu rechnen ist. Gerade moderne Grafik-Engines profitieren vom Leistungsvermögen aktueller Grafikkarten und eben dieser Vorteil soll weiter ausgebaut werden. Im vergangenen Jahr wurden 15 Milliarden US-Dollar im Bereich „PC-Gaming“ umgesetzt, 2013 sollen es sogar 20 Milliarden US-Dollar sein. Ebenfalls immer höher werden die Auflösungen, in denen gespielt wird. 1080p gehört inzwischen fast schon zum Standard, was sicherlich auch mit der Tatsache zu begründen ist, dass die entsprechenden Displays immer günstiger zu haben sind. Ebenfalls für AMD im Fokus steht die höhere Effizienz seiner GPUs sowie das GPU-Computing. Letztgenannter Bereich ist für AMD ein immer wichtig werdender Punkt, genau wie die Limitierung der Cayman-GPU-Architektur, die man nun aufheben will.

presentation-25-rs

Mit dem heutigen Tag stellt AMD nur die Radeon HD 7970 vor, die Folie legt allerdings nahe, dass es mehrere Karten der Radeon-HD-7900-Serie geben wird.

  NVIDIA GeForce GTX 570

NVIDIA GeForce GTX 580

AMD Radeon HD 6950 AMD Radeon HD 6970 AMD Radeon HD 7970
GPU GF110 GF110 Cayman PRO Cayman XT Tahiti XT
Fertigung 40 nm 40 nm 40 nm 40 nm 28 nm
Anzahl Transistoren 3 Milliarden 3 Milliarden 2,6 Milliarden 2,6 Milliarden 4,3 Milliarden
Die-Größe 530 mm² 530 mm² 389 mm² 389 mm² 365 mm²
GPU-Takt 732 MHz 772 MHz 800 MHz 880 MHz 925 MHz
Speichertakt 950 MHz 1000 MHz 1250 MHz 1375 MHz 1375 MHz
Speichertyp GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Speichergröße 1280 MB 1536 MB 2048 MB 2048 MB 3072 MB
Speicherinterface 320 Bit 384 Bit 256 Bit 256 Bit 384 Bit
Speicherbandbreite 152 GB/Sek. 192 GB/Sek. 160 GB/Sek. 176 GB/Sek. 264 GB/Sek.
Shader Model 5.0 5.0 5.0 5.0 5.0
DirectX 11 11 11 11 11.1
Shader-Einheiten 480 (1D) 512 (1D) 1408 (352 4D) 1536 (384 4D) 2048 (1D)
Shader-Takt 1464 MHz 1544 MHz 800 MHz 880 MHz 925 MHz
Texture Units 60 64 88 96 128
ROPs 40 48 32 32 32
maximale Leistungsaufnahme 219 Watt 244 Watt 200 Watt 250 Watt 250 Watt
minimale Leistungsaufnahme - 30-32 Watt 20 Watt 20 Watt 2,6 Watt
CrossFire/SLI SLI SLI CrossFireX CrossFireX CrossFireX


Die Radeon HD 7970 basiert auf der „Tahiti XT“-GPU und wird im 28-nm-Verfahren gefertigt. Insgesamt kommt die GPU auf eine Anzahl von 4,3 Milliarden Transistoren. Zum Vergleich: Intels Sandy-Bridge-E-Prozessoren besitzen - mit Ausnahme der Quadcore-Ableger - 2,27 Milliarden Transistoren. Der Vorgänger Cayman der Radeon-HD-6900-Serie kommt auf 2,6 Milliarden Transistoren. Untergebracht sind diese auf einem 365 mm² großen Die. Dieser ist etwas kleiner als der 389 mm² große der „Cayman“-GPUs, die natürlich in 40 nm gefertigt werden. Die GF110-GPU von NVIDIA kommt mit 3 Milliarden Transistoren auf rund 530 mm². Ein Großteil der Transistoren wird für die 2048 Shader-Prozessoren aufgewendet. Die GPU und auch die Shader-Domain arbeiten mit einem Takt von 925 MHz. Im Vergleich zur Radeon HD 6970 hat AMD den Takt des GDDR5-Speicher bei 1375 MHz belassen. Dafür ist das Speicherinterface nun nicht mehr 256 Bit sondern 384 Bit breit, was die Speicherbandbreite auf 264 GB/Sek. erhöht. Hinzu kommt, dass die Gesamtkapazität von 2048 MB auf 3072 MB angehoben wurde. 128 Texture-Einheiten und 32 ROPs verrichten ihren Dienst auf der Radeon HD 7970 - einen Anstieg für die Textur-Einheiten im Vergleich zur Radeon HD 6970, die Anzahl der ROPs hat man belassen. AMD gibt eine maximale Leistungsaufnahme für die Radeon HD 7970 von 250 Watt an, was gleichzeitig auch das Limit für PowerTune darstellt. Die typische Leistungsaufnahme soll bei 210 Watt liegen. Die Radeon HD 6970 kommt hier auf 250 Watt Maximalverbrauch und 190 Watt für die typische Last. Durch ZeroCore Power (dazu später mehr) soll der Idle-Verbrauch weniger als drei Watt betragen.

7970-gpuz

GPU-Z 0.5.7 liest, wie zu erkennen ist, noch nicht alle Daten der AMD Radeon HD 7970 korrekt aus. So wird auf unserem Sockel 1366-Testsystem das Businterface als PCI-Express 3.0 x16 angezeigt und der GPU-Takt mit 500 MHz angegeben. Daraus resultieren auch falsche Werte für die Pixel- und Texelfüllrate. Richtigerweise wären es bei 925 MHz GPU-Takt 29,6 GPixel/Sek. sowie 118,4 GTexel/Sek.. 


presentation-01-rs

PCI-Express 3.0

Als erster Grafikkartenhersteller bietet AMD mit den „Southern-Islands“-Karten einen Support für PCI-Express 3.0. Auf Seiten der Mainboards bzw. Chipsätze ist Intel mit seinem Z68- und X79-Chipsatz derzeit als einziger Hersteller in der Lage entsprechende Steckplätze anzubieten. PCI-Express 3.0 kann pro Lane eine Bandbreite von 1 GB/Sek. liefern. PCI-Express 2.0 kommt auf eine Bandbreite von 500 MB/Sek. pro Lane. Entsprechend äußert sich dies auch bei einem PCI-Express-x16-Steckplatz in einer Bandbreite von 16 GB/Sek. gegenüber 8 GB/Sek. Die Vorteile der höheren Bandbreite machen sich beim Einsatz einer einzelnen Karte kaum bemerkbar. Schon etwas anders sieht dies im CrossFire-Einsatz aus.

presentation-02-rspresentation-03-rs

DirectX 11.1

DirectX 11.1 wird ein Einzug mit Windows 8 halten, aber auch Windows 7 und damit entsprechende Anwendungen und Spiele sollen in den Genuss der neuen Features kommen. Weitgehende optische neue Features wird man bei DirectX 11.1 allerdings vermissen, Microsoft geht es mehr darum die Performance und Effizienz zu verbessern. Hauptaugenmerk stellt dabei die Unterstützung von Stereoscopic 3D dar. Es wird also keine herstellereigene API mehr für eine 3D-Darstellung nötig sein.


presentation-04-rs

Die wichtigsten technischen Daten der Radeon HD 7970 noch einmal zusammengefasst. Für das Marketing offenbar besonders wichtig sind die 2048 Shader-Prozessoren, 3 GB GDDR5-Speicher, das 384 Bit breite Speicherinterface und die Anzahl und Möglichkeiten der Display-Anschlüsse.

presentation-05-rs

Das PCB einer Radeon HD 7970 misst 26,5 cm, mitsamt Kühler benötigt sie zwei Slots an Bauhöhe. Das Referenzlayout ist gegenüber der Radeon-HD-6900-Serie leicht verändert worden. Es bleibt aber weiterhin bei einem Radiallüfter, der die Luft ansaugt und in Richtung der Slotblende drückt. Der Lüfter ist im Durchmesser etwas größer und besitzt leicht anders geformte Lüfterschaufeln. Diese sollen die Luftmenge erhöhen, die gefördert werden kann und zudem für eine geringere Geräuschentwicklung sorgen. Der eigentliche Kühlkörper setzt auf die 6. Generation der von AMD entwickelten Vapor-Chamber, deren Funktionsprinzip hinlänglich bekannt sein sollte. All diese Maßnahmen sollen für eine deutlich effizientere Kühlung sorgen. Auf der Slotblende zu finden ist ein Dual-Link-DVI-Anschluss  sowie einmal HDMI und zwei Mini-DisplayPort-Anschlüsse. AMD und die Partner legen einen HDMI-DVI- und aktiven Mini-DisplayPort-DVI-Adapter bei.


presentation-06-rspresentation-07-rs

PowerTune:

Mit der Radeon-HD-6900-Serie führte AMD Die PowerTune-Technologie ein. Dabei wird innerhalb der GPU im Millisekundenbereich die Aktivität der verschiedenen Bereiche des Chips gemessen. Es wird also nicht mehr einfach nur über die Temperatur oder Spannung und Strom der Verbrauch ermittelt, sondern deutlich detaillierter auf dem Chip selbst. AMD richtet den Maximalverbrauch auf praktische Anwendungen aus. Dies sind Spiele und Anwendungen mit höchster Last und entsprechend höchstem Verbrauch. Alles, was darüber hinaus durch spezielle Tools wie Furmark oder OCCT erreicht wird, wird durch PowerTune dynamisch auf den gewünschten Wert angepasst. Sollte der typische Takt von 925 MHz bei der Radeon HD 7970 allerdings dazu führen, dass es noch etwas Luft bis zum maximalen Verbrauch von 225 Watt vorhanden ist, hat AMD noch weitere P-States eingeführt, die einen höheren Takt erlauben. Im mittleren Bereich sind ebenfalls mehr P-States hinterlegt als dies bei der Radeon-HD-6900-Serie der Fall ist, sodass die GPU in eine höhere Anzahl an Takt- und Spannungslevel wechseln kann. Dies soll auch den Stromverbrauch bei der Verwendung von zwei oder mehr Displays reduzieren. Der hohe Verbrauch bei Verwendung von mindestens zwei Displays ist einer der Hauptkritikpunkte beim ansonsten guten Eindruck, den AMD bei der Leistungsaufnahme hinterlassen hat. AMD versucht so eine auf Abruf höhere Performance mit einem geringeren Verbrauch in Einklang zu bringen.

presentation-08-rs

Neben der besseren Performance war vor allem die höhere Effizienz ein Beweggrund für AMD für die neue Architektur. Den bereits geringen Idle-Verbrauch will man aber auch durch eine weitere Technologie reduzieren.

presentation-09-rs

ZeroCore Power:

ZeroCore Power schaltet die GPU komplett ab, wenn der Monitor ausgeschaltet ist. ZeroCore Power hat nichts mit einem Standy-Betrieb gemein. Hier geht es einzig und alleine um den Zustand eines laufenden Rechners, bei dem das Display abgeschaltet wird. AMD will den Verbrauch noch einmal um 95 Prozent gegenüber einem Standard-Idle-Betrieb reduziert haben. Einzig die Kommunikation über das PCI-Express-Interface muss aufrechterhalten werden, was AMD mit einem Verbrauch im Milliwatt-Bereich beziffert. Aufgrund des geringen Verbrauchs wird in diesem Zustand sogar der Lüfter komplett abgeschaltet. ZeroCore Power kann seine Vorteile aber besonders im CrossFire-Betrieb ausspielen. Bei Verwendung nur einer GPU, schalten sich die restlichen Karten in den „ZeroCore Power“-Modus - verbrauchen somit fast keinen Strom mehr und sind zudem keine zusätzliche Geräuschquelle.

presentation-10-rs

Ab Werk wird die "Tahiti XT"-GPU mit 925 MHz ausgeliefert, doch AMD sieht ein Overclocking-Potenzial, das auch einen Takt von 1 GHz und mehr möglich machen soll. Im Abschnitt dazu werden wir uns dieses Themas etwas genauer annehmen.


presentation-01-rs

Bereits erwähnt haben wir die Einführung einer neuen GPU-Architektur mit der Radeon-HD-7000-Serie. Die Entwicklung zur „Graphics-Core-Next“-Architektur (GCN) hat bereits vor fünf Jahren, kurz nach dem Launch der R600-GPU, die auf der Radeon-HD-2000 und 3000-Serie zum Einsatz kam, begonnen. GNC wird laut Aussage von AMD in den kommenden Jahren die Basis in der GPU-Architektur bilden und löst die alten VLIW4- und VLIW5-Architekturen ab. GCN soll sowohl in High-End-GPUs wie auch in Strom sparenden integrierten Lösungen zum Einsatz kommen. Um die Beweggründe für die Entwicklung von GCN zu verstehen, muss VLIW vielleicht noch einmal erklärt werden.

presentation-13-rs

VLIW steht für „Very Long instruction Word“  und bezeichnet eine Befehlsstruktur, bei der ein sequentieller Programmablauf durch eine Aufteilung in  kleinere Instruktionen parallelisiert werden kann. Dazu ist es aber nötig, dass der Compiler diese parallelisierbaren Instruktionen in eine bestimmte Gruppengröße zerlegt und später wieder zusammenfasst. Diese Aufteilung wird innerhalb der Hardware durchgeführt, erfolgt allerdings in der Praxis nicht immer ideal, sodass es zu Leerinstruktionen kommen kann. Diese versuchte AMD mit dem Wechsel von VLIW5 (Radeon-HD-6800-Serie) auf VLIW4 (Radeon-HD-6900-Serie) zu reduzieren, doch war bereits damals klar, dass eine effiziente Nutzung dieser Architektur zukünftig nicht mehr möglich sein wird. Zudem ist die VLIW-Architektur nicht weit genug auf das GPU-Computing ausgelegt - ein Bereich, der für AMD und NVIDIA sehr wichtig geworden ist. Grund hierfür ist die Tatsache, dass die Daten durch mehrere Stufen hindurchgeführt werden mussten, was zur Verzögerungen und Konflikten in den Registern (Caches, etc.) geführt hat.

presentation-12-rs

GNC verfolgt einen völlig anderen Ansatz. Die kleinste Einheit innerhalb der GCN-Architektur bildet die „Compute Unit“ (CU). Jede CU wiederum besteht auf vier Vektor-Prozessoren. Diese Vektor-Prozessoren bauen sich aus vier SIMDs (Single instruction, multiple data) zusammen, die jeweils 16 ALUs beinhalten. Aus diesen Zusammenhängen lassen sich nun die 2048 Shader-Prozessoren der Radeon HD 7970 (32 CUs x 4 SIMDs x 16 ALUs) ableiten.

Für die vier Vektor-Prozessoren innerhalb einer CU stehen viermal 64 kB Vektor-Register zur Verfügung. Hinzu kommen 64 kB Local-Data-Share-Cache, was der doppelten Menge gegenüber der alten Architektur entspricht. Dieser Cache ist in der Mitte zwischen den Vektor-Prozessoren platziert worden, um Latenzen durch die Verbindungen so gering wie möglich zu halten. Ebenfalls pro CU eingesetzt wird eine „Scalar Unit“ mit 4 kB Register. Bei der „Scalar Unit“ handelt es sich um eine Art Co-Prozessor. Ein „Scheduler“ sorgt dafür die Aufgaben gleichmäßig an die 16 SIMDs zu verteilen. Eine zusätzliche „Branche Unit“ kann priorisierte Prozesse an diesem „Scheduler“ vorbei an die Vektor-Prozessoren und damit die SIMDs bringen.

presentation-19-rs

Weiterer wichtiger Bestandteil der GPUs sind die Textureinheiten. Von diesen besitzen die „Tahiti“-GPUs jeweils vier pro CU, sodass die Radeon HD 7970 auf deren 128 kommt. Pro Textureinheit stehen wiederum vier „Textur Fetch Load / Store Units“ bereit, die der übergeordneten Einheit zuarbeiten. Eine weitere Komponente sind die „Render Output Units“ oder „Raster Operations Pipelines“ kurz ROPs. Von diesen besitzen die Karten der Radeon-HD-7900-Serie mit „Tahiti“-GPU pro CU eine. Der erste Cache in der Hierachie ist der L1-Cache der CU mit einer Größe von 16 kB. Er kann Daten mit bis zu 16 GB/Sek. in die CUs laden.

presentation-14-rs

Geht man in der Cache-Hierarchie eine Stufe höher, werden hier für vier CUs 16 kByte „Instruction Cache“ und 32 kB „Scalar Data Cache“ sichtbar. Diese sogenannten „GCN-Quad-SIMDs“ wiederum tauschen ihre Daten über den L2-Cache aus. Der L1-Cache schreibt seine Daten mit 64 Byte pro Takt in den L2-Cache. Der L2-Cache setzt sich aus mehreren Blöcken zusammen und ist im Falle von „Tahiti“ bis zu 786 kB groß. Ein Block ist jeweils über ein 64 Bit breites Interface mit dem Grafikspeicher angebunden. Der Grafikspeicher spielt eine besonders wichtige Rolle bei der Compute-Performance, aber natürlich auch beim alltäglichen Gaming-Einsatz. Über ein 384 Bit breites Speicherinterface kann AMD bis zu 264 GB/Sek. an Daten übertragen, was eine deutliche Steigerung gegenüber dem Vorgänger (bis zu 176 GB/Sek. bei der AMD Radeon HD 6970) und auch der Konkurrenz ist. NVIDIAs GeForce GTX 580 kann aufgrund geringerer GDDR5-Taktraten, bei im Vergleich zur AMD Radeon HD 7970 identischen Speicherinterface, mit maximal 192 GB/Sek. Speicherbandbreite aufwarten.


presentation-16-rs

In der Radeon-HD-7000-Serie zum Einsatz kommt die Tessellation-Engine in der 9. Generation. In dieser wurde die Wiederverwendung der Vertex-Daten erhöht, das Buffering optimiert und die Größe des Paramter-Cache verdoppelt.

presentation-20-rs

Dies soll dazu führen, dass die Tessellation-Engine der 9. Generation bis zu viermal schneller arbeitet als die 8. Generation in der Radeon-HD-6900-Serie. Besonders zum Tragen soll dies in hohen Tessellation-Stufen ab Level 15 kommen. Bemerkbar macht sich dies natürlich nur in Anwendungen und Spielen, die Gebrauch von Tessellation machen.

presentation-17-rs

NVIDIA hat es über die vergangenen Jahre geschafft, seine GPUs auch für das Computing anderer Aufgaben interessant zu machen. Dies hat zum einen mit dem guten Support zu tun, den NVIDIA in dieser Hinsicht leistet und ist zum zweiten auch durch die Fermi-Architektur begründet, die für diesen Einsatzzweck ausgelegt wurde.

AMD hat dies erkannt und will mit „Southern Islands“ gegensteuern. Doch neben den bereits erwähnten grundsätzlichen Optimierungen in der GCN-Architektur hat AMD auch noch weitere Komponenten der GPU auf das Computing ausgelegt. So sind in jeder „Tahiti“-GPU zwei ACEs (Asynchonous Compute Engine) zu finden. Diese arbeiten unabhängig voneinander und auch vom GCP (Graphics Command Processor). Die Aufgabe der Dual-ACEs ist es, die anstehenden Rechenaufgaben möglichst effizient zu verteilen. Eine Dual-DMA-Engine (Direct Memory Access) erlaubt den direkten Speicherzugriff ohne den Umweg über die CPU. Die Dual-DMA-Engine kommuniziert direkt mit dem L2-Cache und den zwei ACEs. Somit ist es möglich, die zur Berechnung nötigen Daten deutlich schneller an die Compute-Engines zu liefern. AMD spricht davon selbst den PCI-Express-Bus mit 16 GB/Sek. bidirektional zu saturieren.

presentation-18-rs

AMD gibt eine Rechenleistung von 4,5 TeraFLOPS für die Fließkommaperformance in Single-Precision an. Bei doppelter Genauigkeit kommt die „Tahiti“-GPU auf eine Rechenleistung von 947 GFLOPS. Zum Vergleich: Eine GF110-GPU kommt auf eine Rechenleistung von 1,58 TeraFLOPS bei einfacher Genauigkeit. Eine Cayman-XT-GPU kommt bei einfacher Genauigkeit auf 2,7 TeraFLOPS und 675 GFOPS bei doppelter Genauigkeit. Doch all diese theoretischen Werte spielen kaum ein Rolle, wenn das übrige Ökosystem nicht darauf abgestimmt ist. AMD bietet daher auch den ECC-Support für DRAM und SRAM. Als erste GPU werden die „Southern-Islands“-Chips auch OpenCL 1.2, DirectCompute 11.1 und C++ AMP unterstützen. Man kann also davon ausgehen, dass in Kürze auch professionelle FirePro-Grafikkarten auf den Markt kommen, die dann explizit auf das Computing ausgelegt sind.


presentation-21-rs

Eine wichtige Rolle spielen hier aber auch die „Partially Resident Textures“ (PRT). Mithilfe dieser Technologie wird der Grafikspeicher wie ein Cache behandelt. Daten können in und aus dem Speicher gestreamt werden. Dies erlaubt die Nutzung besonders großer Texturen. So lassen sich Texturen von bis zu 32 TB (16kB x 16 kB x 8 kB x 128 Bit) laden und auch der Compute-Performance ist dies zuträglich.

presentation-28-rspresentation-29-rs

Bei PRT wird eine Textur in feste Blöcke aufgeteilt. Gleichfarbige Flächen benötigen dabei natürlich weniger Informationen als ein Farb- oder Formenübergang. Es wird also bestimmt, welche Bereiche der 64 kB Textur eine höhere Auflösung benötigen. Diese höher aufgelösten Bereiche werden nun aber nicht mehr als komplette Textur in höherer Auflösung abgelegt, sondern in einem Pool des Grafikspeicher, in dem sich alle benötigten Teilbereiche befinden.

presentation-30-rs

In einer Realtime-Demo gibt AMD einen Ausblick darauf, was mit dieser Technologie möglich seind wird. Im folgenden Video ist sind Ausschnitte aus der Demo nebst englischen Erläuterungen zu sehen bzw. hören.

 

Abgefilmt haben wir auch den komplette Demo-Durchlauf auf der Veranstaltung von AMD. Die Demo soll in Kürze für jedermann zugänglich gemacht werden.

 


presentation-22-rs

Mit der Einführung der „Barts“-GPUs und später auch mit „Cayman“ musste AMD harsche Kritik bezüglich der AF-Filterqualität einstecken. Letztendlich führte dies dazu, dass wir durch die schlechtere Filterung in den Standard-Settings für eine Vergleichbarkeit in den Benchmarks die Qualitätseinstellungen im Treiber anpassen mussten. Dies sorgte bei der Radeon-HD-6800 und 6900-Serie dafür, dass die Performance um etwa fünf Prozent verringert wurde. AMD will nach diesem Rückschritt wieder einen Schritt in die richtige Richtung gemacht haben und führt einen neuen Algorithmus für das anisotrope Filtering ein. Dieser führt eine neue Gewichtung bei der Berechnung des Filters ein, was die Filterqualität deutlich verbessern soll. Unser erster Eindruck bestätigt dies und so werden wir für die Radeon-HD-7900-Serie zukünftig wieder zu den Standard-Settings zurückkehren. AMD aktiviert den neuen Filter-Algorithmus automatisch und verspricht keinerlei Performance-Einbußen.

AFTester-rs

Mithilfe des AF-Testers aber auch in Spielen haben wir die Bildqualität versucht zu beurteilen. Hier lassen sich optimale Darstellung (rechts) und durch die Grafikkarte angewendeter Filter (links) ideal miteinander vergleichen. Da das Flimmern sich in einem Foto nicht darstellen lässt, haben wir ein Video erstellt, das die Filterqualität in verschiedenen Einstellungen gegen die AMD Radeon HD 6970 vergleicht.

 

Wer sich das Video herunterladen möchte, findet hier den entsprechenden Link.


presentation23-rs

Mit einer neuen Hardware gehen oftmals auch neue Software-Features einher. Eines davon ist die nächste Iteration von Eyefinity. Mit Eyefinity 2.0 ist es nun möglich nicht nur das Spielgeschehen auf bis zu sechs Displays darstellen, sondern dies auch in HD3D zu tun. Der HDMI-Anschluss bietet den Support der HDMI-Spezifikation 1.4a und erlaubt somit auch die Darstellung von 3D-Inhalten in 1080p bei 60 Hz pro Auge. Über diesen und die DisplayPort-Anschlüsse wird es zukünftig auch möglich sein 4K-Displays anzusteuern. 

presentation-24-rs

Zudem ist es mit Eyefinity 2.0 möglich bis zu drei unterschiedliche Audio-Streams an drei verschiedene Displays zu liefern. DDMA (Discret Digital Multi-Point Audio) ist natürlich nur über HDMI und DisplayPort möglich. Der Support von Eyefinity 2.0 wird mit dem aktuellen Catalyst 11.12 eingeführt. Dieser bietet allerdings noch keinen CrossFire-Support, der erst mit dem Catalyst 12.1 folgt. Die Catalyst-Version 12.2 soll dann auch benutzerdefinierte Auflösungen wie beispielsweise 2400x600, 3840x720 oder 5760x1200 Pixel bieten. Dann wird es ebenfalls möglich sein die Taskleiste beliebig zu platzieren und diese nicht nur auf den rechten Display darzustellen.


presentation-26-rs

Mit der Radeon-HD-7900-Serie führt AMD die 3. Generation des UVD (Universal Video Decoder) ein. Dieser erlaubt nun das Decoding von gleich mehreren Codecs gleichzeitig und besitzt zwei Modi. 

presentation-27-rs

Im Full-Mode läuft das Decoding in der AMD VCE (Video Codec Engine) ab und passt sich dabei an die benötigte Decoding-Performance an. Dies erlaubt ein schnelles und angepasstes Decoding bei gleichzeitig geringem Verbrauch. Im Hybrid-Mode der VCE können auch mehrere Streams gleichzeitig decodiert werden. Denkbar ist dann beispielsweise ein HTPC, der ein Display im Büro und gleichzeitig ein weiteres im Wohnzimmer ansteuert. Der Hybrid-Modus wird allerdings nur auf den High-End-Grafikkarten der neuen Serie zum Einsatz kommen.


7970-01-rs

Bereits auf den ersten Bildern zu erkennen, sind auch die Änderungen am Erscheinungsbild der AMD Radeon HD 7970, und so werden wir auch die ersten Retail-Karten in diesem Gewand sehen. Dem Grundprinzip bleibt AMD allerdings treu und verwendeten einen Radiallüfter am hinteren Ende der Karte, der die kühle Luft in Richtung der Slotblende transportiert. Anstatt der matt-schwarzen Oberfläche, von der sich die roten Elemente abheben, setzt AMD nun mit Klavierlack auf eine glänzende Optik.

7970-01-rs

Das PCB der AMD Radeon HD 7970 misst in der Länge 26,5 cm. Da der Kühler noch einige Millimeter übersteht, kommt die Karte auf eine Gesamtlänge von 27,5 cm. Im Gegensatz zur Radeon HD 6970 verzichtet AMD hier auf die Backplate.

7970-01-rs

Die leicht modifizierten Lüfterschaufeln sollen das Luftvolumen bei gleicher Drehzahl erhöht haben und zudem für eine geringere Geräuschentwicklung sorgen.

7970-01-rs

Die Stromversorgung erfolgt über den PCI-Express-Steckplatz mit seinen bis zu 75 Watt sowie jeweils einen 6-Pin- und 8-Pin-Anschluss, die noch einmal 75 bzw. 150 Watt liefert. Maximal soll die AMD Radeon HD 7970 eine Leistung von 250 Watt aufnehmen können, über die Anschlüsse können ihr in der Theorie bis zu 300 Watt zugeführt werden.

7970-06-rs7970-07-rs

Über die beiden CrossFire-Anschlüsse können bis zu vier Karten der Radeon HD 7970 in einem CrossFireX-Verbund zusammengeführt werden. Wir hoffen in Kürze eine zweite Karte zu bekommen, um entsprechende Tests nachreichen zu können.

Auf beiden Bildern ebenfalls zu sehen ist der BIOS-Switch, der den Wechsel zwischen den zwei BIOS-Chips erlaubt. Das primäre BIOS ist schreibgeschützt und kann nicht verändert werden. Auf dem sekundären BIOS können eigene Versionen aufgespielt werden.


7970-01-rs

AMD verzichtet auf den Einsatz einer Backplate, muss aber natürlich den Heatsink in bekannter Form auf die GPU pressen.

7970-01-rs

Ein Blick auf die Slotblende offenbart die bereits erwähnten Anschlüsse. Dies wären jeweils einmal Dual-Link-DVI und HDMI sowie zweimal Mini-DisplayPort. AMD und die Partner legen einen HDMI-DVI- und aktiven Mini-DisplayPort-DVI-Adapter bei.

7970-01-rs

Die AMD Radeon HD 6970 (oben) und Radeon HD 7970 (unten) im direkten Vergleich. Die Maße des PCBs und auch die sonstigen Dimensionen sind identisch.

7970-12-rs7970-13-rs

Der etwas größere Radiallüfter ist nur im direkten Vergleich zu erkennen. Allerdings ist nicht der Durchmesser des Lüfters verändert worden, sondern einfach nur die Schauffellänge vergrößert worden.

Am hinteren Ende der Karte lässt AMD zwei kleine Öffnungen, um etwas warme Luft entweichen zu lassen. Die Radeon HD 6970 war an dieser Stelle komplett geschlossen.


7970-01-rs

Vergleicht man den Kühler der Radeon HD 6970 mit dem neuen auf der Radeon HD 7970, sind die Unterschiede nur im Detail zu finden. AMD setzt auf die 6. Generation der von AMD entwickelten Vapor-Chamber, die allerdings auch von anderen Hersteller in ähnlicher Form verwendet wird. An dieser Stelle ebenfalls zu sehen ist, dass auch die Speicherchips aktiv gekühlt werden.

7970-01-rs

Das komplette Kühlergehäuse ist, bis auf die Vapor-Chamber und der Bereich rund um den Lüfter, mit dem Kupfer-Heatsink aufgekleidet. An der hier abgebildeten Stelle wird die warme Luft über die Slotblende nach außen geblasen.

7970-01-rs

Das PCB der nackten AMD Radeon HD 7970 im Überblick. Rechts sind die Komponenten der Strom- und Spannungsversorgung zu erkennen. Mittig platziert wird die GPU von den Speicherchips eingerahmt. Links an der Slotblende sind die Komponenten für die Signalverarbeitung zu sehen.

7970-01-rs

Die "Tahiti"-GPU wird durch einen Rahmen geschützt, der ungleichen Druck durch den Kühler etwas ausgleichen soll. Auf der GPU selbst ist keinerlei Beschriftung zu erkennen. 12 Speicherchips zu jeweils 256 MB sind rings um die GPU platziert worden.


7970-01-rs

Hier noch einmal detailliert im Überblick die Spannungs- und Stromversorgung AMD hat diese laut eigener Aussage ausreichend großzügig dimensioniert, aber nach Öffnung des Designs werden zahlreiche Hersteller sicher in Kürze modifizierte Varianten vorstellen.

7970-01-rs

Auch ein noch genauerer Blick auf die GPU lässt keinerlei Beschriftung erkennen. Einzig die interne Produktbezeichnung "1146" und die Tatsache, dass es sich bei der Karte um ein Engineering Sample handelt, ist zu erkennen.

7970-01-rs

Beim GDDR5-Speicher handelt es sich um den gleichen, der auch schon auf der Radeon HD 6970 zum Einsatz kommt. Er stammt aus dem Hause Hynix.

7970-01-rs

Zur Steuerung der Spannung hat AMD einen Chil 8228G verbaut. Dieser Spannungsregler lässt sich über ein I2C-Interface ansprechen und erlaubt die Reglung und das Monitoring von bis zu acht Phasen.


Um die Treiber-Generationen anzugleichen, aber auch um die Hardware auf ein neues Level vorzubereiten, haben wir das Testsystem etwas umgestellt. Der Intel Core i7 Extreme 965 wird von 3,2 GHz auf 3,875 GHz übertaktet, um Limitierungen durch den Prozessor weitestgehend auszuschließen. Folgende Systemkomponenten kommen dabei zum Einsatz:

Testsystem  
Prozessor Intel Core i7 Extreme 965 3,2 GHz übertaktet auf 3,875 GHz
Mainboard ASUS P6T6 WS Revolution
Arbeitsspeicher Corsair XMS3 Dominator 4 GB PC3-12800U CL 7-7-7-20
Festplatte Seagate Barracuda 7200.11 320 GB
Netzteil Corsair HX1000
Betriebssystem Windows 7 64 Bit
Grafikkarten  
NVIDIA NVIDIA GeForce GTX 590 (608/1215/854 MHz, 3072 MB - 1536 MB effektiv)
NVIDIA GeForce GTX 580 (772/1544/1000 MHz, 1536 MB)
NVIDIA GeForce GTX 570 (732/1464/950 MHz, 1280 MB)
NVIDIA GeForce GTX 560 Ti 448 Cores (732/1464/950 MHz, 1280 MB)
NVIDIA GeForce GTX 560 Ti (820/1640/1000 MHz, 1024 MB)
NVIDIA GeForce GTS 550 Ti (900/1800/1026 MHz, 1024 MB)
NVIDIA GeForce GTX 480 (700/1401/924 MHz, 1536 MB)
  NVIDIA GeForce GTX 470 (608/1215/838 MHz, 1280 MB)
  NVIDIA GeForce GTX 465 (608/1215/802 MHz, 1024 MB)
  NVIDIA GeForce GTX 460 (675/1350/900 MHz, 1024 MB)
  NVIDIA GeForce GTS 450 (783/1566/902 MHz, 1024 MB)
AMD AMD Radeon HD 7970 (925/925/1375 MHz, 3072 MB)
AMD Radeon HD 6990 (830/830/1250 MHz, 4096 MB - 2048 MB effektiv)
AMD Radeon HD 6970 (880/880/1375 MHz, 2048 MB)
AMD Radeon HD 6950 (800/800/1200 MHz, 2048 MB)
AMD Radeon HD 6870 (900/900/1050 MHz, 1024 MB)
AMD Radeon HD 6850 (775/775/1000 MHz, 1024 MB)
AMD Radeon HD 5970 (725/725/1000 MHz, 2048 MB - 1024 MB effektiv)
AMD Radeon HD 5870 (850/850/1200 MHz, 1024 MB)
  AMD Radeon HD 5850 (725/725/1000 MHz, 1024 MB)
  AMD Radeon HD 5830 (800/800/1000 MHz, 1024 MB)
Treiber:  
NVIDIA

GeForce 285.76

AMD AMD Catalyst 11.12 (8.921.2-111215a-130438E-ATI)

Treibereinstellungen NVIDIA:

Textureinstellungen AMD:

Folgende Benchmarks kommen mit den genannten Settings zum Einsatz:

Futuremark 3DMark06:
- 1680x1050 8xAA 16xAF
- 1920x1200 8xAA 16xAF
- 2560x1600 8xAA 16xAF
Futuremark 3DMark Vantage (PhysX aus):
- Performance
- High
- Extreme
Resident Evil 5 (Motion Blur - an, Shadow Detail - High, Texture Detail - High, Overall Quality - High):
- 1680x1050 8xAA 16xAF
- 1920x1200 8xAA 16xAF
- 2560x1600 8xAA 16xAF
H.A.W.X. 2 (DirectX 11, alles hoch bzw. ein):
- 1680x1050 4xAA 16xAF
- 1680x1050 8xAA 16xAF
- 1920x1200 4xAA 16xAF
- 1920x1200 8xAA 16xAF
- 2560x1600 4xAA 16xAF
- 2560x1600 8xAA 16xAF
Far Cry 2 (DirectX 10, Performance - Very High, Overall Quality - Optimal, alles andere High):
- 1680x1050 4xAA 16xAF
- 1680x1050 8xAA 16xAF
- 1920x1200 4xAA 16xAF
- 1920x1200 8xAA 16xAF
- 2560x1600 4xAA 16xAF
- 2560x1600 8xAA 16xAF
Unigine Heaven 2.0 (DirectX 11, Shader - High, Tesselation - Normal):
- 1680x1050 4xAA 16xAF
- 1680x1050 8xAA 16xAF
- 1920x1200 4xAA 16xAF
- 1920x1200 8xAA 16xAF
- 2560x1600 4xAA 16xAF
- 2560x1600 8xAA 16xAF
Metro 2033 (DirectX 11, Quality - High, DOF - an, PhysX - deaktiviert):
- 1680x1050 4xAA 16xAF
- 1680x1050 8xAA 16xAF
- 1920x1200 4xAA 16xAF
- 1920x1200 8xAA 16xAF
- 2560x1600 4xAA 16xAF
- 2560x1600 8xAA 16xAF
Mafia II (alles High bzw. ein, ohne Apex):
- 1680x1050 kein AA 16xAF
- 1680x1050 8xAA 16xAF
- 1920x1200 kein AA 16xAF
- 1920x1200 8xAA 16xAF
- 2560x1600 kein AA16xAF
- 2560x1600 8xAA 16xAF
STALKER (2560x1600, DirectX 11, Preset - Extreme, 4x MSAA, SSAO Mode - Default, SSOA Quality - Medium, enable Tesselation)
- Day
- Night
- Rain
- Sun
Anno 1404 (alles an/hoch, Kampagne starten und die ersten 60 Sekunden):
- 1680x1050 4xAA 16xAF
- 1920x1200 4xAA 16xAF
- 2560x1600 4xAA 16xAF
Crysis Warhead (DirectX 10, Enthusiast):
- 1680x1050 4xAA 16xAF
- 1920x1200 4xAA 16xAF
- 2560x1600 4xAA 16xAF
Framediagramme:
Medal of Honor (2560x1600, Grüße aus Bagram - die ersten 60 Sekunden)
Metro 2033 (2560x1600, DirectX 11, Quality - High, DOF - an, PhysX - deaktiviert)

Futuremark 3DMark Vantage (PhysX aus):

Futuremark 3DMark 11:

Resident Evil 5 (Motion Blur - an, Shadow Detail - High, Texture Detail - High, Overall Quality - High):

H.A.W.X. 2 (DirectX 11, alles hoch bzw. ein):

Far Cry 2 (DirectX 10, Performance - Very High, Overall Quality - Optimal, alles andere High):

Unigine Heaven 2.1 (DirectX 11, Shader - High, Tesselation - Normal):

Metro 2033 (DirectX 11, Quality - High, DOF - an, PhysX - deaktiviert):

Mafia II (alles High bzw. ein, ohne APEX PhysX):

Anno 1404 (alles an/hoch, Kampagne starten und die ersten 60 Sekunden):

Crysis Warhead (DirectX 10, Enthusiast, Frost Flythrough):

Frameverläufe:

 

 


Beginnen wollen wir mit den Messungen:

mess1

AMD gibt einen theoretischen Idle-Verbrauch von 2,6 Watt für die Radeon HD 7970 an. Mit einem Wert von 145,2 Watt liegen wir sechs Watt unterhalb der Radeon HD 6970. Den von AMD angegebenen Wert können wir somit nicht bestätigen, dennoch ist die Radeon HD 7970 die sparsamte High-End-Grafikkarte, die uns bisher untergekommen ist.

mess1

Auch für den Last-Betrieb verspricht AMD eine Reduzierung des Verbrauchs bei gleichzeitig besserer Performance. Zumindest erst gennannte Punkte können wir der Radeon HD 7970 attestieren. Mit knapp unter 400 Watt liegen wir rund 25 Watt unter der Radeon HD 6970 und haben einen deutlichen Abstand zur GeForce GTX 580.

mess1

Bereits beim Referenzlayout legen die Hersteller immer größeren Wert auf die Kühlung, so auch AMD bei der Radeon HD 7970. Im Idle-Betrieb ist das Potenzial allerdings nur sehr gering, und so bewegen wir uns mit den 42 °C auf üblichem Niveau.

mess1

Schon anders schaut dies für den Last-Betrieb aus. Hier präsentieren sich besonders die Dual-GPU-Karten immer wieder als zu hitzig. Die Radeon HD 7970 ist mit gemessenen 85 °C so warm wie der direkte Vorgänger und nur wenige Grad kühler als die Konkurrenz aus dem Hause NVIDIA. Mit 85 °C können wir aber sehr gut leben, denn erst ab 95 °C darf man sich so seine Gedanken über die Lebensdauer der Karte machen.

mess1

Im Idle-Betrieb messen wir eine Lautstärke von 51,2 dB und damit liegt die Radeon HD 7970 im Mittelfeld. Einzig die Dual-GPU-Grafikkarten stechen hier negativ hervor.

mess1

Wie immer entscheidend, auch bei der Lautstärke, ist der Last-Betrieb. Hier messen wir einen Wert von 57,8 dB, durch den sich die Radeon HD 7970 etwas von der Radeon HD 6970 mit 61 dB und der GeForce GTX 580 mit 58,5 dB absetzt. Insgesamt hinterlässt die Kühlung also einen durchaus positiven Eindruck.


Mit den ersten Performance-Messungen beginnen wir im 3DMark Vantage. Der 3DMark Vantage in seiner aktuellen Version ist sehr grafikkartenlastig und damit ideal für unsere Zwecke geeignet. Um die 3D-Grafikpracht flüssig zu genießen, ist aber auch eine schnelle CPU notwendig. Der Download von 3DMark Vantage ist wie immer in unserem Download-Area möglich.


vantage1

vantage1

vantage1


Auch die neuste Generation des 3DMark wollen wir mit in den Benchmark-Parcour aufnehmen. Beim 3DMark 11 handelt es sich um den ersten vollständigen DirectX-11-Benchmark aus dem Hause Futuremark. Aus diesem Grund macht er auch ausgiebig Gebrauch von Tessellation, Depth of Field, Volumetric Lighting und Direct Compute. Obligatorisch ist natürlich auch die Unterstützung für Multi-Core-Prozessoren mit mehr als vier Kernen. Der Download ist in unserem Download-Area möglich.

3dmark11_2_rs 3dmark11_1_rs
3dmark11_4_rs 3dmark11_3_rs

3dmark1

3dmark1

3dmark1


Die letzte Version aus der Horror-Reihe Resident Evil erschien nicht nur für diverse Konsolen, sondern auch für den PC. Die integrierte Benchmark-Funktion lädt dann natürlich geradezu ein, Grafikkarten auf Herz und Nieren im Grusel-Ambiente zu testen. Wir wählten den zweiten, weil deutlich kürzeren, Benchmark-Durchlauf.

ResidentEvil1_rs ResidentEvil2_rs
ResidentEvil3_rs ResidentEvil4_rs

Zur Vollversion von Resident Evil 5 in unserem Preisvergleich gelangt man über diesen Link.

resi1

resi1

resi1


Bei Far Cry 2 handelt es sich um einen First-Person-Shooter aus dem Hause Ubisoft. Der Nachfolger des legendären Spieleklassikers basiert auf der eigens entwickelten Dunia Engine, wodurch beispielsweise dynamisches Wetter, Tag- und Nachtzyklen und eine dynamische Vegetation realisierst werden. Das Spiel nutzt Mehrkernprozessoren, unterstützt sowohl DirectX-9 als auch -10 und besitzt eine integrierte Benchmark-Funktion mit zahlreichen Einstellungsmöglichkeiten.


Zur Vollversion von Far Cry 2 in unserem Preisvergleich gelangt man über diesen Link.

far1

far1

far1

far1

far1

far1


Immer wieder für grafische Highlights verantwortlich zeichnen die Macher von Crysis. Die als Basis dienende Cry-Engine sorgt dafür, dass selbst aktuelle High-End-Systeme den Anforderungen nicht mehr gewachsen sind. Daher eignet sich Crysis Warhead ideal für unsere Benchmarks. Wir verwendeten Crysis im DirectX-10-Modus, alle Details auf Maximum.

Crysis1_rs Crysis2_rs
Crysis3_rs Crysis4_rs

Zur Vollversion von Crysis Warhead in unserem Preisvergleich gelangt man über diesen Link.

crysis1

crysis1

crysis1


Die Fortsetzung der berühmten und mehrfach ausgezeichneten Aufbaustrategie-Serie kommt im neuen Gewand daher und heißt Anno 1404. 2009 erschienen, fesselt Ubisofts Anno 1404 den Spieler erneut und lässt ihn den Orient im 15. Jahrhundert erkunden. Das Motto hier - siedeln in Perfektion. Sämtliche Gebäude wurden noch einmal detaillierter dargestellt, das Meer bewegt sich noch realistischer, Flora und Fauna sind eine richtige Augenweide. Selbst die Mühlen hört man knarzen, Vögel fliegen umher und Rauch steigt von Feuerstellen empor. Weiterhin stehen dem Spieler größere Inseln denn je zuvor zur Verfügung, wo er eine mächtige Zivilisation errichten und neue Technologien erforschen kann. Wird der Schieberegler für die Details und Effekte ganz nach rechts geschoben, fordert Anno 1404 das System ordentlich und zeigt, was in ihm steckt.

Anno1404_4_rs Anno1404_3_rs
Anno1404_2_rs Anno1404_1_rs

anno1

anno1

anno1


Unigine Heaven 2.1 beinhaltet zahlreiche Änderungen gegenüber dem Vorgänger. Dazu gehört beispielsweise eine verstärke Nutzung von Tessellation. Des Weiteren wurden Objekte hinzugefügt, die den Einsatz neuer Effekte notwendig machen. Dazu zählen dynamische Lichtquellen sowie physikalisch korrekt berechnete Flaggen.

unigine2_1_rs unigine2_2_rs
unigine2_3_rs unigine2_4_rs

Unigine Heaven 2.1 ist ein kostenloser Benchmark, der unter www.unigine.com zu beziehen ist.

uni1

uni1

uni1

uni1

uni1

uni1


Eine unwirtliche und verstrahlte Umwelt, Mutanten und ständige Bedrohungen - all diese Elemente nutzen die Ex-S.T.A.L.K.E.R. Entwickler 4A Games Studios, um den Spieler in die Welt von Metro 2033 zu entführen. Im Jahr 2013 hat sich die Menschheit mal wieder bekriegt und durch einen Atomschlag gegenseitig fast in die Luft gebombt. Eine Hand voll Überlebende hat sich in die Systeme der Moskauer U-Bahn zurück gezogen, um dort Zuflucht zu suchen. Zum Leidwesen der Flüchtlinge ist dieser Ort nicht ihre alleinige Heimat, auch feindselige Kreaturen, die sich an die giftige Atmosphäre gewöhnt haben, sind dort anzutreffen. Ihr Ziel: Die verbleibenden Menschen ausrotten! Ob sie nun rohe Gewalt oder ausgeklügelte Taktik anwenden, es bleibt ihnen überlassen, wie sie das Ziel erreichen. Wie schon bei ihrem Erstlingswerk schaffen die Entwickler eine Wahnsinnsatmosphäre und lassen selbst moderne Grafikkarten an ihre Grenzen kommen.

Metro_1_rs Metro_2_rs
Metro_3_rs Metro_4_rs

metro1

metro1

metro1


Der Luftkampf hat sich weiterentwickelt, ebenso wie die Grafik-Engine, die nun massiven Gebrauch von Tessellation macht. Der Spieler muss jedes Element des modernen Luftkampfs meistern. Zuerst dringt er unentdeckt in feindlichen Luftraum ein, führt einen tödlichen Stoß aus und verschwindet, noch bevor der Gegner reagieren kann. Er nutzt überlegene Technologie, um den Gegner aus der Ferne zu schwächen und erledigt ihn dann in spannenden Dogfights. Nächtliche Überfälle und Auftanken in der Luft sowie viele weitere Aufgaben warten auf den Spieler.

HAWX2_1_rs HAWX2_2_rs
HAWX2_3_rs HAWX2_4_rs

hawx1

hawx1

hawx1

hawx1

hawx1

hawx1


2K Czech, die Entwickler des ersten Mafia Spiels, sorgen auch in Mafia II für eine riesige Spielwelt voller liebevoller Details. Mit den 40ern und 50er Jahren erstreckt sich Mafia II über zwei der wohl schillerndsten Dekaden des 20. Jahrhunderts. Über 50 Autos im Stil der jeweiligen Epoche mit individuellem Fahrverhalten können gefahren werden. So lässt sich die Stadt zum Sound von Buddy Holly und Dean Martin erkunden – über 120 original lizenzierte Songs aus den 40ern und 50ern ertönen aus den Lautsprechern des Autoradios.

Mafia4_rs Mafia3_rs
Mafia2_rs Mafia1_rs

mafia1

mafia1

mafia1

mafia1

mafia1

mafia1


verlauf-1-rs

Als erster Frameverlauf wählen wir Alien vs. Predator in 2560x1600 bei 8xAA und 16xAF. Hier zeigt sich sehr klar, dass sich die AMD Radeon HD 7970 zwischen die Dual-GPU-Karten (AMD Radeon HD 6990 und NVIDIA GeForce GTX 590) und die "alten" High-End Single-GPU-Karten (AMD Radeon HD 6970 und NVIDIA GeForce GTX 580) setzt. Oft reicht die Performance auch sehr dicht an die NVIDIA GeForce GTX 590 heran.

verlauf-2-rs

Auch in Battlefield Bad Company 2 gibt es eine klare Zwei-Klassen-Gesellschaft. Die Dual-GPU-Karten setzen sich klar ab, die AMD Radeon HD 7970 muss allerdings ein paar Federn lassen und platziert sich über der AMD Radeon HD 6970 und 6950 ein. Die NVIDIA GeForce GTX 580 stellt die Szene mit ein paar FPS mehr dar.

verlauf-3-rs

Call of Duty Black Ops ist besonders durch den Framedrop im mittleren Bereich der Szene interessant. Hier haben alle Karten zu kämpfen, besonders betroffen sind die Dual-GPU-Karten. Offenbar spielt der Grafikspeicher an dieser Stelle eine entscheidende Rolle - die AMD Radeon HD 7970 glättet dies problemlos und präsentiert die stabilste Framerate.

verlauf-4-rs

Wieder wie erwartet präsentiert sich der Frameverlauf in Metro 2033. Die Dual-GPU-Karten setzen sich klar ab, die AMD Radeon HD 7970 platziert sich zwischen diese und die Vorgänger-Generation von AMD und NVIDIA.


Nun hat sich in den Benchmarks gezeigt, dass die AMD Radeon HD 7970 vor allem bei hohen Auflösungen und Qualitätseinstellungen profitieren kann. Dies dürfte auch maßgeblich dem 3 GB großen Grafikspeicher zugesprochen werden. Einige Hersteller haben auch von der GeForce GTX 580 eine Version mit 3 GB Grafikspeicher auf den Markt gebracht, die wir in einigen Benchmarks gegen die Radeon HD 7970 vergleichen wollen.

3gb-1

3gb-1

3gb-3

3gb-4

Die GeForce GTX 580 mit 3 GB kann sich eigentlich nur bei hohen Auflösungen vom Modell mit 1536 MB absetzen, das zeigten uns schon die entsprechenden Vergleiche vor einigen Monaten. Nun zeigt sich aber auch, dass nicht nur der Grafikspeicher eine entscheidende Rolle spielt, denn die Radeon HD 7970 setzt sich doch noch immer recht deutlich von der GeForce GTX 580 ab, wenngleich der Abstand etwas verkürzt wurde.

Wir sind gespannt, wie NVIDIA auf die Radeon HD 7970 reagiert, eine Verdopplung des Grafikspeichers wird auch hier erwartet und dürfte gemeinsam mit den Änderungen in der Architektur auch auf die hohen Auflösungen abzielen.


AMD verspricht ein Overclocking-Potenzial von 1 GHz und mehr. Wir haben versucht das Sample der Radeon HD 7970 ebenfalls bis an das Maximum zu bringen. Dazu verwendeten wir das Overdrive-Tool im Catalyst-Treiber, da kein anderes Programm zum Zeitpunkt dieses Artikels in der Lage war, die GPU und den Speicher korrekt anzusprechen. Dies setzte uns allerdings auch ein Limit des GPU-Taktes bei 1125 MHz und des Speichers bei 1575 MHz. Realistisch betrachtet liegen beide Werte aber weit außerhalb dessen, was über eine Luftkühlung zu erreichen ist.

overdrive-rs

Da uns keine Erhöhung der Spannung möglich war, drehten wir nur am Takt von GPU und Speicher, bis kein stabiler Betrieb mehr möglich war. Letztendlich erreichten wir einen GPU-Takt von 1045 MHz und einen Speicher-Takt von 1400 MHz. Wir konnten die GPU sogar noch schneller takten lassen, dann jedoch griff PowerTune ein und ließ keine höhere Performance zu, sondern drosselte den Takt wieder.

In den Benchmarks wirkte sich dies wie folgt aus:

oc1

oc1

oc1

oc1

Bei einer Taktsteigerung von rund 13 Prozent erreichen wir eine um 11 bis 14 Prozent höhere Performance. Natürlich geht der erhöhte Takt auch mit einem höheren Verbrauch, höherer Temperatur und Lautstärke einher.

oc1

oc1

oc1


AMD stand vor gleich zwei Problemen. Zum einen erkannte man, dass die VLIW-Architektur sich selbst überlebt hat. Die Strukturen waren nicht auf die zukünftigen Bedürfnisse ausgelegt, gerade das Computing brachte die Architektur an ihre Grenzen. Zum Zweiten setzte der Entwicklung auch die 40-nm-Fertigung Grenzen. Nun musste AMD nicht nur die Architektur erneuern, sondern in Zusammenarbeit mit TSMC auch gleich die Fertigungstechnologie. Dass es dabei zu Problemen kommen kann, hat Intel bereits vor einiger Zeit erkannt und auf das Tick-Tock-Prinzip umgestellt. Ursprünglich wurde ein ähnliches Vorgehen auch für einen Shrink der VLIW4-Architektur erwartet - doch wie so oft ist es anders gekommen.

AMD hat sich für eine neue GCN-Architektur entschieden, die ihr Potenzial bereits jetzt teilweise nutzen, aber vermutlich erst in den kommenden Monaten vollends ausspielen kann. 2048 Shader-Prozessoren klingen gigantisch im Vergleich zu den 512 einer GF110-GPU von NVIDIA. Doch auch ein "Cayman XT" der AMD Radeon HD 6970 kommt bereits auf 1536 Shader-Einheiten. Die Komplexität der "Tahiti"-GPU lässt sich wohl am besten mit den 4.312.711.873 Transistoren beziffern, die man dank 28-nm-Fertigung auf 365 mm² packen konnte. Neue Features wie ZeroCore Power können überzeugen - andere wie PCI-Express 3.0 und DirectX 11.1 müssen erst noch beweisen, dass sie einen Wechsel wert sein können.

{jphoto image=18931}

Wie sich der Wechsel auf die 28-nm-Fertigung und die neue Architektur in der Performance auswirkt, haben die Benchmarks gezeigt. In den synthetischen Benchmarks ist die Radeon HD 7970 zwischen 15 und 45 Prozent schneller als die GeForce GTX 580. Gegenüber der Radeon HD 6970 sind es sogar zwischen 30 und 65 Prozent. Eines zeigt sich bereits an dieser Stelle: hohe Auflösungen spielen der Radeon HD 7970 mit ihren 3 GB in die Karten. Der Trend hin zu höheren Auflösungen zeigt sich auch in den Real-Life-Benchmarks. Hier sehen wir einen Performance-Vorteil von bis zu 20 Prozent in 1680x1050 mit 4fachem und 8fachem Anti-Aliasing im Vergleich zur GeForce GTX 580. Die Radeon HD 6970 liegt um 25 bis 30 Prozent hinter der neuen Generation. Bei 1920x1200 Pixeln sind es zwischen 20 und 30 Prozent für die Konkurrenz, die eigene Konkurrenz in Form der Radeon HD 6970 ist eher im oberen Spektrum zu suchen. Wo die Stärken liegen, zeigen die Benchmarks bei 2560x1600. Hier sehen wir die Radeon HD 7970 zwischen 30 und 40 Prozent vor der GeForce GTX 580. Gegenüber der Radeon HD 6970 sind es sogar hin und wieder mehr als 50 Prozent.

Die Radeon HD 7970 ist also besonders bei hohen Auflösungen zuhause. Der Unigine Heaven stellt auch die deutlich höhere Tessellation-Performance dar, die allerdings nur je nach Spiel oder Benchmark zum Tragen kommt.

7970-aggro

Die neue Fertigung soll aber nicht nur bei der Performance zu einem deutlichen Zuwachs führen, sondern auch im Bereich der Leistungsaufnahme. ZeroCore Power ist eine Technik, die gerade im Idle-Betrieb noch einmal für einen deutlich geringeren Verbrauch sorgen kann. Natürlich ist dazu auch ein abgeschaltetes Display vonnöten. Wer seinen Arbeits- oder Gaming-Rechner allerdings verlässt, um im Hintergrund beispielsweise einen Download auszuführen, den wird das nicht weiter stören. Bereits auf dem Papier ist auch der maximale Verbrauch geringer geworden, was unsere Messungen auch bestätigen konnten. Nur geringere Verbesserungen, wenn überhaupt, stellen wir bei den Temperaturen und der Lautstärke des Lüfters fest. Hier sehen wir noch großes Potenzial bei Öffnung des Referenzdesigns für die Retail-Hersteller mit dann eigenen Kühllösungen.

Positiv überrascht sind wir vom Overclocking-Potenzial. Von 925 MHz konnten wir die GPU ohne größere Schwierigkeiten auf 1045 MHz bringen. Ohne den Support durch entsprechende Software sicher kein schlechtes Ergebnis. Auch hier erwarten wir Retail-Lösungen mit werksseitiger Übertaktung und weitere interessante Eigen-Designs.

AMD nennt eine unverbindliche Preisempfehlung von 499 Euro für die Radeon HD 7970. Wirft man einen Blick in unseren Preisvergleich, so ist eine Radeon HD 6970 hier für 280 Euro zu haben, eine Radeon HD 6990 kommt auf 550 bis 580 Euro. Die Konkurrenz von NVIDIA kostet in Form der GeForce GTX 580 rund 370 Euro, die GeForce GTX 590 wechselt für 630 Euro den Besitzer. Im Vergleich zur GeForce GTX 580 ist der Preis also etwas zu hoch angesetzt. Ähnliches gilt auch im Hinblick auf die Radeon HD 6970. Für die Verfügbarkeit gibt AMD den 9. Januar 2012 an.

Positive Aspekte der AMD Radeon HD 7970:

Negative Aspekte der AMD Radeon HD 7970:

Die kommenden Wochen dürften in vielerlei Hinsicht interessant werden. Zum Einen erwarten wir in Kürze ein zweites Modell der Radeon-HD-7900-Serie und zum Anderen vielleicht auch schon die ersten Retail-Modelle der Radeon HD 7970 mit modifiziertem Kühler. Auch eine Radeon HD 7990 ist laut der Gerüchteküche in Planung, Hinweise dazu finden sich auch in den aktuellen AMD-Präsentationen. Bis NVIDIA auf die neue Radeon-Serie reagieren wird, könnte noch etwas Zeit vergehen. Die derzeitige Gerüchtelage spricht von einer neuen Mittelklasse-Serie zur CeBIT - die High-End-Modelle von "Kepler" sollen aber noch bis mindestens in die zweite Jahreshälfte 2012 auf sich warten lassen.

excellent_award

Aufgrund der neuen GPU-Architektur und der damit einhergehenden Performance-Steigerung
verleihen wir der AMD Radeon HD 7970 unseren "Excellent Hardware Award".

Weiterführende Links: