AMDs „Kaveri“-APU im Kurzvergleich

Veröffentlicht am: von

AMD Logo 2013In den letzten Wochen und Monaten hat AMD kräftig die Werbetrommel für seine neuen „Kaveri“-APUs gerührt - und das eigentlich schon seit kurz nach dem Start der ersten „Richland“-Modelle. Immer wieder versorgte man die breite Öffentlichkeit mit neuen Informationshäppchen. Zuletzt enthüllte man in der vergangenen Woche im Rahmen der Consumer Electronics Show in Las Vegas weitere Details. Damit die Vorstellung der neuen Kombiprozessoren aber nicht zwischen den zahlreichen Messe-Highlights versinkt, hat AMD den Starttermin auf ein späteres Datum gelegt. Mit dem heutigen Tag und damit exakt eine Woche nach dem Start der CES 2014 entlässt die Chipschmiede offiziell die ersten zwei „Kaveri“-Modelle in den Handel – versorgt mit einer komplett überarbeiteten Architektur und einer Vielzahl von neuen Features. Wir stellen in dieser Maxi-News die neue Generation kurz vor und liefern erste Vergleichs-Messungen.

Als AMD am 5. Juni 2013 seine neuen Kombiprozessoren auf „Richland“-Basis präsentierte, lief die Marketing-Maschine schon wenige Stunden später für den Nachfolger an. Auf einer Pressekonferenz im Rahmen der Computex 2013 versprach Lisa Su, Senior Vice President und General Manager der Global-Business-Unit, die ersten „Kaveri“-Modelle schon gegen Ende des Jahres in den Handel zu schicken und „Richland“ damit schon nach knapp einem halben Jahr wieder zu beerben. Wie wir nun wissen, hat AMD dieses Ziel knapp verfehlt und die neuen APUs erst im neuen Jahr ins Rennen geschickt. Dafür bringt „Kaveri“ eine völlig neue Architektur und eine Vielzahl an neuen Features mit sich – sowohl was den CPU- wie auch Grafik-Part anbelangt. Auch setzt man jetzt auf das fortschrittliche 28-nm-SHP-Verfahren bei Globalfoundries. Während bei „Richland“ kein neues Mainboard angeschafft werden musste und alles beim alten Sockel FM2 blieb, sieht es eine Generation später wieder anders aus. Wer sich für „Kaveri“ entscheidet, braucht den neuen Sockel FM2+. Dieser ist aber abwärtskompatibel zu den „Richland“- und „Trinity“-Modellen. Eine neue Chipsatzflotte mit kleineren Änderungen gibt es ebenfalls.

Insgesamt wirft „Kaveri“ auf einer Fläche von 246 mm² eine deutlich größere Anzahl an Transistoren in die Waagschale als sein Vorgänger. Waren es bei „Richland“ noch 1,3 Milliarden Schalteinheiten sind es jetzt 2,41 Milliarden. Die „Kaveri“-Familie bzw. die 7000er-Reihe anführen wird zunächst der AMD A10-7850K. Zunächst deswegen, da ein 50er-Modell bei AMD noch nie eine Produktserie angeführt hat, bislang war dies immer ein Ableger 70er-Reihe. Man vergleiche hierzu die AMD Radeon HD 7970 mit der Radeon HD 7950 oder die Radeon HD 6870 mit der Radeon HD 6850. Ein höher getakteter A10-7870K wäre also durchaus denkbar.

Bis dahin bleibt der A10-7850K das schnellste Modell. Dieses verfügt über insgesamt zwölf Compute-Cores. Während die CPU-Kerne und GPU-Einheiten bislang separat ausgewiesen wurden, kombiniert AMD nun diese nun in der Nomenklatur. Insgesamt gibt es vier Prozessor-Cores und acht GPU-Cores. In der Praxis sind das vier „Steamroller“-Kerne und 512 GCN-Shadereinheiten. Die Taktraten beziffert AMD auf einen Basis- und Turbo-Takt von 3,7 bzw. 4,0 GHz. Die Grafikeinheit macht sich hingegen mit 720 MHz ans Werk. Dazu gibt es einen 4 MB großen L2-Cache. Die TDP beziffert AMD auf 95 Watt. Insgesamt soll der A10-7850K eine kombinierte Rechenleistung von 856 GFLOPs besitzen - die 1,0-TFLOPs-Marke, die AMD mit „Kaveri“ eigentlich knacken wollte, ist damit noch nicht gefallen.

kaveri tech day presentation-hsa k

Das nächst kleinere Modell ist der AMD A10-7700K. Dieser rechnet mit 3,4 bzw. 3,8 GHz etwas langsamer und muss auch bei der Grafikeinheit weitere Abstriche hinnehmen. Diese arbeitet zwar ebenfalls mit 720 MHz, kann dafür aber nur noch auf 384 Shadereinheiten vertrauen. Etwas später – voraussichtlich im Laufe des ersten Quartals – soll es mit dem A8-7600 einen dritten „Kaveri“-Ableger geben. Dieser soll sich dann in der 65-Watt-Klasse einreihen und mit Taktraten von 3,3 bzw. 3,8 GHz noch einmal etwas langsamer sein. Die Grafikeinheit wird jedoch nicht weiter beschnitten. Auch die vier „Steamroller“-Kerne bleiben erhalten. Wann die restlichen Modelle der A6- und A4-Reihe erscheinen werden, ist offen.

Deutlich zu erkennen: Im Vergleich zu „Richland“ besitzt „Kaveri“ auf dem Papier eine meist höhere Anzahl an Shadereinheiten, ist dafür aber deutlich niedriger getaktet, was am Ende wohl die Effizienz in Verbindung mit der 28-nm-Fertigung verbessern dürfte - die TDP wurde leicht nach unten korrigiert.

Desktop-Modelle der A-Serie (Kaveri)
ProzessorA10-7850KA10-7700KA8-7600
Preis 173 US-Dollar 152 US-Dollar 119 US-Dollar
TDP 95 Watt 95 Watt 65/45 Watt
Module / Threads 2
4
2
4
2
4
CPU-Frequenz 3,7 GHz 3,4 GHz 3,3/3,1 GHz
Turbo-Takt 4,0 GHz 3,8 GHz 3,8/3,3 GHz
Speicherinterface Dual-Channel DDR3-2133
(Low Voltage Support)
L2-Cache 4 MB 4 MB 4 MB
Grafik 512 SPs, 720 MHz 384 SPs, 720 MHz 384 SPs, 720 MHz

War „Richland“ noch ein Facelift zu „Trinity“, wurde „Kaveri“ von Grund auf neu entworfen. Die „Steamroller“-Architektur der beiden Prozessor-Module ist laut Angaben AMDs bisher größte Architektur-Änderung seit der Einführung von „Bulldozer“. Der inzwischen längst verstaubte VLIW4-Aufbau bei der Grafikeinheit wurde bei „Kaveri“ gegen die GCN-Architektur ausgetauscht und die lang umworbenen Features rund um HSA implementiert. Die fortschrittliche 28-nm-Fertigung rundet das Gesamtpaket ab.

Heterogene System-Architektur (HSA)

kaveri tech day presentation-hsa k

Die wohl größte Neuerung von „Kaveri“ ist die Umstellung auf eine heterogene System-Architektur (HSA), wodurch Grafik- und Prozessor-Kerne noch enger zusammenarbeiten sollen. Ein Grund, weswegen AMD beide Funktionseinheiten zusammenfasst und von Compute-Cores spricht. Vor allem immer wieder hervorgehoben werden zwei Funktionen: „Shared System Memory“ und „Heterogeneous Queuing“. Erstere Technologie schafft einen Speicher, der sowohl von den CPU- wie auch von den GPU-Kernen genutzt werden kann, womit beide Funktionseinheiten immer auf dem neuesten Stand bleiben und ihre Informationen direkt miteinander austauschen können. Ein langwieriges Kopieren der Daten entfällt.

Dieser gemeinsame Speicherbereich „hUMA“ ist Grundvoraussetzung für hQ. Bislang galt die CPU als Master-Einheit und war für den kompletten Programmablauf zuständig. Nun soll auch die GPU die CPU direkt mit Jobs füttern können, was beide Funktionseinheiten gleichstellt, sie aber auch unterschiedliche Aufgaben übernehmen lässt. Während sich CPUs besser für serielle Aufgaben eignen, liegen die Stärken einer GPU auf parallelen Rechenaufgaben. Durch die Verteilung dieser verspricht sich AMD eine höhere Effizienz. In Zahlen ausgedrückt: Die neuen „Steamroller“-Kerne sollen eine bis zu 20 Prozent höhere Leistung abliefern als die Vorgänger-Generation.

„Steamroller“-Architektur

kaveri tech day presentation-cpu k

Mit den neuen „Steamroller“-Kernen sollen die Probleme, die „Bulldozer“ noch hatte, behoben werden. Am Konzept von „Bulldozer“ hält AMD im Groben aber weiter fest. Am Pipeline-Anfang gibt es wie gehabt einen gemeinsamen Fetch-Schritt. Ein Modul besitzt zwei Integer-Kerne, die sich eine FPU und einen Instruktions-Cache, der auf 96 kB vergrößert wurde, teilen. Dafür gibt es neue Prefetcher und einen eigenen Befehlsdecoder für die Integereinheiten, womit die Fetch-Stufe im Frontend 30 Prozent weniger Cache-Fehlschläge bei Datenbank-Anwendungen erreichen soll. Weiterhin wurde die Dispatch-Bandbreite pro Thread um 25 Prozent erweitert. Vor allem bei Single-Core-Anwendungen dürfte „Kaveri“ damit bei gleichem Takt deutlich zulegen können. Die Pro-Megahertz-Leistung soll bei „Kaveri“ höher ausfallen als noch bei der Vorgänger-Generation, ein Grund, weshalb AMD die Taktraten leicht abgesenkt hat.

Umstieg auf GCN-Architektur

kaveri tech day presentation-gpu k

Die neue GPU-Architektur soll die Grafikleistung sogar um 50 Prozent beschleunigen. Möglich soll dies dank eines Grafikchips der Radeon-R7-Reihe und dem damit verbundenen Wechsel vom eingestaubten VLIW4-Aufbau hin zur GCN-Architektur, wie sie bereits in der „Volcanic Islands“-Generation und seit der Radeon-HD-7000-Familie zum Einsatz kommt, werden. Bei einer VLIW-Befehlsstruktur wird ein sequentieller Programmablauf mithilfe eines Compilers in kleinere Instruktionen aufgeteilt und entsprechend parallelisiert. Der Compiler muss diese nicht nur in eine bestimmte Gruppengröße zerlegen, sondern später auch wieder zusammenfassen, was in der Praxis nicht immer ideal war – es kam zu Leerinstruktionen. Bei GCN muss ein solcher „register port conflict“ nicht mehr gehandelt werden. GCN verfolgt einen völlig anderen Ansatz. Die kleinste Einheit bildet hier die Compute-Unit, die wiederum aus vier Vektor-Prozessoren besteht, die sich aus vier SIMDs mit je 16 ALUs zusammenfügen. Im Falle des A10-7850K stehen der Grafiklösung acht Compute-Units und somit 512 Shader-Prozessoren (8 CUs x 4 SIMDs x 16 ALUs) zur Verfügung. Da an jeden Shadercluster vier Textureinheiten angeschlossen sind, stehen in der Summe 32 TMUs zur Verfügung. Das Speicherinterface weist eine Breite von 128 Bit auf.

Damit entspricht die Grafiklösung des A10-7850K einer AMD Radeon HD 7750, deren Taktraten allerdings reduziert wurden. AMD gibt den Grafik-Takt bei allen neuen „Kaveri“-APUs mit 720 MHz an. Die Radeon HD 7750 brachte es hier noch 800 MHz.

kaveri tech day presentation-mantle k

Darüber hinaus soll „Kaveri“ die notwendigen DSPs für AMDs True Audio besitzen, die neue Low-Level-API „Mantle“ unterstützen und PCI-Express-3.0-Support mit sich bringen. Der Speichercontroller kommt weiterhin mit 2.133 MHz schnellem DDR3-Speicher zurecht. Die neuen Modelle sollen sich auf dem Desktop in TDP-Klassen zwischen 45 und 95 Watt wiederfinden. Für Notebooks soll es auch Ableger mit nur 15 Watt TDP geben. Zu guter Letzt haben der Video-Encoder (VCE) und der Unified-Video-Decoder (UVD) einen Versionssprung nach vorne gemacht. 

Neue Mainboards werden fällig

Die Umstellung der Architektur macht leider eine neue Pin-Struktur notwendig, weshalb AMD bei „Kaveri“ wieder einmal mehr einen neuen Sockel einführen muss. Während „Richland“ bislang nach dem Sockel FM2 verlangte, ist es bei „Kaveri“ nun der Sockel FM2+. Dieser soll laut AMD jedoch abwärtskompatibel zu den Vorgänger-Modellen der A-Serie 6000 und 5000 sein, bringt mit dem A88X und A78 aber auch neue Chipsätze mit sich. Diese entsprechen mit Ausnahme kleinerer Änderungen aber ihren Vorgängern A85X und A75. Laut AMD soll auch der ältere A55-FCH unterstützt werden.

kaveri kurztest-04
Der A10-7850K besitzt zwei Pins mehr als der A10-6800K.

Dank der Verbesserungen an der CPU- und GPU-Einheit soll „Kaveri“ im Vergleich zu seinen Vorgängern vor allem bei Single-Core-Anwendungen und in Spielen kräftig zulegen können und das obwohl die Taktraten (Basis/Turbo/Grafik) allesamt etwas geringer ausfallen als noch bei der Vorgänger-Generation. Mit Ausnahme von Cinebench, 7Zip und Frybench, wo „Kaveri“ in unseren Benchmarks wenige Prozentpunkte hinter das einstige Flaggschiff unter den Desktop-APUs zurückfällt, bestätigt sich diese Einschätzung. In diesen Benchmarks kommt die eigentlich höhere IPC-Leistung der „Steamroller“-Kerne aufgrund der niedrigeren Taktraten leider nicht zu tragen. Große Zuwächse gibt es bei der Arithmetik, in der Kryptografie und beim Video-Transcodieren sowie in aktuellen Spielen.

Eine Auswahl an ersten Benchmarks gibt es in dieser Bildergalerie. In den nächsten Wochen werden wir uns ausführlicher mit den APUs beschäftigen und uns hierfür weitere Vergleichsmodelle ins Haus holen, um diese dann auf Herz und Nieren zu prüfen.

 {jphoto image=49429}

Für unsere Tests bekamen wir von AMD ein ASRock-Mainboard mit A88X-Chipsatz, 8 GB DDR3-Arbeitsspeicher mit einer Geschwindigkeit von 2.133 MHz und den besagten AMD A10-7850K. Auf eine zusätzliche Grafikkarte haben wir an dieser Stelle verzichtet und die restlichen drei APUs noch einmal durch den Benchmark-Parcours gejagt. „Kaveri“ sollte aber nicht nur die Leistung im Vergleich zum Vorgänger erhöhen, sondern auch die Effizienz. In unserem Vorab-Test können wir nur teilweise von einer Verbesserung sprechen. Während unser Gesamtsystem im normalen Windows-Betrieb mit 39,3 Watt genau so viel aus der Steckdose zog wie ein AMD A10-5800K und damit nicht ganz so sparsam wie die „Richland“-Generation war, zeigte sich der neue Kombiprozessor vor allem unter Volllast deutlich sparsamer. Hier genehmigte sich unser A10-7850K knapp 133 Watt, wohingegen es beim A10-6800K noch 173,8 Watt waren. Noch sparsamer war nur der A10-6700 mit knapp unter 100 Watt. Für unsere Messungen haben wir den CPU-Part mit Prime95 belastet, die Grafiklösung hingegen mittels Furmark. 

kaveri-kurzvergleich-ces2014-strom-idle
kaveri-kurzvergleich-ces2014-strom-last

Seit dem Start von „Richland“ rührte AMD kräftig die Werbetrommel für „Kaveri“. Dank der neuen HSA-Features, einer komplett überarbeiteten Architektur und eines filigraneren Fertigungsverfahrens sollte die neue APU-Generation sowohl die Leistung des CPU-Parts wie auch die Performance der Grafiklösung deutlich nach oben treiben. AMD versprach hier einen Leistungsschub von 20 bzw. 50 Prozent. Nun ist die inzwischen schon vierte Generation der Kombiprozessoren von AMD endlich offiziell auf dem Markt - zumindest sind es mit dem A10-7850K und dem A10-7700K zwei Modelle. Die restlichen Vertreter der „Kaveri“-Reihe sollen im Laufe des ersten Quartals auf den Markt kommen.

Ganz einlösen konnte AMD seine Versprechen jedoch nicht, denn nicht jeder Benchmark profitiert von den Verbesserungen der „Steamroller“-Kerne. Bei 7Zip, Frybench und auch im Cinebench-Benchmark kann sich der neue A10-7850K nur um einen Wimpernschlag vor seinen Vorgänger setzten oder bleibt sogar hinter diesem leicht zurück. Dies ist vermutlich auf die niedrigeren Taktraten zurückzuführen. Rechnete das „Richland“-Flaggschiff noch mit einem Takt von bis zu 4,4 GHz, sind es bei "Kaveri" maximal 4,0 GHz. Gleiche oder sogar noch höhere Frequenzen dürfte erst ein möglicher AMD A10-7870K mit sich bringen. In den restlichen Benchmarks setzt sich das neue Topmodell aber stets an die Spitze und das gerne auch mal mit einem deutlichen Abstand im hohen zweistelligen Prozentbereich. Vor allem die Kryptografie- und Arithmetik-Leistung steigt bei „Kaveri“ deutlich an.

{jphoto image=49316}

Aber auch der Umstieg vom verstaubten VLIW4-Aufbau bei der Grafiklösung auf die neue GCN-Architektur, die AMD in seinen aktuellen Grafikkarten der "Volcanic Islands"-Generation verwendet, bringt „Kaveri“ einen deutlichen Leistungsschub. Aktuelle Spiele wie Metro: Last Light, Grid 2 oder Bioshock laufen mit deutlich höheren Frameraten über den Bildschirm. Anno 2070 erfreut sich ebenfalls höherer Bildwiederholraten. Ein Spielen in FullHD-Auflösung ist mit „Kaveri“ durchaus möglich. Je nach Titel muss allerdings die Qualität ein klein wenig heruntergedreht werden. Insgesamt dürfte die „Kaveri“-Grafik etwas unterhalb dem Niveau einer AMD Radeon HD 7750 liegen - zumindest ist dies auf dem Papier so. In den kommenden Wochen werden wir ausführlichere Benchmarks nachliefern. Gerne hätte wir heute auch Ergebnisse von Battlefield 4 präsentiert. Leider machte uns da aber EAs Origin am Wochenende einen Strich durch die Rechnung. Spätestens mit dem Mantle-Patch - Kaveri bringt entsprechenden Support mit sich - dürfte es interessant werden.

Bei der Leistungsaufnahme konnte AMD sich ebenfalls verbessern - zumindest unter Volllast blieb unser AMD A10-7850K sparsamer als die Topmodelle der Vorgänger-Generationen. Im normalen 2D-Betrieb genehmigte sich unser Testmuster allerdings ein klein wenig mehr, war mit knapp 40 Watt für das Gesamtsystem aber immer noch sehr sparsam.

Wir werden uns in den nächsten Wochen hinter unser Testsystem klemmen und „Kaveri“ ausführlich mit einer Vielzahl aktueller APUs und CPUs mit IGP vergleichen.