> > > > Asynchronous Shader sollen AMD-Grafikkarten weiter beschleunigen

Asynchronous Shader sollen AMD-Grafikkarten weiter beschleunigen

DruckenE-Mail
Erstellt am: von

Seite 2: Asynchronous Shader - Teil 2

Asynchronous Shader sind bereits ein Teil der GCN-Architektur und es ist auch nicht weiter verwunderlich, dass eine GPU-Architektur derart vorausberechnend entwickelt wird. Die Ingenieure bei allen CPU- und GPU-Herstellern arbeiten sozusagen immer vorausschauend und planen bereits mit Softwareumsetzungen, die erst in einigen Jahren Anwendung finden werden.

Asynchronous Shader bei AMD
Asynchronous Shader bei AMD

Die ACEs sind bereits Bestandteil der "Graphics Core Next"-Architektur. Im Falle der "Hawaii"-GPU sind acht ACEs, mit der Möglichkeit jeweils acht Queues abzuarbeiten, vorhanden. Alle Grafikkarten aus dem Hause AMD mit GCN-Architektur sollen über diese ACEs verfügen, wobei sich die Anzahl natürlich abhängig vom Ausbau der Architektur unterscheidet.

Asynchronous Shader bei AMD
Asynchronous Shader bei AMD

Acht asynchrone Compute Engines (ACE) stehen in der "Hawaii"-GPU zur Verfügung, die allesamt unabhängig voneinander arbeiten können. Jede dieser ACEs kann wiederum acht unabhängig voneinander arbeitende Queues aufbauen. Für den schnellen Zugriff auf Daten können alle ACEs direkt auf den L2-Cache zugreifen. Über die Dual-DMA-Engine ist dies auch auf den Arbeitsspeicher möglich. Mit 16 GB pro Sekunde wird die volle Bandbreite von PCI-Express-3.0 ausgenutzt.

Asynchronous Shader bei AMD
Asynchronous Shader bei AMD

Asynchronous Shader sollen aber nicht nur die grundsätzliche Performance aktueller Architekturen und Arbeitsweisen von Render-Engines verbessern, sondern auch in speziellen Themenfeldern Verbesserungen bringen. Das Aufkommen der VR-Technologie stellt alle damit beteiligten Hersteller vor neue Herausforderungen, denen prinzipiell auf eine ähnliche Art und Weise begegnet wird - egal ob von AMD oder NVIDIA. Um die Immersion, also das Eintauchen in eine virtuelle Welt störungsfrei gestalten zu können, müssen verschiedene Faktoren übereinstimmen.

Eine möglichst hohe Auflösungen der Displays bei einer möglichst hohen Bildwiederholungsrate sind eine Herausforderung an die Rechenleistung als solches. Eine Auflösung von UltraHD pro Auge bei 90 Bildern pro Sekunde gelten momentan als das vorläufige Optimum. Die dazu notwenige Rechenleistung soll durch die Asynchronous Shader bereitgestellt werden. Zusätzlich reduziert sich die Latenz zwischen Eingabe durch den Nutzer und Darstellung auf dem Display, was für die Immersion ein entscheidender Faktor ist.

Mit den Asynchronous Shader ermöglicht werden auch weitere Technologien. Auf die Funktionsweise von Image Warping und (Asynchronous) Timewarp sind wir in anderen Artikeln schon genauer eingegangen. Die Herausforderungen und Lösungsansätze sind bei AMD und NVIDIA vergleichbar bzw. sogar identisch.

Asynchronous Shader bei AMD
Asynchronous Shader bei AMD

Nun darf man sich sicherlich die Frage stellen, wann und wie sich konkrete Vorteile für Spieler aus den Asynchronous Shader ergeben. Praxisbeispiele sind derzeit noch nicht anzuwenden und auch die bisherigen DirectX-12-Benchmarks sind allenfalls Orientierungen, da sie nur Teilbereiche der Render Pipeline beleuchten können. Bestes Beispiel sind wieder einmal die Draw Calls, deren Anzahl sich im Vergleich zwischen DirectX 11 und Mantle/DirectX 12 dramatisch erhöhen, deren Auswirkungen auf die komplette Render Pipeline aber noch nicht abzuschätzen sind.

Wir werden uns wohl noch gedulden müssen, bis die ersten echten DirectX-12-Anwendungen verfügbar sind, um die Auswirkungen nachvollziehen zu können. Wie groß der Einfluss der Asynchronous Shader dabei ist, versucht AMD in eigenen Benchmarks nachvollziehbar zu machen. Dabei soll in einem Beispiel aus dem LiquidVR-SDK die Leistung ohne Asynchronous Shader mit zugeschalteten Post-Processing-Effekten von 245 auf 158 fps sinken. Werden die Asynchronous Shader nun wieder aktiviert, erreicht die Leistung wieder ein Niveau wie ohne die Post-Processing-Effekte.

Asynchronous Shader bei AMD
Asynchronous Shader bei AMD

AMD hat nun also in der Theorie erklärt wie ein Teil der Leistungs-Zugewinns mit DirectX 12 bei bestehender Hardware erreicht werden soll. Weiterhin schuldig bleibt man aber den konkreten Nachweis nach der Verbesserung der Leistung. Synthetische Benchmarks sind das eine und sprechen von einem Plus von teilweise mehreren hundert Prozent. Dabei werden aber nur Teilaspekte und niemals ein eventuelles Leistungsplus der kompletten Plattform beleuchtet. Dabei ergeht es allerdings nicht nur AMD so, sondern auch allen Anbietern vermeintlicher DirectX-12-Hardware. Mit der Windows 10 Technical Preview sowie den dazugehörigen Treibern wären die notwendigen Voraussetzungen in technischer Hinsicht erreicht, nun fehlt es noch an der Software.

Bei der Frage nach der Unterstützung durch die Hardware sind aber ebenso noch einige Fragen offen. Vermutlich wird es wieder unterschiedliche Ebenen für die Unterstützung von DirectX 12 geben. Mit unterschiedlichen Feature-Leveln hatten wir bereits bei DirectX 11 zu kämpfen und daran wird sich wohl auch mit DirectX 12 nichts tun. Sowohl AMD als auch NVIDIA benennen zumindest ihre letzten beiden GPU-Generationen als kompatibel zu DirectX 12. Im welchem Umfang dies der Fall sein soll, ist derzeit aber noch nicht bekannt.

Mit den Asynchronous Shader gibt AMD einen interessanten Einblick in das Verbesserungspotenzial durch DirectX 12. Die dazugehörige Hardware vorausgesetzt besteht also großes Potenzial für Leistungsverbesserungen, die nun allerdings noch umgesetzt werden müssen. Vermutlich werden wir erst zur Veröffentlichung von Windows 10 im Sommer und mit ersten DirectX-12-Updates der Spiele (oder reinen DirectX-12-Engines) das Ergebnis der Anstrengungen durch AMD und NVIDIA sehen.

Update:

Inzwischen konnten wir auch in Erfahrung bringen, welche GPUs die Asynchronous Shader nun in welcher Form genau unterstützen.

Support der Asynchronous Shader
Architektur Mixed-Mode GPU-Computing
AMD GCN 1.2 (R9 285) 1x Grafik + 7x Compute 8x Compute
AMD GCN 1.1 (R9-290-Series) 1x Grafik + 7x Compute 8x Compute
AMD GCN 1.1 (R7-260-Series) 1x Grafik + 1x Compute 2x Compute
AMD GCN 1.0 (HD-7000- und restliche 200-Series) 1x Grafik + 1x Compute 2x Compute
NVIDIA Maxwell 2. Generation (GTX-900-Series) 1x Grafik + 31x Compute 32x Compute
NVIDIA Maxwell 1. Generation (GTX-750-Series) 1x Grafik 32x Compute
NVIDIA Kepler (GK110) 1x Grafik 32x Compute
NVIDIA Kepler (GK10x) 1x Grafik 1x Compute

Natürlich arbeitet auch NVIDIA an einer ähnlichen Technologie bzw. hat diese mit HyperQ bereits 2012 für den professionellen Bereich vorgestellt. Gegenüber "Fermi" ließ sich "Kepler" mit mehr als nur einer Work-Queue füttern. Bis zu 32 virtuelle GPU-Kerne können so erstellt und mit Daten versorgt werden. Die Implementierung unterscheidet sich allerdings bei AMD und NVIDIA, so dass die absoluten Zahlen sich nicht direkt vergleichen lassen.

AMD erklärt die Funktionsweise der Asynchronous Shader und einen Demo-Vergleich in zwei Videos:

 

Social Links

Seitenübersicht

Ihre Bewertung

Ø Bewertungen: 5

Tags

Kommentare (22)

#13
Registriert seit: 23.10.2013

Hauptgefreiter
Beiträge: 192
Sind denn schon, neben Star Citizen, etwaige Titel mit DX12 angekündigt worden?
#14
Registriert seit: 21.10.2014

Stabsgefreiter
Beiträge: 267
Pre oder Post-DX11?
#15
customavatars/avatar108709_1.gif
Registriert seit: 17.02.2009
Sachsen, Brandis b. Leipzig
Admiral
Beiträge: 16801
Zitat Zero-11;23336027
klingt verdächtig nach HSA


Dito - der Ansatz ist sehr Ähnlich wie mir scheint. Denn so könnte man auch Aufgaben zwischen CPU- und GPU Teil einer APU Priorisieren und dem Entsprechendem Teil zukommen lassen.


Na mal schauen, wenn das irgendwo durchgeht und nicht wieder von nVidia blockiert wird (wenn es wie schon weiter oben geschrieben ein offener Standard werden könnte) sehe ich sogar gute Chancen das APUs richtig effektiv werden.


Zitat Jogi5;23336086
Pre oder Post-DX11?


Post-DX11 ... Prä wäre davor... :fresse: (Prähistorisch z.b.)
#16
customavatars/avatar202850_1.gif
Registriert seit: 06.02.2014
Im sonnigen Süden
Admiral
Beiträge: 9432
Zitat Pirate85;23336119
Dito - der Ansatz ist sehr Ähnlich wie mir scheint. Denn so könnte man auch Aufgaben zwischen CPU- und GPU Teil einer APU Priorisieren und dem Entsprechendem Teil zukommen lassen.


Na mal schauen, wenn das irgendwo durchgeht und nicht wieder von nVidia blockiert wird (wenn es wie schon weiter oben geschrieben ein offener Standard werden könnte) sehe ich sogar gute Chancen das APUs richtig effektiv werden.

Hier geht es aber ausschlieslich um die Recheneinheiten in der Grafikkarte/Grafikeinheit selbst.. nicht um die APUs!
Höchstens das Prinzip ist das Selbe.

Jedenfalls wäre es gut von/für AMD wenn sie mit Microsoft so an DX12 zusammengearbeitet haben, dass sie jetzt daraus ein par Vorteile rausholen können.
#17
customavatars/avatar108709_1.gif
Registriert seit: 17.02.2009
Sachsen, Brandis b. Leipzig
Admiral
Beiträge: 16801
Genau, exakt.

Es geht um das Prinzip.

Dieses wäre in gleichem Maße auf APUs anwendbar und somit HSA... :wink:
#18
customavatars/avatar95761_1.gif
Registriert seit: 27.07.2008

Fregattenkapitän
Beiträge: 2577
Not macht eben erfinderisch.
Die Parallelisierung der Aufgaben ist sicherlich eine gute Möglichkeit die Leistung optimal zu nutzen. Leider ist es wiederum sehr schwierig einen Ablauf zu parallelisieren. Das ist einen große Herausforderung für AMD aber der darin enthaltene Gewinn wiegt die Mühe auf.

Wobei man NVIDIA sicherlich nicht nachsagen kann, das sie einfallslos wären. Sie haben schließlich mit Maxwell eine deutlich effizientere Architektur auf die Beine gestellt und das muss man auch erst einmal erreichen.
Allerdings ist es oft so, das AMD mit ihren Innovationen oft nicht genug Beachtung geschenkt wird und sie daraus dann nicht dementsprechend entlohnt werden. Siehe z.B. DirectX10.1
Direct3D 10.1 im Test: Fünf Spiele mit Microsofts API im Vergleich (Seite 9) - ComputerBase
Da waren Leistungssprünge von guten 20% gegenüber DirectX10 möglich, was heute schon eine neue Grafikkartengeneration bedeuten würde.
Warum es trotzdem keinen so großen Anklang fand, wissen wir doch alle. ;)
#19
customavatars/avatar14695_1.gif
Registriert seit: 27.10.2004
HNX
Kapitänleutnant
Beiträge: 1945
Die letzte Grafik scheint nicht zu stimmen.
Die R9 290 hat 8 ACEs und jede kann bis zu 8 Queues nutzen ergibt 64 Queues.
amd-asynchronous-shader-8 » Fotostrecken
Zitat


AMD GCN 1.2 (285) 1 Graphics + 8 ACEs = 64+ Compute (64+ queues)
AMD GCN 1.1 (290 Series) 1 Graphics + 8 ACEs = 64+ Compute (64+ queues)
AMD GCN 1.1 (260 Series) 1 Graphics + 2 ACEs = 16+ Compute (16+ queues)
AMD GCN 1.0+ (Kabini) 1 Graphics + 4 ACEs = 8+ Compute (8+ queues)
AMD GCN 1.0 (7000/200 Series) 1 Graphics + 2 ACEs = 4 Compute+ (4+ queues)
NVIDIA Maxwell 2 (900 Series) 1 Graphics + 1 Compute = 32 Compute (32 queues)
NVIDIA Maxwell 1 (750 Series) 1 Graphics = 1 Compute (32 queues)
NVIDIA Kepler GK110 (780/Titan) 1 Graphics = 1 Compute (32 queues)
#20
Registriert seit: 05.08.2009
Neckarsulm
Korvettenkapitän
Beiträge: 2377
Na dann mal schauen was der Fiji so an ACE bieten wird und bo man das wirklich so sehr merken wirkt.
#21
Registriert seit: 23.10.2013

Hauptgefreiter
Beiträge: 192
Vermutlich 16 = 128
#22
customavatars/avatar14695_1.gif
Registriert seit: 27.10.2004
HNX
Kapitänleutnant
Beiträge: 1945
Zitat
Acht asynchrone Compute Engines (ACE) stehen in der "Hawaii"-GPU zur Verfügung, die allesamt unabhängig voneinander arbeiten können.

Steht im Artikel und auf den Folien, die letzte Grafik stimmt also immer noch nicht.

Der Autor sollte seinen Artikel bitte korrigieren.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Roundup: 5x GeForce GTX 1070 mit Custom-Design im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/5X-GTX1070/GTX1070_CUSTOM_ROUNDUP-TEASER

Nachdem wir bereits eine Reihe von Boardpartner-Karten der NVIDIA GeForce GTX 1080 ausführlich getestet haben, holen wir gleiches nun für das kleinere Schwestermodell nach, denn auch von der NVIDIA GeForce GTX 1070 gibt es viele Custom-Modelle mit höheren Taktraten, eigenen Kühlsystemen und... [mehr]

Drei Custom-Modelle der GeForce GTX 1060 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/3X-GTX1060/GTX1060_ROUNDUP_TEST-TEASER

Anders als bei der GeForce GTX 1080 und GeForce GTX 1070 trudelten wenige Stunden nach unserem Test zur Founders Edition der NVIDIA GeForce GTX 1060 schon die ersten Boardpartner-Karten mit teils höheren Taktraten, eigenem Kühlsystem und überarbeitetem Platinenlayout ein. Sie dürften... [mehr]

NVIDIA GeForce GTX 1080 mit Pascal-Architektur im XXL-Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Heute ist es soweit: NVIDIA läutet mit der GeForce GTX 1080 und GTX 1070 auf Basis der Pascal-Architektur den diesjährigen Neustart bei den Grafikkarten ein. In Kürze wird wohl auch AMD seinen Beitrag zu diesem Thema leisten. Vor zehn Tagen lud NVIDIA die gesammelte Fachpresse nach Austin ein... [mehr]

Roundup: 5x GeForce GTX 1080 im Custom-Design im Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Nachdem wir uns die Founders Edition der GeForce GTX 1080 und GeForce GTX 1070 bereits angeschaut haben, folgen nun fünf Retail-Modelle, die wir in aller Ausführlichkeit unter die Lupe nehmen wollen. Aus den vielen Boardpartnern und unterschiedlichen Modellen haben wir uns solche von ASUS, EVGA,... [mehr]

AMD Radeon RX 480 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/RADEON-RX480/RADEON-RX480-REFERENCE-LOGO

Es ist also soweit: AMD startet die großangelegte Zurückeroberung des Grafikkartenmarktes mit der Radeon RX 480, die als erste Grafikkarte der Polaris-Generation mit gleichnamiger Architektur erscheint und die wir uns genauer anschauen können. Dabei versucht sich AMD an einem anderen Ansatz im... [mehr]

PowerColor Radeon RX 480 Red Devil im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/POWERCOLOR-RX480/POWERCOLOR-RX480REDDEVIL-LOGO

Mit der Radeon RX 480 will AMD zurück zu alter Stärke und hat daher über Monate hinweg die PR-Trommel geschlagen. Letztendlich dabei herausgekommen ist eine sehr gute Karte für einen niedrigen Preis, die aber nicht in allen Bereichen zu überzeugen weiß. Wohl größtes Manko der Karte sollte... [mehr]