DX 12 multi-GPU

mustrum · 04.08.2015

Hallo zusammen!

Gibt es eigentlich schon irgendwelche greifbaren Informationen zu multi-GPU unter DX12?
Spiele sind ja noch keine released aber eventuell Erfahrungsberichte von Entwicklern?

Ich frage deshalb, da im Marktplatz niemand meine R9 290 mit EK Kühler samt Backplate Interesse hat bzw ich die Karte nicht verschenken will.
Wenn Dx12 Spiele die Kombination Fury X + R9 290 tatsächlich nutzen können, kommt die Karte zurück in den Rechner.
Wenn es skalieren würde wie Crossfire bisher könnte sich das ja durchaus lohnen.

Phantomias88 · 04.08.2015

Hallo mustrum,
ja es gibt schon ein paar Infos, ob es auch wirklich so ist, kann man zur Zeit nur "trail and error" probieren.

DirectX 12: Mit

Microsoft hat das Feature auf die Bezeichnung „Explicit Multiadapter“ getauft, das herstellerunabhängig mit der GPU-Konfiguration laufen kann.

derneuemann · 04.08.2015

Was der Artikel nicht wieder gibt, ist das die Frametimes sehr schlecht waren(also wirklich spürbar, bzw. sichtbar)!
Jedoch bleibt zu hoffen, das die das noch hin bekommen, ohne das die Bildausgabe ungleichmäßig ist.
Ich bin da sehr gespannt drauf.

Phantomias88 · 04.08.2015

@derneuemann
Bei AMD wurde Frame Pacing genutzt, das ist schon seit letztes Jahr September im Catalyst integriert und automatisch an bei CrossfireX oder DualGraphics:
AMD A10-7700K und A10-7850K im Test | Planet 3DNow!

Wichtig für uns ist an dieser Stelle nur das Aufzeigen dessen, dass Dual Graphics inzwischen durchaus brauchbare Werte vorzeigen kann. Mikroruckler durch stark schwankende Frametimes können wir beim Spielen nicht feststellen. Das Frame Pacing für einen Dual-Graphics-Verbund funktioniert.

mustrum · 04.08.2015

Danke für die Infos. Ich hoffe da kommt bald noch mehr. Wenn ich kein vernünftige Angebot bekomme, behalte ich die R290 einfach. Das könnte durchaus interessant werden.

derneuemann · 04.08.2015

Phantomias88 schrieb:
@derneuemann
Bei AMD wurde Frame Pacing genutzt, das ist schon seit letztes Jahr September im Catalyst integriert und automatisch an bei CrossfireX oder DualGraphics:
AMD A10-7700K und A10-7850K im Test | Planet 3DNow!

Ja Frame pacing kenne ich und funktioniert nur begrenzt. Klar wurde einiges besser, aber gerade bei dem von dir verlinkten Bericht, gab es auf anderen Plattformen (nicht CB) die Info, das die Messung zwar einen Gewinn von kanpp über 10% zeigt, aber es durch die unregelmäßige Bildausgabe versaubeutelt wurde. Aber das ist ja auch noch ein frühes Stadium. Seitdem ich das erste mal diesen Bericht gesehen habe, sind doch bestimmt schon 6-7 Monate vergangen...

mustrum schrieb:
Danke für die Infos. Ich hoffe da kommt bald noch mehr. Wenn ich kein vernünftige Angebot bekomme, behalte ich die R290 einfach. Das könnte durchaus interessant werden.

Vielleicht liegt es am Preis?

Ich habe meine R9 290X mit montierter Wakü für 270 verkauft und neuer sind die Karten seit Januar nicht geworden.

Phantomias88 · 04.08.2015

derneuemann schrieb:
Ja Frame pacing kenne ich und funktioniert nur begrenzt. Klar wurde einiges besser, aber gerade bei dem von dir verlinkten Bericht, gab es auf anderen Plattformen (nicht CB) die Info, das die Messung zwar einen Gewinn von kanpp über 10% zeigt, aber es durch die unregelmäßige Bildausgabe versaubeutelt wurde. Aber das ist ja auch noch ein frühes Stadium. Seitdem ich das erste mal diesen Bericht gesehen habe, sind doch bestimmt schon 6-7 Monate vergangen...

Ja Frame Pacing greift wohl nur bei DX10 & DX11, daher ja auch Freesync (bzw. G-Sync bei nvidia).
Wer ein AMD System hat, sollte bezüglich ungleichmässiger Frametimes keine Probleme mehr haben.
Zwar liest FRAPS immer noch unregelmässigkeiten aus, aber FRAPS ist auch kein Profi-software, sondern so lala wenn man die Daten nicht professionell auswertet.

Ohne Frame Pacing Feb. 2014: http://abload.de/img/frappo_bf4stock_cfxwju8t.png

mustrum · 04.08.2015

derneuemann schrieb:
Ja Frame pacing kenne ich und funktioniert nur begrenzt. Klar wurde einiges besser, aber gerade bei dem von dir verlinkten Bericht, gab es auf anderen Plattformen (nicht CB) die Info, das die Messung zwar einen Gewinn von kanpp über 10% zeigt, aber es durch die unregelmäßige Bildausgabe versaubeutelt wurde. Aber das ist ja auch noch ein frühes Stadium. Seitdem ich das erste mal diesen Bericht gesehen habe, sind doch bestimmt schon 6-7 Monate vergangen...

Vielleicht liegt es am Preis? Ich habe meine R9 290X mit montierter Wakü für 270 verkauft und neuer sind die Karten seit Januar nicht geworden.

Mag sein aber 270 inkl Versand (kostet mich nach D 15 €) sind das was ich will.
Der Kühler allein kostet 130 €.
Die Alternative ist eine neue R9 390 für 320 € dazu noch 130€ für den Kühler falls man überhaupt einen bekommt. Dafür hat man 8GB Speicher die nichts bringen.

Natürlich kann ich runter mit dem Preis bis ein Schnäppchenjäger zuschlägt.
Wie gesagt ansonsten nehme ich die lieber als DX 12 Experiment.

Edit: Bei regulärem Crossfire mit zwei R9 290 waren Frametimes absolut kein Thema. Mal sehen wie das dann asynchron funktionieren wird. Derzeit berechnet ja einfach ein Karte ein Bild voraus = AFR (was der Tod für VR ist weshalb es sterben muss).

Cheesekilla · 04.08.2015

Ob eine Fury mit einer 290X im CF läuft ist meines Wissens ausgeschlossen da verschiedene Chips/Serien

mustrum · 04.08.2015

Cheesekilla schrieb:
Ob eine Fury mit einer 290X im CF läuft ist meines Wissens ausgeschlossen da verschiedene Chips/Serien

Unter DX 12 läuft eine Fury X mit einer Nvidia Karte oder auch Intel HD onboard. Die Frage ist nur wie viel es bringt.

Phantomias88 · 04.08.2015

mustrum schrieb:
Edit: Bei regulärem Crossfire mit zwei R9 290 waren Frametimes absolut kein Thema. Mal sehen wie das dann asynchron funktionieren wird. Derzeit berechnet ja einfach ein Karte ein Bild voraus = AFR (was der Tod für VR ist weshalb es sterben muss).

Im Grunde ist asynchron Bauert bedingt besser, die stärkste Karte sitzt ganz oben, falls kein Multi-GPU geboten wird.
Je schwächer die Karte umso weiter unten sollte sie sitzen, als Bsp.: Fury X oben, Fury in der Mitte und Fury Nano ganz unten.

Bin auch gespannt, wie die Mantle Titel unter DX12 laufen. :bigok:

derneuemann · 05.08.2015

Aussagen wie" Frametimes waren kein Thema" sind halt nicht allgemein gültig, da sich ja schon die Geister, bei Fragen was flüssig ist scheiden. Ich kenne kein CF/SLI Test, der sich mit dem Thema befasst hat und im Fazit nicht negativ über dieses Problem sprach...

mustrum · 05.08.2015

derneuemann schrieb:
Aussagen wie" Frametimes waren kein Thema" sind halt nicht allgemein gültig, da sich ja schon die Geister, bei Fragen was flüssig ist scheiden. Ich kenne kein CF/SLI Test, der sich mit dem Thema befasst hat und im Fazit nicht negativ über dieses Problem sprach...

Alle aktuellen Tests die ich gelesen habe zeigen nur noch leicht erhöhte Frametimes auf. Alle mit dem Fazit, dass dies nicht mehr spürbar sind. Dies deckt sich mit mit meinen Erfahrungen. Ich schlage vor aktuelle Crossfire Tests zu lesen (z.B.: Fury X). Wo AFR scheitert ist der VR Bereich, da die zusätzlich Latenz dort ein Problem darstellt. Weiters würde ich von Multi-GPU abraten wenn die FPS niedrig sind. Wenn man mittels Multi-GPU Setup von 20 auf 30 FPS kommen möchte, werden die minimum FPS bzw Frameverläufe nicht toll sein.

Phantomias88 · 05.08.2015

derneuemann schrieb:
Aussagen wie" Frametimes waren kein Thema" sind halt nicht allgemein gültig, da sich ja schon die Geister, bei Fragen was flüssig ist scheiden. Ich kenne kein CF/SLI Test, der sich mit dem Thema befasst hat und im Fazit nicht negativ über dieses Problem sprach...

Es gibt schon ein paar Test, nur nicht in Deutsch: The AMD Radeon R9 295X2 8GB Graphics Card Review | Battlefield 4
Da sieht man schön wie die Frametimes einer Dual GPU R9 295X² besser sind als SLI mit BF4.
Bei meinem Frappo Auswertung sind 95% der FPS zwischen 9,11ms und 9,23ms.
Je höher die FPS umso weniger fallen die µ-ruckler auf.

mustrum · 05.08.2015

Phantomias88 schrieb:
Es gibt schon ein paar Test, nur nicht in Deutsch: The AMD Radeon R9 295X2 8GB Graphics Card Review | Battlefield 4
Da sieht man schön wie die Frametimes einer Dual GPU R9 295X² besser sind als SLI mit BF4.
Bei meinem Frappo Auswertung sind 95% der FPS zwischen 9,11ms und 9,23ms.
Je höher die FPS umso weniger fallen die µ-ruckler auf.

Kann ich so unterschreiben. Ich hatte bei mir die Framtimes immer auf dem Logitech G-15 Display. Bei hohen FPS ist die Latenz sehr gering.
Deshalb sage ich auch immer, dass Crossfire eigentlich nur mit den aktuellen Highend Karten wirklich Sinn macht. Selbst dann funktioniert es aber nie mit allen Spielen mangels Unterstützung.

Cheesekilla · 05.08.2015

Hatte die Oculus DK 2 mit 7970 CF in Alien Isolation, absolut smooth

mustrum · 05.08.2015

Selbes berichten Nvidia SLI user mit Elite Dangerous (kein Crossfire bzw FPS Drops mit CF).
Tatsache ist, dass die Latenz um 16.67ms erhöht wird. Ob man das spürt, kann ich nicht sagen. Oculus ist ja bemüht unter 20ms zu kommen, da hilft es nicht wenn man 16+ draufpappt.

Das du das als smooth empfindest und es gut spielbar war kann ich mir aber schon vorstellen. Die SLI User in ED werden ja auch nicht alle lügen. Man hat eben eine leichte Verzögerung beim positional tracking drin mit SLI/CF. Ob man das aber tatsächlich spürt ist die Frage. Zukünftig gehen beide Hersteller allerdings von AFR weg um eben diese Latenz zu minimieren.

Phantomias88 · 05.08.2015

mustrum schrieb:
Kann ich so unterschreiben. Ich hatte bei mir die Framtimes immer auf dem Logitech G-15 Display. Bei hohen FPS ist die Latenz sehr gering.
Deshalb sage ich auch immer, dass Crossfire eigentlich nur mit den aktuellen Highend Karten wirklich Sinn macht. Selbst dann funktioniert es aber nie mit allen Spielen mangels Unterstützung.

Es geht auch mit kleineren Karten, allerdings sollte man hier nicht zuviel erwarten, Ultra oder "Epic" Einstellungen bleiben den Flaggschiffen vorbehalten.

mustrum schrieb:
Selbes berichten Nvidia SLI user mit Elite Dangerous (kein Crossfire bzw FPS Drops mit CF).
Tatsache ist, dass die Latenz um 16.67ms erhöht wird. Ob man das spürt, kann ich nicht sagen. Oculus ist ja bemüht unter 20ms zu kommen, da hilft es nicht wenn man 16+ draufpappt.

Das du das als smooth empfindest und es gut spielbar war kann ich mir aber schon vorstellen. Die SLI User in ED werden ja auch nicht alle lügen. Man hat eben eine leichte Verzögerung beim positional tracking drin mit SLI/CF. Ob man das aber tatsächlich spürt ist die Frage. Zukünftig gehen beide Hersteller allerdings von AFR weg um eben diese Latenz zu minimieren.

16,6ms wären 60FPS weniger, das merkst du auf jeden Fall.
Die Hersteller gehen nicht von AFR weg, sondern den Software Entwicklern wird überlassen, welche Technik sie für ihr Spiel nutzen wollen.

Falls du Allgemein noch etwas über die Technik dahinter nachlesen willst: Civilization: Beyond Earth bietet bereits zum Start Unterstützung für Mantle API – Erste Benchmarks [2. Update] | Planet 3DNow!
Finde den Artikel sehr gelungen und gut erklärt.

mustrum · 06.08.2015

Phantomias88 schrieb:
Es geht auch mit kleineren Karten, allerdings sollte man hier nicht zuviel erwarten, Ultra oder "Epic" Einstellungen bleiben den Flaggschiffen vorbehalten.

16,6ms wären 60FPS weniger, das merkst du auf jeden Fall.
Die Hersteller gehen nicht von AFR weg, sondern den Software Entwicklern wird überlassen, welche Technik sie für ihr Spiel nutzen wollen.

Falls du Allgemein noch etwas über die Technik dahinter nachlesen willst: Civilization: Beyond Earth bietet bereits zum Start Unterstützung für Mantle API – Erste Benchmarks [2. Update] | Planet 3DNow!
Finde den Artikel sehr gelungen und gut erklärt.

Es sind nicht 60 FPS weniger. Eine Sekunde hat 1000 millisekunden! Bei SLI bzw. Crossfire passiert ganz einfach folgendes: Pro Sekunde bei aktiviertem Vsync und 75 hz wird ein Frame Latenz hinzugefügt. Das heißt das Bild ist um 1/75el einer Sekunde hinten nach. Das sind 0,016 Sekunden = 16 ms. Klingt nach nicht viel aber wenn man bedenkt, dass das Ziel für VR 20ms bis das Bild beim Auge ankommt (Displayverzögerung schon inkludiert), dann ist das sehr viel. Auch eine single GPU hat schon Latenz um ein Bild zu berechnen. Die 16ms kommen quasi nur noch oben drauf.

Das positional Tracking ist zwar 100% flüssig aber eben immer leicht "hinten nach".

Zu dem Link:
Die Technik ist mir durchaus bekannt und auch absolut nicht neu. AFR kam erst später. Crossfire hat zu Beginn mit Super Tiling gearbeitet. Das Verfahren hat das Latenzproblem nicht in dem Ausmaß, skaliert aber eben nicht so gut wie AFR.

derneuemann · 06.08.2015

Die lange Kette der Latenz, wird oft falsch angegangen. Die gesamte latenz von der Eingabe, bis zur Ausgabe auf dem Bildschirm müsste eigentlich betrachtet werden. Aber ich muss auch sagen, da ich gerne multiplayer shooter spiele, würden mir 16ms extra nicht in die Tüte kommen. Aber da scheiden sich auch die Geister.

Phantomias88 · 06.08.2015

@mustrum
16,6ms Frametimes entsprechen 60FPS: 33.3ms sind 30FPS.
Du beziehst dich nur auf den zeitlichen Versatz, daher ist das etwas verwirrend.

3DMark API Overhead: DirectX 12 im Test vor Mantle und AMD vor Nvidia - ComputerBase
Bei mir sind ~8Mio Single GPU und 16Mio mit CrossfireX

mustrum · 06.08.2015

Phantomias88 schrieb:
@mustrum
16,6ms Frametimes entsprechen 60FPS: 33.3ms sind 30FPS.
Du beziehst dich nur auf den zeitlichen Versatz, daher ist das etwas verwirrend.

3DMark API Overhead: DirectX*12 im Test vor Mantle und AMD vor Nvidia - ComputerBase
Bei mir sind ~8Mio Single GPU und 16Mio mit CrossfireX

Ich spreche aber nicht von Frametimes sondern von Latenz und auf diese kommt es bei VR an.

Phantomias88 · 06.08.2015

@mustrum
Ok, hab es allgemein gemeint, nicht direkt auf dich Bezogen.
Die Latenz misst man auch in Zeiteinheiten: ms oder ns (z.B. beim Speicher und Cache).

Meinst du mit VR = LiquidVR : AMD LiquidVR

mustrum · 06.08.2015

Phantomias88 schrieb:
@mustrum
Ok, hab es allgemein gemeint, nicht direkt auf dich Bezogen.
Die Latenz misst man auch in Zeiteinheiten: ms oder ns (z.B. beim Speicher und Cache).

Meinst du mit VR = LiquidVR : AMD LiquidVR

VR = Virtual Reality (Oculus Rift DK2 in meinem Fall). LiquidVR ist AMD's SDK dafür und wird AMD Hardware darauf optimieren. Nvidia bringt das gleiche in ihrem unsäglichen Gameworkspaket.

Phantomias88 · 06.08.2015

mustrum schrieb:
VR = Virtual Reality (Oculus Rift DK2 in meinem Fall). LiquidVR ist AMD's SDK dafür und wird AMD Hardware darauf optimieren. Nvidia bringt das gleiche in ihrem unsäglichen Gameworkspaket.

Ok, also hast du auch schon Erfahrung mit VR, das ist bestimmt mal hilfreich!

Es gibt ja hier im Forum inzwischen ein Eigenen Task: "Virtual Reality"

z. B. durch die Reduzierung der Motion-to-Photon-Latenz auf unter 10 Millisekunden. Dies ist ein entscheidender Schritt, um noch bestehende Schwachpunkte zu beheben. Eine reale Herausforderung ist z.B. das Lösen der „Bewegungskrankheit“, die auftreten kann, wenn der Kopf in der virtuellen Welt bewegt wird und es nur wenige Millisekunden zu lange dauert, bis die neue Perspektive eingespielt wird.

Das kling ein bischen nach "Seekrank" :sick:

fdsonne · 08.08.2015

mustrum schrieb:
Es sind nicht 60 FPS weniger. Eine Sekunde hat 1000 millisekunden! Bei SLI bzw. Crossfire passiert ganz einfach folgendes: Pro Sekunde bei aktiviertem Vsync und 75 hz wird ein Frame Latenz hinzugefügt. Das heißt das Bild ist um 1/75el einer Sekunde hinten nach. Das sind 0,016 Sekunden = 16 ms. Klingt nach nicht viel aber wenn man bedenkt, dass das Ziel für VR 20ms bis das Bild beim Auge ankommt (Displayverzögerung schon inkludiert), dann ist das sehr viel. Auch eine single GPU hat schon Latenz um ein Bild zu berechnen. Die 16ms kommen quasi nur noch oben drauf.

Kurze (EDIT: eher längere :fresse:

) Anmerkung. Es ist rein logisch gesehen nicht ein ganzes Frame, was an "Latenz" oben drauf kommt. Sondern es ist im Optimalfall ziemlich exakt ein Halbes

Warum? Ganz einfach, die Bildausgabe erfolgt sequenziell. Wäre es ein ganzes Frame zusätzliche Verzögerung, dann müssten beiden GPUs zwei Frames exakt zur selben Zeit beginnen zu berechnen wie auch exakt zur selben Zeit beenden. Der Framebuffer bekommt dann zwei Frames. Was eigentlich keinen Sinn macht, weil es in beiden Fällen zum selben Ergebnis führen würde (also das Bild sieht identisch aus, da zum Berechnungsbeginn bei exakt selbem Zeitstempel auch exakt die selben "Daten" bei beiden Bildern vorliegen...

Damit AFR Sinn macht (nämlich die FPS zu steigern), muss ein Versatz her. Dieser Versatz ist im Optimalfall exakt die Hälfte eines Frames. (also die Zeit in ms, wie lange ein Frame zur Berechnung dauert, geteilt durch zwei) -> die zweite GPU fängt (bildlich von ganz vorn gesehen) also mit dem Bild n+1 genau dann an, wenn das erste Bild "zur Hälfte" fertig ist. Frame Metering bzw. Frame Pacing sollten genau dafür (mit)verantwortlich sein. -> eben um schwankende Frametimes zu unterbinden rechnet man mit den Zeiten der/des vorherigen Frames.
GPU zwei benutzt als Basisdaten für jenen Frame n+1 auch nicht die selbe Basis wie GPU eins für Frame n -> sondern schon einen "Schritt" weiter. Somit entsteht eine Bildänderung -> ein Schwenk des Sichtfeldes oder eine Positionsänderung von Objekten auf dem Bild usw. usf.
Wäre dies nicht so, dann würde man zwar die doppelten Bilder pro Sekunde berechnen (mit zwei GPUs), aber beide GPUs würden den selben Frame raushauen. Auch wenn es formal zwei verschiedene Bilder wären, wäre der Inhalt exakt identisch -> somit wären gemessen zwar mehr Bilder pro Sekunde da, aber sichtbar nur die "Hälfte". Ähnlich VSync bei 60Hz und nur unter 60 FPS -> da wird jedes Frame doppelt so lange dargestellt.
Da der Mensch aber nicht die ausgegebenen Bilder erkennt, sondern den Inhalt der Bilder, ändert sich bei doppelter Ausgabegeschwindigkeit aber dafür immernoch nur gleich vielen Bildinhaltsänderungen visuell gesehen gar nix!

Anders das Problem mit den Frametimes. Hier kommt es aufgrund von starken Schwankungen zu dem Problem, dass die kurzen Zeitunterschiede unter gehen an den längeren Perioden. Jedes zweite Bild wird länger dargestellt und somit entsteht der Eindruck, dass der Speed gar nicht zunimmt (Stichwort MR)

PS: für VR würde sich auch AFR als solches gar nicht wirklich anbieten. Ich weis nicht genau, wie die Entwicklung an der Stelle nun wirklich steht (ohne direkt kaufbare Consumer Produkte), aber für VR wäre eine Art MGPU mit zwei GPUs und der Berechnung pro Auge deutlich sinnvoller. Skalierung sollte in dem Fall bei >90% liegen -> weil die Komplexität der Berechnung beider Augen wenig unterschiedlich pro "virtuellem Frame" ist. Ein "virtueller Frame" meint dabei das Bild ansich, was einmal fürs linke und einmal fürs rechte Auge gerendert wird. Da die Basis in beiden Fällen gleich ist wäre eine annähernd perfekte MGPU Skalierung hinzubekommen. Und natürlich auch keine Latenzsteigerung

Deine benannten ~20ms wären also durchaus im Rahmen des möglichen, wenn man sich allein auf die GPU(s) beschränkt. -> dies ist aber leider auch nicht alles, wie derneuemann schon sagte. Die Latenz von Eingabe bis zum Erfassen des Gehirns vom "Bild" über beide Augen ist das entscheidende... Um so schneller die FPS, desto mehr Zeit bleibt für die Restlatenz abseits der GPU...

PPS: theoretisch würde sich so eine Art MGPU sogar für normale 3D Darstellung mit ner Shutterbrille oder ähnliches anbieten. Das Problem dabei ist eher, dass es am GPU Ausgang nur wieder zusammen gesetzt wird und somit der Effekt verpufft. Ein aktiver 3D Monitor, welcher mit zwei Streams gleichzeitig angesteuert werden würde, könnte sowas umgehen... Gibts aber atm soweit ich weis nicht. Bestenfalls ein paar "Krücken" im Bereich UHD mit 2x HDMI oder sowas -> aber dort eher um die Auflösung hinzubekommen als um den 3D Effekt zu erzeugen.

DX 12 multi-GPU

Enthusiast

Banned

Enthusiast

Banned

Enthusiast

Enthusiast

Banned

Enthusiast

Urgestein

Enthusiast

Banned

Enthusiast

Enthusiast

Banned

Enthusiast

Urgestein

Enthusiast

Banned

Enthusiast

Enthusiast

Banned

Enthusiast

Banned

Enthusiast

Banned

Legende