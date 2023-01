Bereits seit Jahren rühren Microsoft, NVIDIA und AMD als vorrangige umsetzende Kräfte die Trommel für DirectStorage. Mit Forspoken ist nun ein erster Titel erschienen, der DirectStorage auf den PC bringt und wir wollten uns einmal anschauen, welche Vor- und vielleicht auch Nachteile diese Technik mit sich bringt. Daneben haben wir Forspoken auch durch einen Standard-Parcours für Grafikkarten geschickt und uns einige Modelle von AMD, Intel und NVIDIA in verschiedenen Auflösungen und Qualitätsstufen angeschaut.

Forspoken ist ein Fantasy-Action-Rollenspiel von Luminous Productions, welches von Square Enix als Publisher vertrieben wird. Als Engine verwendet wird die hauseigene Luminous Engine, die bereits vor einiger Zeit beispielsweise um Raytracing-Effekte erweitert wurde.

Vorrangig für uns interessant ist aber die Umsetzung von DirectStorage. Aber was genau ist DirectStorage überhaupt und welche Vorteile soll diese Technik bieten?

Spiele haben inzwischen Installationsgrößen von 100 GB und mehr. Ein Großteil dieser Daten entfällt dabei auf die Texturen und Assets, die dazu beitragen, dass die Spielewelten immer realistischer aussehen. Aber diese Daten sind eben auch extrem groß und müssen zunächst einmal in den Grafikspeicher und an die GPU herangeführt werden. Nicht komprimiert, wären die Spieleverzeichnisse und Downloads noch größer und so werden diese Daten etwas effizienter und in komprimiert Form gespeichert.

Die auf dem Massenspeicher befindlichen Daten werden gelesen, an den Prozessor übertragen, dort in den Arbeitsspeicher gepackt, hier entpackt und dann wieder aus dem Arbeitsspeicher über das PCI-Express-Interface in den Grafikspeicher geschrieben.

Nun sind NVMe-SSD schon bei 7 GB/s für das Lesen und Schreiben von Daten angekommen. Die Schnittstelle ist nicht mehr zwangsläufig der Flaschenhals in dieser Kette des Heranführens der Daten an die GPU. Stattdessen muss der Prozessor das Entpacken der Daten übernehmen und hier kann es tatsächlich zu einer signifikanten Last auf den Kernen kommen.

Die Idee von DirectStorage ist es nun den Umweg über den Prozessor nicht mehr gehen zu müssen. Die Daten sollen vom schnellen Massenpeicher per PCI-Express direkt zur GPU übertragen werden, wo sie dann auch von dieser dekomprimiert werden. Nicht komprimierte Daten müssen nicht mehr vom Prozessor zur Grafikkarte übertragen werden und dem Prozessor werden Aufgaben abgenommen, die womöglich auf der GPU effizienter bearbeitet werden können.

DirectStorage und Forspoken

Um die DirectStorage-Umsetzung testen zu können, muss nur eine PCI-Express-SSD im System vorhanden sein, welche nach dem Standard 3.0 oder 4.0 angebunden ist und auf der sich natürlich auch die Spieledaten befinden. Bei einer per SATA angebundenen HDD oder SSD wird DirectStorage nicht aktiv. Forspoken bietet allerdings auch keinen Schalter für DirectStorage, sodass wir den Vergleich nicht für eine NVMe-SSD mit ab- und zugeschalteter DirectStorage-Unterstützung machen können.

Was wir also getan haben, ist Forspoken einerseits von der per SATA angebundenen HDD aus zu starten und dann noch mit einer NVMe-SSD, die per PCI-Express 3.0 und 4.0 angebunden war. Daher haben wir aber natürlich einerseits den Einfluss der schnelleren SSD bzw. Schnittstelle auf die Ergebnisse und können den Einfluss der DirectStorage-Umsetzung nicht wirklich isolieren. Dennoch hat uns interessiert, wie sich das Gesamtkonstrukt aus schneller SSD plus DirectStorage auf die Ladezeiten auswirkt.

Dazu haben wir drei Spielstände aus Forspoken erstellt, die wir immer wieder geladen haben. Jeder Ladevorgang wurde dreimal wiederholt, dazwischen das System immer neugestartet und aus den drei Wiederholungen wurde ein Mittelwert gebildet.

DirectStorage-Test mit Forspoken Ladezeit Szene 1 - 3.840 x 2.160 Pixel - Ultra NVIDIA GeForce RTX 4080 (NVMe SSD, DS An) 0.887XX AMD Radeon RX 7900 XTX (NVMe SSD, DS An) 1.077XX NVIDIA GeForce RTX 4080 (NVMe SSD, DS Aus) 1.135XX AMD Radeon RX 7900 XTX (NVMe SSD, DS Aus) 1.479XX Intel Arc A770 (NVMe SSD, DS An) 1.767XX Intel Arc A770 (NVMe SSD, DS Aus) 2.081XX AMD Radeon RX 7900 XTX (SATA HDD) 6.766XX NVIDIA GeForce RTX 4080 (SATA HDD) 8.241XX Intel Arc A770 (SATA HDD) 10.943XX Zeit in s Weniger ist besser

DirectStorage-Test mit Forspoken Ladezeit Szene 2 - 3.840 x 2.160 Pixel - Ultra NVIDIA GeForce RTX 4080 (NVMe SSD, DS An) 2.470XX AMD Radeon RX 7900 XTX (NVMe SSD, DS An) 2.551XX AMD Radeon RX 7900 XTX (NVMe SSD, DS Aus) 2.906XX NVIDIA GeForce RTX 4080 (NVMe SSD, DS Aus) 2.944XX Intel Arc A770 (NVMe SSD, DS An) 3.746XX Intel Arc A770 (NVMe SSD, DS Aus) 4.127XX NVIDIA GeForce RTX 4080 (SATA HDD) 27.431XX AMD Radeon RX 7900 XTX (SATA HDD) 30.201XX Intel Arc A770 (SATA HDD) 30.399XX Zeit in s Weniger ist besser

DirectStorage-Test mit Forspoken Ladezeit Szene 3 - 3.840 x 2.160 Pixel - Ultra AMD Radeon RX 7900 XTX (NVMe SSD, DS An) 2.516XX NVIDIA GeForce RTX 4080 (NVMe SSD, DS An) 2.544XX NVIDIA GeForce RTX 4080 (NVMe SSD, DS Aus) 2.810XX AMD Radeon RX 7900 XTX (NVMe SSD, DS Aus) 3.026XX Intel Arc A770 (NVMe SSD, DS An) 5.950XX Intel Arc A770 (NVMe SSD, DS Aus) 6.761XX Intel Arc A770 (SATA HDD) 35.220XX AMD Radeon RX 7900 XTX (SATA HDD) 37.618XX NVIDIA GeForce RTX 4080 (SATA HDD) 38.990XX Zeit in s Weniger ist besser

Die Ladezeiten werden um den Faktor fünf bis zehn reduziert. Vom Menü geht es also auch schon gleich los mit dem Spiel. Häufig überdecken Zwischensequenzen die Ladezeiten, so dass DirectStorage hier nicht so offensichtlich zum Einsatz kommt, aber ohnehin wird sich noch zeigen müssen, wie fließend die Technik in die Spiele-Alltag einziehen wird. Neben der reinen Ladezeit von Level und Spielständen soll sich das Daten-Streaming auch positiv auf die Leistung in großen Open-World-Titeln auswirken.

Für Forspoken haben wir den Einfluss auf die FPS ebenfalls versucht festzuhalten:

DirectStorage-Test mit Forspoken 3.840 x 2.160 Pixel - Ultra AMD Radeon RX 7900 XTX (SATA HDD) 46.7XX 40.4XX AMD Radeon RX 7900 XTX (NVMe SSD) 45.6XX 40.6XX NVIDIA GeForce RTX 4080 (NVMe SSD) 45.0XX 37.8XX NVIDIA GeForce RTX 4080 (SATA HDD) 44.9XX 34.5XX Intel Arc A770 (NVMe SSD) 17.5XX 14.9XX Intel Arc A770 (SATA HDD) 15.5XX 13.0XX FPS Mehr ist besser

Einen direkten Einfluss auf die Leistung durch die Nutzung von DirectStorage konnten wir nicht feststellen. Bisherige Berichte sprachen davon, dass die Leistung wegen der Nutzung der GPUs mit DirectStorage sogar niedriger ausfallen könnte. Davon sehen wir hier noch nichts.

Forspoken: Grafikqualität und Benchmarks

Zunächst einmal werfen wir einen Blick auf die Grafik-Einstellungen. Das Grafikmenü von Forspoken ist nicht besonders umfangreich.

Neben der Auflösung und dem Anzeigemodus kann eine maximale Bildwiederholrate festgelegt und das V-Sync (de)aktiviert werden. In den erweiterten Einstellungen können dann noch einige Detaileinstellungen gemacht werden. Eine Hilfestellung sollen die Presets sein, auf die wir gleich noch kommen. Daneben bietet Forspoken die Unterstützung von FSR 2 sowie, DLSS 2 und ermöglicht eine Auflösungsskalierung.

Bei den Qualitätseinstellungen können die Modell- und Texturdetails in verschiedenen Presets ausgewählt werden. Darüber hinaus ist es möglich, einige weitere Effekte in ihrer Qualität zu steuern. Auch die Raytracing-Effekte lassen sich hier zuschalten bzw. abschalten.

Die Auswirkungen auf die Grafikqualität sehen wir folgt aus:

Schatten- und Beleuchtungsberechnung sowie im Ultra-Preset das Hinzufügen der Raytracing-Effekte hat durchaus einen Einfluss auf die Darstellungsqualität. Sichtbar sind die Unterschiede in den Details allemal, aber am Ende kommt es ja auch darauf an, welche Hardware in der Lage ist bei der gewünschten Auflösung auch noch ausreichende FPS darzustellen.

Für die nun folgenden Benchmarks haben wir einen Intel Core i9-12900K auf einem ASUS TUF Gaming Z690-Plus zusammen mit G.Skill Trident Z5 RGB 2x 16 GB DDR5-5600, CL36-36-36-76 verwendet. Für die schon gezeigten Tests von DirectStorage kam eine Solidigm P44 Pro zum Einsatz, auf der das Spiel dann abgelegt war.

Forspoken - Presets 3.840 x 2.160 Pixel NVIDIA GeForce RTX 4080 (Niedrig) 98.6XX 68.7XX AMD Radeon RX 7900 XTX (Niedrig) 98.0XX 78.3XX NVIDIA GeForce RTX 4080 (Standard) 70.6XX 52.9XX AMD Radeon RX 7900 XTX (Standard) 69.5XX 59.7XX NVIDIA GeForce RTX 4080 (Hoch) 64.8XX 51.4XX AMD Radeon RX 7900 XTX (Hoch) 61.3XX 54.1XX NVIDIA GeForce RTX 4080 (Ultra) 46.6XX 37.7XX AMD Radeon RX 7900 XTX (Ultra) 42.5XX 32.0XX Intel Arc A770 (Niedrig) 38.5XX 30.0XX Intel Arc A770 (Standard) 26.4XX 18.3XX Intel Arc A770 (Hoch) 24.2XX 20.8XX Intel Arc A770 (Ultra) 16.0XX 13.4XX FPS Mehr ist besser

Von "Niedrig" auf "Standard" verlieren die Karten in etwa 30 % an Leistung. Von "Standard" auf "Hoch" sind es zwischen 10 und 15 %. Der Sprung auf "Ultra" reduziert die FPS noch einmal um etwa 30 %. Ähnlich sieht dies für alle Karten der drei Hersteller aus.

Forspoken bietet zwei Raytracing-Effekte: Einmal für die Berechnung der Umgebungsbeleuchtung und einmal für die nahen Schatten. In der Bildqualität können wir allerdings nur wenige Unterschiede erkennen, sodass man sich schon gut überlegen muss, ob man diese Effekten hinzuschaltet oder nicht.

Bildvergleich

Bildvergleich

Also selbst bei genauem Hinschauen sind die Unterschiede nicht immer gut zu erkennen. Die nahen Schatten sind per Raytracing-Berechnung etwas genauer und weicher, die Umgebungsbeleuchtet verbessert sich aber kaum. Auf die Leistung wirken sich die Raytracing-Effekte wie folgt aus:

Forspoken 2.560 x 1.440 Pixel - Ultra AMD Radeon RX 7900 XTX (RT Aus) 103.6XX 87.1XX NVIDIA GeForce RTX 4080 (RT Aus) 89.1XX 61.0XX AMD Radeon RX 7900 XTX (RT An) 83.3XX 48.1XX NVIDIA GeForce RTX 4080 (RT An) 78.5XX 46.5XX Intel Arc A770 (RT Aus) 40.5XX 28.8XX Intel Arc A770 (RT An) 31.2XX 23.6XX FPS Mehr ist besser

Die Radeon-Karte verliert etwa 20 % an FPS durch das Zuschalten der Raytracing-Effekte. Bei der GeForce RTX 4080 sind es nur 12 %. Bei Intel messen wir mit 23 % den höchsten Einbruch bei den FPS.

Nun wollen wir noch einige Karten durch eine Benchmark-Szene schicken. Dabei handelt es sich um die AMD Radeon RX 7900 XT und Radeon RX 7900 XTX in der Referenzversion, die Intel Arc A770 und Arc A750 in der Limited Edition sowie die NVIDIA GeForce RTX 4090 und GeForce RTX 4080 in der Founders Edition und die Gigabyte GeForce RTX 4070 Ti Gaming OC.

Forspoken 1.920 x 1.080 Pixel - Ultra NVIDIA GeForce RTX 4090 115.5XX 78.0XX AMD Radeon RX 7900 XTX 106.8XX 84.5XX NVIDIA GeForce RTX 4080 101.1XX 51.3XX AMD Radeon RX 7900 XT 98.0XX 82.0XX NVIDIA GeForce RTX 4070 Ti 80.0XX 61.9XX Intel Arc A770 41.6XX 31.4XX Intel Arc A750 40.9XX 27.9XX FPS Mehr ist besser

Forspoken 2.560 x 1.440 Pixel - Ultra NVIDIA GeForce RTX 4090 93.1XX 65.5XX AMD Radeon RX 7900 XTX 83.3XX 48.1XX NVIDIA GeForce RTX 4080 78.5XX 46.5XX AMD Radeon RX 7900 XT 72.1XX 44.9XX NVIDIA GeForce RTX 4070 Ti 60.8XX 48.1XX Intel Arc A770 31.2XX 23.6XX Intel Arc A750 28.6XX 19.8XX FPS Mehr ist besser

Forspoken 3.840 x 2.160 Pixel - Ultra NVIDIA GeForce RTX 4090 60.1XX 48.1XX AMD Radeon RX 7900 XTX 46.7XX 40.4XX NVIDIA GeForce RTX 4080 44.9XX 34.5XX AMD Radeon RX 7900 XT 39.8XX 32.8XX NVIDIA GeForce RTX 4070 Ti 35.7XX 30.8XX Intel Arc A770 17.5XX 14.9XX Intel Arc A750 9.1XX 7.1XX FPS Mehr ist besser

Die GeForce RTX 4090 liefert in allen Auflösungen und Einstellungen die meisten FPS. Die Radeon RX 7900 XTX schlägt die GeForce RTX 4080 und belegt damit den zweiten Platz. Die Radeon RX 7900 XT setzt sich genau zwischen die GeForce RTX 4080 und das neueste Modell – die GeForce RTX 4070 Ti. Die beiden Arc-Karten von Intel liegen abgeschlagen im hinteren Ende des Feldes. Aber ja, aufgrund des Fokus auf DirectStorage haben wir uns nur jeweils die schnellsten Modelle angeschaut.

Fazit

Den Anfang soll eine Beurteilung der Darstellungsqualität machen. Forspoken ist hier allerdings leider kein Vorzeige-Titel. Die Berechnung der Beleuchtung ist nicht auf dem Standard aktueller Titel. Dies liegt vor allem in der schlecht umgesetzten indirekten Beleuchtung. Viele Bereiche sind einfach viel zu hell, auch wenn sie eigentlich im Schatten liegen sollten. Besonders in Städten mit Sonnenschein fällt dies auf. Forspoken bietet die Möglichkeit sowohl Schatten wie auch die indirekte Beleuchtung per Raytracing zu berechnen. Einen großen Unterschied konnten wir hier allerdings nicht erkennen – zumindest nicht in der Berechnung der Umgebungsbeleuchtung.

Etwas besser ist hier die Umsetzung der Berechnung der Schatten. Allerdings kommt Raytracing hier nur für nahe Objekte zum Einsatz. Dies führt dazu, dass der Übergang zwischen den weichen Raytracing-Schatten zu den fixen Shadow-Maps deutlich zu erkennen ist.

Die technische Umsetzung hat uns also nicht ganz so gut gefallen und die trotz der Schwächen in der Darstellungsqualität sind die Herausforderungen an die Hardware hoch. In den letzten Final-Fantasy-Titeln gefiel uns die Grafik deutlich besser - und das bei ähnlichen technischen Voraussetzungen im Hinblick auf die verwendete Engine.

Für DirectStorage hätten wir gerne besser isolieren wollen, welche Verbesserungen die Technik im Vergleich zum Wechsel von einer Festplatte zur SSD bietet. So müssen wir diesen Teil der Betrachtung noch etwas in der Schwebe lassen. Einen negativen Einfluss hat die Nutzung von DirectStorage bei uns aber nicht. Der Mehraufwand für die GPU äußert sich also nicht in geringeren FPS. Sollte ein zukünftiger Titel ebenfalls DirectStorage unterstützen bzw. es eine Möglichkeit geben die Funktion auch getrennt vom Wechsel des Massenspeichers ein- und abzuschalten, werfen wir gerne auch noch einmal isoliert einen Blick auf DirectStorage.