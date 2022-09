Wir nähern uns so langsam der finalen Phase in der Einführung der ersten Arc-Grafikkarten. In den USA soll die Arc A770 am 12. Oktober für 329 US-Dollar erscheinen. Eine wichtige Funktion der neuen Hardware von Intel ist der AI-Upscaler XeSS. Ähnlich wie NVIDIAs DLSS setzt Intel hier ebenfalls auf eine AI-Rekonstruktion.

Nun sind für Shadow of the Tomb Raider und den Directors Cut von Death Stranding Patches erschienen, die XeSS aktivieren.

Zur Auswahl stehen in Shadow of the Tomb Raider die Profile "Leistung", "Ausgeglichen", "Qualität" und "Ultra-Qualität". In einigen Benchmarks haben wir XeSS mit DLSS vergleichen – zumindest hinsichtlich der Leistung. Als Testsystem zum Einsatz kam eine GeForce RTX 3090 Ti Founders Edition.

Shadow of the Tomb Raider 3.840 x 2.160 Pixel (alles hoch, RT: an) DLSS (Ultra-Leistung) 229.4XX



185.4XX DLSS (Leistung) 190.0XX



152.1XX DLSS (Ausgeglichen) 170.7XX



135.8XX XeSS (Leistung) 162.0XX



132.7XX DLSS (Qualität) 152.8XX



120.2XX XeSS (Ausgeglichen) 145.8XX



118.9XX XeSS (Qualität) 133.5XX



107.8XX XeSS (Ultra-Qualität) 117.7XX



94.3XX Aus 110.1XX



82.6XX FPS Mehr ist besser

Was wir noch nicht beleuchtet haben, ist die Darstellungsqualität im Vergleich zwischen DLSS und XeSS. Aus offensichtlichen Gründen kommt es zwischen DLSS und XeSS zu Unterschieden in der Darstellung – es handelt sich um andere Techniken. Vielmehr aber wird es bei XeSS interessant, da sich hier die Darstellung je nach Hardware ebenfalls unterscheiden kann. Auf einer GeForce-Karte könnte es so zu einer anderen Darstellungsqualität kommen, als auf einer Radeon-Karte und eine Arc-Grafikkarte von Intel soll noch einmal für eine andere Darstellung sorgen.

Der Grund dafür ist die unterschiedliche Machine-Learning-Leistung der Hardware. Für das Inferencing, also die Auswertung der XeSS-Technik auf der Grafikkarte, nutzt Intel ein Datenformat namens DP4a, welches gleich vier INT8-Berechnungen in einer FP32-Rechenoperation packt. DP4a kann von jeder FP32-Recheneinheit ausgeführt werden – also nicht nur in den Xe-Cores der Intel-GPUs, sondern auch in allen anderen GPUs von AMD und NVIDIA. Die XMX-Einheiten der Alchemist-GPUs können dieses DP4a-Format um mehrfache Faktoren schneller ausführen, da sie auf die Nutzung von INT8-Daten ausgelegt sind und viele Berechnungen gleichzeitig ausführen können.

Wie hoch die DP4a-Leistung auf einer Arc A770 im Vergleich zu einer GeForce RTX 3070 ist, lässt sich aktuell jedoch nicht sagen. Bietet eine GeForce RTX 3090 Ti also eine ähnliche DP4a-Leistung wie die Arc A770, ist die Darstellungsqualität dann vergleichbar? Dies ist sicherlich eine der spannenden Fragen.

Inzwischen hat Intel auch den Source Code für XeSS auf GitHub veröffentlicht, so dass Spiele-Entwickler das AI-Upscaling in ihre Spiele einbauen können.