Seite 11: Benchmarks: DL-Boost

Disney Mona Island
Disney Mona Island
Disney Mona Island
Disney Mona Island
Disney Mona Island

Neben den Ice-Lake-Prozessoren sind solche auf Basis von Cascade Lake die einzigen, die DL-Boost per AVX-512 Vector Neural Network Instructions (AVX512VNNI) unterstützen. Diese neuen Instruktionen sollen entsprechende Anwendungen beschleunigt berechnen. Im Serverbereich gibt es bereits zahlreiche Anwendungsbereiche für DL-Boost, während es im Endkunden- bzw. Workstation-Segment jedoch noch ganz anders aussieht.

Eines vorweg: Einen Vergleich zu anderen Prozessoren können wir hier nicht bieten. Wir vergleichen also nur den Core i9-9980XE gegen den Core i9-10980XE. Dies liegt zum einen an der notwendigen Zeit für die Tests und zum anderen daran, dass wir sowohl den Renderer, als auch den Open Image Denoiser nicht auf einem AMD-System zum Laufen bekommen haben.

Für den Test haben wir die Moana-Island-Szene der Walt Disney Animation Studios per Raytracing berechnen lassen und mittels OSPRay bzw. Open Image Denoise ein Entrauschen darauf angewendet. Dies stellt eine typische Rechenaufgabe im Bereich des Film-Renderings dar. Wir haben zunächst die Zeit aufgezeichnet, die für das Ray Tracing benötigt wird. Die Auflösung des Bildes beträgt dabei 2.048 x 858 Pixel und das Path Tracing wurde in 64 Samples Per Pixel (SPP) durchgeführt. 

OSPRay und Open Image Denoise

Ray Tracing

Sekunden
Weniger ist besser

Dafür benötigen die beiden Core-i9-Prozessoren in etwa gleich lang, wobei der Core i9-10980XE etwas schneller ist. Um die Rechenzeit in einen Vergleich zu setzen: Verdoppeln wir die Auflösung und erhöhen die SPP auf 256, dauert die Berechnung eines Frames bereits mehrere Stunden.

OSPRay und Open Image Denoise

Entrauschen

Sekunden
Weniger ist besser

In einem weiteren Schritt wurde der Open Image Denoiser auf den Frame angewendet, um ein eventuelles Rauschen durch fehlende Samples zu entfernen. Je weniger Samples pro Pixel wir anwenden, desto größter ist das Rauschen im Bild. Der Open Image Denoiser entfernt dieses Rauschen und ersetzt die Informationen durch in einem Deep-Learning-Netzwerk trainierte Daten.

In der Dauer des Entrauschens kommt die DL-Boost-Beschleunigungen des Core i9-10980XE ins Spiel, denn das System erledigt das Entrauschen in 17,9 Sekunden, während der Core i9-9980XE mit 165,5 Sekunden fast die zehnfache Zeit benötigt.

OSPRay und Open Image Denoise

Ray Tracing und Entrauschen

Sekunden
Weniger ist besser

In der Kombination aus der Berechnung per Raytracing und dem Entrauschen ergibt sich die Berechnung des finalen Frames. Hier ist der Anteil der Raytracing-Berechnung natürlich am größten und die Entrauschen spart die Zeit im Gesamtrendering ein. Zwischen einem Core i9-9980XE und dem Core i9-10980XE liegen 156 Sekunden, die pro Frame eingespart werden.