Seite 9: Benchmarks: AI- und ML-Anwendungen

Wieder etwas mehr "klassische Rechenleistung" ist für das Raytracing eines Frames aus der Moana-Island-Szene der Walt Disney Animation Studios gefragt. Dies stellt eine typische Rechenaufgabe im Bereich des Film-Renderings dar. Wir haben zunächst die Zeit aufgezeichnet, die für das Raytracing benötigt wird.

Die Auflösung des Bildes beträgt dabei 2.048 x 858 Pixel und das Pathtracing wurde in 64 Samples Per Pixel (SPP) durchgeführt. Dafür benötigen die beiden Xeon-Platinum-Prozessoren der ersten und zweiten Generation in etwa vier Minuten. Die beiden Xeon Platinum 8380 profitieren von ihren 40 Kernen und sind knapp 50 % schneller.

Um die Rechenzeit in einen Vergleich zu setzen: Verdoppeln wir die Auflösung und erhöhen die SPP auf 256, dauert die Berechnung eines Frames bereits mehrere Stunden.

In einem weiteren Schritt wurde der Open Image Denoiser auf den Frame angewendet, um ein eventuelles Rauschen durch fehlende Samples zu entfernen. Je weniger Samples pro Pixel wir anwenden, desto größter ist das Rauschen im Bild. Der Open Image Denoiser entfernt dieses Rauschen und ersetzt die Informationen durch in einem Deep-Learning-Netzwerk trainierte Daten.

OSPRay und Open Image Denoise

Ray Tracing

Sekunden
Weniger ist besser

Zunächst einmal wird der Frame per Raytracing berechnet und hier kann zumindest der EPYC 7713 mit seinen 64 Kernen mithalten bzw. genau hier kann er seine Stärken ausspielen. Die Modelle mit 24, 16 und acht Kerne fallen in solchen Anwendungen erwartungsgemäß etwas ab.

OSPRay und Open Image Denoise

Entrauschen

Sekunden
Weniger ist besser

Beim Entrauschen kommen den aktuellen Intel-Prozessoren ihre angepassten Befehlssatzerweiterungen zugute, was natürlich auch nur bei der entsprechenden Software in dieser Form der Fall ist. In jedem Fall sind sie in der Lage, das Entrauschen deutlich schneller zu erledigen.

OSPRay und Open Image Denoise

Ray Tracing und Entrauschen

Sekunden
Weniger ist besser

In der Kombination aller Schritte, vor allem aber aufgrund des schnellen Denoise-Prozesses sind die Xeon-Prozessoren hier noch im Vorteil. Der EPYC 7713 kann dies durch seine Rohleistung etwas kompensieren, die speziellen Anpassungen in der Software zeigen sich hier sicherlich mit am deutlichsten und machen noch einmal klar, dass die Hardware ein wichtiger Punkt ist, es aber auch darum geht, diese per Software möglichst effizient anzusprechen.