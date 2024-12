Werbung

In einem technischen Seminar hat Mark Cerny, Chefarchitekt der PlayStation 5 and PlayStation 5 Pro, weitere Informationen zur Hardware gemacht. Dabei wurden auch einige Gerüchte beiseite geräumt – wie die die theoretische Rechenleistung, die bei 16,7 TFLOPS und damit +67 % gegenüber der PlayStation 5 höher liegt.

Vor und auch noch mit dem Start der PlayStation 5 Pro wurde immer wieder darüber spekuliert, welche Architekturen denn nun im Custom-Chip zum Einsatz kommen. Darüber klärte Sony nun ebenfalls auf. Die CPU-Kerne basieren weiterhin auf der Zen-2-Architektur. Deutlich verändert haben Sony und AMD die GPU-Architektur sowie das Machine Learning.

Die GPU verwendet eine RDNA-2.5-Architektur, während dort integrierte Raytracing-Hardware aber bereits Komponenten einer zukünftigen RDNA-Architektur verwendet. So werden die BVH-Bäume, die in der Simulation des Strahlenverlaufs zum Einsatz kommen, anders berechnet. Anstatt eines BVH4 verwendet die PS5 Pro BVH8 mit Boxen in Gruppen von acht anstatt vier. Durch diese Maßnahmen werden die entsprechenden Berechnungen pro Taktzyklus effizienter. Die Intersection Engine kann pro Taktzyklus die Lichtstrahlen gegen acht Boxen und zwei Dreiecke "prüfen" – bisher waren es mit vier Boxen und einem Dreieck nur halb so viele.

Es handelt sich also um eine Hybrid-Architektur, die sich nicht an einer Versionsnummer festmachen lässt.

Während AMD bei den dedizierten GPUs auf relativ große Caches setzt (Infinity Cache), fallen diese bei den integrierten GPUs deutlich kleiner aus. Dies hat gewisse Auswirkungen für Machine-Learning-Anwendungen, wie zum Beispiel PSSR (PlayStation Super Resolution). Für solche Anwendungen kann der Speicher gar nicht groß und schnell genug sein.

Die PlayStation 5 Pro bietet mit 576 gegenüber 448 GB/s eine etwas höhere Speicherbandbreite als das normale PS5-Modell. Zudem stehen 1 GB mehr an Speicher zur Verfügung. Aber selbst diese 576 GB/s sind für Machine-Learning-Anwendungen kaum hilfreich.

Sony wendet an dieser Stellte zwei Tricks an: Zum einen werden die KI-unterstützten Frames nicht voll in 4K berechnet, sondern in mehrere Abschnitte aufgeteilt. Täte man dies nicht, würde man für einen Tile mit einer Auflösung von 4K etwa 128 MB an schnellem Speicher benötigen. Sony teilt die Frames aber in mehrere Tiles auf und berechnet diese nacheinander – zum Beispiel für PSSR.

Für möglichst vieles und schnellen Cache greift man dann auf den zweiten Trick zurück: So nimmt man die Vektor-Register der WGPs mit vier Register-Sets je WGP und jeweils 128 kB mit einer Bandbreite von 1,67 TB/s. Über alle 30 WGPs zusammengenommen kommt Sony so auf 15.360 kB (15 MB) an schnellem SRAM (30 x 4 x 120 kB), der eine zusammengenommene Bandbreite von 200 TB/s vorzuweisen hat. Mit diesem schnellen Speicher können dann auch die Machine-Learning-Anwendungen effizient durchgeführt werden.

Projekt Amethyst

Für den letztgenannten Aspekt arbeiten Sony und AMD für das Projekt Amethyst zusammen. Mit Hilfe der weiteren Entwicklungen sollen Machine-Learning-Anwendungen mittels Convolutional Neural Networks (CNN) auf einer möglichst flexiblen Architektur ausgeführt werden können. Sogenannte Fully Fused Networks sind das Ziel.

Die Einzelkomponenten, die CNNs, können von AMD und Sony weiterentwickelt werden und werden dann zusammengeführt. Die Fortschritte dieser Entwicklungen werden für Technologien der PlayStation zum Einsatz kommen, man kann aber auch davon ausgehen, dass AMD diese für seine Radeon-Technologien nutzen wird.