> > > > AMD Radeon Pro SSG mit zwei M.2-Slots für SSDs (Update)

AMD Radeon Pro SSG mit zwei M.2-Slots für SSDs (Update)

Veröffentlicht am: von

AMD Logo 2013Neben den drei neuen Workstation-Grafikkarten auf Basis der neuen Polaris-GPUs hat AMD auf der Siggraph auch noch ein weiteres Modell vorgestellt. Die Radeon Pro SSG (Solid State Graphics) bietet dabei, sehr ungewöhnlich für einen solchen GPU-Beschleuniger, zwei M.2-Slots für den Einsatz zweier SSDs. Damit möchte AMD den lokal auf der Grafikkarte zur Verfügung stehenden Speicher massiv vergrößern.

Auch hier fehlen uns noch einige technische Daten, doch bei der Durchschau des Streams zur Veranstaltung sowie aufgrund logischer Schlussfolgerungen lassen sich zumindest einige Details erkennen. AMD verwendet für die Radeon Pro SSG eine Polaris-10-GPU sowie die zwei besagten M.2-Slots. Diese sind direkt mit der GPU verbunden, wobei unklar ist, ob die PCI-Express-Lanes direkt von der GPU kommen oder dies über einen PCI-Express-Bridge-Chip wie auf den Dual-GPU-Grafikkarten realisiert wird. Der maximale Speicherausbau soll dabei bis zu 1 TB betragen. Natürlich kann dieser Speicher nicht direkt als Grafikspeicher verwendet werden und so muss AMD hier eine weitere Speicherebene einziehen – zusätzlich zu den Registern, L1/L2-Caches und dem eigentlichen Grafikspeicher.

Update:

Inzwischen scheint klar zu sein, woher AMD die PCI-Express-Lanes zur Anbindung des NAND-Speichers nimmt. Acht der 16 Lanes werden dazu verwendet, die sich wiederum zu jeweils vier pro M.2-Slot aufteilen. Wir sehen hier also die aktuell klassische und schnellste Anbindung für eine solche SSD.

AMD Radeon Pro SSG mit zwei M.2-Slots für SSDs
AMD Radeon Pro SSG mit zwei M.2-Slots für SSDs

Wo zusätzliche 1 TB an NAND auf einer Grafikkarte sinnvoll sein können, hat AMD ebenfalls demonstriert. So seien die maximalen 32 GB einer Fire Pro W9100 zwar in den meisten Fällen ausreichend, es gäbe aber auch Workloads wie die Verarbeitung von Daten für Erforschung von Öl- und Gasvorkommen sowie die Videobearbeitung in 8K, bei denen diese 32 GB nicht mehr ausreichen. Zwar ist in solchen Fällen auch die Auslagerung von Daten über das PCI-Express-Interface in den Systemspeicher möglich, diese Datenübertragung ist aber noch immer langsamer, als ein direkter Speicher auf der Grafikkarten. Bei einem Scrollen durch ein 8K-Video schlägt sich dies in einer Steigerung der FPS von 17 auf über 90 nieder.

Organisation des Speichers bei der AMD Radeon Pro SSG
Organisation des Speichers bei der AMD Radeon Pro SSG

Ein per PCI-Express angebundener NAND auf der Grafikkarte bietet eine geringere Latenz und muss auch nicht über den Prozessor adressiert werden. Dies macht ihn schneller, als die Auslagerung auf den Systemspeicher. Da dies aber nicht in jedem Fall so sein muss, darf man gespannt darauf sein, wie sich diese Umsetzung in der Realität auf die Performance auswirken wird. Anwendungen, die diesen zusätzlichen Speicher verwenden wollen, müssen explizit daraufhin arbeiten und diese Speicherebene gezielt ansteuern. Der Treiber übernimmt nur einen Teil der Arbeit, so dass abzuwarten bleibt, welche Anwendungen die Unterstützung für die Radeon Pro SSG bieten werden.

Derzeit sieht AMD die Radeon Pro SSG noch als Prototyp und verteilt entsprechende Developer Kits. 2017 sollen die Karten schließlich marktreif sein. Welche GPU dann darauf zum Einsatz kommt, steht aber noch in den Sternen. Wer an einem Developer Kit der Radeon Pro SSG interessiert ist, sollte auch noch ein paar Euro zur Seite legen, denn AMD verlangt für die Teilnahme am Entwicklerprogramm stolze 9.999 US-Dollar.

Update:

Inzwischen sind weitere Details zur Karte bzw. der technischen Umsetzung bekannt. So verwendet AMD den bekannten PCI-Express-Bridge-Chip PEX8747, wie er auf fast allen Dual-GPU-Grafikkarten eingesetzt wird. Zwei Samsung 950 Pro sind mit jeweils vier Lanes am M.2-Slot angebunden. Die beiden SSDs werden in einem RAID0 betrieben. Die 1 TB Speicher sollen auch im Windows auftauchen und können darüber angesprochen werden. Ob dies bei der finalen Variante auch noch der Fall sein wird, bleibt abzuwarten.

 

 

Fudzilla konnte außerdem einen Blick auf die Rückseite der Karte werfen und diese zeigt eine eindeutige Verwandtschaft zu den AMD-Grafikkarten mit Fiji-GPU. Die vielen SMD-Widerstände hinter dem GPU-Package sowie die fehlenden Lötstellen für den GDDR5-Speicher deuten daraufhin. Im direkten Vergleich zur Radeon R9 Fury X wird dies deutlich.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (8)

#1
Registriert seit: 30.11.2012

Banned
Beiträge: 529
Angenommen das entwickelt sich ubd alle daten werden von der grafikkartr verwaltet, wird die gpu dann nicht zur cpu? Rein auf das eine programm bezogen?
#2
customavatars/avatar191989_1.gif
Registriert seit: 12.05.2013

Vizeadmiral
Beiträge: 6928
Nope das heist "nur" das der Zusätzliche NAND Speicherplatz eine langsame Erweiterung der Grafikkarten Speichers wird.
#3
Registriert seit: 30.11.2012

Banned
Beiträge: 529
Ich denke mir wenn ich wirklich 200gb erwiterung habe. Dann könnte ich ein programm direkt da installieren(falss treiberseitig möglich) aber das meiste würde ohnehin von der cpu berrechnet werden.

Finde es aber als interessanten ansatz. Zum beispiel spiele auf den speicher legen um deutlich schnelleren zugriff zu ermöglichen. Oder wenigstens die texturen usw.
#4
customavatars/avatar121331_1.gif
Registriert seit: 13.10.2009

Oberbootsmann
Beiträge: 828
Zitat ASCI3;24784297
Angenommen das entwickelt sich ubd alle daten werden von der grafikkartr verwaltet, wird die gpu dann nicht zur cpu? Rein auf das eine programm bezogen?
Naja, ich denke mal das Betriebssystem und das Programm, welches die Berechnungen über die GPU ausführt, läuft weiterhin über die CPU. Die GPU hat ja einfach mehrere Tausend "dumme" Rechenkerne, die weiterhin über eine Softwareschnittstelle mitbekommen müssen, was sie wie berechnen müssen.

Korrigiert mich wenn ich falsch liege.
#5
Registriert seit: 30.04.2008
Civitas Tautensium, Agri Decumates
Oberbootsmann
Beiträge: 886
Zitat ASCI3;24784324
Ich denke mir wenn ich wirklich 200gb erwiterung habe. Dann könnte ich ein programm direkt da installieren(falss treiberseitig möglich) aber das meiste würde ohnehin von der cpu berrechnet werden.


Nein, nicht das Programm liegt dort, das liegt im RAM der CPU. Die von diesem Programm mit Hilfe der GPU als Rechenknecht zu verarbeitenden Daten liegen dort.
Die Daten liegen also schlicht aus Sicht der GPU lokaler vor. Statt von der PCIe-SSD erst in den Hauptspeicher geladen zu werden und dann von dort in die GraKa transferiert zu werden, werden sie dann direkt von der PCIe-SSD in die GraKa geladen.
#6
customavatars/avatar11960_1.gif
Registriert seit: 18.07.2004
Vorarlberg/Österreich
Fregattenkapitän
Beiträge: 2699
Zitat smalM;24786801
Nein, nicht das Programm liegt dort, das liegt im RAM der CPU. Die von diesem Programm mit Hilfe der GPU als Rechenknecht zu verarbeitenden Daten liegen dort.
Die Daten liegen also schlicht aus Sicht der GPU lokaler vor. Statt von der PCIe-SSD erst in den Hauptspeicher geladen zu werden und dann von dort in die GraKa transferiert zu werden, werden sie dann direkt von der PCIe-SSD in die GraKa geladen.


Die Idee ist aber durchaus gut für die Zukunft. Kleine SSDs sind nicht mehr so teuer. Gerade für VR, wo man die Latenz so niedrig wie möglich halten will, wäre das schon interessant. Da es sich hier ja nur um einen Versuch handelt und es eine Profikarte ist, wird man da aber wohl noch länger (wenn überhaupt) nichts davon sehen.
#7
customavatars/avatar44491_1.gif
Registriert seit: 08.08.2006
SN
Moderator
Beiträge: 33227
Zitat smalM;24786801
Nein, nicht das Programm liegt dort, das liegt im RAM der CPU. Die von diesem Programm mit Hilfe der GPU als Rechenknecht zu verarbeitenden Daten liegen dort.
Die Daten liegen also schlicht aus Sicht der GPU lokaler vor. Statt von der PCIe-SSD erst in den Hauptspeicher geladen zu werden und dann von dort in die GraKa transferiert zu werden, werden sie dann direkt von der PCIe-SSD in die GraKa geladen.


Der Ansatz ansich ist interessant, setzt nach aktuellen Infos aber dedizierte Anwendungskompatibilität vorraus... Denn das Problem ist schlicht, wie kommen die Daten auf den SSD Pool?
Rein vom logischen her durchlaufen ALLE Daten den Hauptspeicher des Systems. Es ist also reichlich Kontraproduktiv das Ganze quasi lagacy ohne Softwareanpassungen einzusetzen... Denn die Daten kommen so vom Storage, gehen über den RAM in den SSD Pool auf der Grafikkarte und bei Zugriff über den PCIe Port in den RAM über den PCIe Port zur GPU. (das wäre der herkömmliche Weg)

Damit das nicht so läuft, muss die Software explizit wissen, dass da an der/hinter der GPU noch ein Storage klemmt und dort Daten abkippen, auf welche die GPU zur Laufzeit Zugriff hat.
Die Schwierigkeit dürfte wohl eher klar der Speed sein. Wir sprechen hier über ~4-5GB/sec lesend bei zwei M.2 SSDs... Das ist nichtmal die Hälfte dessen, was man heute in der Lage ist über einen PCIe 3.0 x16 Anschluss zu transferieren. Heist also wenn der GPU in Games der Speicher ausgeht, wäre es immernoch schneller mit deutlich größer 4-5GB/sec Texturdaten über den PCIe Slot aus dem RAM zu ziehen als diese mit 4-5GB/sec aus dem SSD Pool zu erhalten.
Man schreibt zwar in den Artikeln zu dem Thema, es wäre schneller direkt auf den SSD Pool zuzugreifen, das sollte primär aber eine Umsetzungssache sein. Denn die Daten müssen ja stand heute erstmal in den RAM kommen, was nicht der Fall ist, wenn man das nicht dort rein kippt.
Leider fehlen so ziemlich alle Infos zu dem genauen Konstrukt seitens AMD, was dort im Video getätigt wurde... Logisch sollte sein, dass der Speed exorbitant schneller ist, wenn man entsprechend große Datenmengen entsprechend schnell der GPU bereit stellen kann... Nur wie sah das Vergleichsystem aus? Laut CB soll das ein nicht näher genanntes System für 10k gewesen sein. 10k? Wirkt für mich nicht wie das technisch maximal mögliche... Für 10k bekomme ich im Zweifel nichtmal 4-5GB/sec Datendurchsatz mit entsprechender Speichergröße eingekauft ;)

Wo ist also der Sinn dahinter?
Hier gehts primär wohl um ganz andere Datenmengen und ganz andere Anwendungsgebiete... Im Profiumfeld ist VRAM Größe sehr wichtig... Zum Teil aber der Speed gar nicht sooo extrem entscheidend.


Ein anderer Vorteil dürfte maximal der sein, dass GPUs üblicherweise aktuell mit 8x oder 16x PCIe 3.0 angebunden sind. Schnellere Speicherzellen, als heute auf idR. mit 4x angebundenen M.2 SSDs könnten also deutlich schneller agieren und das ohne spezielle Schnittstellen oder sonstwedem Zeug. Denn nen 16x PCIe 3.0 Slot haben fast alle PCs der heutigen Zeit. :wink:
#8
customavatars/avatar89889_1.gif
Registriert seit: 19.04.2008
PorscheTown
Vizeadmiral
Beiträge: 6311
Zitat ASCI3;24784297
Angenommen das entwickelt sich ubd alle daten werden von der grafikkartr verwaltet, wird die gpu dann nicht zur cpu? Rein auf das eine programm bezogen?

Du kannst den Speicher auch als Laufwerk einbinden, sofern es der Benutzer wünscht.
Dann hast eine M.2 mit PCI Express 16x anbindung wenn die GPU gerade nichts aus dem Speicher will, weil die Anwendung es verlangt.
Ich stell mir das wie ein Netzlaufwerk vor, deine Daten bekommen Priorität wenn du es als Speicher Medium nutzt/festgelegt hast.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Von ASUS bis ZOTAC: Vier Modelle der GeForce GTX 1050 Ti im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/NVIDIA-GTX1050TI-ROUNDUP/NVIDIA_GTX1050TI_4ER_ROUND_UP-TEASER

Seit Ende Oktober gibt es die aktuelle Pascal-Generation von NVIDIA auch für unter 200 Euro. Tatsächlich bekommt man hier nicht nur viel Leistung fürs Geld, sondern obendrein einen sehr effizienten 3D-Beschleuniger, wie unser Launch-Test zur NVIDIA GeForce GTX 1050 Ti pünktlich zum Marktstart... [mehr]

AMD Radeon RX Vega 56 und Vega 64 im Undervolting-Test

Logo von IMAGES/STORIES/2017/AMD_RADEON_RX_VEGA_64_56_TEST

Unser Test der Radeon RX Vega 64 und Vega 56 hat gezeigt: AMD liefert eine Leistung auf dem Niveau der GeForce GTX 1080 und GeForce GTX 1070, erkauft wird dies aber mit einer deutlich zu hohen Leistungsaufnahme. Derzeit hat AMD bei den Vega-Karten noch viele Baustellen, die vor allem den Treiber... [mehr]

AMD Radeon RX Vega 64 und RX Vega 56 im Test

Logo von IMAGES/STORIES/2017/AMD_RADEON_RX_VEGA_64_56_TEST

Nun endlich ist es soweit: Was vor gut einem Jahr mit einer ersten Ankündigung begann und ab Ende 2016 konkret wurde, findet nun sein finales Ende in den ersten Tests der Radeon RX Vega 64 und RX Vega 56. AMD ist als einziger Konkurrent zu NVIDIA geradezu zum Erfolg verdonnert. Die Ansprüche an... [mehr]

Neun Modelle der GeForce GTX 1080 Ti im Test

Logo von IMAGES/STORIES/LOGOS-2017/GTX1080TI-LOGO

Wenn es nach AMD geht, wird NVIDIA mit der Radeon RX Vega bald Konkurrenz im High-End-Segment bekommen. Derzeit ist die Informationslage aber noch etwas undurchsichtig und so bleibt die GeForce GTX 1080 Ti erst einmal die schnellste Grafikkarte am Markt. Einige Modelle haben wir uns schon... [mehr]

ASUS ROG GeForce GTX 1080 Ti Strix OC im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2017/ASUS-ROG-GTX1080TI-STRIX-OC/ASUS_ROG_GEFORCE_GTX_1080_TI_STRIX_OC

Die Inno3D GeForce GTX 1080 Ti X3 Edition war eines der ersten Custom-Designs, welches wir in der Redaktion begrüßen und bereits ausführlich auf den Prüfstand stellen konnten. Während sie noch auf der Platine der Founders Edition basiert und lediglich ein eigenes Kühlsystem aufgeschnallt... [mehr]

Ab Werk die schnellste: ZOTAC GeForce GTX 1080 Ti AMP! Extreme Edition im Test

Logo von IMAGES/STORIES/LOGOS-2017/ZOTAC-GTX1080TI-EXTREME-LOGO

Einige Modelle der GeForce GTX 1080 Ti konnten wir uns ja bereits anschauen und damit lässt sich auch ein erster Eindruck zusammenfassen: Die GeForce GTX 1080 Ti ist in der Founders Edition eine gute Karte, die Custom-Modelle beschleunigen sie noch etwas und bieten zudem eine bessere und leisere... [mehr]