> > > > Für zukünftige GPUs: High Bandwith Memory von SK Hynix im Detail erläutert

Für zukünftige GPUs: High Bandwith Memory von SK Hynix im Detail erläutert

Veröffentlicht am: von

skhynixDie Anbindung von Speicher spielt für aktuelle CPUs und GPUs eine immer wichtigere Rolle. Nicht ohne Grund wachsen die Caches immer weiter an und die Hersteller wie AMD und NVIDIA lassen sich im GPU-Bereich immer mehr einfallen, um die zur Verfügung stehende Speicherbandbreite besser nutzen zu können. Dazu gehören zunächst einmal Software-Mechanismen, die mittels Speicherkomprimierung die übertragenen Datenmengen reduzieren. NVIDIA präsentierte auf der GTC den "Maxwell"-Nachfolger "Pascal", der unter anderem 3D-Memory oder auch Stacked Memory einsetzen soll.

SK Hynix zu HBM
SK Hynix zu HBM.

Auch AMD werden Arbeiten an einer besseren und vor allem schnelleren Anbindung des Grafikspeichers nachgesagt. Dabei arbeitet man mit SK Hynix zusammen. Nun ist eine Präsentation aufgetaucht, welche die Pläne für den sogenannten High Bandwith Memory (HBM) darlegt. Beim HBM wird der DRAM-Speicher nicht mehr neben der/dem GPU/CPU/SoC auf dem PCB untergebracht, sondern direkt auf der/dem GPU/CPU/SoC. Dazu werden zusätzliche Silizium-Layer auf dem jeweiligen Chip angebracht, sogenannte Through Silicon Vias (TSVs) verbinden beide Komponenten. Ähnliche Techniken werden heute bereits bei den modernen SoCs eingesetzt. So besitzt die PlayStation Vita einen 128 MB großen RAM im selben Package wie der SoC. Hier spricht man aber noch nicht von Staket Memory, 3D Memory oder TSV, da ein separater Chip im Package untergebracht ist.

SK Hynix zu HBM
SK Hynix zu HBM.

Externe Bond Wires wären theoretisch auch in der Lage, unterschiedliche Lagen miteinander bzw. mit einem Package zu verbinden, allerdings sind diese je nach Fertigungsgröße nur noch schwer bis gar nicht realisierbar und zudem auch noch anfällig gegen elektromagnetische Störungen untereinander. TSVs sparen Platz und sind deutlich weniger anfällig.

SK Hynix zu HBM
SK Hynix zu HBM.

Die Möglichkeit höhere Frequenzen beim Speicherinterface zu verwenden und dieses auch noch deutlich breiter gestalten zu können, hat natürlich einen positiven Einfluss auf die Speicherbandbreite insgesamt. SK Hynix vergleicht einen DDR3-Speicher gegen per TSV angebundenen HBM. Bei vergleichbarem Speichertakt erhöht sich die Bandbreite von 12,8 auf 256 GB pro Sekunde - natürlich ist dies abhängig von der jeweiligen DDR-Konfiguration mit Dual- oder Quad-Channel-Betrieb. Allerdings werden mit 256 GB pro Sekunde offenbar bereits in der ersten Generation Speicherbandbreiten erreicht, die wir aktuell von modernen GPUs mit 256 Bit breitem Speicherinterface und schnellem GDDR5-Speicher kennen.

SK Hynix zu HBM
SK Hynix zu HBM.

Erstmals im Detail zu sehen ist auch der Aufbau eines HBM. Dieser besteht aus fünf Layern, die auf dem Chip sitzen. Der unterste Layer (Base Logic Die) dient dabei der Anbindung an den Chip und führt die TSVs sowie die Versorgung des Speichers. In einer ersten Ausbaustufe befinden sich darüber vier sogenannte Core-Die-Layer. Jeder dieser vier Core-Die-Layer teilt sich wiederum in zwei Blöcke zu noch einmal vier Speicher-Blöcken auf. Die beiden Speicherblöcke einer jeden Core-Die-Layer sind über ein 128-I/O-Verbindungen angebunden. Aus 4 x 2 x 128 ergeben sich 1.024 I/O-Kontakte bzw. TSVs des Speichers, was letztendlich einem 128 Bit breiten Speicherinterface entspricht.

SK Hynix zu HBM
SK Hynix zu HBM.

In einer ersten Ausbaustufe will SK Hynix 2 GBit pro Core-Die-Layer verbauen. Dies entspricht einem Gesamt-Speicherausbau von 1 GB für ein Chip-on-Wafer, die jeweils mit einem 128 Bit breiten Speicherinterface angebunden sind. Theoretisch denkbare wäre der Einsatz mehrerer dieser Chips auf einer GPU. Eine mögliche Konfiguration wären vier Chips, was einem Speicherausbau von 4 GB entspräche, die über ein insgesamt 512 GB pro Sekunde breites Speicherinterface angebunden wären. Hier werden auch gleich die Vorteile von HBM deutlich, denn 512 Bit erreicht aktuell nur die "Hawaii"-GPU von AMD und deren Architektur kann als extrem komplex bezeichnet werden, was unter anderem dem komplizierten Speicherinterface anzurechnen ist. Ein weiterer Vorteil ist die geringe Leitungsaufnahme. Aktuell wird schneller GDDR5-Speicher mit 1,5 Volt betrieben. HBM gibt sich mit 1,2 Volt genügsamer, zudem fließen hier wesentlich geringere Ströme.

SK Hynix zu HBM
SK Hynix zu HBM.

Für die zweite Ausbaustufe sieht SK Hynix 8 GBit pro Core-Die-Layer vor. Diese können in vier oder gar acht Lagen gestapelt werden, so dass der Speicherausbau pro Chip-on-Wafer bei 4 bzw. 8 GB liegt. Die Speicherbandbreite verdoppelt sich auf 256 GB pro Sekunde. Auch hier sind dann natürlich mehrere dieser HBM-Module auf einem Chip denkbar, was die Kapazität und Anbindung weiter erhöht.

Im Vergleich zu DDR- und GDDR-Speicher werden noch einmal die Vorteile herausgestellt. Die zur Verfügung stehende Bandbreite wird deutlich gesteigert und damit eines der wichtigsten Probleme aktueller Architekturen deutlich reduziert. Keinerlei Vorteile besitzt HBM im Hinblick auf die Latenzen. Dafür aber wird die Leistungsaufnahme deutlich geringer sein.

SK Hynix zu HBM
SK Hynix zu HBM.

Noch etwas schwer tut sich SK Hynix bei der Roadmap für zukünftige Ausbaustufen. Allerdings sollen noch in diesem Jahr erste Produkte mit HBM der ersten Generation auf den Markt kommen. Bereits für das kommende Jahr sieht SK Hynix erste Produkte mit Speicher in acht Layern vor. Hier bietet sich nun dank der Zusammenarbeit mit AMD unweigerlich der Einsatz auf den kommenden GPUs an. Gerüchte dazu gibt es bereits vielfach und daher haben wir nun auch einmal versucht die Technik und Vorteile besser herauszustreichen, denn unweigerlich werden wir uns damit zukünftig beschäftigen müssen. Auch NVIDIA verfolgt, wie bereits in der Einleitung angesprochen, ähnliche Pläne.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (11)

#2
customavatars/avatar206123_1.gif
Registriert seit: 14.05.2014
Hamburg
Kapitänleutnant
Beiträge: 1907
Kommt drauf an, Speicher wird ja oftmals gar nicht mehr so heiß, dass er überhaupt gekühlt werden muss.

Fürs Übertakten wird es dann vielleicht hinderlich.....?!
#3
customavatars/avatar95761_1.gif
Registriert seit: 27.07.2008

Fregattenkapitän
Beiträge: 2938
Wir reden hier über Speicher. Der wird nicht so warm.
#4
customavatars/avatar109791_1.gif
Registriert seit: 05.03.2009
Viersen
Kapitänleutnant
Beiträge: 1650
außerdem fließen ja wesentlich geringere Ströme (wie auch im Text zu lesen) deswegen wohl eher nicht.
#5
customavatars/avatar87890_1.gif
Registriert seit: 24.03.2008
Heidelberg
Moderator
A glorious mess!
Beiträge: 4845
Wenn der Speicher über die DIE gestapelt wird, 4 layer! und somit diese ja verdeckt+wärmt, muss das doch auf jeden Fall extrem hinderlich sein was die Kühlung der DIE angeht.
Und wenn ich bedenke das mein RAM auch mit 1,2V arbeitet und trotzdem zimlich "warm" werden kann... na ich weiß nicht.

Lassen wir uns überraschen ;)
#6
customavatars/avatar17354_1.gif
Registriert seit: 05.01.2005
Nähe Köln/Bonn
Admiral
Beiträge: 8766
Zitat Brainorg;22706404
Wenn der Speicher über die DIE gestapelt wird, 4 layer! und somit diese ja verdeckt+wärmt, muss das doch auf jeden Fall extrem hinderlich sein was die Kühlung der DIE angeht.
Und wenn ich bedenke das mein RAM auch mit 1,2V arbeitet und trotzdem zimlich "warm" werden kann... na ich weiß nicht.

Lassen wir uns überraschen ;)


Da arbeiten gut bezahlte Ingenieure und werden mit sicherheit nicht das Thermik Problem vergessen. Ich glaube kaum, das wird enduser uns darüber einen Kopf machen müssen ;) Und was ist ziemlich warm? 60-70°C sind für ram nicht wirklich ein problem und diese "ramkühlung" ist eh überbewertet, es haben mittlerweile zig tests gezeigt, das ram, ohne kühlkörper meist weniger warm wird, als mit kühlkörper. Ein Luftzug auf der nakten ramoberfläche ist meisten viel effektiever als passive kühlkörper.
#7
customavatars/avatar87890_1.gif
Registriert seit: 24.03.2008
Heidelberg
Moderator
A glorious mess!
Beiträge: 4845
Ja klar ;)
Mir geht es bei meiner Überlegung auch weniger um den RAM als um die Kühlung der drunter liegenden DIE.
Die "Sorge" ist halt das dann das OC Potential darunter leiden könnte.
Aber recht hast du, soll nicht meine Sorge sein :D
#8
customavatars/avatar3377_1.gif
Registriert seit: 15.11.2002
www.twitter.com/aschilling
[printed]-Redakteur
Tweety
Beiträge: 29954
Das ist sicherlich ein Punkte, der noch eine Rolle spielt. Allerdings sehen aktuelle Umsetzungen Pläne noch vor, dass der Speicher NICHT direkt auf dem Chip sitzt, sondern direkt daneben. Das sieht man auf den ersten Developer-Bords von Pascal auch: GTC 2014: NVIDIA präsentiert NVLINK, 3D Memory und neue 'Pascal'-GPU
#9
Registriert seit: 11.05.2009
Ludwigsburg
Oberleutnant zur See
Beiträge: 1457
Hört sich doch klasse an, hoffe die neue High End Klasse von AMD wird mit diesem Speicher bestückt.
#10
customavatars/avatar202425_1.gif
Registriert seit: 26.01.2014

Oberleutnant zur See
Beiträge: 1327
*Likebutton*
#11
customavatars/avatar193800_1.gif
Registriert seit: 22.06.2013
Berlin
Stabsgefreiter
Beiträge: 389
Ich halte das für Augenwischerei mit den Abständen. Nicht die Stromgeschwindigkeit ist für Verzögerungen verantwortlich sondern die Taktrate.

Bringt also garnichts, selbst wenn man 20 GByte 10-fach "gestapelt" in 2 nm Strukturbreite packt, wenn es immernoch nur auf 200 MHz getaktet ist.
Lohnt sich aber natürlich enorm für den Hersteller, mehr Gbyte zu verkaufen, im Besonderen wenn er dafür tatsächlich nur mehr Silizium (Sand) und ein paar neue technische Tricks investieren muss.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Von ASUS bis ZOTAC: Vier Modelle der GeForce GTX 1050 Ti im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/NVIDIA-GTX1050TI-ROUNDUP/NVIDIA_GTX1050TI_4ER_ROUND_UP-TEASER

Seit Ende Oktober gibt es die aktuelle Pascal-Generation von NVIDIA auch für unter 200 Euro. Tatsächlich bekommt man hier nicht nur viel Leistung fürs Geld, sondern obendrein einen sehr effizienten 3D-Beschleuniger, wie unser Launch-Test zur NVIDIA GeForce GTX 1050 Ti pünktlich zum Marktstart... [mehr]

AMD Radeon RX Vega 56 und Vega 64 im Undervolting-Test

Logo von IMAGES/STORIES/2017/AMD_RADEON_RX_VEGA_64_56_TEST

Unser Test der Radeon RX Vega 64 und Vega 56 hat gezeigt: AMD liefert eine Leistung auf dem Niveau der GeForce GTX 1080 und GeForce GTX 1070, erkauft wird dies aber mit einer deutlich zu hohen Leistungsaufnahme. Derzeit hat AMD bei den Vega-Karten noch viele Baustellen, die vor allem den Treiber... [mehr]

AMD Radeon RX Vega 64 und RX Vega 56 im Test

Logo von IMAGES/STORIES/2017/AMD_RADEON_RX_VEGA_64_56_TEST

Nun endlich ist es soweit: Was vor gut einem Jahr mit einer ersten Ankündigung begann und ab Ende 2016 konkret wurde, findet nun sein finales Ende in den ersten Tests der Radeon RX Vega 64 und RX Vega 56. AMD ist als einziger Konkurrent zu NVIDIA geradezu zum Erfolg verdonnert. Die Ansprüche an... [mehr]

Neun Modelle der GeForce GTX 1080 Ti im Test

Logo von IMAGES/STORIES/LOGOS-2017/GTX1080TI-LOGO

Wenn es nach AMD geht, wird NVIDIA mit der Radeon RX Vega bald Konkurrenz im High-End-Segment bekommen. Derzeit ist die Informationslage aber noch etwas undurchsichtig und so bleibt die GeForce GTX 1080 Ti erst einmal die schnellste Grafikkarte am Markt. Einige Modelle haben wir uns schon... [mehr]

ASUS ROG GeForce GTX 1080 Ti Strix OC im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2017/ASUS-ROG-GTX1080TI-STRIX-OC/ASUS_ROG_GEFORCE_GTX_1080_TI_STRIX_OC

Die Inno3D GeForce GTX 1080 Ti X3 Edition war eines der ersten Custom-Designs, welches wir in der Redaktion begrüßen und bereits ausführlich auf den Prüfstand stellen konnten. Während sie noch auf der Platine der Founders Edition basiert und lediglich ein eigenes Kühlsystem aufgeschnallt... [mehr]

Ab Werk die schnellste: ZOTAC GeForce GTX 1080 Ti AMP! Extreme Edition im Test

Logo von IMAGES/STORIES/LOGOS-2017/ZOTAC-GTX1080TI-EXTREME-LOGO

Einige Modelle der GeForce GTX 1080 Ti konnten wir uns ja bereits anschauen und damit lässt sich auch ein erster Eindruck zusammenfassen: Die GeForce GTX 1080 Ti ist in der Founders Edition eine gute Karte, die Custom-Modelle beschleunigen sie noch etwas und bieten zudem eine bessere und leisere... [mehr]