> > > > Für zukünftige GPUs: High Bandwith Memory von SK Hynix im Detail erläutert

Für zukünftige GPUs: High Bandwith Memory von SK Hynix im Detail erläutert

DruckenE-Mail
Erstellt am: von

skhynixDie Anbindung von Speicher spielt für aktuelle CPUs und GPUs eine immer wichtigere Rolle. Nicht ohne Grund wachsen die Caches immer weiter an und die Hersteller wie AMD und NVIDIA lassen sich im GPU-Bereich immer mehr einfallen, um die zur Verfügung stehende Speicherbandbreite besser nutzen zu können. Dazu gehören zunächst einmal Software-Mechanismen, die mittels Speicherkomprimierung die übertragenen Datenmengen reduzieren. NVIDIA präsentierte auf der GTC den "Maxwell"-Nachfolger "Pascal", der unter anderem 3D-Memory oder auch Stacked Memory einsetzen soll.

SK Hynix zu HBM
SK Hynix zu HBM.

Auch AMD werden Arbeiten an einer besseren und vor allem schnelleren Anbindung des Grafikspeichers nachgesagt. Dabei arbeitet man mit SK Hynix zusammen. Nun ist eine Präsentation aufgetaucht, welche die Pläne für den sogenannten High Bandwith Memory (HBM) darlegt. Beim HBM wird der DRAM-Speicher nicht mehr neben der/dem GPU/CPU/SoC auf dem PCB untergebracht, sondern direkt auf der/dem GPU/CPU/SoC. Dazu werden zusätzliche Silizium-Layer auf dem jeweiligen Chip angebracht, sogenannte Through Silicon Vias (TSVs) verbinden beide Komponenten. Ähnliche Techniken werden heute bereits bei den modernen SoCs eingesetzt. So besitzt die PlayStation Vita einen 128 MB großen RAM im selben Package wie der SoC. Hier spricht man aber noch nicht von Staket Memory, 3D Memory oder TSV, da ein separater Chip im Package untergebracht ist.

SK Hynix zu HBM
SK Hynix zu HBM.

Externe Bond Wires wären theoretisch auch in der Lage, unterschiedliche Lagen miteinander bzw. mit einem Package zu verbinden, allerdings sind diese je nach Fertigungsgröße nur noch schwer bis gar nicht realisierbar und zudem auch noch anfällig gegen elektromagnetische Störungen untereinander. TSVs sparen Platz und sind deutlich weniger anfällig.

SK Hynix zu HBM
SK Hynix zu HBM.

Die Möglichkeit höhere Frequenzen beim Speicherinterface zu verwenden und dieses auch noch deutlich breiter gestalten zu können, hat natürlich einen positiven Einfluss auf die Speicherbandbreite insgesamt. SK Hynix vergleicht einen DDR3-Speicher gegen per TSV angebundenen HBM. Bei vergleichbarem Speichertakt erhöht sich die Bandbreite von 12,8 auf 256 GB pro Sekunde - natürlich ist dies abhängig von der jeweiligen DDR-Konfiguration mit Dual- oder Quad-Channel-Betrieb. Allerdings werden mit 256 GB pro Sekunde offenbar bereits in der ersten Generation Speicherbandbreiten erreicht, die wir aktuell von modernen GPUs mit 256 Bit breitem Speicherinterface und schnellem GDDR5-Speicher kennen.

SK Hynix zu HBM
SK Hynix zu HBM.

Erstmals im Detail zu sehen ist auch der Aufbau eines HBM. Dieser besteht aus fünf Layern, die auf dem Chip sitzen. Der unterste Layer (Base Logic Die) dient dabei der Anbindung an den Chip und führt die TSVs sowie die Versorgung des Speichers. In einer ersten Ausbaustufe befinden sich darüber vier sogenannte Core-Die-Layer. Jeder dieser vier Core-Die-Layer teilt sich wiederum in zwei Blöcke zu noch einmal vier Speicher-Blöcken auf. Die beiden Speicherblöcke einer jeden Core-Die-Layer sind über ein 128-I/O-Verbindungen angebunden. Aus 4 x 2 x 128 ergeben sich 1.024 I/O-Kontakte bzw. TSVs des Speichers, was letztendlich einem 128 Bit breiten Speicherinterface entspricht.

SK Hynix zu HBM
SK Hynix zu HBM.

In einer ersten Ausbaustufe will SK Hynix 2 GBit pro Core-Die-Layer verbauen. Dies entspricht einem Gesamt-Speicherausbau von 1 GB für ein Chip-on-Wafer, die jeweils mit einem 128 Bit breiten Speicherinterface angebunden sind. Theoretisch denkbare wäre der Einsatz mehrerer dieser Chips auf einer GPU. Eine mögliche Konfiguration wären vier Chips, was einem Speicherausbau von 4 GB entspräche, die über ein insgesamt 512 GB pro Sekunde breites Speicherinterface angebunden wären. Hier werden auch gleich die Vorteile von HBM deutlich, denn 512 Bit erreicht aktuell nur die "Hawaii"-GPU von AMD und deren Architektur kann als extrem komplex bezeichnet werden, was unter anderem dem komplizierten Speicherinterface anzurechnen ist. Ein weiterer Vorteil ist die geringe Leitungsaufnahme. Aktuell wird schneller GDDR5-Speicher mit 1,5 Volt betrieben. HBM gibt sich mit 1,2 Volt genügsamer, zudem fließen hier wesentlich geringere Ströme.

SK Hynix zu HBM
SK Hynix zu HBM.

Für die zweite Ausbaustufe sieht SK Hynix 8 GBit pro Core-Die-Layer vor. Diese können in vier oder gar acht Lagen gestapelt werden, so dass der Speicherausbau pro Chip-on-Wafer bei 4 bzw. 8 GB liegt. Die Speicherbandbreite verdoppelt sich auf 256 GB pro Sekunde. Auch hier sind dann natürlich mehrere dieser HBM-Module auf einem Chip denkbar, was die Kapazität und Anbindung weiter erhöht.

Im Vergleich zu DDR- und GDDR-Speicher werden noch einmal die Vorteile herausgestellt. Die zur Verfügung stehende Bandbreite wird deutlich gesteigert und damit eines der wichtigsten Probleme aktueller Architekturen deutlich reduziert. Keinerlei Vorteile besitzt HBM im Hinblick auf die Latenzen. Dafür aber wird die Leistungsaufnahme deutlich geringer sein.

SK Hynix zu HBM
SK Hynix zu HBM.

Noch etwas schwer tut sich SK Hynix bei der Roadmap für zukünftige Ausbaustufen. Allerdings sollen noch in diesem Jahr erste Produkte mit HBM der ersten Generation auf den Markt kommen. Bereits für das kommende Jahr sieht SK Hynix erste Produkte mit Speicher in acht Layern vor. Hier bietet sich nun dank der Zusammenarbeit mit AMD unweigerlich der Einsatz auf den kommenden GPUs an. Gerüchte dazu gibt es bereits vielfach und daher haben wir nun auch einmal versucht die Technik und Vorteile besser herauszustreichen, denn unweigerlich werden wir uns damit zukünftig beschäftigen müssen. Auch NVIDIA verfolgt, wie bereits in der Einleitung angesprochen, ähnliche Pläne.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (11)

#2
customavatars/avatar206123_1.gif
Registriert seit: 14.05.2014
Hamburg
Kapitänleutnant
Beiträge: 1632
Kommt drauf an, Speicher wird ja oftmals gar nicht mehr so heiß, dass er überhaupt gekühlt werden muss.

Fürs Übertakten wird es dann vielleicht hinderlich.....?!
#3
customavatars/avatar95761_1.gif
Registriert seit: 27.07.2008

Fregattenkapitän
Beiträge: 2582
Wir reden hier über Speicher. Der wird nicht so warm.
#4
customavatars/avatar109791_1.gif
Registriert seit: 05.03.2009
Viersen
Kapitänleutnant
Beiträge: 1635
außerdem fließen ja wesentlich geringere Ströme (wie auch im Text zu lesen) deswegen wohl eher nicht.
#5
customavatars/avatar87890_1.gif
Registriert seit: 24.03.2008
Heidelberg
Moderator
A glorious mess!
Beiträge: 4828
Wenn der Speicher über die DIE gestapelt wird, 4 layer! und somit diese ja verdeckt+wärmt, muss das doch auf jeden Fall extrem hinderlich sein was die Kühlung der DIE angeht.
Und wenn ich bedenke das mein RAM auch mit 1,2V arbeitet und trotzdem zimlich "warm" werden kann... na ich weiß nicht.

Lassen wir uns überraschen ;)
#6
customavatars/avatar17354_1.gif
Registriert seit: 05.01.2005
Nähe Köln/Bonn
Admiral
Beiträge: 8385
Zitat Brainorg;22706404
Wenn der Speicher über die DIE gestapelt wird, 4 layer! und somit diese ja verdeckt+wärmt, muss das doch auf jeden Fall extrem hinderlich sein was die Kühlung der DIE angeht.
Und wenn ich bedenke das mein RAM auch mit 1,2V arbeitet und trotzdem zimlich "warm" werden kann... na ich weiß nicht.

Lassen wir uns überraschen ;)


Da arbeiten gut bezahlte Ingenieure und werden mit sicherheit nicht das Thermik Problem vergessen. Ich glaube kaum, das wird enduser uns darüber einen Kopf machen müssen ;) Und was ist ziemlich warm? 60-70°C sind für ram nicht wirklich ein problem und diese "ramkühlung" ist eh überbewertet, es haben mittlerweile zig tests gezeigt, das ram, ohne kühlkörper meist weniger warm wird, als mit kühlkörper. Ein Luftzug auf der nakten ramoberfläche ist meisten viel effektiever als passive kühlkörper.
#7
customavatars/avatar87890_1.gif
Registriert seit: 24.03.2008
Heidelberg
Moderator
A glorious mess!
Beiträge: 4828
Ja klar ;)
Mir geht es bei meiner Überlegung auch weniger um den RAM als um die Kühlung der drunter liegenden DIE.
Die "Sorge" ist halt das dann das OC Potential darunter leiden könnte.
Aber recht hast du, soll nicht meine Sorge sein :D
#8
customavatars/avatar3377_1.gif
Registriert seit: 15.11.2002
www.twitter.com/aschilling
[printed]-Redakteur
Tweety
Beiträge: 29105
Das ist sicherlich ein Punkte, der noch eine Rolle spielt. Allerdings sehen aktuelle Umsetzungen Pläne noch vor, dass der Speicher NICHT direkt auf dem Chip sitzt, sondern direkt daneben. Das sieht man auf den ersten Developer-Bords von Pascal auch: GTC 2014: NVIDIA präsentiert NVLINK, 3D Memory und neue 'Pascal'-GPU
#9
Registriert seit: 11.05.2009
Ludwigsburg
Oberleutnant zur See
Beiträge: 1407
Hört sich doch klasse an, hoffe die neue High End Klasse von AMD wird mit diesem Speicher bestückt.
#10
customavatars/avatar202425_1.gif
Registriert seit: 26.01.2014

Oberleutnant zur See
Beiträge: 1311
*Likebutton*
#11
customavatars/avatar193800_1.gif
Registriert seit: 22.06.2013
Berlin
Stabsgefreiter
Beiträge: 368
Ich halte das für Augenwischerei mit den Abständen. Nicht die Stromgeschwindigkeit ist für Verzögerungen verantwortlich sondern die Taktrate.

Bringt also garnichts, selbst wenn man 20 GByte 10-fach "gestapelt" in 2 nm Strukturbreite packt, wenn es immernoch nur auf 200 MHz getaktet ist.
Lohnt sich aber natürlich enorm für den Hersteller, mehr Gbyte zu verkaufen, im Besonderen wenn er dafür tatsächlich nur mehr Silizium (Sand) und ein paar neue technische Tricks investieren muss.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Roundup: 5x GeForce GTX 1070 mit Custom-Design im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/5X-GTX1070/GTX1070_CUSTOM_ROUNDUP-TEASER

Nachdem wir bereits eine Reihe von Boardpartner-Karten der NVIDIA GeForce GTX 1080 ausführlich getestet haben, holen wir gleiches nun für das kleinere Schwestermodell nach, denn auch von der NVIDIA GeForce GTX 1070 gibt es viele Custom-Modelle mit höheren Taktraten, eigenen Kühlsystemen und... [mehr]

Drei Custom-Modelle der GeForce GTX 1060 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/3X-GTX1060/GTX1060_ROUNDUP_TEST-TEASER

Anders als bei der GeForce GTX 1080 und GeForce GTX 1070 trudelten wenige Stunden nach unserem Test zur Founders Edition der NVIDIA GeForce GTX 1060 schon die ersten Boardpartner-Karten mit teils höheren Taktraten, eigenem Kühlsystem und überarbeitetem Platinenlayout ein. Sie dürften... [mehr]

NVIDIA GeForce GTX 1080 mit Pascal-Architektur im XXL-Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Heute ist es soweit: NVIDIA läutet mit der GeForce GTX 1080 und GTX 1070 auf Basis der Pascal-Architektur den diesjährigen Neustart bei den Grafikkarten ein. In Kürze wird wohl auch AMD seinen Beitrag zu diesem Thema leisten. Vor zehn Tagen lud NVIDIA die gesammelte Fachpresse nach Austin ein... [mehr]

Roundup: 5x GeForce GTX 1080 im Custom-Design im Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Nachdem wir uns die Founders Edition der GeForce GTX 1080 und GeForce GTX 1070 bereits angeschaut haben, folgen nun fünf Retail-Modelle, die wir in aller Ausführlichkeit unter die Lupe nehmen wollen. Aus den vielen Boardpartnern und unterschiedlichen Modellen haben wir uns solche von ASUS, EVGA,... [mehr]

AMD Radeon RX 480 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/RADEON-RX480/RADEON-RX480-REFERENCE-LOGO

Es ist also soweit: AMD startet die großangelegte Zurückeroberung des Grafikkartenmarktes mit der Radeon RX 480, die als erste Grafikkarte der Polaris-Generation mit gleichnamiger Architektur erscheint und die wir uns genauer anschauen können. Dabei versucht sich AMD an einem anderen Ansatz im... [mehr]

PowerColor Radeon RX 480 Red Devil im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/POWERCOLOR-RX480/POWERCOLOR-RX480REDDEVIL-LOGO

Mit der Radeon RX 480 will AMD zurück zu alter Stärke und hat daher über Monate hinweg die PR-Trommel geschlagen. Letztendlich dabei herausgekommen ist eine sehr gute Karte für einen niedrigen Preis, die aber nicht in allen Bereichen zu überzeugen weiß. Wohl größtes Manko der Karte sollte... [mehr]