Aktuelles

Packaging als Herausforderung: Speicher und Compute rücken zusammen

Thread Starter
Mitglied seit
06.03.2017
Beiträge
65.612
samsung-hbm2.jpg
Bereits häufiger haben wir über die Weiterentwicklung in der Speichertechnik berichtet, in der ein Processing-in-Memory (PIM) stattfindet. Die Kommunikation zwischen den eigentlichen Recheneinheiten und dem Speicherort der Daten wird zunehmend zu einem Flaschenhals. Geringe Latenzen und hohe Bandbreiten sind für AI-Anwendungen besonders wichtig – entsprechend breit und schnell werden die Speicherinterfaces.
... weiterlesen
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.

Bitmaschine

Experte
Mitglied seit
01.03.2013
Beiträge
1.387
Auch hier, danke für die Folien.
Was mir sofort in der 12'ten Folie aufgefallen ist, dass im Bild AMD-Grafikchip mit HBM 3 Package der Hinweis auf eine Grafikkarte (High End Graphic) gezeigt wird. Wird das wohl die neue Generation Grafikkarten für Consumer von AMD sein? :fresse:

HBM Folie.jpg
 

Richard88

Experte
Mitglied seit
05.11.2020
Beiträge
1.515
Glaubst du? Ich finde, die Folie sagt viel aus. AMD GPU + HBM3, dann Shooter-Bild und dahinter kleine süße Karte ... kann ja auch ironisch sein 😜. Was ich aber nicht vermute.
Naja, sind halt marketingfolien, das würde ich ja nicht auf die goldwaage legen. Aber wir werden es ehen. Villeicht ne apu mit hbm? Klar. Zu teuer aber man darf ja etwas träumen.
 

Bitmaschine

Experte
Mitglied seit
01.03.2013
Beiträge
1.387
Naja, sind halt marketingfolien, das würde ich ja nicht auf die goldwaage legen. Aber wir werden es ehen. Villeicht ne apu mit hbm? Klar. Zu teuer aber man darf ja etwas träumen.
APUs mit HBM könnte ich mir gut vorstellen. Zumal die Anbindungslimitierung von 256 Bit aufgebrochen wird und mit HBM3 (1024 Bit I/O) bzgl. dezidiertem Grafikspeicher einen enormen Leistungsschub bekommen wird. Es wird sicher nicht ein Monolith mit 16 GB Speicher sein, aber 2x2 oder 2x4 GB könnte ich mir gut vorstellen und im Preis sicher nicht die Welt sein wird. GDDR6(+) ist auch nicht gerade billig.
Laut Folie wird GDDR6 um Längen bzgl. Speicherdurchsatz geschlagen. DDR4 wird gerade bei APUs genutzt. Gut, es sind Folien und geschönte Zahlen unter besten Voraussetzungen ermittelt, aber diese hohen Werte brauchen nicht geschönt zu werden.
intel-vlsi22-sk-hynix-015_1920px.jpeg
 

Richard88

Experte
Mitglied seit
05.11.2020
Beiträge
1.515
@Bitmaschine das problem ist, Hbm ist sehr temperaturenpfindlich. Ab 60c treten schon erste fehler auf. War jedenfalls bei vega so.
 

Bitmaschine

Experte
Mitglied seit
01.03.2013
Beiträge
1.387
Gut möglich, ich hatte ne vega 56, die 64er hatte samsung speicher. Wir sehen es eh bald, aber etwas da herumzuträumen macht schon spass.
Das stimmt schon. Zumal ich Computer seit dem Ping-Pong Spiel kenne und seit dem letzten Jahrzehnt die Chipentwicklung einen enormen Schub genommen hat :cool:
 

Bitmaschine

Experte
Mitglied seit
01.03.2013
Beiträge
1.387
Jup, wir hatten damals in den barracken auch so eine pong maschine, War toll, nur eben 2 stunden am tag strom :fresse:
Wir in der Familie haben den bekommen, weil mein Papa Verträge mit Zeitungen an den Mann brachte und die Empfehlungsprämie einkassiert hat, neben Uhren, die mit Klappen die Zeit angegeben haben 😆
 

Oberst

Enthusiast
Mitglied seit
03.07.2007
Beiträge
289
Glaubst du? Ich finde, die Folie sagt viel aus. AMD GPU + HBM3, dann Shooter-Bild und dahinter kleine süße Karte ... kann ja auch ironisch sein 😜. Was ich aber nicht vermute.
Die kleine süße Karte dahinter ist eine R9 Nano, also uralt. Ist wohl nur eine Werbung dafür, in der Hoffnung, dass da ein GPU Entwickler wieder einkauft.
 

Richard88

Experte
Mitglied seit
05.11.2020
Beiträge
1.515
Die kleine süße Karte dahinter ist eine R9 Nano, also uralt. Ist wohl nur eine Werbung dafür, in der Hoffnung, dass da ein GPU Entwickler wieder einkauft.
Die r9 nano war aber auch ein schnuggelchen.
Beitrag automatisch zusammengeführt:

@Bitmaschine ich höre mir gerade broken silicon an. Es werden server APU mit HBM kommen. Eine apu mit 8 kernen und 4gb oder 6gb hbm in consumer bereich ist durchaus möglich.
 
Zuletzt bearbeitet:

Bluto

Enthusiast
Mitglied seit
02.12.2005
Beiträge
649
Ort
Hannover
Ist es nicht das Prinzip, dass die Apple M Prozessoren so gut, schnell und teils auch effizient macht? Ich bin eher der Windows-Nutzer. Schaue gerade aber gerade neidisch auf die Leistung der neuen Prozessoren bei Apple.
 

pillenkoenig

Experte
Mitglied seit
11.12.2018
Beiträge
1.457
meine auch was von guter speicheranbindung bei apple gelesen zu haben. das und viel extra-hardware um moeglichst viel in harware machen zu koennen.
 

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.380
APUs mit HBM könnte ich mir gut vorstellen.
Sowas gab es schon einmal in Form von Kaby Lake-G. Nur war die Package sehr groß im Vergleich zu den Modellen ohne G und dazu kommt, dass man bei einer APU niemals die Performance einer Highend Graka hinbekommen wird, alleine schon weil deren Leistungsaufnahme nie die der GPUs auf solche Grakas erreichen kann. Obendrein ist HBM teuer und verlangt einen Halbleiterinterposer, der die Kosten weiter nach oben treibt und braucht eben auch Platz unter dem HS. Da APUs also sowieso nie mit einer CPU plus Graka der gehobenen Leistungsklasse mithalten können, macht es auch keinen Sinn sowas zu bauen und sollte von APU (bzw. iGPUs) nicht mehr als Windows und Multimedia und vielleicht sehr anspruchsloses Gaming erwarten und für alles andere eine Graka nehmen.
 

Bitmaschine

Experte
Mitglied seit
01.03.2013
Beiträge
1.387
Sowas gab es schon einmal in Form von Kaby Lake-G. Nur war die Package sehr groß im Vergleich zu den Modellen ohne G und dazu kommt, dass man bei einer APU niemals die Performance einer Highend Graka hinbekommen wird, alleine schon weil deren Leistungsaufnahme nie die der GPUs auf solche Grakas erreichen kann. Obendrein ist HBM teuer und verlangt einen Halbleiterinterposer, der die Kosten weiter nach oben treibt und braucht eben auch Platz unter dem HS. Da APUs also sowieso nie mit einer CPU plus Graka der gehobenen Leistungsklasse mithalten können, macht es auch keinen Sinn sowas zu bauen und sollte von APU (bzw. iGPUs) nicht mehr als Windows und Multimedia und vielleicht sehr anspruchsloses Gaming erwarten und für alles andere eine Graka nehmen.
Deine Argumentation kann ich gut nachvollziehen. Für mich sind APUs mit integrierter Grafikeineinheit kein Ersatz für High End Gamer in höchster Auflösung und eher für Multimedia oder kleine Systeme für den Alltag (z.B. NUC-Systeme). Ich bezog mich auf die Speicheranbindung, bzw. der Unterschied zwischen DDR4/5 und HBM. Aktuell ist es ja doch so, dass bei APUs von den DDR4/5 RAM-Riegel im System ein Bereich als dezidierter Speicherplatz beansprucht wird. Was wiederum aufgrund der Anbindung ein Flaschenhals ist. Deswegen kann ich mir schon gut vorstellen, dass die Integration von HBM als dezidierter Speicher durchaus eine Berechtigung hat. Zumal die Grafikeinheit so designt werden kann, dass die Grafikeinheit einen direkten Zugang zum Speicher hat und nicht den Weg CPU-RAM Riegel-CPU mit limitiertem BUS durchlaufen muss. Und da denke ich, dass die Grafikeinheit, bei gleichem Takt insgesamt performanter laufen wird. Dass HBM zusätzlich Platz unter dem HS braucht, ist kein Thema. Aber der HBM Speicher muss ja auch nicht absolut quadratisch sein, vielleicht kann es in einer in die Länge gezogene Rechteckform designt werden. 3D-Stacking wäre auch eine Lösung. Aber das sind jetzt Spekulationen und Hypothesen. Aber der Trend geht klar in Richtung Chiplets mit unterschiedlichen, speziellen Aufgaben und in Richtung y-Achse.
 

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.380
Für mich sind APUs mit integrierter Grafikeineinheit kein Ersatz für High End Gamer in höchster Auflösung und eher für Multimedia oder kleine Systeme für den Alltag (z.B. NUC-Systeme).
Aber für Multimedia reichen die iGPUs (APUs) doch locker aus. Da sehe ich sie auch und eben weil sie niemals gegen eine fette GPU auf einer Graka anstinken können, schon alleine wegen dem Platz und der Leistungsaufnahme, beides müssen die iGPUs ja auch noch mit der CPU teilen), können sie allenfalls die billigen Low-End Graka wie eine GT1030 überflügeln, wo ist der Unterschied ob sie auch eine 1050 übertreffen, wenn sie dann aber wegen des HBM die Kosten gewaltig in die Höhe treiben? Dies würde für Multimedia keinen Unterschied machen, sondern nur für ein paar anspruchslose Gamer die dann ein paar fps oder Details oder Pixel in der Auflösung mehr einstellen könnten, bevor das Game unspielbar lahm wird. Die 1030 und 1050 sind nur Beispiele, bevor hier jemand mit einer APU kommt die auch ohne HBM eine 1050 schlägt.

Bei einem NUC oder eben Notebook, Intel baut die NUCs ja mit Notebooktechnologie und Notebook (also U und H Serie) CPUs, wo man dann sowieso nicht den Platz oder die Leistungsaufnahme für eine extra Graka hat, würde es vielleicht noch Sinn machen und dafür war ja der Kaby Lake-G gedacht. Aber da es bisher noch keinen Nachfolger gibt und scheinbar alle bis auf einen eingestellt worden sind, dürfte der Markt dafür einfach zu klein sein um so ein Nischenprodukt rentabel anbieten zu können und ich meine es gab damals Gerüchte Intel hätte die vor allem für Apple produziert.

Ich bezog mich auf die Speicheranbindung, bzw. der Unterschied zwischen DDR4/5 und HBM. Aktuell ist es ja doch so, dass bei APUs von den DDR4/5 RAM-Riegel im System ein Bereich als dezidierter Speicherplatz beansprucht wird. Was wiederum aufgrund der Anbindung ein Flaschenhals ist.
Das war mir schon klar, nur wie gesagt würde dies nichts daran ändern, dass die iGPUs auch so für Multimedia schon locker ausreichen und für ernsthaftes Gaming immer hoffnungslos unterlegen wären. Wie man in der News leben kann und bei Intels Sapphire Rapids mit HBM sieht, ist mehr Speicherbandbreite für die CPUs, gerade bei Anwendungen wie AI, ebenso wichtig und da kommen fette Server CPUs zum Einsatz die gar keine iGPU haben, womit die Kosten da auch nicht so relevant sind.

Nachdem Intel dies also einmal gemacht hat und dann nie wieder, dürfte wir kaum nochmal HBM auf APU/CPUs mit iGPU sehen, aber wer weiß, vielleicht bringen ja die Technologien um die es hier in der News geht, sowas oder was ähnliches für den Notebookbereich zurück. Wobei Intel ja etwas ähnliches schon bei Broadwell (und ich meine einigen mobilen Skylake CPUs?) mit dem eDRAM auch schon mal gemacht hat und auch da brachte es schon einiges für die Performance der iGPU.
 

DTX xxx

Enthusiast
Mitglied seit
03.05.2013
Beiträge
2.244
Dass HBM zusätzlich Platz unter dem HS braucht, ist kein Thema.
Bei diesem Satz hatte ich dann gleich ein Bild vor Augen. Also ein Heatspreader in ITX Format und darauf ein Ventilator. Werden so zukünftige komplett PCs aussehen?
Bitte nicht ganz so ernst nehmen.
 

Bitmaschine

Experte
Mitglied seit
01.03.2013
Beiträge
1.387
Nachdem Intel dies also einmal gemacht hat und dann nie wieder, dürfte wir kaum nochmal HBM auf APU/CPUs mit iGPU sehen, aber wer weiß, vielleicht bringen ja die Technologien um die es hier in der News geht, sowas oder was ähnliches für den Notebookbereich zurück. Wobei Intel ja etwas ähnliches schon bei Broadwell (und ich meine einigen mobilen Skylake CPUs?) mit dem eDRAM auch schon mal gemacht hat und auch da brachte es schon einiges für die Performance der iGPU.
Ich denke, wir werden sehen. Nicht ohne Grund wurde die Folie mit dem Hinweis auf AMD GPU, Shooter-Bild und dezidierter Grafikkarte gezeigt. Das wurde sicher mit AMD abgestimmt. Leider kenne ich nur die Folien, die Aussagen, die Hinweise von HWLuxx und nicht die verbale Präsentation zu den einzelnen Folien. Das wäre interessanter, weil aus erster Hand. Faktisch bewege ich mich in Spekulationen und unendlichen, sinnlosen Diskussionen.
@Don/HWLuxx:
Gibt es Videos zu den Präsentationen der aktuellen Chipentwicklungen? Wenn ja, könnte man die Links ins Forum stellen? Das wären Infos aus erster Hand und deutlich aussagekräftiger.
 

Don

[printed]-Redakteur, Tweety
Mitglied seit
15.11.2002
Beiträge
34.276
Nein, dazu gibt es kein öffentlich zugängliches Video. Ich habe die Diskussion hier auch etwas verfolgt und würde aus dem Bild jetzt keine weiteren Schlüsse ziehen wollen - sonst hätte ich das sicherlich auch schon getan ;)
 

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.380
Nicht ohne Grund wurde die Folie mit dem Hinweis auf AMD GPU
Welches Bild meinst Du? Das auf Seite 24? Vergiss nicht, dass auch AMD schon HBM bei Grakas eingesetzt hat und und dies wird eben auch bei den fetten GPUs für Serveranwendung gemacht. Mit APUs hat das aber nichts zu tun, so wie das ganze Thema praktisch nichts mit APU oder gar Gaming zu tun hat, sondern mit AI.
 

Bitmaschine

Experte
Mitglied seit
01.03.2013
Beiträge
1.387
Nein, dazu gibt es kein öffentlich zugängliches Video. Ich habe die Diskussion hier auch etwas verfolgt und würde aus dem Bild jetzt keine weiteren Schlüsse ziehen wollen - sonst hätte ich das sicherlich auch schon getan ;)
Schade, aber danke für die Info. Mal sehen, was kommt. Auf jeden Fall tut sich einiges und verspricht Interessantes in der Zukunft (y)
 

passat3233

Enthusiast
Mitglied seit
01.05.2007
Beiträge
3.676
Naja, man könnte ja auch endlich mal das Thema Timings angehen.
Wenn ich mir die Timings von aktuellem RAM so anschaue, ist da noch sehr viel Potential.
Beispielsweise bei DDR4 gehts von CL 16 bis CL 22.
Bei DDR5 sehe ich sogar CL 38 und CL 40.
Wie wäre den DDR4 mit CL 4?
Das wäre ein sehr sehr deutlicher Geschwindigkeitsschub!
Statt dessen wird die Taktfrequenz hochgeschraubt (und damit auch die Timings langsamer) und/oder die Interfacebreite hochgeschraubt.
Der Cache in CPUs hat deutlich schärfere Timings.
So etwas mal als RAM wäre ein echter Geschwindigkeitsschub (allerdings auch sehr teuer!)
 

passat3233

Enthusiast
Mitglied seit
01.05.2007
Beiträge
3.676
Das ist klar.
Ideal wäre CL 1, d.h. 1 Speicherzugriff pro Taktzyklus.
Aber das habe ich seit FPM nicht mehr gesehen.
 

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.380
Ideal geht aber eben technisch nicht und tatsächlich ist die Latenz in ns bei DRAM seit den DDR1 Zeiten nicht großartig besser geworden, da dies einfach physikalisch bedingt ist. Die HBM RAMs haben eine bessere Latenz, weil bei denen die Adressierung anderes ist, denn da diese so viele Verbindungen haben, dafür braucht man aber immer auch einen teuren Halbleiterinterposer zur Anbindung, werden dort Rows und Columns zeitgleich adressiert und nicht nacheinander. Nur ist die Anzahl der möglichen Verbindungen bei den RAM Riegeln halt beschränkt und man kann daher dieses Vorgehen eben nicht einfach übernehmen.
 

Strikeeagle1977

Experte
Mitglied seit
02.09.2019
Beiträge
2.330
Ort
421**, wo die U-Bahn an der Decke hängt
Wenn ich mir die Timings von aktuellem RAM so anschaue, ist da noch sehr viel Potential.
Beispielsweise bei DDR4 gehts von CL 16 bis CL 22.
Bei DDR5 sehe ich sogar CL 38 und CL 40.
Wie wäre den DDR4 mit CL 4?
Das wäre ein sehr sehr deutlicher Geschwindigkeitsschub!
Statt dessen wird die Taktfrequenz hochgeschraubt (und damit auch die Timings langsamer) und/oder die Interfacebreite hochgeschraubt.
Der Cache in CPUs hat deutlich schärfere Timings.
äh, ja neee.

Rechne mal die Timing mit der Taktfrequenz in Nanosekunden um, also ns der Bausteine. Wir pendeln seit Jahren da um 9-11ns bei Standard RAM , egal ob DDR2, DDR3, oder DDR4 oder sogar DDR5.
Mehr Durchsatz bei gleichen Timings, alles gut.
CL... muss immer mit Bezug auf die Taktfrequenz gesehen werden. Aktuell liegen die Standard DDR5 Bausteine in der Geschwindigkeit gleichauf oder etwas zurück mit den Serienbausteinen für DDR4. In 2 Jahren mag das anders aussehen, da ist DDR5 dann sicherlich als DDR5-7200 oder so unterwegs und sollte mit guten Timings locker Vorteile gegenüber schnellem DDR4-4400 haben.
 
Oben Unten