1. Hardwareluxx
  2. >
  3. News
  4. >
  5. Hardware
  6. >
  7. Arbeitsspeicher
  8. >
  9. Samsung HBM-PIM: Schneller Speicher bekommt eingebaute AI-Engine (Update)

Samsung HBM-PIM: Schneller Speicher bekommt eingebaute AI-Engine (Update)

Veröffentlicht am: von

samsung-hbm2Samsung hat eine neue Art High Bandwidth Memory (HBM) vorgestellt, der nicht nur ein einfacher Speicher ist, sondern der eine Processing-in-Memory (PIM) Architektur enthält. Es handelt sich laut Samsung um den ersten HBM, der über eine solche Art der integrierten Recheneinheiten verfügt.

Noch ist nicht bekannt, wie genau die integrierten Recheneinheiten funktionieren, bzw. welche Rechenleistung diese erreichen. Samsung nennt keinerlei Leistungsdaten. Höchstwahrscheinlich handelt es sich um Optimierungen der Daten selbst, um parallele Zugriffe und das Speichermanagement zu optimieren. Wohl aber soll der HBM-PIM sowohl für das Inferencing mit niedriger Genauigkeit als auch das Training mit hoher Genauigkeit geeignet sein. Der Vorteil von integrierten Recheneinheiten liegt in der hohen Bandbreite und den geringen Latenzen, die so erreicht werden können.

Kwangil Park, Senior Vice President der Memory-Sparte: "Our groundbreaking HBM-PIM is the industry’s first programmable PIM solution tailored for diverse AI-driven workloads such as HPC, training and inference. We plan to build upon this breakthrough by further collaborating with AI solution providers for even more advanced PIM-powered applications."

Ein HBM-Chip besteht aus mehreren Ebenen. Der Logic-Die bildet die Basis und stellt die Verbindung zum Speicherinterface her. Darüber befinden sich bis zu acht DRAM Dies – der eigentliche Speicher. TSVs und Microbumps stellen die Verbindungen zu den einzelnen Ebenen her. Samsungs HBM-PIM sieht eine AI-Engine in jeder Speicherbank vor.

Im Vergleich zu bestehenden HBM2-Aquabolt-Lösungen sollen die AI-Engines die doppelte Leistung bei um 70 % reduzierter Leistungsaufnahme erreichen. Unklar ist allerdings, welche Vergleiche Samsung hier heranzieht. Laut Samsung soll HBM-PIM zu bestehenden Hardwarelösungen kompatibel sein.

Auf der International Solid-State Circuits Virtual Conference (ISSCC) am 22. Februar will Samsung weitere Details zum HBM-PIM verkünden. Mit einigen Partnern arbeiten Samsung bereits zusammen. In der zweiten Jahreshälfte 2021 erwartet man die Validierung der ersten Umsetzungen.

Update: Weitere Details

Doch etwas früher als gedacht sind nun weitere Details zum HBM-PIM bekannt geworden, die auch einige der noch offenen Fragen klären. TomsHardware hat einige Ausschnitte aus der Präsentation von Samsung, die Auskunft über die Funktionsweise des HBM-PIM geben.

So verwendet Samsung für den HBM-PIM einen Puffer Die, vier Lagen des Speichers mitsamt der Recheneinheiten und weitere vier Lagen klassischen HBM-Speichers. In den FIMDRAM-Layern befinden sich jeweils 32 der Rechenkerne, die mit einem Takt von 300 MHz arbeiten. Diese können jeweils eine Fließkommaoperation mit 16 Bit ausführen. Die Rechenleistung eines kompletten Speicherchips mit vier FIMDRAM-Layern beträgt also 4 x 32 x 32 Byte x 300 MHz = 1,2 TFLOPS.

Die HBM-DIM-Speicherchips kommen allerdings nicht auf die gleiche Kapazität, wie die vergleichbaren reinen HBM-Chips. Samsung nennt eine Kapazität von 6 GB, da nur vier der acht Layer komplett aus Speicher bestehen und die weiteren vier FIMDRAM-Layer nur noch zur Hälfte, denn der Rest wird von den Recheneinheiten belegt.

Anders als zunächst vermutet nimmt Samsung im HBM-PIM nicht einfach nur ein AI-Speichermanagement vor, sondern bietet hier tatsächlich eine gewisse Rechenleistung. Zum Vergleich: Der A100 GPU-Beschleuniger von NVIDIA kommt auf eine Rechenleistung von 78 TFLOPS für FP16-Berechnungen. Mit den Tensor Cores und Sparsity sind es sogar 312 bzw. 624 TFLOPS. Der HBM-PIM spielt also nur für sehr spezielle Lösungen eine entscheidende Rolle. Wenn es nur auf die Rechenleistung ankommt, dürfte der Einsatz dieses Speichers wohl kaum einen Sinn machen.

Social Links

Das könnte Sie auch interessieren:

  • G.Skill Trident Z Neo 32 GB im Test

    Logo von IMAGES/STORIES/2017/PREVIEW_GSKILL_TRIDENT_Z_NEO

    Speichermodule vom Hersteller G.Skill sind bei vielen Moddern sehr beliebt, und auch in der Community trifft man auf viele Systeme, die mit Speicher aus der TridentZ-Serie ausgestattet sind. Wir haben uns mal ein 32-GB-Kit der Trident Z Neo-Serie aus dem Regal gegriffen und es durch unseren... [mehr]

  • Corsair Dominator Platinum RGB White 16 GB DDR4-3600 im Test

    Logo von IMAGES/STORIES/2017/PREVIEW_CORSAIR_DOMINATOR_PLATINUM

    Viele haben es sich schon gewünscht und Corsair scheint die Wünsche seiner Kunden erhört zu haben. Es gibt die beliebten Dominator Platinum RGB seit kurzem auch mit weißem Heatspreader. Jetzt können alle, die gerne einen Schwarz/Weiß-Build aufbauen möchten, auch bei der Dominator-Serie auf... [mehr]

  • Antec Katana 16 GB DDR4-3200 im Test

    Logo von IMAGES/STORIES/2017/PREVIEW_ANTEC_KATANA

    Mit den Katana-Arbeitsspeichermodulen hat Antec seine ersten Arbeitsspeichermodule auf den Markt gebracht, die sich hauptsächlich an Gamer und Designbewusste Käufer richten. In unserem Test werden wir die neuen Riegel genauer unter die Lupe nehmen und herausfinden, ob die Leistung genauso scharf... [mehr]

  • G.SKILL Trident Z Neo DDR4 nun mit DDR4-4000 für Ryzen-5000-Serie

    Logo von IMAGES/STORIES/2017/GSKILL

    Passend zu den neu erschienen AMD Ryzen Prozessoren der 5000-Serie, stellte G.SKILL eine eigens auf die neuen Prozessoren abgestimmte Variante seiner Trident Z Neo-Serie vor. Die neuen Kits machen dabei von dem verbesserten Arbeitsspeicher-Support bei den neuen Ryzen-5000-Modellen Gebrauch, was... [mehr]

  • TeamGroup präsentiert DDR5-RAM mit 4.800 MHz für Endkunden

    Logo von IMAGES/STORIES/2017/TEAMGROUP-2019

    In einer Pressemittelung kündigt TeamGroup das baldige Erscheinen von DDR5-Arbeitsspeicher-Chips für den breiten Markt an. Die ersten Module sollen demnach eine Kapazität von 16 GB bei einer Taktfrequenz von 4.800 MHz bieten. Weiterhin heißt es, man arbeite mit großen... [mehr]

  • G.Skill stellt neue Low-Latency DDR4-Kits vor

    Logo von IMAGES/STORIES/2017/GSKILL_TRIDENTZ_RGB

    G.Skill hat neue Speicherchips vorgestellt, die sich vor allem durch ihre niedrigen Latenzen auszeichnen sollen. Angeboten werden die Kits als DDR4-4000 CL16 mit 32 GB (2x 16 GB) und als DDR4-4400 CL16  mit16 GB (2x 8 GB). Als Basis dienen einmal mehr die B-Die-Speicherchips von Samsung,... [mehr]