1. Hardwareluxx
  2. >
  3. News
  4. >
  5. Hardware
  6. >
  7. Prozessoren
  8. >
  9. Manticore: RISC-V Multi-Chiplet-Konzept mit HBM2 und 4.096 Kernen

Manticore: RISC-V Multi-Chiplet-Konzept mit HBM2 und 4.096 Kernen

Veröffentlicht am: von

manticore-risc-vAuf der HotChips-Konferenz zeigten Wissenschaftler der Systems Laboratory der ETH Zürich sowie der Universität von Bologna ein Multi-Chiplet-Konzept auf Basis eines RISC-V-Designs. HBM2, ein Chiplet-Design, schneller Interconnect und bis zu 4.096 Kerne zeigen die Richtung, in die es gehen soll. Mit dem Manticore getauften Design zielt man klar auf ein HPC-Design für einen solchen Prozessor ab.

Das Manticore-Konzept besteht aus vier Chiplets. Jedes dieser Chiplets misst 222 mm² (14,9 x 14,9mm). Die Fertigung könnte bei GlobalFoundries in 22 nm (22FDX) stattfinden. Diese Prozesstechnologie wurde gewählt, weil die Ausbeute und Kosten in einem guten Verhältnis stehen. Jedes der vier Chiplets ist mit den anderen dreien per Interconnect verbunden. Pro Chiplet sind 8 GB an HBM2 geplant. Zur Anbindung des Manticore-Konzepts soll ein PCI-Express-Interface genutzt werden.

Jedes der Chiplets besteht aus vier Quadranten (in denen sich die Rechenkerne befinden), einem 27 MB großen L2-Cache, einem HBM2-Speicherinterface sowie dem PCI-Express-Controller. Jeder der vier Quadranten besteht aus 32 Clustern bzw. 256 Kernen – jedes Cluster besitzt also acht RV32G Snitch Kerne. Pro Takt können die Kerne 16DP- und 32SP-Operationen ausführen. Die Taktfrequenz soll bei 1.000 MHz liegen. Auf jedem Chiplet befinden sich außerdem vier Management-Kerne namens Ariane. Auf diesen kann ein Linux arbeiten.

Die RV32G-Kerne haben einen 8 kB großen L1-Instruction- und einen 128 kB großen L1-Data-Cache. Die großen Caches für die Daten sind notwendig, um die zu verarbeitenden Daten so nahe wie möglich am eigentlichen Rechenkern behalten zu können. Dies trifft auch auf den großen L2-Cache sowie den HBM2 zu. Die Ariane-Kerne (RV64G) haben ein anderes Design und bieten daher 16/32 kB an L1-Instruction/Data-Cache.

Einen solch großen Chip können die Wissenschaftler nicht einfach so fertigen lassen. Dies wäre zu aufwendig und kostenintensiv. Also hat man einen Prototypen der Chiplet-Architektur fertigen lassen. Dieser hat eine Fläche von gerade einmal 9 mm². Man will hier die wichtigsten Komponenten testen können – darunter die RV32G Snitch Kerne, 1,25 MB an L2-Cache und die Ariane-Kerne auf Basis eines RV64G-Designs.

Hinsichtlich der Rechenleistung und Effizienz muss man sich auf Projektionen verlassen, die auf Basis des Prototyps erstellt wurden. Demnach käme das Manticore-Konzept auf eine Rechenleistung im Bereich einer GV100-GPU von NVIDIA – je nach Art der Berechnungen natürlich. Als HPC-Chip stehen die FP64, also Berechnungen bei doppelter Genauigkeit, im Fokus. Auf der Spannungs/Takt-Kurve entsprechend getrimmt wäre das Manticore-Konzept im den Faktor fünf effizienter als ein A100-Beschleuniger von NVIDIA. Hinsichtlich der FP32-Rechenleistung ist man etwas im Nachteil, aber noch immer besser als anderen Designs.

In einem nächsten Schritt soll nun ein Quad-Chiplet-Prototyp hergestellt werden. Dabei wird es sich aber noch nich um ein vollintegriertes Package handeln. Zunächst einmal will man Chip-Prototypen mit FinFET-Komponenten fertigen lassen, um die Vorteile einer modernen Fertigung mit einfließen zu lassen.

Welche ist die beste CPU?

Unsere Kaufberatung zu den aktuellen Intel- und AMD-Prozessoren hilft dabei, die Übersicht nicht zu verlieren. Dort zeigen wir, welche Prozessoren aktuell die beste Wahl darstellen - egal, ob es um die reine Leistungsfähigkeit oder das Preis-Leistungs-Verhältnis geht.


Social Links

Das könnte Sie auch interessieren:

  • Der König ist bezwungen: AMD Ryzen 9 5900X und Ryzen 5 5600X im Test

    Logo von IMAGES/STORIES/2017/AMD_RYZEN_9_5900X_5600X_REVIEW-TEASER

    Seit heute sind die ersten Ableger der neuen Ryzen-5000-Familie erhältlich. Mit ihnen will AMD die letzte Intel-Bastion zu Fall bringen und endlich auch bei der Spieleleistung wieder ganz vorne mitspielen, nachdem man dem Konkurrenten mit seinen Matisse-Ablegern in Sachen Preis und... [mehr]

  • Generations-Nachzügler: AMD Ryzen 9 5950X und Ryzen 7 5800X im Test

    Logo von IMAGES/STORIES/2017/AMD_RYZEN_9_5950X_5800X-TEASER

    Wie angekündigt hat uns AMD pünktlich zum gestrigen Marktstart der ersten vier Ryzen-5000-Modelle inzwischen auch mit den noch fehlenden zwei Modellvarianten versorgt. Wir komplettieren die Testreihen daher nun um das Topmodell mit 16 Kernen, den AMD Ryzen 9 5950X, und um den AMD Ryzen 7 5800X... [mehr]

  • Prozessor non grata: Rocket Lake-S als Core i7-11700K im Vorab-Test (Update)

    Logo von IMAGES/STORIES/2017/COREI7-11700K

    Gut einen Monat vor dem offiziell geplanten Verkaufsstart konnte jeder Nutzer bereits den Core i7-11700K erstehen. Mindfactory verkaufte den Prozessor tagelang und jeder der wollte, konnte diesen auch bestellen. Auch wir haben die Gelegenheit ergriffen und präsentieren bereits heute einen... [mehr]

  • Günstiger 10-Kern-Einstieg: Intel Core i9-10850K im Test

    Logo von IMAGES/STORIES/2017/INTEL-CML-S

    Ende Juli stellte Intel in einem kleinen, zweiten Schwung einige weitere neue Modelle an Comet-Lake-S-Prozessoren vor. Die wichtigste Neuvorstellung ist dabei sicherlich der Core i9-10850K, der sich knapp unter dem Core i9-10900K aufstellt. Zehn Kerne, etwas niedrigere Taktraten, dafür ein um... [mehr]

  • Refresh-Nachzügler: AMD Ryzen 7 3800XT und Ryzen 5 3600XT im Test

    Logo von IMAGES/STORIES/2017/AMD_MATISSE_REFRESH_TRIPLE-TEASER

    Wenige Tage nach unserem Test zum AMD Ryzen 9 3900XT versorgte uns die Chipschmiede mit den beiden kleineren Serienvertretern der Matisse-Refresh-Generation, die dank zahlreicher Verbesserungen im Fertigungsprozess und etwas höherer Taktraten die Effizienz gegenüber den bestehenden Modellen... [mehr]

  • Zen 2 optimiert: So funktioniert der ClockTuner for Ryzen (Update)

    Logo von IMAGES/STORIES/2017/CTR

    Bereits vor einigen Wochen wurde der ClockTuner for Ryzen (CTR) angekündigt. Ab heute ist er nun für Jedermann verfügbar und kann ausprobiert werden. 1usmus, der Entwickler hinter dem DRAM Calculator for Ryzen, hat auch den ClockTuner for Ryzen entwickelt. Durch einen Custom... [mehr]