1. Hardwareluxx
  2. >
  3. News
  4. >
  5. Hardware
  6. >
  7. Prozessoren
  8. >
  9. TSMC zeigt eigene Chiplet-Techniken für ARM-HPC-Prozessoren

TSMC zeigt eigene Chiplet-Techniken für ARM-HPC-Prozessoren

Veröffentlicht am: von

tsmcDie Zukunft scheint den Chiplet-Designs zu gehören. AMD wird dazu mit den Ryzen-Prozessoren der dritten Generation und den EPYC-Prozesoren der zweiten Generation erste Produkte auf den Markt bringen und die Erfahrungen, die AMD bei den Zen-Prozessoren gemacht hat, will man in zukünftigen RDNA-Architekturen für die Grafikkarten umsetzen. Auch Intel arbeitet bei den Prozessoren in diese Richtung und das, was Intel bisher zur Xe-Architektur gezeigt hat, spricht ebenfalls für einen modularen Aufbau des Chips. Zuletzt veröffentlichte NVIDIA ein Forschungspapier zu einem MCM-basierten AI-Beschleuniger.

Auf dem VLSI-Symposium in Kyoto, Japan, zeigte nun auch TSMC seine Umsetzung für ein Chiplet-Design. WikiChip war vor Ort und hat die dort erhaltenen Informationen aufgearbeitet. Dabei sollten auch einige konkrete Vorgaben mit einbezogen werden, die im Fokus stehen sollen und die zeigen, dass ein Chiplet-Design auch im HPC-Segment sinnvoll umgesetzt werden kann:

  • es sollten vier ARM-Kerne mit einem Takt von 4 GHz oder mehr verwendet werden
  • es sollte ein bidirektionaler Interconnect in Mesh-Topologie verwendet werden, der ebenfalls 4 GHz und mehr erreichen sollte
  • die eigene Chip-on-Wafer-on-Substrate (CoWoS) Packaging-Technologie und der Low-voltage-In-Package-Interconnect sollten verwendet werden und 8 GT/s  bei < 1 pJ/Bit erreichen

TSMC hat sich für einen Dual-Chiplet-Prozessor entschieden. Dieser verwendet pro Chiplet jeweils vier ARM Cortex-A72-Kerne, die in 7 nm gefertigt werden. Das Design wurde derart ausgelegt, dass die beiden ARM-Kerne einen Takt von 4 GHz oder mehr erreichen. Den vier ARM-Kernen stehen 2x 1x MB L2-Cache zur Verfügung. Hinzu kommen 6 MB L3-Cache. Das gesamte Package besteht aus 15 Layern. Zwei dieser Chiplets sollten letztendlich auf einem Substrat in wiederum einem größeren Package untergebracht werden. Dieser Aufbau beschreibt dann auch die Herausforderungen an die On-Chip- und Off-Chip-Interconnects.

Doch zunächst konzentrierte sich TSMC auf eine möglichst hohe Leistung der ARM-Kerne und eine gute Skalierung des Taktes über die Spannung. Mit der 7-nm-Fertigung hat TSMC schon gute Erfahrungen gemacht und mit AMD hat man auch einen Kunden, der große CPUs und GPUs hier in 7 nm fertigen lässt.

Gegenüberstellung von Takt und Spannung
Frequenz 2,8 GHz 3,0 GHz3,5 GHz4,0 GHz4,2 GHz
Takt 0,775 V
0,825 V
0,95 V1,20 V1,375 V

Beim Takt wurden bis zu 4,2 GHz erreicht, allerdings waren dazu auch 1,375 V notwendig. Bei 2.8 GHz reichten 0,775 V aus.

Die Interconnects und das Packaging

TSCM verwendet einen bidirektionalen Interconnect in Mesh-Topologie für die Verbindung innerhalb des Chiplets für vier ARM-Kerne und den L3-Cache. Sechs verteilte Flip-Flop-Mesh-Stations kümmern sich um diese Interconnect-Struktur. Realisiert wird darüber ein 1.968 Bit breiter Bus, der mit Taktraten zwischen 2,0 und 5,2 GHz arbeiten kann. Damit ist eine Datenrate von 1,2 TB/s möglich.

Die zwei Chiplets kommunizieren über ein den Low-voltage-In-Package-Interconnect (LIPINCON) miteinander. Dazu verfügt jedes Chiplet über jeweils zwei PHYs (physikalische Ebene im OSI-Modell). Die einzelnen Verbindungen sind unidirektional realisiert. Eine stellt den Master für die CPU-Kommunikation zum L3-Cache während die zweite als Slave in die andere Richtung arbeitet. Jeder PHY kann dann 2:1 Multiplexing eine Datenrate von 8 GB/s erreichen.

Das Packaging ist für ein Chiplet-Design ebenfalls wichtig. TSMC beschreibt hier die eigene Chip-on-Wafer-on-Substrate (CoWoS) Packaging-Technologie. Ein Package-Substrat stellt die Verbindung zwischen dem Package und dem Logicboard her. Hier kommen die vergleichsweise großen BGAs (Ball Grid Array) zum Einsatz. Auf dem Substrat sitzt der Silizium-Interposer, der über sogenannte C4-Bumps aus Kupfer eine Verbindung zum Substrat herstellt.

Die zwei Chiplets sitzen auf dem Interposer und haben einen Abstand von gerade einmal 100 µm zueinander. Über Micro-Bumps mit einem Abstand von gerade einmal 40 µm werden die LIPINCON-PHYs miteinander verbunden. Zum Vergleich: AMD setzt für seine neuen 7-nm-Dies bei den RYZEN- und EPYC-Proezssoren auf Bumbs mit einem Abstand von 130 µm zueinander.

Gegenüberstellung der Chiplet-Technologien
AMD Intel TSMC
PackagingMCM EMIB CoWoS
Channel- 1 mm 500 µm
Chiplet-Bumbs130 µm 55 µm 40 µm
InterconnectInfinity Fabric (IF) Advanced Interface Bus (AIB)
LIPINCON
Datenrate10,6 GT/s 2 GT/s 8 GB/s
Leistungsaufnahme2 pJ/Bit 1,2 pJ/Bit
0.56 pJ/bit
konkrete UmsetzungRyzen 3. Gen
Ryzen Threadripper 3. Gen
EPYC 2. Gen
Stratix 10
-

Der Vergleich der einzelnen Chiplet-Designs zueinander, zeigt die Unterschiede deutlich auf. Während AMD mit der höchsten Datenrate für den Interconnect aufwarten kann, sind Intel und TSMC scheinbar technologisch in der Lage, deutlich kompakter zu fertigen, was auch in der Auslegung der Produkte erkennbar ist. AMD konzentriert sich auf den Desktop-Markt, in dem Baugröße und Abstände keine allzu große Rolle spielen. Damit nimmt AMD auch eine etwas geringere Effizienz für den Interconnect in Kauf. Dafür kann AMD in diesem Jahr mit ersten konkrete Produkten für den Desktop- und Servermarkt aufwarten.

Intel spezialisiert sich hinsichtlich des Chiplet-Designs zunächst auf Spezialmärkte. In der breiten Massen wird es noch etwas dauern, bis wir EMIB und AIB in Kombination sehen werden. TSMC hat auf dem VLSI-Symposium zunächst eine reine Machbarkeitsstudie präsentiert. Konkrete Produkte sind noch nicht absehbar. AMD lässt seine CPU-Chiplets zwar bei TSMC fertigen, das Packaging findet aber an anderer Stelle statt und die Interconnect-Technologie basiert auf einer eigenen Technik.

Welche ist die beste CPU?

Unsere Kaufberatung zu den aktuellen Intel- und AMD-Prozessoren hilft dabei, die Übersicht nicht zu verlieren. Dort zeigen wir, welche Prozessoren aktuell die beste Wahl darstellen - egal, ob es um die reine Leistungsfähigkeit oder das Preis-Leistungs-Verhältnis geht.


Social Links

Das könnte Sie auch interessieren:

  • AMDs Ryzen 7 3700X und Ryzen 9 3900X im Test

    Logo von IMAGES/STORIES/2017/AMDRYZEN93900X

    Heute ist es endlich soweit: AMD bläst zum Großangriff. Die Zen-2-Architektur versetzt AMD offenbar in die Situation, endgültig mit dem Konkurrenten Intel aufzuschließen. Mit Zen, Zen+ und der AM4-Plattform hat AMD über zwei Jahre die Basis zum Erfolg geschaffen. Nun will man den... [mehr]

  • AMD Ryzen 5 3600 im Test: Ohne X noch viel besser

    Logo von IMAGES/STORIES/2017/AMD_RYZEN_5_3600_TEST-TEST

    Gegenüber dem AMD Ryzen 5 3600X aus unserem letzten Test, der trotz seiner Einstufung in die Mittelklasse ältere Topmodelle schlägt, ist der AMD Ryzen 3600 ohne das X-Kürzel nur 200 bis 300 MHz niedriger getaktet und mit einer TDP von 65 W sparsamer klassifiziert, was einen... [mehr]

  • AMD Ryzen 5 3600X im Test: 265-Euro-CPU schlägt ältere Flaggschiff-Modelle

    Logo von IMAGES/STORIES/2017/RYZEN_5_3600X_REVIEW-TEASER

    Mit dem Ryzen 9 3900X und dem Ryzen 7 3700X ist AMD seinem Konkurrenten wieder mächtig auf die Pelle gerückt und macht ihm selbst im High-End-Bereich mit einer hohen Anwendungs- und Spiele-Leistung zu einem deutlich günstigeren Preis das Leben schwer. Doch auch in den unteren Preis- und... [mehr]

  • AMD Ryzen 5 3400G im Test: Weniger Änderungen als erwartet

    Logo von IMAGES/STORIES/2017/AMD_RYZEN_5_3400G-TEASER

    Im letzten Jahr erwiesen sich die Raven-Ridge-APUs als gute Alternative, wenn man sich einen sparsamen und günstigen Office-Rechner zusammenbauen wollte. Die Kombination aus Zen-Prozessor und Vega-Grafiklösung erwies sich als durchaus leistungsfähig für den Alltag. Ob dies auch für die... [mehr]

  • AMD Ryzen 7 3800X im Test: Ein hungriger Lückenfüller

    Logo von IMAGES/STORIES/2017/AMDRYZEN93900X

    Kurz vor dem Start des lange ersehnten AMD Ryzen 9 3950X und der kommenden Threadripper-Modelle schließen wir eine weitere Lücke in unserer Testdatenbank und stellen den AMD Ryzen 7 3800X auf den Prüfstand, der über acht Kerne verfügt, gegenüber seinem kleinen Schwestermodell jedoch in einer... [mehr]

  • In Spielen König, sonst eher ein kleiner Prinz: Intel Core i5-10600K und Core...

    Logo von IMAGES/STORIES/2017/INTEL-CML-S

    Heute ist es soweit und wir dürfen die ersten Leistungsdaten des Core i5-10600K und des Core i9-10900K präsentieren. Damit öffnet Intel seine Comet-Lake-Prozessoren für den Markt, denn ab heute sind die ersten Modelle im Handel verfügbar. Die Kernkompetenzen der neuen Prozessoren liegen vor... [mehr]