> > > > Multi-Chip-Ansatz: TSMC stapelt mehrere Wafer übereinander

Multi-Chip-Ansatz: TSMC stapelt mehrere Wafer übereinander

Veröffentlicht am: von

tsmcZukünftige CPUs und GPUs werden wohl den Weg eines Multi-Chip-Ansatzes gehen. Ganz ähnlich wie AMD dies bei den Ryzen-Prozessoren bereits heute tut, werden solche Designs auf vielen kleineren Modulen aufgebaut sein, die entsprechend des Einsatzzweckes des jeweiligen Produktes skaliert werden können. Dementsprechend arbeiten auch viele CPU- und GPU-Hersteller an einer technischen Umsetzung dieses Ansatzes.

AMD verwendet für seine GPUs mit HBM einen Interposer, der jedoch recht kompliziert zu fertigen und dementsprechend recht teuer ist. Intel setzt auf eine Technologie namens Embedded Multi-die Interconnect Bridge oder kurz (EMIB) und anstatt Through-Silicon Vias (TSVs) können auch induktive Verfahren wie ThruChip Interface (TCI) zum Einsatz kommen.

Beim Auftragsfertiger TSMC arbeitet man derzeit verstärkt in Richtung einer Fertigung in 7 nm, denkt aber natürlich auch schon über die nächsten Schritte nach. Für zukünftige Produkte, die aus mehreren Chips bestehen, will TSMC eine weitere Technologie anbieten und arbeitet in diesem Bereich mit dem Unternehmen Cadence zusammen. Diese hört auf den Namen Wafer-on-Wafer oder kurz WoW. Nach Chip-on-Wafer-on-Substrate (CoWoS) und Integrated-Fan-Out (InFO) handelt es sich bei WoW um die dritte Iteration einer 3D-Technologie.

Für Wafer-on-Wafer kommen zwei Wafer zum Einsatz, von denen eine kopfüber über die zweite geführt wird. Die Pads, also Kontakte der Wafer, müssen überdeckend gefertigt werden, damit ein der Kontakt auch hergestellt werden kann. Wie TSMC die beiden Bonding Layer (BEOL und FEOL) zusammenführt ist das Geheimnis des zugrundeliegenden Prinzips. Muss der obere der beiden Chips IO-Signale ausgeben können, werden diese durch TSVs aus dem Package herausgeführt.

Das WoW-Verfahren hat aber auch einige Hürden, die vor allem eine möglichst hohe Ausbeute guter Chips voraussetzt. Die zusammengelegten Wafer werden erst nach diesem Vorgang geschnitten. Auf einem Belichteten Wafer können noch keine Tests der Chips stattfinden. Es könnte also passieren, dass ein funktionierender und ein nicht funktionierender Chip zusammenkommen. Das Gesamtkonstrukt ist dann aber noch immer nicht mehr funktionstüchtig. Eine hohe Ausbeute der Wafer ist für das WoW-Verfahren also eine Grundvoraussetzung.

Laut TSMC lassen sich WoW und andere Verfahren auch kombinieren. So kann ein WoW-Package mit einem weiteren mittels Interposer zusammengebracht werden. Außerdem ermöglicht das WoW-Verfahren auch mehr als zwei Wafer übereinander – sofern alle bis auf den untersten auch TSVs anbieten.

TSMC plant den Einsatz von Wafer-on-Wafer für Chips, die in 7 oder 5 nm gefertigt werden sollen. Konkrete Ankündigungen gibt es noch nicht. Das Verfahren eignet sich besonders für große Chips und wird daher für HPC-Prozessoren zum Einsatz kommen. Cadence fertigt IC-Design-Werkzeuge und stellt entsprechende Techniken zur Verfügung. In der Pressemitteilung werden diese wie folgt beschrieben:

  • Innovus Implementation System: Supports single database top-die including front/back-side routing and backside-through-silicon-via (BTSV) support, creating connections between multiple dice
  • Quantus Extraction Solution: Supports back-side routing layers, sub-circuit replacement for BTSV and die-to-die interface coupling capacitance extraction, enabling electrical analysis between the dice
  • Voltus IC Power Integrity Solution: Provides die-level power map generation, enabling concurrent power analysis of multiple dice
  • Tempus Timing Signoff Solution: Provides multi-die static timing analysis (STA) support, enabling a checking of timing paths that cross multiple dice
  • Physical Verification System (PVS): Offers design rule checking (DRC) and layout vs. schematic (LVS) for die with BTSV, interface alignment and connectivity checks, ensuring that the two dice connect properly
  • Virtuoso Platform: Includes features for bump placement and alignment on top of the existing PDK via the Virtuoso Incremental Technology Database (ITDB), creating connections between multiple dice
  • OrbitIO interconnect designer: Provides interface connectivity, device flattening, port connectivity and configurable module definitions to manage top-level connectivity, enabling unified planning of die interconnect and alignment
  • Sigrity PowerSI 3D-EM Extraction Option: Offers electrical modeling of the combined die and interposer, validating that the power and ground distribution is sufficient for multiple dice
  • Sigrity PowerDC technology: Thermal analysis solution with interposer and die analysis capabilities that allow co-simulation with Voltus IC Power Integrity Solution, enabling inclusion of temperature into concurrent electromigration analysis of multiple dice
  • Sigrity XcitePI Extraction: Provides accurate interposer-level interconnect model extraction, enabling validation of high-speed signal propagation in the time and frequency domains
  • Sigrity SystemSI technology: Automatic construction of complete model-based interconnect topologies used to drive simultaneous switching noise (SSN/SSO) analysis for concise eye-diagram validation

Social Links

Ihre Bewertung

Ø Bewertungen: 5

Tags

Kommentare (9)

#1
customavatars/avatar281911_1.gif
Registriert seit: 13.02.2018

Fregattenkapitän
Beiträge: 2793
Das wird wohl noch spannend, gerade auch bei GPUs. Die Fertigung von Einzelmodulen dürfte günstiger sein als Riesenchips. Stattdessen könnte man wie bei Ryzen nur noch Einzelmodule herstellen die dann skalierbar sind und sich auf die Verbesserung der Zwischemodullatenz fokussieren.
#2
Registriert seit: 01.08.2017
ganz im Westen
Leutnant zur See
Beiträge: 1147
So einfach wie du dir das Vorstellst, ist die Sache aber nicht.
Lies dir das mal durch.
Next-Gen GPU: Warum ein Multi-Chip-Ansatz für Navi alles andere als trivial ist - Hardwareluxx

AMDs infinity Fabric schafft grade mal 160Gb/sekunde. Für CPUs reicht das aus, GPUs haben mittlerweile eine Speicherbandbreite von 500 bis 1000Gb/sekunde...... solch ein Interconnect gibt es leider noch nicht....
#3
customavatars/avatar202850_1.gif
Registriert seit: 06.02.2014
Im sonnigen Süden
Admiral
Beiträge: 12451
Interessant dass Silizium doch noch nicht am Ende ist!
#4
customavatars/avatar128299_1.gif
Registriert seit: 29.01.2010
CH
Fregattenkapitän
Beiträge: 2995
Zitat Mo3Jo3;26293995
So einfach wie du dir das Vorstellst, ist die Sache aber nicht.
Lies dir das mal durch.
Next-Gen GPU: Warum ein Multi-Chip-Ansatz für Navi alles andere als trivial ist - Hardwareluxx

AMDs infinity Fabric schafft grade mal 160Gb/sekunde. Für CPUs reicht das aus, GPUs haben mittlerweile eine Speicherbandbreite von 500 bis 1000Gb/sekunde...... solch ein Interconnect gibt es leider noch nicht....


Dabei geht es aber imo immer um Interconnects über ein PCB. Bei HBM oder Intels EMIB werden die einzelnen Chips nicht über ein PCB verbunden sondern über Silizium. Dazu müssen die Chips halt sehr nahe beinander liegen, dafür ist die Latenz und der Durchsatz deutlich besser. HBM erreicht hier was? 250GB/s oder sowas pro Chip.
#5
Registriert seit: 11.08.2017

Banned
Beiträge: 503
und was ist mit der wärme, ein heizender chip auf einem heizenden chip?
#6
Registriert seit: 01.08.2017
ganz im Westen
Leutnant zur See
Beiträge: 1147
Zitat Nimrais;26294929
Dabei geht es aber imo immer um Interconnects über ein PCB. Bei HBM oder Intels EMIB werden die einzelnen Chips nicht über ein PCB verbunden sondern über Silizium. Dazu müssen die Chips halt sehr nahe beinander liegen, dafür ist die Latenz und der Durchsatz deutlich besser. HBM erreicht hier was? 250GB/s oder sowas pro Chip.

Das wäre auch die einzige Möglichkeit, ein Interposer oder EMIB. So wie es bei der R9 295X2 ist (oder Ryzen CPUs), kann ich mir niemals eine effektive GPU MultiChip Lösung vorstellen. Durch den großen Abstand geht viel zu viel Bandbreite verloren.
Und EmPas argument ist in diesen Zusammenhang auch nicht unwichtig. Wenn es über EMIB oder Interposer läuft, hast du auch viel Wärmeentwicklung auf kleiner Fläche.
#7
customavatars/avatar281911_1.gif
Registriert seit: 13.02.2018

Fregattenkapitän
Beiträge: 2793
Dafür verringert man die Strukturbreite, damit es weniger heizt.
#8
Registriert seit: 05.11.2007
Neckar-Odenwald Kreis
Kapitän zur See
Beiträge: 3615
Zitat Mo3Jo3;26295478

Und EmPas argument ist in diesen Zusammenhang auch nicht unwichtig. Wenn es über EMIB oder Interposer läuft, hast du auch viel Wärmeentwicklung auf kleiner Fläche.


Die Wärmeentwicklung wäre aber immernoch die gleiche W/mm2 wie bei einem monolytiachem Monsterchip.

Bei dem Verfahren hier hast du die doppelt Leistungsabgabe pro mm2 und das bei einem dickeren Substrat und demnach wohl schlechterer Wärmeabgabe. Ja gut, man kann niedriger Takten, macht aber einiges der zusätzlichen Leistungen wieder kaputt. Also fraglich, ob sich hier der Mehraufwand lohnt.

Ich sehe das eher als Problem, als die Bandbreite zwischen zwei Chips auf einem Interposer.
#9
Registriert seit: 01.08.2017
ganz im Westen
Leutnant zur See
Beiträge: 1147
Ist es denn nicht grade der Sinn, mehr Chipfläche durch das MultiChipDesign zu bekommen? Stell dir mal einen Threadripper im monilytischen Design vor. Der Chip wäre riesig. Und durch mehr Chipfläche steigt auch die wärme.
Alleine zwei Gp104 Chips aus der Gtx1070 nebeneinander wären mit den normalen Grakakühlern nicht zu betreiben.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Intel kämpft mit schwerer Sicherheitslücke (Update: Intel veröffentlicht...

Logo von IMAGES/STORIES/2017/INTEL

Vor, während und zwischen den Feiertagen herrschte ein wildes Treiben in der Linux-Community. Zunächst war nicht ganz klar, was hier genau vor sich geht, inzwischen aber scheinen die Auswirkungen deutlich zu werden: Intel hat nach einer Lücke in der Management Unit eines jeden... [mehr]

Gelungener Feinschliff: AMD Ryzen 7 2700X und Ryzen 5 2600X im Test

Logo von IMAGES/STORIES/2017/AMD_RYZEN_7_2700X

Rund ein Jahr nach dem Start der Ryzen-Prozessoren legt AMD nach und bringt die zweite Generation in den Handel. Die soll schneller und effizienter arbeiten und den Druck auf Intel weiter erhöhen. Allerdings lautet die Devise Evolution statt Revolution, statt gravierender Änderungen gibt es vor... [mehr]

AMD Ryzen 5 2400G und Ryzen 3 2200G im Test: Die Lücke ist gestopft

Logo von IMAGES/STORIES/2017/AMD_RYZEN_5_2400G

Während Notebook-Käufer sich bereits seit einigen Wochen von den Vorzügen der Zen-basierten Raven-Ridge-APUs überzeugen können, musste sich das Desktop-Lager noch gedulden. Nun aber heißt es auch hier: Intel erhält neue Konkurrenz. Und die könnte einen noch größeren Einfluss als die... [mehr]

AMD Ryzen Threadripper 2990WX und 2950X im Test: Mit Vollgas an Intel vorbei

Logo von IMAGES/STORIES/2017/AMD_THREADRIPPER_2950X

Pünktlich zum ersten Geburtstag startet AMD den Ryzen-Threadripper-Generationswechsel. Und wie schon im Frühjahr beim Sprung von Ryzen 1 zu Ryzen 2 vertraut man auf zwei Dinge: mehr Kerne und einen geringeren Preis. Beide sollen dabei helfen, dem Dauerrivalen Intel im... [mehr]

Intel Core i9-9900K im Test: Acht Kerne mit Luxuszuschlag

Logo von IMAGES/STORIES/2017/INTEL_CORE_I9-9900K

Nach monatelangen Spekulationen und zahlreichen durchgesickerten Informationen hat Intel vor knapp zwei Wochen seine neunte Generation der Core-Prozessoren vorgestellt. Ins Rennen werden mit dem Core i5-9600K, Core i7-9700K und Core i9-9900K zunächst drei Modelle geschickt, die nicht nur... [mehr]

AMD Ryzen 5 2400G und Ryzen 3 2200G: Raven Ridge kann auch spielen

Logo von IMAGES/STORIES/2017/AMD_RYZEN_TEASER_100

Eine gute Alternative, wenn es um einen Alltags- oder Office-Rechner geht: So lautete vor wenigen Tagen das Fazit zu AMDs neuen APUs. Doch wie sich Ryzen 3 2200G und Ryzen 5 2400G schlagen, wenn die Zeit zwischen Word und Chrome mit dem ein oder anderen Spiel überbrückt werden soll, konnte... [mehr]