> > > > Googles TPUs werden enger gepackt und wassergekühlt

Googles TPUs werden enger gepackt und wassergekühlt

Veröffentlicht am: von

googleaiAuf der Keynote der diesjährigen Google I/O drehte sich vieles um Machine Learning und intelligente Assistenzsysteme. Um diese trainieren zu können, arbeitet Google seit einigen Jahren an eigener Hardware, die auf diese Anwendungen ausgelegt sind – Tensor Processing Units oder kurz TPUs.

Bei der TPU handelt es sich um einen Custom-ASIC (Application Specific Integrated Circuit), der speziell auf das Machine Learning mittels TensorFlow zugeschnitten ist. Die zweite Generation der TPUs berechnet 256 × 256 Multiplizier/Aufaddier-Einheiten (Multiplier/Accumulator, MAC) – bestehend aus 2x 128 x 128 Rechencluster. Hinzu kommen 16 GB an HBM2. Diese 16 GB erreichen eine Speicherbandbreite von 600 GB/s und arbeiten demnach mit einem Takt von etwas weniger als 600 MHz. Die Rechenleistung pro TPU gibt Google mit 180 TFLOPS an.

Zur I/O-Keynote stellt Google nun die dritte Iteration der TPUs vor. Auf Seiten der ASICs und damit der eigentlichen Hardware tut sich allerdings nichts. Wir sprechen also weiterhin von zwei Rechenkernen pro Chip und vier Chips ergeben eine TPU. Eine solche TPU kommt auf 180 TFLOPs. Hinzu kommen Scalar-, Vektor- und eine Matrix-Einheit.

Für das Training eines Deep-Learning-Netzwerkes sind FP32-Berechnungen, also Fließkommaberechnungen mit einfacher Genauigkeit, entscheidend. Um einmal die Komplexität der angewendeten Matrix-Multiplikationen vor Augen zu führen, stellt Google die mathematischen Zusammenhänge etwas besser grafisch dar.

Schnell wird also klar, mit welchen Zahlen solche Systeme umgehen müssen und diese Berechnungen werden milliardenfach pro Sekunde ausgeführt. bfloat16 ist ein neuer Datentyp, der so in dieser Form bisher nur von Google verwendet wird. Er soll den Umfang von FP32 bieten, ohne aber die Genauigkeit übernehmen zu müssen, die in diesem Fall unnötig ist.

Keine neue Hardware – wohl aber dichter gepackt und wassergekühlt

An der eigentlichen Hardware in Form der Chips hat sich also nichts getan. Offenbar aber kann Google die Chips nun dichter zusammen packen und der eigene Interconnect, über den es keinerlei technische Details zur Bandbreite oder Anzahl der Links gibt, ist in der Lage mehr TPUs anzusprechen, so dass die Pods, in denen Google mehrere Dutzend mit hunderten oder gar tausenden TPUs betreibt, größer werden. Bisher bestanden solche Pods aus 64 TPUs. Diese erbringen eine Rechenleistung von 11,5 PFLOPS und bieten 4 TB an HBM2. Die neue Pods können mehr als zehnmal so groß sein und erreichen eine Rechenleistung von 100 PFLOPS für INT8-Berechnungen, die für das Machine Learning wichtig sind.

Die TPUs der dritten Generation kommen allerdings nicht mehr mit einer Luftkühlung aus. Nicht, weil die Leistung derart gesteigert werden konnte, sondern weil Google sie in den Pods dichter zusammenpackt und die Abwärme über eine Wasserkühlung besser abgeleitet werden kann.

Inzwischen verwendet Google die TPUs aber nicht nur für eigene Anwendungen, sondern stellt sie auch in der eigenen Cloud zur Verfügung. Eine Cloud-TPU-Konfiguration besteht aus vier dieser Chips, kommt also auf 64 GB HBM2 und acht „Dual-Cores". Diese kleinste Cloud-TPU-Konfiguration kann durch Nutzer angemietet werden. Die Kosten belaufen sich auf 6,50 US-Dollar pro Cloud-TPU und Stunde.

Social Links

Ihre Bewertung

Ø Bewertungen: 5

Tags

Kommentare (5)

#1
customavatars/avatar191989_1.gif
Registriert seit: 12.05.2013

Vizeadmiral
Beiträge: 7677
Die Wasserkühlung sieht irgendwie nach vor 15 Jahren aus :D Aber ich gehe mal schwer davon aus, dass die da sehr viel Hirnschmalz rein gesteckt haben^^
#2
customavatars/avatar3377_1.gif
Registriert seit: 15.11.2002
www.twitter.com/aschilling
[printed]-Redakteur
Tweety
Beiträge: 31212
Das sieht immer etwas "wilder" aus, als man das von den sauberen Installationen vieler Desktop-Wasserkühlungen kennt: https://twitter.com/hardwareluxx_de/status/981545723211771904
#3
Registriert seit: 26.09.2007
Kärnten/Österreich
Kapitän zur See
Beiträge: 3119
naja hier gehts wohl auch eher darum möglichst effektiv und wartungseinfach zu sein.

Was mit einer Kupferplatte und den einfach zu steckenden Schläuchen durchaus erreicht worden sein dürfte.

Schönheit stand hier sicher nie zur Debatte :D
#4
Registriert seit: 02.11.2004

Mr. Freelancer
Beiträge: 4655
...


Ja, da braucht's eben kein RGB Firlefanz, auch müssen die Leitungen nicht rosa sein :)

Das sieht für mich nach einer perfekten Wasserkühlung aus, ... klare Ansage, kein BlingBling, effektiv und einfach zu warten, wie's mein Vorredner bereits auf den Punkt gebracht hat.

Wenn, dann möchte ich auch sowas.

...

Das Teil sieht ja auch super aus und hat Stil, wie die Wasserkühlung auch.

https://www.zurich.ibm.com/st/quantum/superconductingcircuits.html

...
#5
customavatars/avatar89889_1.gif
Registriert seit: 19.04.2008
PorscheTown
Vizeadmiral
Beiträge: 7063
Zitat Arkos;26303763
...


Ja, da braucht's eben kein RGB Firlefanz, auch müssen die Leitungen nicht rosa sein :)

Das sieht für mich nach einer perfekten Wasserkühlung aus, ... klare Ansage, kein BlingBling, effektiv und einfach zu warten, wie's mein Vorredner bereits auf den Punkt gebracht hat.

Wenn, dann möchte ich auch sowas.

...

Das Teil sieht ja auch super aus und hat Stil, wie die Wasserkühlung auch.

https://www.zurich.ibm.com/st/quantum/superconductingcircuits.html

...

Dem würde ich mich Anschließen, schlichtes Design bei bedachten Materialien. (Vollkupfer)
Hat auch den Vorteil, die WaKü ist leichter und beansprucht nicht soviel mechanische Temperatur Koeffiziente seitens des Mainboard (Mutter-Brett)
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

  • Gelungener Feinschliff: AMD Ryzen 7 2700X und Ryzen 5 2600X im Test

    Logo von IMAGES/STORIES/2017/AMD_RYZEN_7_2700X

    Rund ein Jahr nach dem Start der Ryzen-Prozessoren legt AMD nach und bringt die zweite Generation in den Handel. Die soll schneller und effizienter arbeiten und den Druck auf Intel weiter erhöhen. Allerdings lautet die Devise Evolution statt Revolution, statt gravierender Änderungen gibt es vor... [mehr]

  • AMD Ryzen Threadripper 2990WX und 2950X im Test: Mit Vollgas an Intel vorbei

    Logo von IMAGES/STORIES/2017/AMD_THREADRIPPER_2950X

    Pünktlich zum ersten Geburtstag startet AMD den Ryzen-Threadripper-Generationswechsel. Und wie schon im Frühjahr beim Sprung von Ryzen 1 zu Ryzen 2 vertraut man auf zwei Dinge: mehr Kerne und einen geringeren Preis. Beide sollen dabei helfen, dem Dauerrivalen Intel im... [mehr]

  • Intel Core i9-9900K im Test: Acht Kerne mit Luxuszuschlag

    Logo von IMAGES/STORIES/2017/INTEL_CORE_I9-9900K

    Nach monatelangen Spekulationen und zahlreichen durchgesickerten Informationen hat Intel vor knapp zwei Wochen seine neunte Generation der Core-Prozessoren vorgestellt. Ins Rennen werden mit dem Core i5-9600K, Core i7-9700K und Core i9-9900K zunächst drei Modelle geschickt, die nicht nur... [mehr]

  • Intel mit eigenen Benchmarks zum i9-9900K, i9-9980XE und i9-9900X (5. Update)

    Logo von IMAGES/STORIES/2017/INTEL

    Am gestrigen Nachmittag präsentierte Intel die kommenden Produktlinien bei den Desktop-Prozessoren. Besonders interessant sind dabei natürlich die Core-Prozessoren der 9. Generation, die mit dem Core i9-9900K nun auch ein Modell mit acht Kernen und 16 Threads beinhalten. Im November wird es... [mehr]

  • AMD soll Ryzen 7 2800X mit 10 Kernen in Vorbereitung haben

    Logo von IMAGES/STORIES/2017/AMD_RYZEN_TEASER_100

    Auf der spanischen Seite El chapuzas Informatico ist ein Bild aufgetaucht, welches die Cinebench-Ergebnisse eines Ryzen 7 2800X zeigen soll. Derzeit lässt sich die Echtheit des Screenshots nicht bestätigen und bisher sind auch noch keine weiteren Informationen zu einem Ryzen 7 2800X... [mehr]

  • Intel Core i7-8086K im Test: Kein Geschenk zum Jubiläum

    Logo von IMAGES/STORIES/2017/INTEL_CORE_I7_8086K

    Zum Jubiläum wollte Intel seinen Fans etwas Besonderes spendieren. Doch der Core i7-8086K, mit dem das Unternehmen den 40. Geburtstag der x86-Technik feiert, entpuppt sich im Test als wenig außergewöhnlich und ein wenig lieblos für ein solches Jubiläumsmodell. Selbst Fans der Marke... [mehr]