> > > > Chinesisches Unternemen Cambricon entwickelt AI-Chip für Datacenter

Chinesisches Unternemen Cambricon entwickelt AI-Chip für Datacenter

Veröffentlicht am: von

cambriconDer Markt an Anbietern für AI im Datacenter-Segment wird um einen weiteren Hersteller erweitert. Allerdings ist Cambricon Technologies bereits an der Entwicklung der AI-IP im Kirin 970 von Huawei beteiligt gewesen, der unter anderem im Huawei Mate 10 Pro zum Einsatz kommt. Die Cambricon-1A getaufte IP (Intellectual Property) kann von weiteren SoC-Herstellern lizenziert wird, kommt bisher aber nur im Kirin 970 zum Einsatz.

Nun aber geht Cambricon Technologies den nächsten Schritt und stellt einen großen AI-Chip für den Einsatz im Datacenter vor. Die Eckdaten: 64 TFLOPS bei halber Genauigkeit, 128 TOPS bei INT8-Berechnungen. Bei Bedarf kann die Rechenleistung sogar noch gesteigert werden. Gefertigt wird der Cambricon MLUv01/MLU100 bei TSMC in 16 nm. Bei einem Takt von 1 GHz wird oben genannte Rechenleistung erreicht. Zum Vergleich: Eine NVIDIA Tesla V100 im SXM2-Format kommt auf 120 TFLOPS für INT8 und 30 TFLOPS bei halber Genauigkeit. Anders als der Cambricon MLU100 bietet NVIDIA hier aber auch einfache und doppelte Genauigkeit. Auf 1,3 GHz liefert der MLU100 83,2 TFLOPS für halbe Genauigkeit und 166,4 TOPS für INT8. Dann steigt die Leistungsaufnahme aber auch auf 110 W an.

An Speicher bietet der AI-Beschleuniger 16 oder 32 GB DDR4-3200, die über ein 256 Bit breites Speicherinterface angebunden sind, ECC-Unterstützung bieten und eine Speicherbandbreite von 102,4 GB/s erreichen. Die Speicherbandbreite ist also wesentlich geringer als bei den Konkurrenzprodukten.

Gegenüberstellung der AI-Beschleuniger
Modell Cambricon MLU100Cambricon MLU100 Boost NVIDIA Tesla V100 (SXM2)NVIDIA Tesla V100 (PCIe)Google TPU
Fertigung 16 nm16 nm 12 nm12 nm-
Transistoren -- 21 Milliarden21 Milliarden-
Architektur Cambricon-MCambricon-M VoltaVolta-
TDP 80 W110 W 300 W250 W-
Kerne / Shader -- 5.1205.120-
Takt 1,0 GHz1,3 GHz 1.455 MHz1.370 MHz-
Speicher DDR4-3200DDR4-3200 HBM2HBM2HBM2
Speicherkapazität 16 / 32 GB16 / 32 GB 16 / 32 GB16 / 32 GB16 GB
Speicherinterface 256 Bit256 Bit 4.096 Bit4.096 Bit-
Speicherbandbreite 102,4 GB/s102,4 GB/s 900 GB/s900 GB/s600 GB/s
Halbe Genauigkeit 64 TFLOPS83,2 TFLOPS 30 TFLOPS28 TFLOPS-
Einfache Genauigkeit -- 15 TFLOPS14 TFLOPS-
Doppelte Genauigkeit -- 7,5 TFLOPS7 TFLOPS-
INT8 128 TOPS166,4 TOPS 120 TOPS112 TOPS45 TOPS

Der Cambricon MLU100 wird derzeit auf einer PCI-Express-Karte verbaut. Damit ist sie mit der NVIDIA Tesla V100 als PCI-Express-Variante vergleichbar. Lenovo scheint den Beschleuniger in sein ThinkSystem SR650 einzubauen. Die Server sind aber noch nicht verfügbar. Huawei betreibt aber auch eigene Server sowie AI-Forschung und wird die Cambricon MLU100 dort wohl ebenfalls schon einsetzen.

Noch ein paar Fragezeichen gibt es hinsichtlich der Softwareunterstützung. Es gibt SDKs für TensorFlow, Caffe und MXNe, doch in wie weit diese die Hardware auch vollständig ansprechen können, bleibt unbekannt. Natürlich arbeitet man auch schon an der nächsten Generation alias Cambricon-1M. Diese soll in 7 nm gefertigt werden und eine Effizienz von 5 TOPS/Watt aufweisen. Dies wäre eine deutliche Steigerung gegenüber den aktuellen 1,6 W/TOPS.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (2)

#1
customavatars/avatar169480_1.gif
Registriert seit: 06.02.2012

Bootsmann
Beiträge: 577
"Chinesisches Unternemen"...
#2
Registriert seit: 14.12.2006
Schweiz
Oberbootsmann
Beiträge: 989
Nur 100GB/s Speicher wird bei 64 TFLOPs FP16 aber zur massiven Bremse. Da sehen dann die effektiven Werte bei GEMM/Conv Operationen wohl eher nach 4 TFLOPs aus.
Ausser sie haben einen absolut massiven local-memory cache, welcher dann ungefähr 4 bis 16MB gross sein müsste (ca. 112KB bei AMD und nVidia pro ~256 CUs).

Da fehlen halt massiv viele Angaben um zu entscheiden, ob das Ding jetzt wirklich so toll ist wie ein V100. Ich denke die Antwort ist Nein.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Intel kämpft mit schwerer Sicherheitslücke (Update: Intel veröffentlicht...

Logo von IMAGES/STORIES/2017/INTEL

Vor, während und zwischen den Feiertagen herrschte ein wildes Treiben in der Linux-Community. Zunächst war nicht ganz klar, was hier genau vor sich geht, inzwischen aber scheinen die Auswirkungen deutlich zu werden: Intel hat nach einer Lücke in der Management Unit eines jeden... [mehr]

Coffee Lake: Intel Core i7-8700K, i5-8600K und i5-8400 im Test

Logo von IMAGES/STORIES/2017/INTEL8GEN

Der sechste und letzte (?) CPU-Launch in diesem Jahr kommt von Intel: Mit den unter dem Codenamen Coffee Lake zusammengefassten Core-i7- und i5-Modellen kommen bei Intel erstmals Sechskern-Prozessoren in den Mainstream-Markt. Bedanken darf man sich aber wohl nicht bei Intel, sondern bei der... [mehr]

Coffee Lake: Overclocking-Check

Logo von IMAGES/STORIES/LOGOS-2016/KABYLAKE

Nach dem ausführlichen Overclocking-Check für Skylake-Prozessoren sowie dem Overclocking-Check für Kaby Lake-Prozessoren ist es nach Veröffentlichung der neuen Generation mit Codenamen Coffee-Lake erneut Zeit für einen Overclocking-Check. Wir werfen einen Blick auf die Übertaktbarkeit... [mehr]

Intel Core i5-8250U und i7-8550U im Test: Mal ein kleiner, mal ein großer...

Logo von IMAGES/STORIES/2017/MEDION_P7649_KABY_LAKE_REFRESH

Im Gleichschritt marschierten Intels Desktop- und Mobil-Prozessoren schon länger nicht mehr. Ein so gravierender Unterschied wie derzeit ist aber völlig neu - und für den Verbraucher einmal mehr irritierend. Denn mit der 8. Core-Generation spendiert Intel beiden Plattformen eine eigene... [mehr]

Gelungener Feinschliff: AMD Ryzen 7 2700X und Ryzen 5 2600X im Test

Logo von IMAGES/STORIES/2017/AMD_RYZEN_7_2700X

Rund ein Jahr nach dem Start der Ryzen-Prozessoren legt AMD nach und bringt die zweite Generation in den Handel. Die soll schneller und effizienter arbeiten und den Druck auf Intel weiter erhöhen. Allerdings lautet die Devise Evolution statt Revolution, statt gravierender Änderungen gibt es vor... [mehr]

AMD Ryzen 5 2400G und Ryzen 3 2200G im Test: Die Lücke ist gestopft

Logo von IMAGES/STORIES/2017/AMD_RYZEN_5_2400G

Während Notebook-Käufer sich bereits seit einigen Wochen von den Vorzügen der Zen-basierten Raven-Ridge-APUs überzeugen können, musste sich das Desktop-Lager noch gedulden. Nun aber heißt es auch hier: Intel erhält neue Konkurrenz. Und die könnte einen noch größeren Einfluss als die... [mehr]