> > > > Intel verrät weitere Details zum Nervana NNP-L1000

Intel verrät weitere Details zum Nervana NNP-L1000

Veröffentlicht am: von

intel-nervana-nnp-l-1000Mitte Mai des vergangenen Jahres stelle Intel den Neural Network Processor (NNP) Nervana NNP L-1000 alias Spring Crest für 2019 in Aussicht. Nun hat der Chipriese auf der Linley Conference weitere Details zum Design verraten. Bereits bekannt ist, dass der NNP L-1000 ein ASIC-Design mit insgesamt 32 GB an HBM2 ist. Seine Rechenleistung soll die eines Prozessors, aber auch eines GPU-Beschleunigers in bestimmten Bereichen bei weitem überflügeln.

Auf der Linley Conference konnte sich David Schor von Wikichips.org einen weiteren Eindruck verschaffen und ist auch mit weiteren Informationen versorgt worden. Der Nervana NNP L-1000 besteht aus vier Pods zu je sechs Compute Clustern, die alle modernen Matrix-Multiplikationen und Datentypen verarbeiten können. Jeweils ein Pod verfügt über einen Speichercontroller, der wiederum jeweils 8 GB an HBM2 ansteuert. Einen lokalen Cache gibt es nicht, stattdessen verfügt jedes Processing Cluster über vergleichsweise üppige 2 MB an SRAM. Der Speicher ist relativ groß ausgelegt, da die Processing Cluster auf die Berechnung großer Matrizen ausgelegt sind und diese mit 1k x 1k x 1k oder gar 4k x 4k x 4k hinsichtlich ihrer Dimensionen auch viel Speicherplatz benötigen.

Die vier Pods sind über Inter-Chip Links (ICL) miteinander verbunden, die eine bi-direktionale Bandbreite von 100 GB/s erreichen. Es handelt sich dabei um eine Mesh-Topologie für den Interconnect. Zur externen Anbindung mehrerer Chips sieht Intel einen Interconnect mit 300 GB/s vor und will Latenzen von 790 ns und weniger erreichen. Der Nervana NNP L-1000 kann in Nodes zu jeweils vier Chips und dann in Racks zu jeweils zwei Nodes zusammengefasst werden. Ein solches Design sieht also acht dieser Chips auf dem selben PCB vor. Für größere Netzwerke können auch mehrere Racks untereinander verbunden werden. Bis zu 64 Chips sind möglich. 

Nervana NNP L-1000​ in 16 nm bei TSMC gefertigt

Intel fertigt den Nervana NNP L-1000 nicht selbst, sondern lässt ihn bei TSMC fertigen. Der Chip ist mit 741 mm² relativ groß und wird eigentlich nur noch von NVIDIAs GV100 mit 850 mm² überboten, der auf den Tesla-V100-GPU-Beschleunigern zum Einsatz kommt. Die Thermal Design Power soll bei 210 W liegen, während NVIDIA die TDP auf bis zu 450 W für seine Tesla V100 erhöht hat.

Unter anderem eingesetzt werden soll der Nervana NNP L-1000 in Form des OCP Accelerator Module (OAM). Intel plant aber auch den Chip auf PCI-Express-Karten zu verpflanzen.

Vorteil durch höhere Effektivität und Auslastung

Gerne prahlen die Hersteller mit Angaben zur Rechenleistung. Dies sind aber meist theoretische Werte, die in der Praxis kaum erreicht werden. An diesem Punkt setzt Intel an. Intel sprach Stand Frühjahr 2018 davon mit dem Nervana NNP L-1000 eine Rechenleistung von 36 TFLOPS zu erreichen. Zum Vergleich: NVIDIAs Tesla V100 kommt auf 120 TFLOPS für INT8-Berechnungen, die beim Machine Learning entscheidend sind. Allerdings soll Lake Crest diese 40 TFLOPS bei einer Auslastung von 96 % auch wirklich erreichen, während die Tesla V100 je nach Anwendung auf nur 30 TFOPS und damit eine Auslastung von 25 % kommen soll.

Diese Zahlen hat Intel auf der Linley Conference bestätigt, nennt für andere Größen der General Matrix to Matrix Multiplication (GEMM) nun aber andere Werte. Der Nervana NNP L-1000 soll theoretisch bis zu 120 TFLOPS erreichen, in der Praxis eher im Bereich von 85 TFLOPS liegen, wäre dann aber noch immer schneller als vergleichbare Hardware. Die höhere Auslastung der Hardware schlägt hier also die höhere Grund-Rechenleistung, die ein GPU-Beschleuniger aber nicht in echte Rechenleistung umsetzen kann.

Der Nervana NNP L-1000 wird derzeit in einem B-Stepping evaluiert und soll noch dieses Jahr verfügbar sein.

Nervana NNP I-1000 in 10 nm mit Ice-Lake-Kern

Während der Nervana NNP L-1000 für das Training von Deep-Learning-Netzwerken ausgelegt ist, soll der Nervana NNP I-1000 das Inferencing, also die Auswertung dieser Netzwerke, beschleunigen. Der unter dem Codenamen Spring Hill entwickelte Chip wird dann in 10 nm gefertigt und mit Sunny-Cove-Kern ausgestattet sein. Auch der Nervana NNP I-1000 soll gegen Ende des Jahres ausgeliefert werden.

Social Links

Ihre Bewertung

Ø Bewertungen: 1

Tags

Kommentare (2)

#1
customavatars/avatar97719_1.gif
Registriert seit: 29.08.2008

Fregattenkapitän
Beiträge: 2742
Also jetzt mal ehrlich, die Hälfte der Artikelüberschrift doppelt stehen zu lassen, ist jetzt aber kein reiner Flüchtigkeitsfehler mehr.

Bitte etwas mehr Sorgfalt an den Tag legen!
#2
customavatars/avatar3377_1.gif
Registriert seit: 15.11.2002
www.twitter.com/aschilling
[printed]-Redakteur
Tweety
Beiträge: 31342
Zitat Morrich;26904040
Also jetzt mal ehrlich, die Hälfte der Artikelüberschrift doppelt stehen zu lassen, ist jetzt aber kein reiner Flüchtigkeitsfehler mehr.

Bitte etwas mehr Sorgfalt an den Tag legen!


Mea culpa –*Ich habe noch was am Titel geändert und dabei ist ein Teil doppelt kopiert worden.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

  • AMD Ryzen Threadripper 2990WX und 2950X im Test: Mit Vollgas an Intel vorbei

    Logo von IMAGES/STORIES/2017/AMD_THREADRIPPER_2950X

    Pünktlich zum ersten Geburtstag startet AMD den Ryzen-Threadripper-Generationswechsel. Und wie schon im Frühjahr beim Sprung von Ryzen 1 zu Ryzen 2 vertraut man auf zwei Dinge: mehr Kerne und einen geringeren Preis. Beide sollen dabei helfen, dem Dauerrivalen Intel im... [mehr]

  • Intel Core i9-9900K im Test: Acht Kerne mit Luxuszuschlag

    Logo von IMAGES/STORIES/2017/INTEL_CORE_I9-9900K

    Nach monatelangen Spekulationen und zahlreichen durchgesickerten Informationen hat Intel vor knapp zwei Wochen seine neunte Generation der Core-Prozessoren vorgestellt. Ins Rennen werden mit dem Core i5-9600K, Core i7-9700K und Core i9-9900K zunächst drei Modelle geschickt, die nicht nur... [mehr]

  • Intel mit eigenen Benchmarks zum i9-9900K, i9-9980XE und i9-9900X (5. Update)

    Logo von IMAGES/STORIES/2017/INTEL

    Am gestrigen Nachmittag präsentierte Intel die kommenden Produktlinien bei den Desktop-Prozessoren. Besonders interessant sind dabei natürlich die Core-Prozessoren der 9. Generation, die mit dem Core i9-9900K nun auch ein Modell mit acht Kernen und 16 Threads beinhalten. Im November wird es... [mehr]

  • AMD soll Ryzen 7 2800X mit 10 Kernen in Vorbereitung haben

    Logo von IMAGES/STORIES/2017/AMD_RYZEN_TEASER_100

    Auf der spanischen Seite El chapuzas Informatico ist ein Bild aufgetaucht, welches die Cinebench-Ergebnisse eines Ryzen 7 2800X zeigen soll. Derzeit lässt sich die Echtheit des Screenshots nicht bestätigen und bisher sind auch noch keine weiteren Informationen zu einem Ryzen 7 2800X... [mehr]

  • AMD Ryzen 3000: Acht Zen-2-Kerne mit PCIe 4.0 ab Mitte 2019

    Logo von IMAGES/STORIES/2017/RYZEN3000-CES19

    Neben der Vorstellung der Radeon Vega 7 als erste Gaming-GPU aus der 7-nm-Fertigung hat AMD eine Vorschau auf die Ryzen-Prozessoren der 3000er-Serie gegeben. Die als Matisse geführten Desktop-Prozessoren werden im Sockel AM4 Platz finden, basieren aber auf der neuen Zen-2-Architektur und bieten... [mehr]

  • Intel Coffee Lake Refresh: Overclocking-Check

    Logo von IMAGES/STORIES/2017/INTEL_CORE_I9-9900K

    Nach dem Start der neuen Generation der Intel-Core-Prozessoren stellt sich die Frage, wie es um die Overclocking-Eigenschaften bestellt ist. Erste Ergebnisse lieferte bereits der Test des Core i9-9900K. Doch wie schon in den vergangenen Jahren soll ein umfangreicher Check zeigen, an welchen... [mehr]