> > > > Intel stellt Nervana NNP-L1000 alias Spring Crest für 2019 in Aussicht

Intel stellt Nervana NNP-L1000 alias Spring Crest für 2019 in Aussicht

Veröffentlicht am: von

intelAuf der AI DevCon hat Intel weitere Details zu Spring Crest, bzw. dem Neural Network Processor (NNP) veröffentlicht. Bisher stammen die letzten offizielle Informationen aus dem Herbst 2017 und sprachen von 32 GB HBM2, der über eine Speicherbandbreite von 1 TB/s verfügen sollte. Außerdem sollten eigene Processing Cluster zum Einsatz kommen, deren Entwicklung das Unternehmen Nervana bereits vor dem Kauf durch Intel begonnen hatte.

Nun aber gibt es weitere Informationen zum Nervana NNP-L1000. Dieser besteht aus zwölf Processing Cluster, die alle modernen Matrix-Multiplikationen und Datentypen verarbeiten können, die im Bereich Machine Learning wichtig sind. Dazu gehört auch bfloat16. Bei bfloat16 handelt es sich um einen neuen Datentyp, der so in dieser Form bisher nur von Google verwendet, bzw. dessen Verwendung angekündigt wurde. Er soll den Umfang von FP32 bieten, ohne aber die Genauigkeit übernehmen zu müssen, die in diesem Fall unnötig ist. Google verwendet diesen Datentyp unter anderem für seine Tensor Processing Units. Zudem gibt Intel bekannt, dass man die Unterstützung für bfloat16 auf weitere Produkte ausweiten wird. Dazu gehören die FPGAs, aber auch Xeon-Prozessoren.

Jeweils drei Processing Cluster verfügen über einen Speichercontroller, der wiederum 8 GB HBM2 ansteuert. Eine aufwändige Cache-Hierarchie soll es bis auf 2 MB pro Processing Cluster nicht geben, stattdessen steuert die Software den On-Chip-Speicher direkt an und verwendet diesen auch als Cache. Dazu verfügt der NNP-L1000 über zwölf Inter-Chip Links (ICL), die eine bi-direktionale Bandbreite von jeweils 100 GB/s aufweisen. Zur externen Anbindung mehrerer Chips sieht Intel einen Interconnect mit 300 GB/s vor und will darauf Latenzen von 790 ns und weniger erreichen. Die Thermal Design Power soll bei 210 W liegen.

Bei der Einschätzung der Rechenleistung müssen wir etwas ausholen. Intel spricht für das Test Vehicle Lake Crest von etwa 36 TFLOPS. Zum Vergleich: NVIDIAs Tesla V100 kommt auf 120 TFLOPS für INT8-Berechnungen, die beim Machine Learning entscheidend sind. Allerdings soll Lake Crest diese 40 TFLOPS bei einer Auslastung von 96 % auch wirklich erreichen, während die Tesla V100 je nach Anwendung auf nur 30 TFOPS und damit eine Auslastung von 25 % kommen soll. Als Vergleichsbasis verwendet Intel hier General Matrix to Matrix Multiplication (GEMM), bei denen Matrizen der Größenordnung A(1536, 2048) und B(2048, 1536) miteinander multipliziert werden. Die Auslastung soll auch für Matrizen A(6144, 2048) und B(2048, 1536) skalieren.

Spring Crest alias Nervana NNP-L1000 soll theoretisch bis zu 120 TFLOPS erreichen, in der Praxis eher im Bereich von 85 TFLOPS liegen und wäre damit auf Niveau der Tesla V100. Aufgrund der Auslastung rechnet Intel mit der Verfügbarkeit im Jahre 2019 damit, dass man drei bis viermal so schnell wie die dann verfügbaren GPU-Beschleuniger sein wird.

Gefertigt werden Lake Crest und Spring Crest übrigens nicht von Intel selbst, sondern TSMC. Lake Crest wird noch in 28 nm gefertigt, Spring Crest soll bereits in 16 nm gefertigt werden. Im Vergleich zu den Prozessoren, vor allem aber den GPU-Beschleunigern ist man hinsichtlich der Fertigung also deutlich im Nachteil. Wann genau im Jahre 2019 der Nervana NNP-L1000 nun erscheinen und was er kosten wird, darüber schweigt sich Intel noch aus.

Social Links

Ihre Bewertung

Ø Bewertungen: 4

Tags

Kommentare (0)

Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

  • Gelungener Feinschliff: AMD Ryzen 7 2700X und Ryzen 5 2600X im Test

    Logo von IMAGES/STORIES/2017/AMD_RYZEN_7_2700X

    Rund ein Jahr nach dem Start der Ryzen-Prozessoren legt AMD nach und bringt die zweite Generation in den Handel. Die soll schneller und effizienter arbeiten und den Druck auf Intel weiter erhöhen. Allerdings lautet die Devise Evolution statt Revolution, statt gravierender Änderungen gibt es vor... [mehr]

  • AMD Ryzen Threadripper 2990WX und 2950X im Test: Mit Vollgas an Intel vorbei

    Logo von IMAGES/STORIES/2017/AMD_THREADRIPPER_2950X

    Pünktlich zum ersten Geburtstag startet AMD den Ryzen-Threadripper-Generationswechsel. Und wie schon im Frühjahr beim Sprung von Ryzen 1 zu Ryzen 2 vertraut man auf zwei Dinge: mehr Kerne und einen geringeren Preis. Beide sollen dabei helfen, dem Dauerrivalen Intel im... [mehr]

  • Intel Core i9-9900K im Test: Acht Kerne mit Luxuszuschlag

    Logo von IMAGES/STORIES/2017/INTEL_CORE_I9-9900K

    Nach monatelangen Spekulationen und zahlreichen durchgesickerten Informationen hat Intel vor knapp zwei Wochen seine neunte Generation der Core-Prozessoren vorgestellt. Ins Rennen werden mit dem Core i5-9600K, Core i7-9700K und Core i9-9900K zunächst drei Modelle geschickt, die nicht nur... [mehr]

  • Intel mit eigenen Benchmarks zum i9-9900K, i9-9980XE und i9-9900X (5. Update)

    Logo von IMAGES/STORIES/2017/INTEL

    Am gestrigen Nachmittag präsentierte Intel die kommenden Produktlinien bei den Desktop-Prozessoren. Besonders interessant sind dabei natürlich die Core-Prozessoren der 9. Generation, die mit dem Core i9-9900K nun auch ein Modell mit acht Kernen und 16 Threads beinhalten. Im November wird es... [mehr]

  • AMD soll Ryzen 7 2800X mit 10 Kernen in Vorbereitung haben

    Logo von IMAGES/STORIES/2017/AMD_RYZEN_TEASER_100

    Auf der spanischen Seite El chapuzas Informatico ist ein Bild aufgetaucht, welches die Cinebench-Ergebnisse eines Ryzen 7 2800X zeigen soll. Derzeit lässt sich die Echtheit des Screenshots nicht bestätigen und bisher sind auch noch keine weiteren Informationen zu einem Ryzen 7 2800X... [mehr]

  • AMD Ryzen 3000: Acht Zen-2-Kerne mit PCIe 4.0 ab Mitte 2019

    Logo von IMAGES/STORIES/2017/RYZEN3000-CES19

    Neben der Vorstellung der Radeon Vega 7 als erste Gaming-GPU aus der 7-nm-Fertigung hat AMD eine Vorschau auf die Ryzen-Prozessoren der 3000er-Serie gegeben. Die als Matisse geführten Desktop-Prozessoren werden im Sockel AM4 Platz finden, basieren aber auf der neuen Zen-2-Architektur und bieten... [mehr]