> > > > NVIDIA Tesla P100 als stärkster GPU-Beschleuniger nun auch mit PCIe-Interface

NVIDIA Tesla P100 als stärkster GPU-Beschleuniger nun auch mit PCIe-Interface

Veröffentlicht am: von

nvidia tesla p100 pcie logoAuf der GPU Technology Conference 2016 präsentierte NVIDIA überraschend nicht nur die Pascal-Architektur, sondern mit der Tesla P100 auch gleich einen dazugehörigen GPU-Beschleuniger. Die zunächst vorgestellten Tesla-P100-Module sind bislang aber nur als feste Octa-Konfiguration, z.B. im NVIDIA DGX-1, erhältlich und verwenden dort NVLink um untereinander und mit weiteren Komponenten zu kommunizieren.

Es war nur eine Frage der Zeit, bis auch eine PCI-Express-Variante vorgestellt wird und diesen Zeitpunkt haben wir mit dem heutigen Tage erreicht. Zunächst einmal aber wollen wir auf unsere Berichterstattung zur GPU Technology Conference 2016 verweisen, auf deren Keynote die Tesla P100 vorgestellt wurde. Außerdem schauten wir uns die Pascal-Architektur, besonders mit dem Fokus auf die Compute-Eigenschaften, an. Denn auch wenn die Pascal-Architektur in Form der GP104-GPU auf der GeForce GTX 1080 zum Einsatz kommt, so gibt es doch einige wichtige Unterschiede. Der Unified Memory, eine ECC-Absicherung des HBM2 sowie NVLink sind nur einige wenige Punkte. Wer sich die Octa-Konfiguration eines DGX-1 einmal etwas anschauen möchte, für den gibt es auch eine entsprechende Meldung bei uns.

NVIDIA Tesla P100
NVIDIA Tesla P100

Doch zurück zur Tesla P100 mit PCI-Express-Interface. Sie bietet die identischen Ansätze zum Einsatzgebiet. Überall dort wo eine hohe Rechenleistung auf möglichst kleinen Raum gefragt ist, will NVIDIA mit der Tesla P100 das richtige Produkt bieten können. Im Fokus befinden sich dabei besonders Deep-Learning-Netzwerke, die im Trainings-Prozess von einer hohen FP16-Rechenleistung sowie der schnellen Speicheranbindung profitieren.

In nahezu allen Anwendungsbereichen zeigt die Tesla P100 deutliche Vorteile im Vergleich zu den GPU-Beschleunigern auf Basis der Maxwell-Architektur. Natürlich profitieren davon besonders solche Netzwerke, die auf die NVIDIA-Schnittstelle hin optimiert worden sein. Dazu gehören unter anderem Caffe und Alexnet.

NVIDIA Tesla P100NVIDIA Tesla P100

NVIDIA Tesla P100

Hinsichtlich der Hardware gibt es einige Unterschiede zwischen der Tesla P100 in NVLink basierten Servern und der PCI-Express-Variante. So liegt die Rechenleistung der NVLink-Variante mit 5,3 TFLOPS bei doppelter und 10,6 TFLOPS bei einfacher Genauigkeit etwas höher, als bei den beiden PCI-Express-Varianten. Dies ist vermutlich dem Design der Kühlung sowie den Einschränkungen durch die PCI-Express-Spezifikation geschuldet. NVIDIA bietet aber auch unterschiedliche Speicherkonfigurationen an. Die Rechenleistung liegt bei 4,7 TFLOPS bei doppelter und 9,3 TFLOPS bei einfacher Genauigkeit . Die für Deep-Learning-Netzwerke wichtige FP16-Rechenleistung wird von 21 TFLOPS auf 18,7 TFLOPS reduziert.

NVIDIA Tesla P100
NVIDIA Tesla P100

Der Speicherausbau mit 16 GB HBM2 ist in der ersten Konfiguration bei einer Speicherbandbreite von 720 GB/s identisch. Die zweite Konfiguration sieht eine Ausstattung mit 12 GB bei einer Speicherbandbreite von 540 GB/s vor. Während die Tesla P100 mit NVLink theoretisch über 160 GB/s im Server angebunden werden kann, ist die Bandbreite bei PCI-Express auf 32 GB/s bidirektional limitiert. Dies ist wohl auch eine der wichtigen Einschränkungen der PCI-Express-Variante.

Die Tesla P100 mit PCI-Express-Interface soll im 4. Quartal erhältlich sein. NVIDIA nennt bei der Verfügbarkeit Partner wie Cray, Dell, Hewlett Packard Enterprise, IBM und SGI. Der Preis ist bisher unbekannt.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (6)

#1
Registriert seit: 10.01.2015

Oberbootsmann
Beiträge: 1004
Da hat entweder jemand Tesla als Auto gekauft oder zuviel Fallout gespielt :D
#2
Registriert seit: 20.09.2015

Hauptgefreiter
Beiträge: 254
Du hast die News anscheinend mit sehr viel Begeisterung geschrieben. Dadurch ist der Text etwas Wirr und nicht ganz komfortabel zu lesen. Der Kollege von CB hat es etwas besser hingekriegt.

Zum Thema. Wenn ich das richtig verstanden habe, ist FirePro S9300 X2 mit 50W mehr TDP und 13,9 TFlops bei einfacher Genauigkeit leistungsfähiger. Gab es schon Tests zu HBM2? Interessant zu wissen wäre, wie HBM1 ausbremst und natürlich auch der Preis der P100. Dann könnte man vergleichen und schauen, wo man mehr pro Euro kriegt.

Edit: Für eine neutrale Berichterstattung fehlt mir sehr oft die Erwähnung von Mitbewerbern (egal worum es gerade geht). Man könnte auch denken, es ist Native Advertising. Und wenn das so wäre, wäre eine entsprechende Kennzeichnung als Werbung angebracht.
#3
Registriert seit: 01.01.1970


Beiträge:
@StefanG3 - zwecks Performance:

http://ambermd.org/gpus/images/dhfr_nve_4fs_amber16.0.0.png
#4
customavatars/avatar7384_1.gif
Registriert seit: 05.10.2003
Nahe Dortmund
Vizeadmiral
Beiträge: 6591
9,3TF - 720GB/s ... die wird nicht günstig :(

Aber schnell :)
#5
Registriert seit: 01.01.1970


Beiträge:
Naja da es ne HPC Karte ist und keine GeForce Treiber in dem Sinne gibt, ist es für uns egal wie schnell sie ist.

Im Renderbereich bei meinem Kollegen wäre die Karte gern gesehen, aber nicht bezahlbar - da lässt man lieber über Renderfarmen alles bearbeiten und hat dazu ne dicke Standleitung.
#6
Registriert seit: 07.06.2013

Stabsgefreiter
Beiträge: 316
na ja, im Bereich des ML wird sie gegen Googles optimierten ASIC einen sehr schwerend Stand haben
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

  • Die GeForce RTX 2080 Ti und RTX 2080 Founders Edition im Test

    Logo von IMAGES/STORIES/2017/GEFORCERTX2080

    Heute nun ist es endlich soweit und wir präsentieren die vollständigen Leistungsdaten und Messwerte zu den beiden ersten Karten der GeForce-RTX-20-Serie von NVIDIA. Nach der Vorstellung der Pascal-Architektur im Mai 2016 sind die neuen Karten für NVIDIA in vielerlei Hinsicht ein... [mehr]

  • Kleiner Turing-Ausbau: Gigabyte GeForce RTX 2070 WindForce 8G im Test

    Logo von IMAGES/STORIES/2017/GIGABYTE-RTX2070-WINDFORCE-LOGO

    Gestern war es soweit und mit der GeForce RTX 2070 startet die vorerst "kleinste" GeForce-RTX-Karte der neuen Serie von NVIDIA. Mit der Gigabyte GeForce RTX 2070 Windforce 8G haben wir ein Partnermodell im Test, denn die Founders Edition ist bislang noch nicht verfügbar. Erwartet wird die GeForce... [mehr]

  • GeForce RTX 2080 Ti von ASUS und MSI im Test

    Logo von IMAGES/STORIES/2017/ASUS-STRIX-RTX2080TI-25_EBA36C79E22348199FB2B590657E5413

    Nach den ersten drei Modellen der GeForce RTX 2080 schauen wir uns nun zwei Custom-Varianten der GeForce RTX 2080 Ti an. Diese stammen aus dem Hause ASUS und MSI, unterscheiden sich äußerlich in einigen Aspekten natürlich, sind sich auf den zweiten Blick aber ähnlicher als man denken möchte.... [mehr]

  • Die GeForce RTX 2080 Ti leidet offenbar an erhöhter Ausfallrate (6. Update)

    Logo von IMAGES/STORIES/2017/GEFORCERTX2080TI

    Reddit und diverse Foren laufen heiß, denn seit einigen Tagen mehren sich die Berichte, nach denen es bei der GeForce RTX 2080 Ti zu einer erhöhten Ausfallrate kommt. Bestätigt ist dies bislang nicht, auch weil belastbare Zahlen fehlen und diese sicherlich nur durch NVIDIA selbst oder die... [mehr]

  • GeForce RTX 2080 von ASUS, Gigabyte und PNY im Test

    Logo von IMAGES/STORIES/2017/ASUS-GEFORCE-RTX

    Nach dem Test der GeForce RTX 2080 in der Founders Edition, wollen wir uns nun die ersten Custom-Modelle genauer anschauen. Diese stammen von ASUS, Gigabyte sowie PNY. Zwei Modelle verwenden das Referenz-PCB von NVIDIA, eines baut aber auch schon auf einem eigenen PCB des Herstellers auf. Eine... [mehr]

  • ASUS ROG Strix GeForce RTX 2070 OC im Test

    Logo von IMAGES/STORIES/2017/ASUS-ROG-RTX2070

    Nach dem ersten Einstiegsmodell können wir uns nun auch eines der schnelleren Modelle der GeForce RTX 2070 anschauen. Die ASUS ROG Strix GeForce RTX 2070 OC ist eine typische ROG-Strix-Lösung, die das Maximum aus der Hardware herausholen soll. Allerdings gönnt sich ASUS auch einen... [mehr]