> > > > NVIDIA Tesla P100 als stärkster GPU-Beschleuniger nun auch mit PCIe-Interface

NVIDIA Tesla P100 als stärkster GPU-Beschleuniger nun auch mit PCIe-Interface

DruckenE-Mail
Erstellt am: von

nvidia tesla p100 pcie logoAuf der GPU Technology Conference 2016 präsentierte NVIDIA überraschend nicht nur die Pascal-Architektur, sondern mit der Tesla P100 auch gleich einen dazugehörigen GPU-Beschleuniger. Die zunächst vorgestellten Tesla-P100-Module sind bislang aber nur als feste Octa-Konfiguration, z.B. im NVIDIA DGX-1, erhältlich und verwenden dort NVLink um untereinander und mit weiteren Komponenten zu kommunizieren.

Es war nur eine Frage der Zeit, bis auch eine PCI-Express-Variante vorgestellt wird und diesen Zeitpunkt haben wir mit dem heutigen Tage erreicht. Zunächst einmal aber wollen wir auf unsere Berichterstattung zur GPU Technology Conference 2016 verweisen, auf deren Keynote die Tesla P100 vorgestellt wurde. Außerdem schauten wir uns die Pascal-Architektur, besonders mit dem Fokus auf die Compute-Eigenschaften, an. Denn auch wenn die Pascal-Architektur in Form der GP104-GPU auf der GeForce GTX 1080 zum Einsatz kommt, so gibt es doch einige wichtige Unterschiede. Der Unified Memory, eine ECC-Absicherung des HBM2 sowie NVLink sind nur einige wenige Punkte. Wer sich die Octa-Konfiguration eines DGX-1 einmal etwas anschauen möchte, für den gibt es auch eine entsprechende Meldung bei uns.

NVIDIA Tesla P100
NVIDIA Tesla P100

Doch zurück zur Tesla P100 mit PCI-Express-Interface. Sie bietet die identischen Ansätze zum Einsatzgebiet. Überall dort wo eine hohe Rechenleistung auf möglichst kleinen Raum gefragt ist, will NVIDIA mit der Tesla P100 das richtige Produkt bieten können. Im Fokus befinden sich dabei besonders Deep-Learning-Netzwerke, die im Trainings-Prozess von einer hohen FP16-Rechenleistung sowie der schnellen Speicheranbindung profitieren.

In nahezu allen Anwendungsbereichen zeigt die Tesla P100 deutliche Vorteile im Vergleich zu den GPU-Beschleunigern auf Basis der Maxwell-Architektur. Natürlich profitieren davon besonders solche Netzwerke, die auf die NVIDIA-Schnittstelle hin optimiert worden sein. Dazu gehören unter anderem Caffe und Alexnet.

NVIDIA Tesla P100NVIDIA Tesla P100

NVIDIA Tesla P100

Hinsichtlich der Hardware gibt es einige Unterschiede zwischen der Tesla P100 in NVLink basierten Servern und der PCI-Express-Variante. So liegt die Rechenleistung der NVLink-Variante mit 5,3 TFLOPS bei doppelter und 10,6 TFLOPS bei einfacher Genauigkeit etwas höher, als bei den beiden PCI-Express-Varianten. Dies ist vermutlich dem Design der Kühlung sowie den Einschränkungen durch die PCI-Express-Spezifikation geschuldet. NVIDIA bietet aber auch unterschiedliche Speicherkonfigurationen an. Die Rechenleistung liegt bei 4,7 TFLOPS bei doppelter und 9,3 TFLOPS bei einfacher Genauigkeit . Die für Deep-Learning-Netzwerke wichtige FP16-Rechenleistung wird von 21 TFLOPS auf 18,7 TFLOPS reduziert.

NVIDIA Tesla P100
NVIDIA Tesla P100

Der Speicherausbau mit 16 GB HBM2 ist in der ersten Konfiguration bei einer Speicherbandbreite von 720 GB/s identisch. Die zweite Konfiguration sieht eine Ausstattung mit 12 GB bei einer Speicherbandbreite von 540 GB/s vor. Während die Tesla P100 mit NVLink theoretisch über 160 GB/s im Server angebunden werden kann, ist die Bandbreite bei PCI-Express auf 32 GB/s bidirektional limitiert. Dies ist wohl auch eine der wichtigen Einschränkungen der PCI-Express-Variante.

Die Tesla P100 mit PCI-Express-Interface soll im 4. Quartal erhältlich sein. NVIDIA nennt bei der Verfügbarkeit Partner wie Cray, Dell, Hewlett Packard Enterprise, IBM und SGI. Der Preis ist bisher unbekannt.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (6)

#1
Registriert seit: 10.01.2015

Bootsmann
Beiträge: 541
Da hat entweder jemand Tesla als Auto gekauft oder zuviel Fallout gespielt :D
#2
Registriert seit: 20.09.2015

Hauptgefreiter
Beiträge: 182
Du hast die News anscheinend mit sehr viel Begeisterung geschrieben. Dadurch ist der Text etwas Wirr und nicht ganz komfortabel zu lesen. Der Kollege von CB hat es etwas besser hingekriegt.

Zum Thema. Wenn ich das richtig verstanden habe, ist FirePro S9300 X2 mit 50W mehr TDP und 13,9 TFlops bei einfacher Genauigkeit leistungsfähiger. Gab es schon Tests zu HBM2? Interessant zu wissen wäre, wie HBM1 ausbremst und natürlich auch der Preis der P100. Dann könnte man vergleichen und schauen, wo man mehr pro Euro kriegt.

Edit: Für eine neutrale Berichterstattung fehlt mir sehr oft die Erwähnung von Mitbewerbern (egal worum es gerade geht). Man könnte auch denken, es ist Native Advertising. Und wenn das so wäre, wäre eine entsprechende Kennzeichnung als Werbung angebracht.
#3
customavatars/avatar33106_1.gif
Registriert seit: 09.01.2006

Admiral
Beiträge: 15009
@StefanG3 - zwecks Performance:

http://ambermd.org/gpus/images/dhfr_nve_4fs_amber16.0.0.png
#4
customavatars/avatar7384_1.gif
Registriert seit: 05.10.2003
Nahe Dortmund
Flottillenadmiral
Beiträge: 5157
9,3TF - 720GB/s ... die wird nicht günstig :(

Aber schnell :)
#5
customavatars/avatar33106_1.gif
Registriert seit: 09.01.2006

Admiral
Beiträge: 15009
Naja da es ne HPC Karte ist und keine GeForce Treiber in dem Sinne gibt, ist es für uns egal wie schnell sie ist.

Im Renderbereich bei meinem Kollegen wäre die Karte gern gesehen, aber nicht bezahlbar - da lässt man lieber über Renderfarmen alles bearbeiten und hat dazu ne dicke Standleitung.
#6
Registriert seit: 07.06.2013

Stabsgefreiter
Beiträge: 335
na ja, im Bereich des ML wird sie gegen Googles optimierten ASIC einen sehr schwerend Stand haben
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Roundup: 5x GeForce GTX 1070 mit Custom-Design im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/5X-GTX1070/GTX1070_CUSTOM_ROUNDUP-TEASER

Nachdem wir bereits eine Reihe von Boardpartner-Karten der NVIDIA GeForce GTX 1080 ausführlich getestet haben, holen wir gleiches nun für das kleinere Schwestermodell nach, denn auch von der NVIDIA GeForce GTX 1070 gibt es viele Custom-Modelle mit höheren Taktraten, eigenen Kühlsystemen und... [mehr]

Drei Custom-Modelle der GeForce GTX 1060 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/3X-GTX1060/GTX1060_ROUNDUP_TEST-TEASER

Anders als bei der GeForce GTX 1080 und GeForce GTX 1070 trudelten wenige Stunden nach unserem Test zur Founders Edition der NVIDIA GeForce GTX 1060 schon die ersten Boardpartner-Karten mit teils höheren Taktraten, eigenem Kühlsystem und überarbeitetem Platinenlayout ein. Sie dürften... [mehr]

NVIDIA GeForce GTX 1080 mit Pascal-Architektur im XXL-Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Heute ist es soweit: NVIDIA läutet mit der GeForce GTX 1080 und GTX 1070 auf Basis der Pascal-Architektur den diesjährigen Neustart bei den Grafikkarten ein. In Kürze wird wohl auch AMD seinen Beitrag zu diesem Thema leisten. Vor zehn Tagen lud NVIDIA die gesammelte Fachpresse nach Austin ein... [mehr]

Roundup: 5x GeForce GTX 1080 im Custom-Design im Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Nachdem wir uns die Founders Edition der GeForce GTX 1080 und GeForce GTX 1070 bereits angeschaut haben, folgen nun fünf Retail-Modelle, die wir in aller Ausführlichkeit unter die Lupe nehmen wollen. Aus den vielen Boardpartnern und unterschiedlichen Modellen haben wir uns solche von ASUS, EVGA,... [mehr]

AMD Radeon RX 480 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/RADEON-RX480/RADEON-RX480-REFERENCE-LOGO

Es ist also soweit: AMD startet die großangelegte Zurückeroberung des Grafikkartenmarktes mit der Radeon RX 480, die als erste Grafikkarte der Polaris-Generation mit gleichnamiger Architektur erscheint und die wir uns genauer anschauen können. Dabei versucht sich AMD an einem anderen Ansatz im... [mehr]

PowerColor Radeon RX 480 Red Devil im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/POWERCOLOR-RX480/POWERCOLOR-RX480REDDEVIL-LOGO

Mit der Radeon RX 480 will AMD zurück zu alter Stärke und hat daher über Monate hinweg die PR-Trommel geschlagen. Letztendlich dabei herausgekommen ist eine sehr gute Karte für einen niedrigen Preis, die aber nicht in allen Bereichen zu überzeugen weiß. Wohl größtes Manko der Karte sollte... [mehr]