> > > > GTC17: NVIDIA präsentiert die nächste GPU-Architektur Volta - Tesla V100 mit 5.120 Shadereinheiten und 16 GB HBM2

GTC17: NVIDIA präsentiert die nächste GPU-Architektur Volta - Tesla V100 mit 5.120 Shadereinheiten und 16 GB HBM2

Veröffentlicht am: von

nvidia-gtc

Wenig überraschend hat NVIDIAs CEO Jen-Hsun Huang heute auf der Keynote der GPU Technology Conference 2017 die nächste GPU-Architektur namens Volta vorgestellt. Erstmalig im März 2013 erwähnt, soll die Volta-Architektur die Basis für die zukünftigen Grafik- und Compute-Beschleuniger sein.

Wie im vergangenen Jahr mit der Pascal-Architektur präsentiert NVIDIA die Volta-Architektur zunächst für den HPC-Bereich. Die Tesla V100 ist der erste GPU-Beschleuniger, der die neue Volta-Architektur einsetzt. Die technischen Daten sind beeindruckend:

21 Milliarden Transistoren gefertigt in 12 nm bei TSMC und eine gigantische Chipfläche von 812 mm². 5.120 Shadereinheiten arbeiten auf der GV100-GPU. Über 100 Milliarden einzelne Verbindungen oder Wires sind in der GPU, dem HBM2 und dem Interposer vorhanden.

Die Rechenleistung beläuft sich auf 7,5 TFLOPS für Floating-Point-Berechnungen mit 64 Bit. Bei 32 Bit erreicht die Tesla V100 die doppelte Rechenleistung von 15 TFLOPS und im Deep-Learning-Bereich wichtigen INT8-Berechnungen werden 120 TFLOPS erreicht.

Im Chip selbst befinden sich 20 MB an Register-File-Cache sowie 16 MB an L3-Cache. Bereits angesprochen haben wir den HBM2, der 16 GB an Gesamtkapazität bietet und mit 900 MHz läuft. NVIDIA setzt auf HBM2 aus dem Hause Samsung, den man im Vergleich zur Tesla P100 noch einmal beschleunigen konnte. Die Speicherbandbreite liegt bei 900 GB/s. Das die Speicherkapazität im Vergleich zur Tesla P100 nicht weiter gesteigert werden konnte, liegt vermutlich an der noch immer schlechten Verfügbarkeit von HBM2 – vor allem mit mehr als vier Stacks.

Genauere Details zur Architektur gibt es derzeit noch nicht. NVIDIA hat aber einige Optimierungen vorgenommen, die besonders im Bereich des Deep-Learning eine wichtige Rolle spielen sollen. NVIDIA spricht nur nicht mehr nur von CUDA-Cores, den Shadereinheiten, sondern auch von einem Tensor Core. 640 dieser Tensor Cores sollen sich in der GV100-GPU befinden. Dabei handelt es sich um eine 4x4-Matrix als Recheneinheit, die spezielle Berechnungen deutlich schneller ausführen können soll.

NVIDIA betonte während der Keynote, dass die Volta-Architektur zunächst in der Tesla V100 eingesetzt wird, man die Grafiksparte aber nicht vergessen hat und so wurden auch einige 3D-Anwendungen gezeigt. Darunter war auch ein Live-Rendering von Square Enix.

Volta steht demzufolge auch im GeForce-Markt in den Startlöcher, wenngleich die ersten Tesla V100 GPU-Beschleuniger erst im dritten Quartal ausgeliefert werden sollen. Unklar ist auch, in welcher Form die Volta-Architektur für den Desktop erscheinen wird. HBM2 scheint noch immer recht schlecht verfügbar zu sein, so dass der Endkundenmarkt für NVIDIA womöglich keine Option ist. Mit GDDR6 will SK Hynix ab Anfang 2018 aber den bisher schnellsten DDR-Grafikspeicher liefern können – womöglich mit den dazugehörigen GPUs auf Basis der Volta-Architektur.

Die technischen Daten der Tesla V100 im Überblick
Modell NVIDIA Tesla P100 NVIDIA Tesla V100
Technische Daten
GPU GP100 GV100
Fertigung 16 nm 12 nm
Transistoren 15,3 Milliarden 21 Milliarden
Chipgröße 610 mm²
815 mm²
GPU-Takt (Base Clock) 1.328 MHz -
GPU-Takt (Boost Clock) 1.480 MHz 1.455 MHz
Speichertakt 737 MHz 878 MHz
Speichertyp HBM2 HBM2
Speichergröße 16 GB 16 GB
Speicherinterface 4.096 Bit 4.096 Bit Bit
Speicherbandbreite 720 GB/s 900 GB/s
Shadereinheiten 3.584 5.120
Typische Boardpower 300 W 300 W

NVLink 2.0

Ein schneller Interconnect ist ein wichtiger Bestandteil einer jeden HPC-Hardware. Alle großen Herstellern arbeiten daran ihre Hardware möglichst schnell untereinander und mit externen Komponenten zu verbinden. Mit NVLink präsentierte NVIDIA 2014 auf der GPU Technology Conference seinen eigenen Interconnect.

NVLink basiert auf dem High-Speed Signaling Interconnect (NVHS), eine Entwicklung von NVIDIA. NVLink der ersten Generation stellt in einer NVHS-Verbindung eine Bandbreite von 20 GBit/s und wird über ein Differential Connection ermöglicht. Acht dieser Connections ergeben einen Sub-Link. Zwei Sub-Links stellen wiederum einen Link dar und eben ein solcher Link stellt die Verbindungen zwischen zwei GPUs (GPU-to-GPU oder GPU-to-CPU) sicher. Ein solcher Link hat eine Bandbreite von 40 GB/s in beide Richtungen und für den eigentlichen Datentransfer stehen 97 % dieser Bandbreite zur Verfügung. Damit ist der Overhead sehr gering.

Bei NVLink 2.0 dreht NVIDIA an der Taktschraube. Erste Informationen dazu tauchten bereits im August 2016 im Zusammenhang mit IBMs POWER9-Prozessoren auf. Auch fiel damals schon der Name Volta. Mit Volta beschleunigt NVIDIA NVLink auf 300 GB/s für eine Verbindung von zwei Endpunkten mit der vollen Anzahl an NVLinks. Bisher waren in dieser Form mit NVLink der ersten Generation bis zu 160 GB/s möglich.

Wir werden diese Meldung in den nächsten Stunden noch um weitere Details erweitern, denn NVIDIA will auf der GPU Technology Conference weitere Details bekanntgeben.

Rechenleistung im Vergleich

Zur besseren Übersicht der Rechenleistung haben wir noch eine Tabelle erstellt, in der auch die bald erwarteten Radeon-Instinct-Modelle enthalten sind.

Rechenleistung von GPU-Beschleunigern im Überblick
Modell NVIDIA Tesla P100 NVIDIA Tesla V100 AMD Radeon Instinct MI25
GPU GP100 GV100 Vega
FP64 5,3 TFLOPS 7,5 TFLOPS -
FP32 10,6 TFLOPS 15 TFLOPS 12,5 TFLOPs
FP16 21,2 TFLOPS 30 TFLOPs -
IN8 - 120 TFLOPs -
FP64/FP32-Verhältnis 1/2 1/2 -
Speichertyp HBM2 GDDR5 HBM2
Speichergröße 16 GB 16 GB 16 GB
Speicherinterface 4.096 Bit 4.096 Bit -
Speicherbandbreite 720 GB/s 900 GB/s -
Shadereinheiten 3.840 5.120 4.096

Social Links

Ihre Bewertung

Ø Bewertungen: 5

Tags

Kommentare (75)

#66
customavatars/avatar70861_1.gif
Registriert seit: 19.08.2007
Bayern
Admiral
Beiträge: 11713
Zitat fideliovienna;25539455
Wo siehst du denn die ganzen Chips von SK Hynix? Glaubst du die produzieren seit Anfang 2016 auf Halde?

4GB 4Hi Stack Module HBM2 wurde von SK Hynix zuerst für Q3/16 angekündigt, Option auf 8GB Module für Q4/16, nur kam das nie so.
Im Jänner 2017 kam eine ähnliche Ankündigung von SK Hynix, also 4GB HBM2 in Kürze verfügbar, diesmal aber Q1/17

Hier ganz nett aufgeschlüsselt:
https://videocardz.com/65649/sk-hynix-updates-memory-product-catalog-hbm2-available-in-q1-2017

Keine Ahnung woher du glaubst zu wissen dass seit Anfang 2016 HBM2 produziert wird bei SK.
Aber sicher alles nur Fake news, SK produziert schon seit mehr als 1 Jahr HBM2, kostet ja nichts etwas auf Lager liegen zu lassen ohne Abnehmer.


Stimmt es gibt keine Verträge zwischen Firmen, die Abnahme etc. festlegen... oh wait

gerade bei einem problematischen Produkt wie HBM/HBM2 macht es Sinn möglichst früh zu produzieren, gerade wenn der Hauptabnehmer daran mitentwickelt hat und schon seit Jahren bekannt ist, dass Vega mit HBM2 erscheint (auch der Vega Release ist schon länger in Stein gemeißelt)

ps. woher ich weiß, dass SK schon seit Anfang 2016 oder früher HBM2 produziert?
Weil Samsung schon seit Anfang 2016 produziert und NICHT für die Entwicklung verantwortlich war.
Samsung Begins Mass Producing World’s Fastest DRAM – Based on Newest High Bandwidth Memory (HBM) Interface Samsung Global Newsroom
Wer weiß, ob AMD nur von SK Hynix HBM2 bezieht oder auch von Samsung

Aber ist eh alles Spekulation von daher...
#67
customavatars/avatar18548_1.gif
Registriert seit: 27.01.2005

Flottillenadmiral
Beiträge: 5444
Was ist denn bei dem GV100 neben dem HBM2 Speicher äußerlich kleine Stücke Silizium plaziert? Ist auch HIER AUF DEM ORIGINAL zusehen.

#68
customavatars/avatar179024_1.gif
Registriert seit: 29.08.2012

Flottillenadmiral
Beiträge: 4593
Habe ich mich auch gefragt - und gehe davon aus, dass da was ausgelagert wurde - und somit wahrscheinlich zur Gesamtfläche des Chips hinzugezählt wird. Da das Teil für professionelles Computing ist, braucht es teilweise nicht so geringe Latenzen denke ich, ähnlich, wie die Ryzen-Prozessoren mit 16 - 32 Kernen.
#69
customavatars/avatar104207_1.gif
Registriert seit: 12.12.2008
Wien
Oberleutnant zur See
Beiträge: 1383
Zitat RAZ0RLIGHT;25539967
Stimmt es gibt keine Verträge zwischen Firmen, die Abnahme etc. festlegen... oh wait
gerade bei einem problematischen Produkt wie HBM/HBM2 macht es Sinn möglichst früh zu produzieren, gerade wenn der Hauptabnehmer daran mitentwickelt hat und schon seit Jahren bekannt ist, dass Vega mit HBM2 erscheint (auch der Vega Release ist schon länger in Stein gemeißelt)

Du träumst wirklich von Eislutschern, glaubst du wirklich die produzieren seit Anfang 2016 um halbwegs ausreichende Mengen für Vega verfügbar zu haben?
Kannst du dir das überhaupt vorstellen wieviel es AMD kosten würde wenn sie SK eine Fertigung 1 Jahr im voraus auslasten müssten und das natürlich auch bezahlen.

Zitat
Weil Samsung schon seit Anfang 2016 produziert und NICHT für die Entwicklung verantwortlich war.
Wer weiß, ob AMD nur von SK Hynix HBM2 bezieht oder auch von Samsung

Zuerst produziert SK seit Anfang 2016 auf Halde, jetzt beziehen sie auch noch zusätzlich Stacks von Samsung, genial was sich AMD so alles leisten kann.
Und etwas zu entwickeln ist bissl was anderes wie anschließend die Serienproduktion zum Laufen zu bringen.
Es sagt ja keiner dass SK nicht bei der Entwicklung federführend war, aber die Aufschlüsselung über 3 Quartale des Portfolio von SK (die Infos kommen von SK selbst) sollten doch klar darstellen dass sie eben Probleme haben bei der Serienfertigung.

Keine Ahnung was du so arbeitest, aber ich darf mich selbst mit dem Transfer aus dem Entwicklungsbereich in die Großproduktion beschäftigen, das läuft nicht immer glatt.
#70
customavatars/avatar44491_1.gif
Registriert seit: 08.08.2006
SN
Moderator
Beiträge: 32796
Zitat RAZ0RLIGHT;25539967
ps. woher ich weiß, dass SK schon seit Anfang 2016 oder früher HBM2 produziert?
Weil Samsung schon seit Anfang 2016 produziert und NICHT für die Entwicklung verantwortlich war.


Klingt für mich eher so als "verschwinden" die HBM Stacks von Samsung alle samt in die NV und Intel Tasche im Moment... Denn das sind die einzigen, die bis dato Samsung HBMv2 4-Hi Stacks abnehmen. Intel sogar mit vollem Speichertakt! -> Intel meint dabei Altera -> eine Intel Tochtergesellschaft.
Stratix 10 MX: Alteras Chips nutzen HBM2 und Intels Interposer-Technik - Golem.de

Mir ist aber kein Produkt bekannt, was Hynix Speicher nutzt abseits der Fury -> und die hat bekanntermaßen die erste Version. :wink:
Wenn man sich die Meldungen aus 2016 zum Thema HBMv2 und Hynix mal ansieht, so ist auch nicht so viel mit Produktion dort gewesen ;) Denn die Verfügbarkeitsaussichten wurden immer weiter zurück gestellt. 8-Hi Stacks von Hynix waren mal für Q4/2016 als Verfügbar angesagt. Heute ist kein Termin für eine Verfügbarkeit bekannt/genannt... Die letzten Meldungen stammen auch von geringerem Takt seitens Hynix.
#71
customavatars/avatar179024_1.gif
Registriert seit: 29.08.2012

Flottillenadmiral
Beiträge: 4593
Zitat fideliovienna;25540397
die Aufschlüsselung über 3 Quartale des Portfolio von SK (die Infos kommen von SK selbst) sollten doch klar darstellen dass sie eben Probleme haben bei der Serienfertigung.

Nur, warum sollten die in ihr Portfolio was aufnehmen, was sie gerade exklusiv zu 100% an AMD liefern. Das ist wie mit CPU-Sockeln. Die sind auch erst im offiziellen Katalog, wenn die nächste Generation schon aktuell ist, obwohl sie von zum Beispiel TE Connectivity schon längst in Massen produziert und ausgeliefert werden. Ganz einfach, weil es gar keinen Sinn macht irgendwen darüber zu informieren, dass man es herstellt - man würde ihn nur verärgern, wenn er erfährt, dass er es noch gar nicht bekommen wird, weil man einen Liefervertrag hat, der bereits alle Kapazitäten auslastet(und wo wahrscheinlich sogar drin steht, dass man erst warten muss, bis mit dem Produkt nicht mehr so viel anzufangen ist, bevor man es an "unbedeutendere" Firmen oder gar Distributoren für den Verkauf an Privatleute freigeben darf.)

Sinn machen würde es aber, für andere den Ausschuss aus seiner Produktion anzupreisen, der ja vielleicht nur mit 800MHz läuft. Edit: Zumindest dann, wenn es mehr ist, als AMD für die schwächeren Vega-Chips abnehmen will.
#72
Registriert seit: 09.08.2006

Flottillenadmiral
Beiträge: 4432
Zitat fdsonne;25540546
Klingt für mich eher so als "verschwinden" die HBM Stacks von Samsung alle samt in die NV und Intel Tasche im Moment... Denn das sind die einzigen, die bis dato Samsung HBMv2 4-Hi Stacks abnehmen. Intel sogar mit vollem Speichertakt! -> Intel meint dabei Altera -> eine Intel Tochtergesellschaft.
Stratix 10 MX: Alteras Chips nutzen HBM2 und Intels Interposer-Technik - Golem.de


Ist das Teil überhaupt schon verfügbar? In dem Link steht Mitte 2017. Und ob man die angepeilten 1000MHz HBM2-ICs nun auch tatsächlich verbaut bleibt ebenfalls offen. Pläne können sich schnell ändern wenn die Realität sich nicht mit dem angedachten vereinbaren lässt.

Zitat oooverclocker;25540661
Nur, warum sollten die in ihr Portfolio was aufnehmen, was sie gerade exklusiv zu 100% an AMD liefern.


Exklusiv an nur einen Abnehmer zu liefern, damit macht man sich doch nur selbst das Geschäft kaputt, würde ich meinen. Wenn genug Abnehmer da sind - und den Preis zahlen - steigere ich eben meine Produktion, um alle auch beliefern zu können. Win-Win für alle Beteiligten.

Exklusiv dürfte eher nur AMDs Partnerschaft mit SK-Hynix sein, die AMD aufgrund der eingebrachten Entwicklungskosten mehr oder weniger dazu zwingt HBM1/2-ICs von eben SK Hynix abzunehmen. Zum Problem könnte das dann werden wenn z.B. Samsung die besseren, evtl. sogar günstigeren (bessere Yield-Rate etc.) HBM1/2-ICs fertigen kann.
#73
customavatars/avatar44491_1.gif
Registriert seit: 08.08.2006
SN
Moderator
Beiträge: 32796
Stratix 10: Intel liefert seinen ersten FPGA an Kunden aus - Golem.de
angeblich also ja -> voller Takt scheint wohl auch drauf.

Zitat oooverclocker;25540661
Nur, warum sollten die in ihr Portfolio was aufnehmen, was sie gerade exklusiv zu 100% an AMD liefern.


kannst du dafür irgendwelche Quellen nachweisen?
Weil schlüssig ist das nicht... Auch der Sockelvergleich nicht. Wer will bitte nen AMD oder Intel PGA/LGA? und warum?
Mir fallen spontan aber mal ganz paar Gründe ein warum es für Hynix sinnig wäre das Produkt anzupreisen... Nicht nur weil Samsung heute lange schon liefert anstatt nur Papiere zu zeigen, sondern weil es absatzstarke Unternehmen gibt, die sicher ebenso entsprechenden Speicher nutzen würden. Da müsste AMD schon massive Fußfesseln ausgepackt haben.

Aber klar, der Strohhalm an den man sich klammert ;) wir sehen es ja bald...
#74
Registriert seit: 09.08.2006

Flottillenadmiral
Beiträge: 4432
Zitat fdsonne;25540985
Stratix 10: Intel liefert seinen ersten FPGA an Kunden aus - Golem.de
angeblich also ja -> voller Takt scheint wohl auch drauf.


OK, aber wirklich überzeugt bin ich davon nicht. Da steht zwar 1TB/s, was auf 4x 4 Hi-Stacks mit je 1000MHz schließen lässt, aber ob die wirklich auch verbaut werden halte ich nicht für sicher. Deine Wortwahl scheint mir da auch nicht zufällig gewählt. Leider spuckt mir Google dazu auch nichts handfesteres aus. Egal, bald sollten wir mehr erfahren...
#75
customavatars/avatar179024_1.gif
Registriert seit: 29.08.2012

Flottillenadmiral
Beiträge: 4593
Zitat fdsonne;25540985
kannst du dafür irgendwelche Quellen nachweisen?

Wenn SK Hynix HBM zusammen mit AMD entwickelt hat, wird es wahrscheinlich so sein. Die Produktion einfach für mehr Nachfrage erhöhen, geht auf dem Gebiet nicht so einfach. Um mit viel Geld die Anlagen umzurüsten, dauert es eventuell Jahre. Neue Fabriken werden erst recht nicht mal eben hochgezogen, sodass die Kapazitäten dann von anderen Produkten weg müssten. Und da der Speicher insgesamt extrem knapp ist, würde das zu noch größeren Lieferengpässen bei DDR- Speicher führen. Das Produktionsvolumen wird sicherlich schon jahrelang vorausgeplant worden sein.

Zitat fdsonne;25540985
Weil schlüssig ist das nicht... Auch der Sockelvergleich nicht. Wer will bitte nen AMD oder Intel PGA/LGA? und warum?

Natürlich, um sein eigenes Mainboard zu entwickeln. Offensichtlich wird das einem aber nicht gerade leicht gemacht, weil man eben erst an die Teile kommt, wenn sie schon veraltet sind. Das gleiche mit fast allen anderen Bauteilen, meinen persönlichen Beobachtungen nach - solange sie neu sind, wandern sie zu 100% direkt and ganz ausgewählte Firmen - erst, wenn die sie nicht mehr brauchen, sodass die Kapazitäten frei werden, werden sie irgendwann offiziell in den Katalog aufgenommen, sodass auch andere sich Samples bestellen können etc.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Roundup: 5x GeForce GTX 1070 mit Custom-Design im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/5X-GTX1070/GTX1070_CUSTOM_ROUNDUP-TEASER

Nachdem wir bereits eine Reihe von Boardpartner-Karten der NVIDIA GeForce GTX 1080 ausführlich getestet haben, holen wir gleiches nun für das kleinere Schwestermodell nach, denn auch von der NVIDIA GeForce GTX 1070 gibt es viele Custom-Modelle mit höheren Taktraten, eigenen Kühlsystemen und... [mehr]

Drei Custom-Modelle der GeForce GTX 1060 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/3X-GTX1060/GTX1060_ROUNDUP_TEST-TEASER

Anders als bei der GeForce GTX 1080 und GeForce GTX 1070 trudelten wenige Stunden nach unserem Test zur Founders Edition der NVIDIA GeForce GTX 1060 schon die ersten Boardpartner-Karten mit teils höheren Taktraten, eigenem Kühlsystem und überarbeitetem Platinenlayout ein. Sie dürften... [mehr]

Roundup: 5x GeForce GTX 1080 im Custom-Design im Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Nachdem wir uns die Founders Edition der GeForce GTX 1080 und GeForce GTX 1070 bereits angeschaut haben, folgen nun fünf Retail-Modelle, die wir in aller Ausführlichkeit unter die Lupe nehmen wollen. Aus den vielen Boardpartnern und unterschiedlichen Modellen haben wir uns solche von ASUS, EVGA,... [mehr]

AMD Radeon RX 480 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/RADEON-RX480/RADEON-RX480-REFERENCE-LOGO

Es ist also soweit: AMD startet die großangelegte Zurückeroberung des Grafikkartenmarktes mit der Radeon RX 480, die als erste Grafikkarte der Polaris-Generation mit gleichnamiger Architektur erscheint und die wir uns genauer anschauen können. Dabei versucht sich AMD an einem anderen Ansatz im... [mehr]

NVIDIA GeForce GTX 1080 und GeForce GTX 1070 im SLI

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/PASCAL-SLI/GTX1080-SLI-LOGO

Die beiden aktuell schnellsten Single-GPU-Karten GeForce GTX 1080 und GeForce GTX 1070 liefern eine ausreichende Leistung für die höchsten Auflösungen und Qualitätseinstellungen. Allerdings müssen dabei hin und wieder ein paar Einschränkungen gemacht werden. Um diesen aus dem Weg zu gehen,... [mehr]

Von ASUS bis ZOTAC: Vier Modelle der GeForce GTX 1050 Ti im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/NVIDIA-GTX1050TI-ROUNDUP/NVIDIA_GTX1050TI_4ER_ROUND_UP-TEASER

Seit Ende Oktober gibt es die aktuelle Pascal-Generation von NVIDIA auch für unter 200 Euro. Tatsächlich bekommt man hier nicht nur viel Leistung fürs Geld, sondern obendrein einen sehr effizienten 3D-Beschleuniger, wie unser Launch-Test zur NVIDIA GeForce GTX 1050 Ti pünktlich zum Marktstart... [mehr]