Aktuelles

GTC17: NVIDIA präsentiert die nächste GPU-Architektur Volta - Tesla V100 mit 5.120 Shadereinheiten und 16 GB HBM2

Thread Starter
Mitglied seit
06.03.2017
Beiträge
31.164
GTC17: NVIDIA präsentiert die nächste GPU-Architektur Volta - Tesla V100 mit 5.120 Shadereinheiten und 16 GB HBM2
nvidia-gtc.jpg
Wenig überraschend hat NVIDIAs CEO Jen-Hsun Huang heute auf der Keynote der GPU Technology Conference 2017 die nächste GPU-Architektur namens Volta vorgestellt. Erstmalig im März 2013 erwähnt, soll die Volta-Architektur die Basis für die zukünftigen Grafik- und Compute-Beschleuniger sein.Wie im vergangenen Jahr mit der Pascal-Architektur präsentiert NVIDIA die Volta-Architektur zunächst für den HPC-Bereich. Die Tesla V100 ist der erste GPU-Beschleuniger, der die neue Volta-Architektur einsetzt. Die technischen Daten sind beeindruckend:{razuna doubleimagefromgallery}2CFD7519BE4F451C80ACDF212D77F874 0 1{/razuna doubleimagefromgallery}21 Milliarden...

... weiterlesen
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.

ABA74

Enthusiast
Mitglied seit
15.04.2007
Beiträge
1.449
Ort
Ratingen
Baaaaam!, Volta ist da ;), Vorfreude ist die Schönste !
 
Zuletzt bearbeitet:

Gurkengraeber

Urgestein
Mitglied seit
10.03.2005
Beiträge
5.745
Ort
Düsseldorf
Baaam was? Also kommt die Consumer Graka erst 2018? Dann kann ich mir ja getrost ne Ti bestellen. :)
 

pescA

Enthusiast
Mitglied seit
14.06.2009
Beiträge
2.709
Ort
Hamburg
"Über 100 Milliarden VIAs sind die GPU und der HBM2 über einen Interposer miteinander verbunden."

Die Zahl klingt etwas zu groß ;)
 

Don

[printed]-Redakteur, Tweety
Mitglied seit
15.11.2002
Beiträge
33.719
"Über 100 Milliarden VIAs sind die GPU und der HBM2 über einen Interposer miteinander verbunden."

Die Zahl klingt etwas zu groß ;)

VIAs ist der falsche Begriff. NVIDIA spricht von 100 Milliarden Wires, die vorhanden sind. Bei der GP100-GPU machte man diese Angabe auch schon und sprach von 50 Milliarden Wires.
 

NasaGTR

Experte
Mitglied seit
12.05.2013
Beiträge
7.926
16GB HBM2 klingt schon fast nach wenig für so ne monströse Rechenleistung^^ Der 102 Ableger wird sowas von 4K Fähig sein.
 

Don

[printed]-Redakteur, Tweety
Mitglied seit
15.11.2002
Beiträge
33.719
16GB HBM2 klingt schon fast nach wenig für so ne monströse Rechenleistung^^ Der 102 Ableger wird sowas von 4K Fähig sein.

Das die Speicherkapazität im Vergleich zur Tesla P100 nicht weiter gesteigert werden konnte, liegt vermutlich an der noch immer schlechten Verfügbarkeit von HBM2 – vor allem mit mehr als vier Stacks.
 
Zuletzt bearbeitet:

hRy

Enthusiast
Mitglied seit
09.09.2011
Beiträge
466
Im Text steht 12nm Fertigung und in der Tabelle 14nm?

Galerie funktoniert (bei mir) nicht.

Wenn der HBM2 auf der Volta nur mit 900 MHz taktet sehe ich auf der Vega keinesfalls die erhofften 1000 MHz.

Scheint aber ein ganz schöner Klotz zu werden bei der Die Fläche. Ich rechne mit steigenden Preisen gegenüber den Einstiegspreisen von Pascal.
 

L0rd_Helmchen

Der Saft ist mit euch!
Mitglied seit
01.01.2007
Beiträge
9.877
Ort
Exil
Na dann kommt hoffentlich ein GV102 mit vollen 5120 Shadern und 16GB GDDR6 aka Titan XV.

€dit: Es sollen "12nm" sein, dass diese Angabe mit Vorsicht zu genießen ist, sollte ja aber auch klar sein...
 
Zuletzt bearbeitet:

Don

[printed]-Redakteur, Tweety
Mitglied seit
15.11.2002
Beiträge
33.719
Muss natürlich 12 nm heißen.
 

Cippoli

Enthusiast
Mitglied seit
09.08.2006
Beiträge
5.085
Es sind sogar 5376 Shader. Ein kleiner Teil wird wie üblich wegen besserer Ausbeute deaktiviert.

Bei 6 GPCs entspricht das 896 Shader (5376 : 6 = 896) je Cluster. Damit lässt sich u.a. auf GV104 spekulieren. Bei Maxwell und Pascal wurden von 6 GPCs 2 deaktiviert. Für den GV104 läuft es daher auf 3584 Shader (896 x 4 = 3584) hinaus. Dazu GDDR6 und fertig ist unser GeForce 2080 Kärtchen.
 

SkizZlz

Experte
Mitglied seit
10.07.2013
Beiträge
5.233
Wer den Livestream nachträglich gucken will, ich hab den komplett aufgenommen :d Lade ihn dann hoch, sobald alles fertig gerendert ist.
Anscheinend soll der schon bei Nvidia direkt verfügbar sein, weiß aber nicht obs da wie bei der 1080Ti wieder nur eine Zusammenfassung ist.
 

Ali G

Experte
Mitglied seit
06.03.2016
Beiträge
1.484
Ach, Anfang 2018 ne Titan Volta wäre doch fein, irgendwas mit 5k Cuda Cores klingt auch nicht verkehrt :d
 

Pickebuh

Enthusiast
Mitglied seit
27.07.2008
Beiträge
3.372
Baaaaam!, Volta ist da ;), Vorfreude ist die Schönste !

Ist doch nur eine Attrappe in seiner Hand, oder glaubst du wirklich, dass von Volta ein über 800mm² Die in 12nm schon jetzt gefertigt werden kann ? Das dauert noch gut 1 Jahr.
 
Zuletzt bearbeitet:

SkizZlz

Experte
Mitglied seit
10.07.2013
Beiträge
5.233
Woher weißt du, dass es "nur" ne Attrappe sein soll ?:fresse2:
 

Don

[printed]-Redakteur, Tweety
Mitglied seit
15.11.2002
Beiträge
33.719
Ist doch nur eine Attrappe in seiner Hand, oder glaubst du wirklich, dass von Volta ein über 800mm² Die in 12nm schon jetzt gefertigt werden kann ? Das dauert noch gut 1 Jahr.

Ab Q3 werden die Super Computer mit Tesla V100 bestückt, die damit geplant sind. Kurz darauf folgen die OEMs.
 

fdsonne

Moderator
Hardwareluxx Team
Mitglied seit
08.08.2006
Beiträge
36.136
Ort
SN
Das die Speicherkapazität im Vergleich zur Tesla P100 nicht weiter gesteigert werden konnte, liegt vermutlich an der noch immer schlechten Verfügbarkeit von HBM2 – vor allem mit mehr als vier Stacks.

Du meist mit mehr als vier Lagen!?
Weil sowohl GP100 als auch GV100 verwenden vier 4-Hi Stacks... Vega verwendet (wohl) zwei 4-Hi Stacks und kommt damit auf 8GB. Die Verfügbarkeit von 8-Hi Stacks dürfte im Moment gegen Null gehen, wenn es sowas überhaupt schon gibt. ;)

PS: Inside Volta: The World’s Most Advanced Data Center GPU | Parallel Forall
Wer sich für mehr Details interessiert...

Sehr interessant finde ich den hier:
"Unlike Pascal GPUs, which could not execute FP32 and INT32 instructions simultaneously, the Volta GV100 SM includes separate FP32 and INT32 cores, allowing simultaneous execution of FP32 and INT32 operations at full throughput, while also increasing instruction issue throughput."

-> 300W TDP im Power-Mode
-> 1455MHz Boost und damit 1,4899TFLop/sec FP32

Am Ende ist das aber irgendwie alles HPC Stuff... Wie viel am Ende davon im GV104 oder GV102 über bleiben wird? Abwarten... Eigentlich kann man nur hoffen, dass Vega richtig einschlägt und so NV gezwungen wird, auch den großen TopDog zu "missbrauchen" :fresse:

Na dann kommt hoffentlich ein GV102 mit vollen 5120 Shadern und 16GB GDDR6 aka Titan XV.

Wenn mich nicht alles täuscht, dann wurde bei den Infos zu GDDR6 schon ein 384Bit SI geteasert ;)
Rechne also eher mit 12GB oder 24GB. Warscheinlich eher 12...
 

Nimrais

Enthusiast
Mitglied seit
29.01.2010
Beiträge
3.567
Ort
CH
Hab mal Excel bemüht und die Anzahl CUDA Cores stieg von Tesla bis Kepler von 24 auf 192 und sank dann wieder (halbierung mit jeder Generation). Tatsächlich scheint es so, wie Cippoli schreibt dass Volta eigentlich 5376 CUDA Cores hat.

Ich hoffe, NV beschäftigt sich nicht aufgrund der "fehlenden" Konkurrenz zu sehr auf Computing und vernachlässigt die GeForce. Bei Pascal konnte man ja noch mehr als zufrieden sein. Das darf ruhig so bleiben.
 

fdsonne

Moderator
Hardwareluxx Team
Mitglied seit
08.08.2006
Beiträge
36.136
Ort
SN
Es bleibt @Nimrais bei 64x pro SM... Und es sind bestätigt (siehe Link auf der Dev. Page von NV) wirklich 5376 ALUs...

PS: G80 kommt auf 16x8 = 128 ALUs
G200 auf 24x10 = 240 ALUs
GF100/110 auf 32x4x4 = 512 ALUs
GK110 auf 192x3x5 = 2880 ALUs
GM200 auf 128x4x6 = 3072 ALUs
GP100 auf 64x10x6 = 3840 ALUs
GP102 auf 128x5x6 = 3840 ALUs
GV100 auf 64x14x6 = 5376 ALUs

Die letzte Zahl steht jeweils für die Anzahl der GPCs
Die mittlere (sofern vorhanden) für die Anzahl der SMs
Und die erste für die ALUs pro jeweiligem Block


Allerdings ist das, siehe oben nur die halbe "Wahrheit" bei GV100... Denn GV100 kann nach dem Post im Dev. Forum alle INT32 Einheiten zusammen mit den FP32 Einheiten nutzen... Technisch gesehen ergibt das ein nicht zu verachtenden Vorteil ggü. dem Vorgänger, sofern ein derartiger Workload anliegt.
 

Cippoli

Enthusiast
Mitglied seit
09.08.2006
Beiträge
5.085
Vernachlässigen würde ich nicht sagen @ Nimrais. Der hier gezeigte Top-Dog (GV100), aus dem üblicherweise die kleineren Chips geschnitzt werden, lässt diesen Schluss jedenfalls nicht zu.

Link von fdsonne: Inside Volta: The World’s Most Advanced Data Center GPU | Parallel Forall

With 84 SMs, a full GV100 GPU has a total of 5376 FP32 cores, 5376 INT32 cores, 2688 FP64 cores, 672 Tensor Cores, and 336 texture units. Each memory controller is attached to 768 KB of L2 cache, and each HBM2 DRAM stack is controlled by a pair of memory controllers. The full GV100 GPU includes a total of 6144 KB of L2 cache. Figure 4 shows a full GV100 GPU with 84 SMs (different products can use different configurations of GV100). The Tesla V100 accelerator uses 80 SMs.

Beim GV102 und darunter dürften (wie üblich) die 2688 FP64 Cores und die nun neu dazugekommen 672 Tensor Cores wegfallen. Damit wäre man irgendwo bei 500mm² Die-Size mit 5120 FP32 Cores und GDDR6 / 384-bit.

Beim GV104 dürften dann wie bereits geschrieben zusätzlich noch 2 GPCs wegfallen --> 3584 FP32 Cores. Die-Size im Bereich um die 350mm² mit GDDR6 und 256-bit.

Vorstellbar wäre dann 1080 Ti Leistung in Form von GV104 bei niedrigeren Preis. Irgendwas um die 500,- Euro vielleicht...
 
Zuletzt bearbeitet:

Betabrot

Experte
Mitglied seit
26.04.2015
Beiträge
1.567
Ort
Augsburg
Da freut man sich ja schon richtig auf die nächste Generation. Auch dürfte die zu einem hohen Werteverfall aktueller Karten führen (da werden sich die ganzen Titan X(P) Besitzer wieder winden *G*).
 

Shevchen

Urgestein
Mitglied seit
20.01.2011
Beiträge
2.739
Über 5k Shader-Einheiten - die wird der Endkunde aber nicht unter nem Gebrauchtwagen-Preis bekommen.

Ich stimme fdsonne da mal zu, hoffentlich schlägt Vega ordentlich ein, damit Nvidia auch die dicken Teile an die "Normalos" rausgibt. Auf der anderen Seite sind 12,5 TFlops vs. 15 TFlops jetzt auch nicht der große Unterschied.

Hätte hätte Frahrradkette - AMD ne Vega Version mit 6144 Shader-Einheiten gebastelt, dann wäre Volta echt unter Druck gewesen. Sieht auf jeden Fall wie ne schöne Architektur aus.

Gibts eigentlich infos zu HBM-Versionen unterschiedlicher Hersteller?
 
Zuletzt bearbeitet:
D

DivineLight

Guest
Vernachlässigen würde ich nicht sagen @ Nimrais. Der hier gezeigte Top-Dog (GV100), aus dem üblicherweise die kleineren Chips geschnitzt werden, lässt diesen Schluss jedenfalls nicht zu.

Link von fdsonne: Inside Volta: The World’s Most Advanced Data Center GPU | Parallel Forall



Beim GV102 und darunter dürften (wie üblich) die 2688 FP64 Cores und die nun neu dazugekommen 672 Tensor Cores wegfallen. Damit wäre man irgendwo bei 500mm² Die-Size mit 5120 FP32 Cores und GDDR6 / 384-bit.

Beim GV104 dürften dann wie bereits geschrieben zusätzlich noch 2 GPCs wegfallen --> 3584 FP32 Cores. Die-Size im Bereich um die 350mm² mit GDDR6 und 256-bit.

Vorstellbar wäre dann 1080 Ti Leistung in Form von GV104 bei niedrigeren Preis. Irgendwas um die 500,- Euro vielleicht...

Für 500 €, würde ich sofort kaufen. In der Praxis wird es höchstens Ende 2017, eher Anfang 2018 was.

Über 5k Shader-Einheiten - die wird der Endkunde aber nicht unter nem Gebrauchtwagen-Preis bekommen.

Ich stimme fdsonne da mal zu, hoffentlich schlägt Vega ordentlich ein, damit Nvidia auch die dicken Teile an die "Normalos" rausgibt. Auf der anderen Seite sind 12,5 TFlops vs. 15 TFlops jetzt auch nicht der große Unterschied.

Hätte hätte Frahrradkette - AMD ne Vega Version mit 6144 Shader-Einheiten gebastelt, dann wäre Volta echt unter Druck gewesen. Sieht auf jeden Fall wie ne schöne Architektur aus.

Gibts eigentlich infos zu HBM-Versionen unterschiedlicher Hersteller?

Wird er schon, aber erst 2018 oder 19. Der GV102 für Normalverbraucher kam auch erst vor ein paar Monaten. Es wird vermutlich recht schnell eine beschnittene Titan kommen, dasselbe Spiel wie immer.

Gäbe es etwas verlässliches würde ich das mit dem SLI glatt aufgeben. Am Ende ist es aber doch wieder ein Jahr hin bis die Modelle die für mich in Frage kämen dann auch verfügbar sind. Dazu kamen beim letzten Mal die überzogenen Preise. Bis 600 € hätte ich glatt eine X80 gekauft, aber für knapp 800 € muss da "Ti" hinterstehen.
 

SkizZlz

Experte
Mitglied seit
10.07.2013
Beiträge
5.233

Livestream zum nachgucken den ich aufgenommen hab, kann ab und an mal zu Unterbrechungen kommen, lag aber am Stream.
 

Betabrot

Experte
Mitglied seit
26.04.2015
Beiträge
1.567
Ort
Augsburg
Glaube ich weniger. Stimmt die Leistung, kaufen sie einfach Volta.

Meinte eher damit, das die sich winden, den Wertverlust zu akzeptieren. Sieht man ja immer wieder wenn es um den Preis zukünftiger Hardware geht (deren Preis dann natürlich im Verhältnis zur Mehrleistung steigen wird, damit man selber keinen Wertverlust erleidet ;) ). Gerade die Titanen der Pascal Serie wird es noch härter treffen als die vorherige X, weil nur 1 GB mehr vRam ist nicht so das Argument für einen Aufpreis wie 6 GB mehr ;).

PS: Ich hab mich schon mal mental von dem Wert meiner verabschiedet :P
 
Oben Unten