> > > > NVIDIA gibt die ersten Tesla V100 an Forscher aus

NVIDIA gibt die ersten Tesla V100 an Forscher aus

Veröffentlicht am: von

nvidia-tesla-p100

Mitte Mai, auf der GPU Technology Conference, präsentierte NVIDIA die Volta-Architektur und die dazugehörigen GPU-Beschleuniger Tesla V100. Alle Details zur Volta-Architektur sind in einem ausführlichen Artikel zu finden. Auf der Computer Vision and Pattern Recognition Conference auf Hawaii hat NVIDIA nun die ersten Modelle der PCI-Express-Variante an Forscher ausgegeben.

Allerdings konnten nicht alle Teilnehmer der sehr speziellen Konferenz eine Tesla V100 entgegennehmen. Von den 150 Teilnehmern können sich immerhin 15 glücklich schätzen den GPU-Beschleuniger nun ihr Eigen nennen zu können. Übergeben wurden die Karten von Jen-Hsun Huang, dem CEO von NVIDIA, persönlich. Auf der Verpackung der Karte findet sich dementsprechend auch eine persönliche Widmung.

NVIDIA hat die Tesla V100 bzw. die GV100 speziell auf die Anwendung von Deep-Learning-Netzwerken ausgelegt. Dementsprechend hat NVIDIA auch spezielle Tensor Cores implementiert und erreicht damit eine Rechenleistung von 120 TFLOPS.

Erkauft wird sich diese Rechenleistung mit einem enormen Entwicklungs- und Fertigungsaufwand. Gefertigt wird die GPU in 12 nm bei TSMC. 5.120 Shadereinheiten, 640 Tensor Cores und mehr als 6 MB an L2-Cache ergeben eine GPU-Fläche von riesigen 815 mm² bei 21,1 Milliarden Transistoren. Damit bewegt sich NVIDIA an den Grenzen des derzeit technische Machbaren.

Neben der reinen Rechenleistung musste NVIDIA auch die Speicher- und Cache-Architektur deutlich ausbauen. Die 16 GB HBM2 sind mit 900 GB/s angebunden. Der L1-Cache kommt auf eine kombinierte Bandbreite von 14 TB/s. Reduziert werden konnten auch die Latenzen. All diese Maßnahmen resultieren in der enormen Leistung des GPU-Beschleunigers.

Die technischen Daten der Tesla V100 im Überblick
Modell Tesla P100 (SMX2) Tesla V100 (SMX2) Tesla V100 (PCIe)
Technische Daten
GPU GP100 GV100 GV100
Fertigung 16 nm 12 nm 12 nm
Transistoren 15,3 Milliarden 21 Milliarden 21 Milliarden
Chipgröße 610 mm²
815 mm²
815 mm
GPU-Takt (Base Clock) 1.328 MHz - -
GPU-Takt (Boost Clock) 1.480 MHz 1.455 MHz 1.370 MHz
Speichertakt 737 MHz 878 MHz 878 MHz
Speichertyp HBM2 HBM2 HBM2
Speichergröße 16 GB 16 GB 16 GB
Speicherinterface 4.096 Bit 4.096 Bit Bit 4.096 Bit
Speicherbandbreite 720 GB/s 900 GB/s 900 GB/s
Shadereinheiten 3.584 5.120 5.120
Tensor Cores - 640 640
FP16-Rechenleistung 21,2 TFLOPS 30 TFLOPS 28 TFLOPS
FP32-Rechenleistung 10,6 TFLOPS 15 TFLOPS 14 TFLOPS
FP64-Rechenleistung 5,3 TFLOPS 7,5 TFLOPS 7 TFLOPPS
Int8-Rechenleistung - 120 TFLOPS 112 TFLOPS
Typische Boardpower 300 W 300 W 250 W

NVIDIA liefert die SMX2-Variante der Tesla V100 bereits an einige Supercomputer-Betreiber aus. Die Stückzahlen sollen bis zum Ende des Jahres aber noch deutlich gesteigert werden. Die PCI-Express-Variante soll ebenfalls gegen Ende des Jahres breiter verfügbar sein. Der Preis dürfte sich mindestens auf Niveau des Vorgängers bewegen und dieser kostet noch immer etwa 7.000 Euro pro Karte.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (0)

Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

AMD Radeon RX Vega 56 und Vega 64 im Undervolting-Test

Logo von IMAGES/STORIES/2017/AMD_RADEON_RX_VEGA_64_56_TEST

Unser Test der Radeon RX Vega 64 und Vega 56 hat gezeigt: AMD liefert eine Leistung auf dem Niveau der GeForce GTX 1080 und GeForce GTX 1070, erkauft wird dies aber mit einer deutlich zu hohen Leistungsaufnahme. Derzeit hat AMD bei den Vega-Karten noch viele Baustellen, die vor allem den Treiber... [mehr]

AMD Radeon RX Vega 64 und RX Vega 56 im Test

Logo von IMAGES/STORIES/2017/AMD_RADEON_RX_VEGA_64_56_TEST

Nun endlich ist es soweit: Was vor gut einem Jahr mit einer ersten Ankündigung begann und ab Ende 2016 konkret wurde, findet nun sein finales Ende in den ersten Tests der Radeon RX Vega 64 und RX Vega 56. AMD ist als einziger Konkurrent zu NVIDIA geradezu zum Erfolg verdonnert. Die Ansprüche an... [mehr]

Neun Modelle der GeForce GTX 1080 Ti im Test

Logo von IMAGES/STORIES/LOGOS-2017/GTX1080TI-LOGO

Wenn es nach AMD geht, wird NVIDIA mit der Radeon RX Vega bald Konkurrenz im High-End-Segment bekommen. Derzeit ist die Informationslage aber noch etwas undurchsichtig und so bleibt die GeForce GTX 1080 Ti erst einmal die schnellste Grafikkarte am Markt. Einige Modelle haben wir uns schon... [mehr]

ASUS ROG GeForce GTX 1080 Ti Strix OC im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2017/ASUS-ROG-GTX1080TI-STRIX-OC/ASUS_ROG_GEFORCE_GTX_1080_TI_STRIX_OC

Die Inno3D GeForce GTX 1080 Ti X3 Edition war eines der ersten Custom-Designs, welches wir in der Redaktion begrüßen und bereits ausführlich auf den Prüfstand stellen konnten. Während sie noch auf der Platine der Founders Edition basiert und lediglich ein eigenes Kühlsystem aufgeschnallt... [mehr]

Gigabyte GeForce GTX 1080 Ti AORUS im Test

Logo von IMAGES/STORIES/LOGOS-2017/GIGABYTE-GTX1080TI-AORUS-LOGO

Bei den Grafikkarten scheint sich derzeit alles auf den High-End-Markt zu konzentrieren, denn besonders NVIDIA ist mit der Titan Xp und den Custom-Modellen der GeForce GTX 1080 Ti hier sehr gut aufgestellt. Heute nun wollen wir uns die Gigabyte GeForce GTX 1080 Ti AORUS einmal genauer anschauen,... [mehr]

Ab Werk die schnellste: ZOTAC GeForce GTX 1080 Ti AMP! Extreme Edition im Test

Logo von IMAGES/STORIES/LOGOS-2017/ZOTAC-GTX1080TI-EXTREME-LOGO

Einige Modelle der GeForce GTX 1080 Ti konnten wir uns ja bereits anschauen und damit lässt sich auch ein erster Eindruck zusammenfassen: Die GeForce GTX 1080 Ti ist in der Founders Edition eine gute Karte, die Custom-Modelle beschleunigen sie noch etwas und bieten zudem eine bessere und leisere... [mehr]