> > > > NVIDIA veröffentlicht Whitepaper zur Tesla V100 und Volta-Architektur

NVIDIA veröffentlicht Whitepaper zur Tesla V100 und Volta-Architektur

Veröffentlicht am: von

nvidia-tesla-p100

Zur GPU Technology Conference präsentierte NVIDIA die neue Volta-Architektur und stellte zudem auch die ersten drei Tesla-Grafikkarten vor, welche die neue GV100-GPU einsetzen. Auf alle Details der Volta-Architektur sind wir in einem gesonderten Artikel bereits eingegangen. Nun hat NVIDIA ein sogenannten Whitepaper (PDF) veröffentlicht, welches sich noch einmal mit der Tesla V100 und Volta-Architektur beschäftigt und dabei auch einige Details verrät, die in dieser Form bisher nicht bekannt waren.

Noch einmal in Kürze die wichtigsten technischen Daten: Genau wie die Pascal-Architektur setzt sich Volta aus verschiedenen Komponenten zusammen. So besteht die GV100-GPU aus Graphics Processing Clustern (GPCs), Texture Processing Clustern (TPCs), Streaming Multiprocessoren (SMs) und einem Speicher-Controller. Der Vollausbau der GV100-GPU besteht aus sechs GPCs, 84 Volta SMs, 42 TPCs (jeder mit jeweils zwei SMs) und acht 512-Bit-Speicher-Controllern (4.096 Bit ingesamt). Jeder SM hat 64 FP32 Cores, 64 INT32 Cores, 32 FP64 Cores und acht der neuen Tensor Cores. Hinzu kommen noch vier Textur-Einheiten pro SM.

Mit 84 SMs kommt der Vollausbau der GV100-GPU auf 5.376 FP32 Cores, 5.376 INT32 Cores, 2.688 FP64 Cores, 672 Tensor Cores und 336 Textur-Einheiten. An jeden Speicher-Controller angekoppelt sind 768 KB L2-Cache und jeder HBM2-DRAM-Stack wird von zwei Speicher-Controllern angesteuert. In dieser Ausbaustufe bietet die GV100.GPU insgesamt 6.144 KB L2-Cache.

Maximum Performance Mode und Maximum Efficiency Mode

NVIDIA bietet drei Varianten der Tesla V100 mit GV100-GPU, die sich vor allem durch die externe Anbindung und den TDP-Bereich unterscheiden, in denen diese betrieben werden. Dazu sieht NVIDIA zwei Betriebsmodi vor: Einen Maximum Performance Mode und einen Maximum Efficiency Mode.

Im Maximum Performance Mode verbraucht die GV100-GPU der Tesla V100 die zur Verfügung stehenden 300 W für die SMX2- und 250 W für die PCI-Express-Variante. Im Maximum Efficiency Mode sollen es nur 50 bis 60 % der maximalen TDP sein und so wird auch eine Tesla V100 im FHHL-Format mit einer TDP von 150 W möglich. Dennoch soll diese Karte etwa 75 bis 85 % der Leistung im Vergleich zum Maximum Performance Mode erreichen.

Damit macht NVIDIA die Tesla V100 deutlich flexibler und Serveranbieter können die Hardware an die Anforderungen des Nutzers anpassen.

NVLink 2.0 wird flexibler

Ein schneller Interconnect ist ein wichtiger Bestandteil einer jeden HPC-Hardware. Alle großen Herstellern arbeiten daran, ihre Hardware möglichst schnell untereinander und mit externen Komponenten zu verbinden. Mit NVLink präsentierte NVIDIA 2014 auf der GPU Technology Conference seinen eigenen Interconnect. NVLink basiert auf dem High-Speed Signaling Interconnect (NVHS), eine Entwicklung von NVIDIA.

Mit der GV100-GPU optimiert NVIDIA die NVLink-Verbindung auf gleich zwei Arten. Zum einen wird die Geschwindigkeit pro Link erhöht. Ebenfalls erhöht wird die Anzahl der möglichen NVLink-Links, die eine GV100-GPU aufbauen kann. Lag die maximale Bandbreite pro NVLink bisher bei 40 GB/s für Sende- und Empfangsrichtung, beträgt sie mit NVLink 2.0 nun 50 GB/s. Da die Anzahl an NVLinks von vier auf sechs erhöht wurde, ergibt sich daraus eine kommulierte Bandbreite von 300 GB/s für die GV100-GPU.

Die zwei zusätzlichen NVLinks können für den Aufbau neuer Infrastruktur-Systeme genutzt werden. Bisher ermöglichte NVLink beispielsweise die Anbindung von acht Tesla P100 und über einen PCI-Express-Switch konnte auch ein Prozessor angebunden werden. Mit NVLink 2.0 stehen nun zwei zusätzliche Links zur Verfügung, die beispielsweise für zwei CPUs verwendet werden können. Im Falle der Tesla-V100-GPU-Beschleuniger können aber auch bis zu 64 dieser GPUs zusammengefasst werden. NVLink wird demnach flexibler und schneller – eine Kombination, die sicherlich für den ein oder andere Server-Anbieter eine Rolle spielen wird.

NVIDIA wird in der zweiten Jahreshälfte 2017 damit beginnen, die ersten Tesla-V100-Karten auszuliefern. Dazu gehören aber nicht nur die einzelnen Karten, sondern auch fertig bestückte Server wie der DGX-1, die DGX Station und der HGX-1-Server. Einzelne Karten, und hier vor allem die PCI-Express-Varianten, werden aber erst gegen Ende des Jahres erhältlich sein. Zunächst einmal wird NVIDIA die Server-Anbieter bestücken.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (0)

Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Von ASUS bis ZOTAC: Vier Modelle der GeForce GTX 1050 Ti im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/NVIDIA-GTX1050TI-ROUNDUP/NVIDIA_GTX1050TI_4ER_ROUND_UP-TEASER

Seit Ende Oktober gibt es die aktuelle Pascal-Generation von NVIDIA auch für unter 200 Euro. Tatsächlich bekommt man hier nicht nur viel Leistung fürs Geld, sondern obendrein einen sehr effizienten 3D-Beschleuniger, wie unser Launch-Test zur NVIDIA GeForce GTX 1050 Ti pünktlich zum Marktstart... [mehr]

NVIDIA GeForce GTX 1080 und GeForce GTX 1070 im SLI

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/PASCAL-SLI/GTX1080-SLI-LOGO

Die beiden aktuell schnellsten Single-GPU-Karten GeForce GTX 1080 und GeForce GTX 1070 liefern eine ausreichende Leistung für die höchsten Auflösungen und Qualitätseinstellungen. Allerdings müssen dabei hin und wieder ein paar Einschränkungen gemacht werden. Um diesen aus dem Weg zu gehen,... [mehr]

PowerColor Radeon RX 480 Red Devil im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/POWERCOLOR-RX480/POWERCOLOR-RX480REDDEVIL-LOGO

Mit der Radeon RX 480 will AMD zurück zu alter Stärke und hat daher über Monate hinweg die PR-Trommel geschlagen. Letztendlich dabei herausgekommen ist eine sehr gute Karte für einen niedrigen Preis, die aber nicht in allen Bereichen zu überzeugen weiß. Wohl größtes Manko der Karte sollte... [mehr]

Drei Modelle der GeForce GTX 1060 von ASUS, EVGA und Inno3D im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/3X-GTX1060-2/GTX1060_ROUNDUP2-TEASER

Nach einer kurzen Unterbrechung durch die AMD Radeon RX 470 und Radeon RX 460 machen wir weiter mit dem nächsten Schwung verschiedener Custom-Modelle zur NVIDIA GeForce GTX 1060. Während die Eigenlösungen der AMD-Partner teilweise noch immer auf sich warten lassen, ist man bei der Konkurrenz... [mehr]

Zwei Modelle der NVIDIA GeForce GTX 1050 Ti im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/EVGA-GTX-1050TI-SC/EVGA_ZOTAC_GTX1050TI_AUFMACHER

Am vergangenen Dienstag rundete NVIDIA sein Pascal-Aufgebot nach unten hin ab und kündigte mit der GeForce GTX 1050 Ti und GeForce GTX 1050 die bislang kleinsten Ableger unter den Pascal-Grafikkarten an. Ab heute werden die neuen Einsteiger-Karten zu Preisen ab 125 bzw. 155 Euro im Handel... [mehr]

MSI GeForce GTX 1060 Gaming X im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/MSI-GTX-1060-GAMING-X/MSI_GEFROCE_GTX_1060_GAMING_X-TEASER

Ob von ASUS, EVGA, Inno3D oder Gigabyte – von nahezu allen großen Grafikkarten-Herstellern konnten wir bereits ein oder mehrere Modelle auf Basis der GeForce GTX 1060 testen. Gefehlt in unserer Liste hat allerdings noch MSI. Das holen wir nun mit einem Test zur MSI GeForce GTX 1060 Gaming X... [mehr]