> > > > GTC 2014: NVIDIA präsentiert NVLINK, 3D Memory und neue 'Pascal'-GPU

GTC 2014: NVIDIA präsentiert NVLINK, 3D Memory und neue 'Pascal'-GPU

DruckenE-Mail
Erstellt am: von

gtc2014Wie jedes Jahr eröffnet NVIDIAs CEO Jen-Hsun Huang die GPU Technology Conference - so auch in diesem Jahr. Bereits gestern sickerten die ersten Informationen zum möglichen Inhalt der Keynote durch. Das Motto lautet: „Let us show the world what is next“.

Zu Beginn bekräftigt Jen-Hsun aber noch einmal die vergangenen und weiterhin stattfindenden Anstrengungen im wissenschaftlichen Feld. Das Interesse an Hard- und Software werde immer größer, die GTC haben von Jahr zu Jahr einen größeren Zulauf. Von der Medizin, über Geografie bis hin zur Raumfahrt - inzwischen sieht sich NVIDIA in allen wissenschaftlichen Bereichen vertreten und will diese Entwicklung weiter fortsetzen.

NVIDIA GTC 2014 Keynote
NVIDIA GTC 2014 Keynote

NVLINK


Die erste Neuvorstellung der GTC 2014 in Sachen GPU-Technologie ist NVLINK. Dabei geht NVIDIA die offensichtlichen Flaschenhälse beim Datenaustausch eines Systems an. Diese sind über die unterschiedlichen Komponenten höchst unterschiedlich in der Performance bzw. Bandbreite. So beträgt die Bandbreite für PCI-Express bis zu 16 GB pro Sekunde. Zwischen dem Arbeitsspeicher und dem Prozessor sind es 60 GB pro Sekunde und moderne GPUs kommen über ein 512 Bit breites Speicherinterface auf über 300 GB pro Sekunde. Doch inzwischen sind den Herstellern auch technische Grenzen entgegengesetzt. So ist es kaum noch möglich, das Speicherinterface breiter zu machen. Bereits heute sind hunderte Pins für den Datenaustausch verantwortlich und das Package einer modernen GPU hat Dimensionen angenommen, die vor einigen Jahren noch nicht denkbar waren. NVLINK soll zumindest einige dieser Probleme beheben.

NVIDIA GTC 2014 Keynote
NVIDIA GTC 2014 Keynote

NVLINK ermöglicht den Unified-Memory, also einen gemeinsamen Speicher für die GPU und den Prozessor. Weiterhin ermöglicht NVLINK aber auch einen koherenten Cache, also auch die Cache-Domains können zusammengelegt und gemeinsam genutzt werden. Angesteuert wird der NVLINK über das PCI-Express-Interface und über die DMA-Engine kann NVLINK auch programmiert werden. Über eine eigene Clock kann die Geschwindigkeit bzw. der Takt an die Bedürfnisse angepasst werden. Fünf bis zwölf mal schneller soll NVLINK im Vergleich zu PCI-Express sein.

NVIDIA GTC 2014 Keynote
NVIDIA GTC 2014 Keynote

3D Memory auf „Pascal“-GPU

Bereits im vergangenen Jahr zeigte NVIDIA auf der GTC eine Roadmap, welche den Nachfolger von „Maxwell“ zeigen sollte. „Volta“ sollte dabei das erste GPU-Design mit Stacked Memory sein. Dabei ist der Speicher nicht mehr extern an die GPU angebunden, sondern befindet sich auf dem selben Die. Neben NVLINK will NVIDIA mit diesem 3D-Memory einen weiteren Flaschenhals des Systems öffnen.

NVIDIA GTC 2014 Keynote
NVIDIA GTC 2014 Keynote

Stacked-Memory ist eigentlich nur ein anderer Name für das, was man heute als 3D-Memory erneut vorstellte. Dabei wird der DRAM-Speicher nicht mehr neben der GPU auf dem PCB untergebracht, sondern direkt auf der GPU. Dazu werden zusätzliche Silizium-Layer auf der GPU angebracht, sogenannte Through Silicon Vias (TSVs) verbinden beide Komponenten. Ähnliche Techniken werden heute bereits bei den modernen SoCs eingesetzt. So besitzt die PlayStation Vita einen 128 MB großen RAM im selben Package wie der SoC. Hier spricht man aber noch nicht von Staket Memory, 3D Memory oder TSV, da ein separater Chip im Package untergebracht ist. 3D-Memory geht noch einmal einen Schritt weiter.

NVIDIA GTC 2014 Keynote
NVIDIA GTC 2014 Keynote

Durch die direkte Positionierung des Speichers auf der GPU sind die Verbindungen zwischen Speicherinterface und Speicher selbst extrem kurz und kompakt gehalten. Moderne GPUs werden in ihrer Speicherbandbreite vor allem durch die komplizierte Anbindung des Speicherinterfaces mit dem Speicher limitiert. So muss beim GPU-Design bereits die Position und Verdrahtung für das Speicherinterface beachtet werden. 3D-Memory vereinfacht dies über die Through Silicon Vias (TSVs) erheblich. So kann der Speicher nicht nur schneller takten und die Latenzen sind durch die kurze Anbindung gering, auch die Breite des Speicherinterfaces kann deutlich erhöht werden.

Bereits angesprochen haben wir die aktuelle Breite des Speicherinterfaces von 384 bzw. 512 Bit für aktuelle High-End-GPUs. Um die von NVIDIA erwähnten 1 TB/s zu erreichen, wäre es denkbar, dass 3D -emory mit einem 2.000 MHz DRAM bei einem 1.024 Bit breiten Speicherinterface anbindet. Möglich wären aber auch 1.000 MHz bei 2.048 Bit und die verschiedensten Konfigurationen dazwischen.

NVIDIA GTC 2014 Keynote
NVIDIA GTC 2014 Keynote

Gleichzeitig mit NVLINK und 3D-Memory vergibt NVIDIA einen neuen Namen für die GPU. Diese wurde nun „Pascal“ genannt und befindet sich bereits in einer ersten Testphase, denn auf der Bühne zeigte Jen-Hsun ein erstes Testboard. Dieses hat rund ein Drittel der Größe einer typischen Grafikkarte und verfügt über Technologien wie NVLINK und eben 3D-Memory. Die Speicherbandbreite soll dabei zwei bis vier mal höher sein, als dies bei aktuellen Karten der Fall ist. Auch der Speicherausbau als solches ist deutlich höher - ebenfalls um den Faktor zwei bis vier. Die Anbindung des „Pascal“-Testboards erfolgt via NVLINK mit den ebenfalls bereits angesprochenen fünf bis zwölffach schnelleren Anbindung, als dies über das PCI-Express-Interface möglich ist.

NVIDIA GTC 2014 Keynote
NVIDIA GTC 2014 Keynote

Zuletzt gab NVIDIA auch noch einen Ausblick auf die aktuelle GPU-Roadmap. Diese sieht "Pascal" für 2016 vor - es wird also noch einige Zeit dauern, bis wir die entsprechenden Features sehen werden. Allerdings wollte NVIDIA im vergangenen Jahr noch gar keine Informationen zu "Volta" veröffentlichen.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (10)

#1
customavatars/avatar63700_1.gif
Registriert seit: 10.05.2007


Beiträge: 12889
Zitat
Bereits heute sind hunderte Lins für den Datenaustausch verantwortlich

Kaufe ein K? :)
#2
customavatars/avatar84710_1.gif
Registriert seit: 10.02.2008

Admiral
Beiträge: 15048
Beim Bild vorm letzten Absatz hat man das Gefühl, dass Pascal noch schneller wäre, wenn die eine größere Halle gefunden hätten... :asthanos:
#3
customavatars/avatar108709_1.gif
Registriert seit: 17.02.2009
Sachsen, Brandis b. Leipzig
Admiral
Beiträge: 16818
:bigok: war auch mein erster Gedanke. :fresse:

Lg Marti (gesendet von unterwegs)
#4
customavatars/avatar83163_1.gif
Registriert seit: 22.01.2008
NRW
Leutnant zur See
Beiträge: 1266
Interessant finde ich das auf dem letzten bild unter maxwell dx12 steht ...
Ist das ein hinweis darauf das doch andere gpu´s nötig sind dafür ???
#5
customavatars/avatar180392_1.gif
Registriert seit: 03.10.2012
Schleswig in Schleswig Holstein!
Leutnant zur See
Beiträge: 1137
Zitat Mick_Foley;22013836
Beim Bild vorm letzten Absatz hat man das Gefühl, dass Pascal noch schneller wäre, wenn die eine größere Halle gefunden hätten... :asthanos:


:lol:

Pascal klingt sehr spannend!
Aber ich hätte mich eher über konkrete Ankündigungen zum Maxwell gefreut.. 2014 ist ein sehr dehnbarer Begriff :-[
#6
customavatars/avatar204405_1.gif
Registriert seit: 21.03.2014

Obergefreiter
Beiträge: 100
Na immerhin haben se die Serie nicht Jaqueline genannt ^^
#7
customavatars/avatar160319_1.gif
Registriert seit: 17.08.2011

Vizeadmiral
Beiträge: 7758
Zitat Doktor Seltsam;22014952
Na immerhin haben se die Serie nicht Jaqueline genannt ^^
#8
customavatars/avatar84710_1.gif
Registriert seit: 10.02.2008

Admiral
Beiträge: 15048
Gibt nur leider keinen Physiker mit dem Nachnamen...
#9
customavatars/avatar44491_1.gif
Registriert seit: 08.08.2006
Weinböhla (Sachsen)
Moderator
Beiträge: 31949
Zitat Mick_Foley;22013836
Beim Bild vorm letzten Absatz hat man das Gefühl, dass Pascal noch schneller wäre, wenn die eine größere Halle gefunden hätten... :asthanos:


Geht aber nicht um reinen Speed bei der Folie, sondern um Effizienz ;)
Interessanter sind da aber wohl eher die Einstufungen...
Für Kepler hatte NV ja etwas mehr wie dreifache Effizienz angekündigt zu Fermi. Das kommt schon in etwa hin mit GK110 zu GF110.

Für Maxwell ist aber nach dieser Folie "gerade mal" nicht ganz doppelte Effizienz angekündigt.
Heist also, fast doppelte Rohleistung bei gleicher Leistungsaufnahme. Nimmt man es den Zahlen genau, wären das ca. 71%. (7 zu 12)... Also 71% mehr Leistung bei gleicher Leistungsaufnahme...
Wohlgemerkt für den TopDog.
Runtergerechnet wie bei Kepler GK104 zu GK110 stehen dann ca. 40% Leistungsunterschied zwischen. Rechnerisch müsste also ein GM104 Mittelklassechip ca. auf das Leistungslevel ~20% Größer einer 780TI/Titan BE kommen...
Bei weniger hoher Effizienz der Mittelklasse eher sogar weniger... :wink:
#10
customavatars/avatar84710_1.gif
Registriert seit: 10.02.2008

Admiral
Beiträge: 15048
Oh stimmt ist nicht Leistung. :D Ich will die Weiterentwicklung auch gar nicht anzweifeln, nur auf dem Bild sieht das wirklich so was als wenn die Halle limitieren würde. :D :haha:

Ich würde gerne mal wissen in wie weit Maxwell DX 12 kann. Sprich ob auch die "neuen" visuellen Effekte beherrscht werden.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Roundup: 5x GeForce GTX 1070 mit Custom-Design im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/5X-GTX1070/GTX1070_CUSTOM_ROUNDUP-TEASER

Nachdem wir bereits eine Reihe von Boardpartner-Karten der NVIDIA GeForce GTX 1080 ausführlich getestet haben, holen wir gleiches nun für das kleinere Schwestermodell nach, denn auch von der NVIDIA GeForce GTX 1070 gibt es viele Custom-Modelle mit höheren Taktraten, eigenen Kühlsystemen und... [mehr]

Drei Custom-Modelle der GeForce GTX 1060 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/3X-GTX1060/GTX1060_ROUNDUP_TEST-TEASER

Anders als bei der GeForce GTX 1080 und GeForce GTX 1070 trudelten wenige Stunden nach unserem Test zur Founders Edition der NVIDIA GeForce GTX 1060 schon die ersten Boardpartner-Karten mit teils höheren Taktraten, eigenem Kühlsystem und überarbeitetem Platinenlayout ein. Sie dürften... [mehr]

NVIDIA GeForce GTX 1080 mit Pascal-Architektur im XXL-Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Heute ist es soweit: NVIDIA läutet mit der GeForce GTX 1080 und GTX 1070 auf Basis der Pascal-Architektur den diesjährigen Neustart bei den Grafikkarten ein. In Kürze wird wohl auch AMD seinen Beitrag zu diesem Thema leisten. Vor zehn Tagen lud NVIDIA die gesammelte Fachpresse nach Austin ein... [mehr]

Roundup: 5x GeForce GTX 1080 im Custom-Design im Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Nachdem wir uns die Founders Edition der GeForce GTX 1080 und GeForce GTX 1070 bereits angeschaut haben, folgen nun fünf Retail-Modelle, die wir in aller Ausführlichkeit unter die Lupe nehmen wollen. Aus den vielen Boardpartnern und unterschiedlichen Modellen haben wir uns solche von ASUS, EVGA,... [mehr]

AMD Radeon RX 480 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/RADEON-RX480/RADEON-RX480-REFERENCE-LOGO

Es ist also soweit: AMD startet die großangelegte Zurückeroberung des Grafikkartenmarktes mit der Radeon RX 480, die als erste Grafikkarte der Polaris-Generation mit gleichnamiger Architektur erscheint und die wir uns genauer anschauen können. Dabei versucht sich AMD an einem anderen Ansatz im... [mehr]

PowerColor Radeon RX 480 Red Devil im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/POWERCOLOR-RX480/POWERCOLOR-RX480REDDEVIL-LOGO

Mit der Radeon RX 480 will AMD zurück zu alter Stärke und hat daher über Monate hinweg die PR-Trommel geschlagen. Letztendlich dabei herausgekommen ist eine sehr gute Karte für einen niedrigen Preis, die aber nicht in allen Bereichen zu überzeugen weiß. Wohl größtes Manko der Karte sollte... [mehr]