> > > > NVIDIA-GPUs und NVLink sollen zwei neue Supercomputer in den USA befeuern

NVIDIA-GPUs und NVLink sollen zwei neue Supercomputer in den USA befeuern

DruckenE-Mail
Erstellt am: von

nvidia 2013Das Department of Energy (DoE) hat in den USA die Aufträge für zwei neue Supercomputer vergeben. Den Zuschlag bekommen haben IBM und NVIDIA und damit könnte NVLink auch erstmals in den Praxiseinsatz gelangen, denn beiden Unternehmen sind die wichtigsten Unterstützer einer neuen Interconnect-Technik für GPUs und CPUs. Zur Verfügung gestellt werden soll der Supercomputer namens Summit dem Oak Ridge National Laboratory und der zweite namans Sierra dem Lawrence Livermore National Laboratory. Erstmals vorgestellt wurde NVLink auf der GTC 2014 in diesem Jahr. Im Oktober gab IBM bekannt, dass NVLink ab 2016 in den ersten Servern zu finden sein wird.

An der Spitze der schnellsten Supercomputer hält sich seit einiger Zeit der Tianhe-2, der im National Super Computer Center in Guangzhou, China, steht. Auf dem 2. Platz der Top-500-Liste hat das DoE bereits einen Server des Oak Ridge National Laboratory stehen, will mit Summit aber wieder an die Spitze dieser Liste. Mit dem Aufbau begonnen werden soll 2016, fertiggestellt werden sollen Summit und Sierra aber erst 2017, womit auch die letztendlichen technischen Spezifikationen noch unklar sind. Einzig der Einsatz der dann aktuellen Tesla-Grafikkarten sowie der dazugehörigen IBM-Prozessoren ist sicher. Zwischen 150 und 300 petaFLOPS soll Summit erreichen, während für Sierra als Ersatz des IBM Blue Gene/Q im Lawrence Livermore National Laboratory (LLNL) 100 petaFLOPS anvisiert sind. Zum Vergleich: Der bereits angesprochene Tianhe-2, die aktuelle Nummer Eins bei den Supercomputern, kommt auf 33,8 petaFLOPS.

NVIDIA NVLink in unterschiedlichen Konfigurationen
NVIDIA NVLink in unterschiedlichen Konfigurationen.

Warum Technologien wie NVLink immer wichtiger werden, macht die schiere Anzahl an Prozessoren und weiteren Beschleunigern deutlich. So sind in Tianhe-2 32.000 Intel Xeon E5-2692 12C mit 2,2 GHz verbaut. Hinzu kommen 48.000 Xeon-Phi-31S1P-Beschleunigerkarten. All diese Bauteile in kleinen und dann immer größeren Knoten miteinander zu verbinden, ist zu einer echten Herausforderung für die Entwickler eines solchen Supercomputers geworden. Für Systeme wie Summit und Sierra sowie weitere zukünftige Supercomputer dürften noch mehr Prozessoren und Beschleuniger zum Einsatz kommen, so dass die Kommunikation/Interconnects noch wichtiger werden.

Interconnects auf Basis von PCI-Express sind zum Flaschenhals geworden. Hier beträgt die Bandbreite in etwa 16 GB pro Sekunde. Zwischen dem Arbeitsspeicher und dem Prozessor sind es 60 GB pro Sekunde und moderne GPUs kommen über ein 512 Bit breites Speicherinterface auf über 300 GB pro Sekunde. Zwischen den Racks in solchen Supercomputern kommen häufig 40Gb-Ethernet-Adapter zum Einsatz, die bidirektional 40 GBit pro Sekunde erreichen sollen, in der Praxis aber für beide Kanäle auf 50 GBit pro Sekunde limitiert sind. Es wird als deutlich, wo die Engstelle in einem Knoten aus mehreren Prozessoren und Beschleunigern zu suchen ist.

NVLink als flexibler Interconnect zwischen Prozessoren und Beschleunigern
NVLink als flexibler Interconnect zwischen Prozessoren und Beschleunigern.

NVLink ist eine direkte Punkt-zu-Punkt-Verbindung ein. Diese besteht wiederum aus jeweils acht Lanes pro NVLink-Verbindung. Pascal wird zunächst einmal vier NVLinks anbieten können. Laut NVIDIA lässt sich deren Anzahl aber auch abhängig vom gewünschten Zielmarkt anpassen. Die NVLink-Verbindungen können flexibel zusammengefasst, um auch hier wieder dem jeweiligen Anwendungsfall gerecht zu werden. Denkbar ist beispielsweise eine einfache GPU-CPU-Verbindung, aber auch ein Netzwerk aus GPU-CPU- und GPU-GPU-Verbindungen.

Nicht nur die Prozessoren und Beschleuniger eines Knotens und mehreren Knoten direkt untereinander profitieren durch eine direkte Verbindung, auch spielt der Unified Memory eine immer wichtigere Rolle und profitiert von einem schnellen Interconnect.

NVLink erlaubt auch den schnellen Zugriff auf den Unified Memory
NVLink erlaubt auch den schnellen Zugriff auf den Unified Memory.

Mit den beiden neuen Supercomputern und der Zusammenarbeit mit IBM könnte sich eine Technologie etablieren, die früher oder später auch auf dem Desktop eine Rolle spielt. Die kommende GPU-Generation Pascal kann bereits über NVLink und PCI-Express kommunizieren, allerdings wird NVLink zunächst einmal den Servern vorbehalten bleiben. Ohnehin wird es noch etwas dauern, bis wir Produkte und Technologien wie Pascal, NVLink sowie Summit und Sierra in Aktion sehen werden.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (8)

#1
customavatars/avatar168709_1.gif
Registriert seit: 23.01.2012
Dromund Kaas
Kapitän zur See
Beiträge: 3258
Erinnert mich irgendwie an das was wir grad in RST haben mit Alternativen zur von Neumann Architektur?
#2
customavatars/avatar3377_1.gif
Registriert seit: 15.11.2002
www.twitter.com/aschilling
[printed]-Redakteur
Tweety
Beiträge: 29104
Die Von-Neumann-Architektur beschreibt ja nur eine grundsätzliche SISD-Architektur mit ALU, Speicher und I/O. Inzwischen ist jeder Prozessor, egal ob nun CPU oder GPU, eine deutliche Erweiterung davon.
#3
Registriert seit: 25.08.2004
AT - NÖ
Oberbootsmann
Beiträge: 832
Sorry aber im gesamten Text fehlen einzelne Wörter oder Sätze werden nicht beendet. Liest sich das niemand ordentlich durch bevor es veröffentlicht wird? Sieht aus wie mit Google übersetzt ...
#4
customavatars/avatar168709_1.gif
Registriert seit: 23.01.2012
Dromund Kaas
Kapitän zur See
Beiträge: 3258
Ja ich weiß,
aber es beruht doch immer noch drauf und langsam muss ein neues Konzept her
so hab ich das verstanden.
Ist das richtig? Wenn nicht bitte aufklären ich lerne gerne :)
#5
customavatars/avatar202850_1.gif
Registriert seit: 06.02.2014
Im sonnigen Süden
Admiral
Beiträge: 9471
Zitat Daunti;22862967
aber es beruht doch immer noch drauf und langsam muss ein neues Konzept her
so hab ich das verstanden.
Ist das richtig? Wenn nicht bitte aufklären ich lerne gerne :)

Dann mach doch mal ein par Alternativ-Vorschläge ;)
Die einzige variante die nicht auf dem von Neumann Prinzip beruht, wäre ein System das fix in Hardware für seine Aufgabe design wäre und z.B. genau dort Speicher hat wo es welchen benötigt, etc.
Das wäre vieleicht schneller, aber auch extrem unflexibel...
#6
customavatars/avatar50343_1.gif
Registriert seit: 28.10.2006

Vizeadmiral
Beiträge: 6777
Zitat Don;22862753
Die Von-Neumann-Architektur beschreibt ja nur eine grundsätzliche SISD-Architektur mit ALU, Speicher und I/O. Inzwischen ist jeder Prozessor, egal ob nun CPU oder GPU, eine deutliche Erweiterung davon.


Nicht direkt, gibt auch auf der Harvard-Architektur basierende Systeme, vor allem viele Mikrocontroller usw.

[COLOR="red"]- - - Updated - - -[/COLOR]

Zitat DragonTear;22863526
Dann mach doch mal ein par Alternativ-Vorschläge ;)
Die einzige variante die nicht auf dem von Neumann Prinzip beruht, wäre ein System das fix in Hardware für seine Aufgabe design wäre und z.B. genau dort Speicher hat wo es welchen benötigt, etc.
Das wäre vieleicht schneller, aber auch extrem unflexibel...


Nope. s.o.
#7
customavatars/avatar121197_1.gif
Registriert seit: 11.10.2009
Franken
Bootsmann
Beiträge: 729
Warum stellt so ein großes Unternehmen wie IBM keine Desktop-Prozessoren her, wenn Sie doch solch große Aufträge für Supercomputer bekommen und scheinbar auch know-how Besitzen?
#8
customavatars/avatar283_1.gif
Registriert seit: 03.07.2001
127.0.0.1
Admiral
Altweintrinker
Beiträge: 25267
Weil sie keine x86 CPUs fertigen. Zudem gabs die CPUs lange Zeit in "Desktop Rechnern", stand dann halt Apple drauf. :o)

https://de.wikipedia.org/wiki/PowerPC

https://de.wikipedia.org/wiki/IBM_Power
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Intel NUC6i7KYK: Skull-Canyon-NUC für Gelegenheitsspieler

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/INTEL-NUC-6I7KYK/INTEL_NUC6I7KYK_TEST-TEASER

Schon weit vor der offiziellen Vorstellung im März drehte das bislang schnellste NUC-System seine Runden durch das Internet – seit wenigen Tagen ist das NUC6i7KYK, welches überwiegend unter dem Codenamen "Skull Canyon" bekannt sein dürfte, im Handel verfügbar. Zeit für uns das... [mehr]

MSI Cubi 2 Plus: Flotter Mini-PC mit Mini-STX-Formfaktor im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/MSI-CUBI2PLUS/MSI_CUBI_2_PLUS_TEST-TEASER

Das MSI Cubi N mag zwar trotz seiner schlanken Abmessungen ein für Office-Arbeiten ausreichend schneller Mini-PC sein, wer jedoch ein wenig mehr Performance benötigt oder gar nach weiteren Aufrüst-Optionen Ausschau hält, der stößt schnell an seine Grenzen. Deutlich flexibler ist man mit dem... [mehr]

27-Zoll-iMac (Late 2015) mit 5K-Retina-Display im Test

Logo von IMAGES/STORIES/LOGOS-2013/IMAC-RETINA-LOGO

Ende des vergangenen Jahres aktualisierte Apple seine iMac-Produktpalette. Neu hinzugekommen ist ein kleiner iMac mit 21,5 Zoll und einer 4K-Auflösung für das Display. Neben einigen kleineren Updates beim Prozessor, der Grafikkarte sowie der Kombination aus Festplatte und SSD hat Apple beim... [mehr]

MSI Cubi N – sparsamer und lautloser Mini-PC im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/MSI-CUBI-N/MSI_CUBI_N_TEST-TEASER

Mit seinem Vortex G65-6QF SLI hatte MSI im April eindrucksvoll bewiesen, dass man sehr kompakte und trotzdem leistungsstarke High-End-Rechner mit schickem Design bauen kann. Doch nicht für jedes Anwendungsgebiet muss es gleich ein 4.000-Euro-System sein – es geht auch deutlich kleiner,... [mehr]

Buyer's Guide 2016: Bauvorschlag für einen 2.200-Euro-Rechner

Logo von IMAGES/STORIES/LOGOS-2016/BUYERS_GUIDE16_HIGH_END_SYSTEM

Nach unserem 600 und 1.300 Euro teuren Buyer's-Guide-Rechnern legen wir noch einmal eine Schippe drauf und erhöhen unser Budget auf 2.200 Euro. Welche Komponenten sind für diese Preisklasse empfehlenswert? Kann man trotzdem ein schnelles und leises System bauen? Wie fällt der... [mehr]

Buyer's Guide 2016: Bauvorschlag für einen 1.300-Euro-Rechner

Logo von IMAGES/STORIES/LOGOS-2016/BUYERS_GUIDE16_MIDRANGE

Nach dem ersten Teil unserer diesjährigen Buyer's Guides erhöhen wir das Budget von 600 auf 1.300 Euro und verbauen noch einmal deutlich schnellere Komponenten. Statt eines Core-i3-Prozessors gibt es ein Core-i5-Modell, den Massen- und Arbeitsspeicher verdoppeln wir und stecken eine deutlich... [mehr]