1. Hardwareluxx
  2. >
  3. News
  4. >
  5. Hardware
  6. >
  7. Grafikkarten
  8. >
  9. NVIDIA schließt Übernahme von Mellanox ab und gibt Hinweise auf Ampere-Architektur

NVIDIA schließt Übernahme von Mellanox ab und gibt Hinweise auf Ampere-Architektur

Veröffentlicht am: von

nvidiaNVIDIA hat die Übernahme von Mellanox nun abgeschlossen. Bereits im März 2019 wurden die Pläne bekannt, aber in solchen Größenordnungen ist es üblich, dass sich die weiteren Verhandlungen, auch mit Wettbewerbshütern, einige Monate hinziehen.

Im Rahmen der Übernahme hat NVIDIAs CEO Jen-Hsun Huang TheNextPlatform nun ein Interview gegeben, welches einige interessante Hinweise enthält. Diese verweisen auch auf mögliche Neuigkeiten, die man auf der nachzuholenden Keynote der GPU Technology Conference am 14. Mai präsentieren wird.

Mit dem Kauf von Mellanox will sich NVIDIA im Datencenter-Segment besser aufstellen. Mit den Tesla-GPGPUs stellt man bereits die notwendige Rechenleistung in Form von Hardware zur Verfügung, die man untereinander auch per NVLink verbindet, eine externe Anbindung aber findet über Lösungen statt, an denen Mellanox bisher einen Maßgeblichen Anteil hatte. Im Interview ist die Wichtigkeit der schnellen Verbindungen untereinander auch der Fokus des Gesprächs. Daten sollten wenn möglich gar nicht von A nach B bewegt werden und wenn doch sollten sie entsprechend optimiert sein. Sogenannten SmartNICs sollen die Daten entsprechend vorbereiten.

Die Wichtigkeit immer schnellerer Interconnect-Technologien zeigt sich in allen Bereichen des Datacenter-Marktes. Inzwischen zeichnet sich eine Etablierung des CXL-Interconnects über die verschiedenen Herstellern hinweg ab. Gen-Z soll als weiterer offener Standard die Verbindung zwischen den Nodes und Racks übernehmen. Eben in diesem Bereich ist Mellanox aktiv.

Was sich nun abzeichnet ist, dass NVIDIA solche Interconnect- bzw. Netzwerktechnologie tiefer in die eigenen GPGPUs integriert. Die Prozessoren sollen als Management-Ebene für diese Techniken weitestgehend überflüssig werden. Der Trainings-Beschleuniger Gaudi von Habana Labs bietet beispielsweise zehn 100-GBit/s-Netzwerkinterconnects. Für Habana Labs ist eine möglichst schnelle und Latenzfreie Netzwerkanbindung ein essentieller Bestandteil für solche Hardware.

Welche Integration NVIDIA für Techniken von Mellanox wird vornehmen müssen, wird sich wohl am 14. Mai zeigen. Mellanox wird laut Huang weiter eine eigenständige Business-Sparte bleiben, die auch eigenständig weiter betrieben wird. Wir werden Mellanox also weiterhin mit anderen Unternehmen zusammenarbeiten sehen.

Hinweise zu Ampere

Außerdem spricht Huang von einer größeren Flexibilität zukünftiger AI-Beschleuniger. Derzeit sieht man die Tesla-V100-Beschleuniger für das Training von Deep-Learning-Netzwerken vor, während das Inferencing am besten auf den Turing-Karten (Tesla T4) läuft. Die Volta-Architektur ist grundsätzlich auf HPC-Leistung mit hoher Genauigkeit optimiert, bietet aber auch schon einige Tensor-Kerne.

"Today our Volta GPUs are really designed for scale up training and our Turing GPUs are designed for scale out inference. They are fine in the beginning of the AI revolution. But if you want your datacenter to be completely programable, then the processors there – including the GPUs – really want to be a lot more flexible."

Dies kann nun als Hinweis verstanden werden, dass NVIDIAs Ampere-Architektur deutlich flexibler werden wird, als dies aktuell mit der Trennung in Volta und Turing der Fall ist. 

Gegenüberstellung der Architekturen
VoltaTuring
GPUV100TU102
FP64-Kerne / SM322
FP64-Kerne / GPU 2.560144
Tensor-Kerne / SM 88
Tensor-Kerne / GPU

640

576
FP64-Rechenleistung 8,2 TFLOPS510 GFLOPS
FP32-Rechenleistung 16,4 TFLOPS16,3 TFLOPS
FP16-Rechenleistung 32,8 TFLOPS32,6 TFLOPS
INT8-Rechenleistung 130 TOPS261 TOPS
INT4-Rechenleistung 260 TOPS522 TOPS
Speicher 32 GB HBM2
4.096 Bit
1.134 GB/s
48 GB GDDR6
384 Bit
672 GB/s

Die Gegenüberstellung der Volta- und Turing-Architektur zeigt die Unterschiede recht deutlich. In der Volta-Architektur sieht NVIDIA 32 FP64-Kerne pro Streaming Multiprocessor (SM) vor, in der Turing-Architektur sind es nur zwei. Dementsprechend ist die FP64-Rechenleistung in der Turing-Architektur sehr gering. Für FP32 und FP16 liegen die Architekturen in den höchsten Ausbaustufen in etwa gleichauf.

Die Tensor-Kerne hat NVIDIA in der Turing-Architektur dahingehend optimiert, dass sie im INT8 Precision Mode die doppelte Leistung einer FP-Berechnung bieten: 2.048 Integer-Operationen pro Takt. Daher auch die hohe Rechenleistung bei niedriger Genauigkeit. Die Tensor-Kerne können bei GPUs mit der Volta- und Turing-Architektur auch in FP16-Berechnungen unterstützen. Obige Tabelle zeigt nur erreichten TFLOPS durch die Shadereinheiten.

Welche ist die beste Grafikkarte (GPU)?

Unsere Kaufberatung zu den aktuellen NVIDIA- und AMD-Grafikkarten hilft dabei, die Übersicht nicht zu verlieren. Dort zeigen wir, welche Grafikkarten aktuell die beste Wahl darstellen – egal, ob es um die reine Leistungsfähigkeit oder das Preis-Leistungs-Verhältnis geht.


Social Links

Das könnte Sie auch interessieren:

  • Gigabyte GeForce RTX 2070 Super Gaming OC 8G im Test

    Logo von IMAGES/STORIES/2017/GIGABYTE-RTX2070SUPER

    Mit der Gigabyte GeForce RTX 2070 Super Gaming OC 8G wollen wir uns heute das zweite Custom-Modell der GeForce RTX 2070 Super anschauen. Anstelle von zwei Axiallüftern kommen hier gleich drei zum Einsatz und demnach wird es sicherlich interessant werden zu sehen, wie gut sie sich hinsichtlich... [mehr]

  • Zweimal RDNA als Navi: Die Radeon RX 5700 und Radeon RX 5700 XT im Test

    Logo von IMAGES/STORIES/2017/RADEON-RX-5700XT

    Mit den Karten der Radeon-RX-5700-Serie positioniert sich AMD klar in der Mittelklasse und will dieses umsatzstarke Segment besetzen. Die Details der RNDA-Architektur haben wir uns bereits angeschaut, nun geht es darum was die Hardware leisten kann. Dazu haben wir die Radeon RX 5700 und Radeon RX... [mehr]

  • Powercolor Red Devil Radeon RX 5700 XT im Test

    Logo von IMAGES/STORIES/2017/POWERCOLOR-RADEONRX5700-DEVIL

    Der erste Schwung der Custom-Navi-Karten hat uns erreicht und mit der Powercolor Red Devil Radeon RX 5700 XT schauen wir uns ein Modell an, welches laut Hersteller schneller, leiser und in allen Belangen besser sein soll. Ob man diese hohen Ziele auch erfüllen kann, schauen wir uns auf den... [mehr]

  • Sapphire Nitro+ Radeon RX 5700 XT 8G im Test

    Logo von IMAGES/STORIES/2017/SAPPHIRE-NITRO-RADEONRX5700XT

    Der erste Schwung der Custom-Modelle für die Navi-Karten von AMD ist verfügbar. Aber noch längst nicht alle der wichtigsten Modelle haben wir uns angeschaut. Die Sapphire Nitro+ Radeon RX 5700 XT ist laut diverser Empfehlungen eine dieser Varianten, auf die man einen genauen Blick... [mehr]

  • Erste Custom-Navi: Sapphire Pulse Radeon RX 5700 XT im Test

    Logo von IMAGES/STORIES/2017/SAPPHIRE_PULSE_RADEON_RX5700XT_TEST-TEASER

    Mit der Radeon RX 5700 und der Radeon RX 5700 XT zwang AMD Anfang Juli seinen Konkurrenten dazu, sein bestehendes Grafikkarten-Produktportfolio mit den ersten drei Super-Modellen aufzufrischen, musste dafür jedoch noch vor dem eigentlichen Marktstart die Preise nach unten korrigieren. Nun... [mehr]

  • Super-Ausbau: GeForce RTX 2060 Super und GeForce RTX 2070 Super im Test

    Logo von IMAGES/STORIES/2017/GEFORCE-RTX-SUPER

    Das Versteckspiel hat nun endlich ein Ende. NVIDIA lässt die Katze aus dem Sack und schlägt AMD damit ein Schnippchen, denn der Konkurrent wird erst am kommenden Sonntag, den 7. Juli, seine neuen Radeon-RX-5700-Karten offiziell auf den Markt bringen. NVIDIA legt mit seinen neuen Super-Modellen... [mehr]