NEWS

Kommentar

NVIDIA und die zukünftig zweigleisige GPU-Strategie

Portrait des Authors


NVIDIA und die zukünftig zweigleisige GPU-Strategie
5

Werbung

In den vergangenen Tagen wurde von verschiedenen Quellen der vermeintliche Name der nächsten GPU-Architektur aus dem Hause NVIDIA genannt. Außerdem soll es einen groben Zeitrahmen geben, in dem es die neuen Karten geben soll. Ampere soll die nächste, dann auch wieder für Spieler interessante, GPU-Architektur aus dem Hause NVIDIA heißen und schon im 2. Quartal 2018 soll es die ersten Karten geben. Es gehört allerdings auch nicht viel dazu einen groben Zeitrahmen abzuschätzen.

Dass es im Frühjahr 2018 und nach mehr als 24 Monaten der Pascal-Generation Zeit für eine neue GeForce-Produktserie wird, dürfte unbestritten sein. Wie diese heißen wird, spielt dabei sicherlich eine nebensächliche Rolle. "Namen sind Schall und Rauch" heißt es schon in Faust von Johann Wolfgang von Goethe. Viel wichtiger hingegen ist, wie NVIDIA sich im GeForce-Segment aufstellt, denn in den vergangenen Monaten standen hinsichtlich der Entwicklung neuer GPU-Architekturen sicherlich weniger die Spieler als die AI-Beschleunigung im Fokus.

Zur GPU Technology Conference im Mai präsentierte NVIDIA die Volta-Architektur. Diese ist mit den Tensor Cores und in vielen weiteren Aspekten als Beschleuniger-Hardware ausgelegt. NVIDIA hat sich bisher noch gar nicht zu einer eventuellen GeForce-Umsetzung der Volta-Architektur geäußert. Auf der GTC17 in München vor wenigen Wochen präsentierte NVIDIA eine neue Hardware-Plattform für zukünftige autonome Fahrzeuge. Drive PX Pegasus ist dazu mit zwei Xavier SoCs und zwei zusätzlichen dedizierten GPUs einer noch nicht veröffentlichten Architektur-Generation ausgestattet. Einen Namen dieser Next-Gen GPU-Architektur wollte NVIDIA bisher ebenfalls nicht verraten.

Fährt NVIDIA zukünftig zweigleisig?

In Gesprächen mit einigen Mitgliedern des Architecture-Teams von NVIDIA, die wir beispielsweise auf der GTC17EU in München oder der Hausmesse GPU Technology Conference im Mai führen konnten, war zwischen den Zeilen immer wieder zu lesen, dass es bei NVIDIA nicht mehr DIE eine Architektur gibt, die alle Anwendungsbereiche abdeckt. Mit der Pascal-Architektur sei dies zwar gelungen, aber dazu mussten Kompromisse eingegangen werden.

Mit den bis zu 640 Tensor Cores, der Fertigung in 14 nm bei 21 Milliarden Transistoren auf einer Fläche von 815 mm² ist klar, dass die GPU in dieser Form für Spieler nicht interessant werden würde, weil NVIDIA sie klar für den GPU-Beschleunigermarkt aufgelegt hat. Sicherlich wäre eine abgespeckte Variante denkbar, die beispielsweise auf die Tensor Core verzichtet, aber selbst dann wäre es fraglich welche Vorteile die Volta- oder über der Pascal-Architektur bietet.

Etwas ungewöhnlich ist, dass NVIDIA zwar schon Hardware auf Basis der Post-Volta-Architektur ankündigt, dieser bisher aber keinen Namen gibt. Uns gegenüber wurde kein Name fallen gelassen, daher können wir Ampere weder bestätigen, noch haben wir gegenteiliges gehört. Letztendlich spielt dies auch keine Rolle, denn wichtig ist was die Architektur zu leisten im Stande ist.

Zukünftig könnte NVIDIA noch deutlicher zweigleisig fahren, als man dies ohnehin schon tut. Nicht mehr jede GPU-Architektur wird auf den Tesla- und GeForce-Karten gleichermaßen einzusetzen sein. Für NVIDIA bedeutet dies aber auch einen enormen Finanz- und Engineering-Aufwand. Die Volta-Architektur soll in der Entwicklung 3 Milliarden US-Dollar gekostet haben. Diese Investition muss sich auch auszahlen. Insgesamt stellt NVIDIA bereits 86 Systeme der Top500-Supercomputer – einige davon werden auf Volta aufrüsten, weitere komplett neue Supercomputer mit Tesla V100 sind gerade im Aufbau. Eine parallele Entwicklung zweier GPU-Architekturen kann sich aber auch NVIDIA (noch) nicht leisten. Insofern könnte eine Art Tick-Tock-Prinzip Einzug halten, bei dem NVIDIA im Wechsel eine neue GPU-Architektur für GPU-Beschleuniger und den GeForce-Markt entwickelt. Mit Pascal --> Volta --> Ampere sehen wir eine erste Stufe dieser Entwicklung.

Ob allerdings jede GPU-Architektur wie Pascal einen Produktzyklus und eine dazugehörige Skalierung über 24 Monaten ermöglicht, hängt wohl auch davon ab, wie sich AMD und Intel verhalten. Mit der Einstellung von Raja Koduri bei Intel wird man bei NVIDIA sicherlich hellhörig geworden sein.