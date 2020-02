In diesem Jahr stehen womöglich gleich zwei neue GPU-Architekturen an. Auf der GPU Technology Conference, die vom 23. bis zu 26. März in San Jose stattfinden wird, dürfte NVIDIA seine nächste HPC-Architektur alias Ampere vorgestellt werden. Der Vorgänger Volta wurde im März 2017 vorgestellt – es ist also sicherlich Zeit für eine neue Generation. Auch bei den GeForce-Karten dürfte es in diesem Jahr Neuigkeiten geben, wenngleich es hier wenig bis gar nichts Konkretes zu berichten gibt.

Aber kommen wir zu der nächsten Generation der Tesla-Karten. Die Indiana University kündigte kürzlich die Inbetriebnahme des Big Red 200 Supercomputer an. Dieser soll 6 PFLOPS erreichen und einer der schnellsten Supercomputer in einer Bildungseinrichtung sein. Aufgebaut ist der Big Red 200 von Cray in Form von Shasta-Racks, die AMDs aktuelle EPYC-Prozessoren alias Rome (1.344 EPYC 7742 mit jeweils 64 Kernen) enthalten sollen.

Die angesprochene Rechenleistung von 6 PFLOPS wird nur durch die Prozessoren erreicht. Gegenüber The Next Platform sprach die Universität davon ursprünglich den Einsatz von Tesla-V100-Beschleunigern geplant zu haben. Nun aber sollen "next-generation NVIDIA Tensor Core GPUs" zum Einsatz kommen. Ein oder mehr GPU-Beschleuniger pro Node sollen die Rechenleistung des Systems auf 8 PFLOPS steigern – 2 PFLOPS also durch die GPU-Beschleuniger. Da die neuen HPC-GPUs von NVIDIA eine um 70 bis 75 % höhere Leistung im Vergleich zum Vorgänger bieten, kämen weniger als ursprünglich geplant zum Einsatz.

Eine um 70 bis 75 % höhere Leistung pro GPU-Beschleuniger wären ein ordentlichen Leistungsplus. Allerdings ist nicht ganz klar, welche Rechenleistung hier gemeint ist. Eine GPGPU kann Berechnungen bei doppelter Genauigkeit (FP64), einfacher Genauigkeit (FP32) und halber Genauigkeit (FP16) ausführen. Die Tensor-Kerne, die erstmals in der Volta-Architektur eingesetzt wurden, die aber auch in der Turing-Architektur Verwendung finden, können FP16-Berechnungen ausführen, aber auch ganzzahlige Matrixoperationen in INT8, INT4 und theoretisch auch INT2. Da die Berechnungen mit geringerer Genauigkeit vor allem im AI-Bereich eine wichtige Rolle spielen und dieser weiterhin stark wächst, kann davon ausgegangen werden, dass NVIDIA die Tensor-Kerne weiter ausbaut – in deren Anzahl aber womöglich auch in der Funktionsweise.

Die GPU-Beschleuniger sollen im Spätsommer bzw. Herbst installiert werden. Dies gibt uns auch einen groben Zeitplan für NVIDIAs neue Tesla-GPUs. Wie sagt wird erwartet, dass NVIDIA die neue Architektur namens Ampere im März vorstellen wird. Der Big Red 200 dürfte damit eines der ersten Systems sein, welches die neuen GPUs verwendet. Ob die Vorstellung der Ampere-Architektur auch Rückschlüsse auf die GeForce-Ableger zulässt, lässt sich schwer sagen. Die Volta-Architektur kam ausschließlich in Form der Titan V im Desktop zum Einsatz. Erst die Turing-Architektur brachte uns im Sommer 2018 wieder neue GeForce-Karten. Turing-GPUs kommen auch als Tesla-Inferencing-Beschleuniger zum Einsatz. Daher spricht NVIDIA in diesem Zusammenhang auch von "Tensor Core GPUs" – was somit vieles bedeuten kann.

Der März wird also sicherlich spannend werden, wenn es um neue GPU-Neuigkeiten von NVIDIA geht.