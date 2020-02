In 23 Tagen, also am 23. März, soll in San Jose die GPU Technology Conference stattfinden – wenn COVID19 hier nicht noch dazwischenfunkt. Zur Keynote der Konferenz erwartet wird eine Vorstellung der nächsten Generation der HPC-Beschleuniger bzw. GPGPU-Karten. Diese sollen auf der Ampere-Architektur basieren, zu der es noch keinerlei Details gibt.

Twitterer @_rogame ist in der Online-Datenbank des Geekbench einige Ergebnisse ausfindig gemacht, welche bisher unbekannte NVIDIA-GPUs beinhalten. Zu bedenken ist an dieser Stelle, dass die Ergebnisse offenbar aus dem Oktober und November des vergangenen Jahres stammen und bisher nur unentdeckt blieben. Wie immer gilt es bei solchen Ergebnissen und Details eine gewisse Vorsicht in der Beurteilung walten zu lassen.

Satte 7.552 bzw. 6.912 CUDA-Cores (Shadereinheiten) sollen hier zum Einsatz kommen. Zum Vergleich: Eine GeForce RTX 2080 Ti bietet 4.352 Shadereinheiten, eine Quadro RTX 6000/8000 kommt auf derer 4.608 und eine Tesla V100 (mit GV100-GPU), der nominelle Vorgänger der Ampere-Karten, bringt es auf 5.120 Shadereinheiten.

Eine vermeintliche GA100-GPU mit 7.552 bzw. 6.912 Shadereinheiten besäße also fast 50 % mehr Shadereinheiten. Ob es beim Aufbau bei 64 Shadereinheiten für einen Streaming Multiprozessor (SM), sprich 118 bzw. 108 SMs bleibt, lässt sich nur vermuten. Zumindest ein Vielfaches von 64 scheint dürfte aber wieder eine Rolle spielen.

Unbekannt ist natürlich der weitere Aufbau. Die Volta-Architektur bietet pro SM 64 FP32-, 64 INT32- und 32 FP64-Recheneinheiten. Hinzu kommen acht Tensor-Kerne und vier Textureinheiten. RT-Kerne spielen erst in der Turing-Architektur eine Rolle. Ob diese im HPC-Segment überhaupt sinnvoll einsetzbar wären, ist nicht bekannt.

Das Geekbench-Ergebnis nennt außerdem den Speicherausbau von 24 und 47 GB. Die 47 GB dürften sich aber eher auf 48 GB beziehen und werden hier aufgrund eines unbekannten Fehlers offenbar falsch angezeigt. Bis zu 48 GB kennen wir schon von der Quadro RTX 8000. Ob hier von GDDR6 oder HBM2 die Rede ist, bleibt ebenfalls offen. HBM2 ließe sich in sechs Speicherchips zu je 8 GB auf 48 GB bringen. Bei dieser Anzahl an Chips sprächen wir dann von einem Speicherinterface mit einer Breite von 6.144 Bit. Bei 460 GB/s pro Chip sprächen wir von einer Gesamtspeicherbandbreite von 2,76 TB/s. Ob dies in dieser Form zu realisieren ist, bleibt abzuwarten.

Keine große Aussagekraft haben die Angaben zum Takt, denn es dürfte sich um recht frühe Samples handeln. Eine Tesla V100 kommt in der PCI-Express-Variante auf 1.245 MHz. Für Ampere wird der Einsatz der 7-nm-Fertigung erwartet und von daher wären auch höhere Taktraten als die angegebenen 1.110 MHz zu erwarten.

Next-Gen HPC oder GeForce

Der Speicherausbau legt nahe, dass wir hier Ampere-Chips für das HPC-Segment sehen. Ob sich daraus auch Rückschlüsse auf zukünftige GeForce-Karten machen lassen, ist nicht bekannt. Insgesamt ist die Informationslage noch recht dünn.

Hinsichtlich der Fertigung wird der Einsatz von 7 oder 8 nm erwartet. Beim Speicher dürfte im HPC-Bereich HBM2 zum Einsatz kommen, während GeForce-Karten wohl eher nicht den teuren Speicher verwenden werden. Wir werden wohl die GTC Ende März abwarten müssen, bis wir gesicherte Erkenntnisse haben.