NEWS

NVIDIAs Tesla K20 bzw. GK110 doch mit 14 SMX-Clustern und 2688 CUDA-Kernen

Von Andreas Schilling
Mittwoch, 31.10.2012 um 14:52 Uhr

Mitte des Monats vermeldete ein Anbieter von GPU-Racks, dass NVIDIAs Tesla K20 auf Basis des GK110 mit 13 SMX-Clusters mit jeweils 192 CUDA-Kernen daher komme. Auf der GTC 2012 war noch von 2880 CUDA-Kernen bzw. dem Vollausbau mit 15 SMX-Clustern die Rede. Anfang dieser Woche wurden im Oak Ridge National Laboratory in Tennessee der Titan, der weltweit schnellste Supercomputer fertiggestellt. Dort arbeiten 18.688 NVIDIA-Tesla-K20-GPUs zusammen, um eine Rechenleistung von mehr als 20 PetaFlops zu bewerkstelligen. Anandtech hat Titan einen Besuch erstattet und dabei auch einige Details erfahren, die den bisherigen Meldungen von 13 SMX-Clustern für GK110 wiedersprechen.

So besitzt eine NVIDIA-Tesla-K20-GPU 2688 CUDA-Kerne, was auf 14 SMX-Cluster schließen lässt. Es bleibt bei der Angabe von 7,1 Milliarden Transistoren pro GPU. Über den Takt gibt es ebenfalls neue Informationen. So soll die GPU mit 732 MHz und nicht mit 702 MHz arbeiten. Der GDDR5-Grafikspeicher soll ebenfalls nicht 5120 MB sondern 6144 MB groß sein. Es macht offensichtlich einen Unterschied, ob 13 oder 14 SMX-Cluster in einer "Kepler"-GPU von NVIDIA arbeiten und wie viel Speicher angesprochen wird.

Mit den nun neuen Angaben ergeben sich die technischen Daten wie folgt:

	GF110	GK104	GK110 auf Tesla K20
Fertigung	40 nm	28 nm	28 nm
Transistoren	3 Milliarden	3,54 Milliarden	7,1 Milliarden
Die-Größe	530 mm²	294 mm²	etwa 600 mm²
TDP	225 Watt	225 Watt	225 Watt
GPU-Takt	772 MHz	1006 MHz	732 MHz
Speichertakt	1000 MHz	1502 MHz	1014 oder 1562 MHz
Speichertyp	GDDR5	GDDR5	GDDR5
Speichergröße	1536 MB	2048 MB	6144 MB
Speicherinterface	384 Bit	256 Bit	256 oder 384 Bit
Speicherbandbreite	192 GB/Sek.	192,2 GB/Sek.	200 GB/Sek.
Shadereinheiten	512 (1D)	1536 (1D)	2688 (1D)
Textur Units	64	128	240
L1-Cache	64 KB	64 KB	64 KB
L2-Cache	768 KB	512 KB	1,5 MB
ECC	Speicher und Caches	nur Speicher	Speicher und Caches
FP64	1/2 FP32	1/24 FP32	1/3 FP32

Sollte es beim Takt von 705 MHz bleiben, ergäbe dies eine theoretische Rechenleistung von 3,94 TFlops bei Single-Precision- und 1,31 TFlops bei Double-Precision-Berechnungen (vorher 3,52 bzw. 1,17 TFops). Der Speicher besitzt eine Transferrate von 200 GB/Sek. Geht man von einem 384 Bit breiten Speicherinterface aus, würde der GDDR5-Speicher mit 1014 MHz arbeiten. Bei 256 Bit wären es 1562 MHz. Insgesamt sollen 5 GB GDDR5-Speicher auf der Tesla K20 zum Einsatz kommen.

Stellt sich noch die Frage, woher die verschiedenen Angaben über die CUDA-Kerne stammen können. Zum einen könnten hier Fehlinformationen auf beiden Seiten vorliegen. Wir gehen aber davon aus, dass die Mitarbeiter am Oak Ridge National Laboratory wissen, welche Hardware in ihrem Supercomputer arbeitet, so dass wir diesen Angaben zunächst einmal die größte Beachtung schenken wollen - zumindest so lange nicht das Gegenteil bewiesen ist. Es ist auch möglich, dass die Angaben über 13 SMX-Cluster aus einem frühen Sample-Stadium der Tesla-K20-Karten stammen. Letztendlich konnte NVIDIA für das fertige Produkt aber ein weiteres Cluster verwenden.

[figure image=images/stories/newsbilder/aschilling/2012/tesla-k20-oak-anandtech-rs.jpg link=images/stories/newsbilder/aschilling/2012/tesla-k20-oak-anandtech.jpg alt=Titan Board]Titan Compute-Board: 4x AMD Opteron 6274 + 4x NVIDIA Tesla K20 (Bild: Anandtech)[/figure]

An dieser Stelle sei nochmals erwähnt, dass es sich bei GK110 bislang ausschließlich um ein GPU-Design für professionelle Anwendungen handelt. Ob und wann NVIDIA GK110-GPUs auch auf Consumer-Grafikkarten verbauen wird, ist nicht bekannt. Sollte dies allerdings geschehen, so geben die für Tesla K20 gewonnenen Erkenntnisse Auskunft darüber, was uns mit einem GeForce-Produkt auf Basis von GK110 erwarten könnte.

Anfang November sollen die ersten Tesla-K20-Karten ausgeliefert werden. Der Preis liegt bei 2950 Euro. Auf die weiteren Details wie Hyper Q und Dynamic Parallelism sind wir bereits genauer eingegangen.

Quellen und weitere Links

KOMMENTARE (5)

{{{_source.title}}} {{#_source.showPrice}} {{{_source.displayPrice}}} {{/_source.showPrice}}

NVIDIAs Tesla K20 bzw. GK110 doch mit 14 SMX-Clustern und 2688 CUDA-Kernen