> > > > NVIDIAs Tesla K20 bzw. GK110 doch mit 14 SMX-Clustern und 2688 CUDA-Kernen

NVIDIAs Tesla K20 bzw. GK110 doch mit 14 SMX-Clustern und 2688 CUDA-Kernen

Veröffentlicht am: von

nvidiaMitte des Monats vermeldete ein Anbieter von GPU-Racks, dass NVIDIAs Tesla K20 auf Basis des GK110 mit 13 SMX-Clusters mit jeweils 192 CUDA-Kernen daher komme. Auf der GTC 2012 war noch von 2880 CUDA-Kernen bzw. dem Vollausbau mit 15 SMX-Clustern die Rede. Anfang dieser Woche wurden im Oak Ridge National Laboratory in Tennessee der Titan, der weltweit schnellste Supercomputer fertiggestellt. Dort arbeiten 18.688 NVIDIA-Tesla-K20-GPUs zusammen, um eine Rechenleistung von mehr als 20 PetaFlops zu bewerkstelligen. Anandtech hat Titan einen Besuch erstattet und dabei auch einige Details erfahren, die den bisherigen Meldungen von 13 SMX-Clustern für GK110 wiedersprechen.

So besitzt eine NVIDIA-Tesla-K20-GPU 2688 CUDA-Kerne, was auf 14 SMX-Cluster schließen lässt. Es bleibt bei der Angabe von 7,1 Milliarden Transistoren pro GPU. Über den Takt gibt es ebenfalls neue Informationen. So soll die GPU mit 732 MHz und nicht mit 702 MHz arbeiten. Der GDDR5-Grafikspeicher soll ebenfalls nicht 5120 MB sondern 6144 MB groß sein. Es macht offensichtlich einen Unterschied, ob 13 oder 14 SMX-Cluster in einer "Kepler"-GPU von NVIDIA arbeiten und wie viel Speicher angesprochen wird.

Mit den nun neuen Angaben ergeben sich die technischen Daten wie folgt:

GF110 GK104 GK110 auf Tesla K20
Fertigung 40 nm 28 nm 28 nm
Transistoren 3 Milliarden 3,54 Milliarden 7,1 Milliarden
Die-Größe 530 mm² 294 mm² etwa 600 mm²
TDP 225 Watt 225 Watt 225 Watt
GPU-Takt 772 MHz 1006 MHz 732 MHz
Speichertakt 1000 MHz 1502 MHz 1014 oder 1562 MHz
Speichertyp GDDR5 GDDR5 GDDR5
Speichergröße 1536 MB 2048 MB 6144 MB
Speicherinterface 384 Bit 256 Bit 256 oder 384 Bit
Speicherbandbreite 192 GB/Sek. 192,2 GB/Sek. 200 GB/Sek.
Shadereinheiten 512 (1D) 1536 (1D) 2688 (1D)
Textur Units 64 128 240
L1-Cache 64 KB 64 KB 64 KB
L2-Cache 768 KB 512 KB 1,5 MB
ECC Speicher und Caches nur Speicher Speicher und Caches
FP64 1/2 FP32 1/24 FP32 1/3 FP32

Sollte es beim Takt von 705 MHz bleiben, ergäbe dies eine theoretische Rechenleistung von 3,94 TFlops bei Single-Precision- und 1,31 TFlops bei Double-Precision-Berechnungen (vorher 3,52 bzw. 1,17 TFops). Der Speicher besitzt eine Transferrate von 200 GB/Sek. Geht man von einem 384 Bit breiten Speicherinterface aus, würde der GDDR5-Speicher mit 1014 MHz arbeiten. Bei 256 Bit wären es 1562 MHz. Insgesamt sollen 5 GB GDDR5-Speicher auf der Tesla K20 zum Einsatz kommen.

Stellt sich noch die Frage, woher die verschiedenen Angaben über die CUDA-Kerne stammen können. Zum einen könnten hier Fehlinformationen auf beiden Seiten vorliegen. Wir gehen aber davon aus, dass die Mitarbeiter am Oak Ridge National Laboratory wissen, welche Hardware in ihrem Supercomputer arbeitet, so dass wir diesen Angaben zunächst einmal die größte Beachtung schenken wollen - zumindest so lange nicht das Gegenteil bewiesen ist. Es ist auch möglich, dass die Angaben über 13 SMX-Cluster aus einem frühen Sample-Stadium der Tesla-K20-Karten stammen. Letztendlich konnte NVIDIA für das fertige Produkt aber ein weiteres Cluster verwenden.

Titan Board
Titan Compute-Board: 4x AMD Opteron 6274 + 4x NVIDIA Tesla K20 (Bild: Anandtech)

An dieser Stelle sei nochmals erwähnt, dass es sich bei GK110 bislang ausschließlich um ein GPU-Design für professionelle Anwendungen handelt. Ob und wann NVIDIA GK110-GPUs auch auf Consumer-Grafikkarten verbauen wird, ist nicht bekannt. Sollte dies allerdings geschehen, so geben die für Tesla K20 gewonnenen Erkenntnisse Auskunft darüber, was uns mit einem GeForce-Produkt auf Basis von GK110 erwarten könnte.

Anfang November sollen die ersten Tesla-K20-Karten ausgeliefert werden. Der Preis liegt bei 2950 Euro. Auf die weiteren Details wie Hyper Q und Dynamic Parallelism sind wir bereits genauer eingegangen.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

es liegen noch keine Tags vor.

Kommentare (5)

#1
Registriert seit: 11.01.2007

Vizeadmiral
Beiträge: 6548
Es sind 732 MHz laut HPC Wire.
#2
Registriert seit: 18.05.2007

Admiral
Beiträge: 8312
Da stimmt doch was nicht, die gleiche TDP von 225W bei fast doppelt so vielen Eiheiten (wie GK104)und 384bit-SI. NEVER!
#3
customavatars/avatar140067_1.gif
Registriert seit: 06.09.2010

Obergefreiter
Beiträge: 111
GK104 hat als GTX 680 eine TDP von 195W.
Als GTX 670 eine TDP von 170W und als 660Ti noch 150W.
#4
Registriert seit: 16.07.2009

Matrose
Beiträge: 30
@Romsky:

Die TDP ist korrekt. Vermutlich auch nur durch die gesenkten Taktraten realisierbar, wie das bei professionellen Lösungen üblich ist.
#5
customavatars/avatar148454_1.gif
Registriert seit: 20.01.2011

Oberbootsmann
Beiträge: 884
Hoffentlich gibt es ne bezahlbare Desktop Version. Mir ist Support egal (großen Unternehmen nicht, aber mit schon) und ich kann durchaus so eine Karte gebrauchen. Bitte mit 14 Clustern. Oder hack auf 15. :3
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Von ASUS bis ZOTAC: Vier Modelle der GeForce GTX 1050 Ti im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/NVIDIA-GTX1050TI-ROUNDUP/NVIDIA_GTX1050TI_4ER_ROUND_UP-TEASER

Seit Ende Oktober gibt es die aktuelle Pascal-Generation von NVIDIA auch für unter 200 Euro. Tatsächlich bekommt man hier nicht nur viel Leistung fürs Geld, sondern obendrein einen sehr effizienten 3D-Beschleuniger, wie unser Launch-Test zur NVIDIA GeForce GTX 1050 Ti pünktlich zum Marktstart... [mehr]

PowerColor Radeon RX 480 Red Devil im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/POWERCOLOR-RX480/POWERCOLOR-RX480REDDEVIL-LOGO

Mit der Radeon RX 480 will AMD zurück zu alter Stärke und hat daher über Monate hinweg die PR-Trommel geschlagen. Letztendlich dabei herausgekommen ist eine sehr gute Karte für einen niedrigen Preis, die aber nicht in allen Bereichen zu überzeugen weiß. Wohl größtes Manko der Karte sollte... [mehr]

Drei Modelle der GeForce GTX 1060 von ASUS, EVGA und Inno3D im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/3X-GTX1060-2/GTX1060_ROUNDUP2-TEASER

Nach einer kurzen Unterbrechung durch die AMD Radeon RX 470 und Radeon RX 460 machen wir weiter mit dem nächsten Schwung verschiedener Custom-Modelle zur NVIDIA GeForce GTX 1060. Während die Eigenlösungen der AMD-Partner teilweise noch immer auf sich warten lassen, ist man bei der Konkurrenz... [mehr]

Zwei Modelle der NVIDIA GeForce GTX 1050 Ti im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/EVGA-GTX-1050TI-SC/EVGA_ZOTAC_GTX1050TI_AUFMACHER

Am vergangenen Dienstag rundete NVIDIA sein Pascal-Aufgebot nach unten hin ab und kündigte mit der GeForce GTX 1050 Ti und GeForce GTX 1050 die bislang kleinsten Ableger unter den Pascal-Grafikkarten an. Ab heute werden die neuen Einsteiger-Karten zu Preisen ab 125 bzw. 155 Euro im Handel... [mehr]

MSI GeForce GTX 1060 Gaming X im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/MSI-GTX-1060-GAMING-X/MSI_GEFROCE_GTX_1060_GAMING_X-TEASER

Ob von ASUS, EVGA, Inno3D oder Gigabyte – von nahezu allen großen Grafikkarten-Herstellern konnten wir bereits ein oder mehrere Modelle auf Basis der GeForce GTX 1060 testen. Gefehlt in unserer Liste hat allerdings noch MSI. Das holen wir nun mit einem Test zur MSI GeForce GTX 1060 Gaming X... [mehr]

ASUS ROG Strix Radeon RX 480 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/ASUS-RX480/ASUS-RX480-LOGO

Nachdem wir uns bereits zwei Custom-Modelle der Radeon RX 480 abgeschaut haben, folgt heute das dritte Modell: Die ASUS ROG Strix Radeon RX 480. Große Erwartungen wurden an die bisherigen Custom-Modelle gesetzt, erfüllt werden konnten diese Erwartungen aber nur größtenteils, nicht vollends.... [mehr]