> > > > NVIDIA veröffentlicht CUDA 6 Release Candidate

NVIDIA veröffentlicht CUDA 6 Release Candidate

Veröffentlicht am: von

nvidia 2013Bereits im letzten Jahr hat NVIDIA CUDA 6 vorgestellt, dass vor allem die parallele Programmierung einfacher machen soll. Heute nun hat man den Release Candidate freigeben und ermöglicht den Entwicklern, die sich mit der CUDA-6-Entwicklungsumgebung beschäftigen, ihre Programme final auf diese neue Schnittstelle vorzubereiten. Besonders interessant ist dies in Hinsicht auf die neue "Maxwell"-Architektur. So lässt sich die Software bereits heute auf die neuen Features wie z.B. Unified Memory, Drop-in Bibliotheken und ein verbessertes Multi-GPU-Scaling hin ausrichten.

Zwar hat NVIDIA mit den beiden Desktop-Grafikkarten GeForce GTX 750 Ti und GeForce GTX 750 erste Hardware mit "Maxwell"-Architektur ausgeliefert, aufgrund der Ausrichtung auf den Desktop-Markt aber spielen die oben genannten Features hier keinerlei Rolle und lassen sich wohl auch nicht durch die Entwickler von CUDA-6-Anwendungen nutzen. Spätestens zur GTC 2014, die vom 24. bis 27. März in San Jose stattfindet, sollte sich dies aber ändern.

Lange wurde das "Project Denver" ebenfalls der "Maxwell"-Architektur zugeschrieben. Wie nun spätestens seit der CES 2014 bekannt ist und auch offiziell vorgestellt wurde, handelt es sich bei "Project Denver" um das erste von NVIDIA entwickelte CPU-Design auf ARM-Basis. Erstmals zum Einsatz kommen wird diese im Tegra K1 SoC. Im Rahmen der Vorstellung der GeForce GTX 750 Ti und GeForce GTX 750 sprach NVIDIA immer nur von der 1. Generation der "Maxwell"-Architektur. Denkbar ist also, dass "Project Denver" noch immer ein Bestandteil von "Maxwell" werden könnte. 

Unified Memory – Dabei handelt es sich um eine Technologie, bei der der Speicher von CPU und GPU virtuell zusammengelegt werden. Beide Chips können dann gemeinsam und gleichzeitig und eventuell gemeinsam genutzt Daten in diesem Speicher zurückgreifen. Dies reduziert aber vor allem den Programmieraufwand für die Entwickler. Ob und welchen Einfluss dies auf die Performance haben kann, ist derzeit nicht bekannt. Allerdings müssen die Daten zur Berechnung auf der GPU noch immer zwingend zwischen den verschiedenen Speicher-Domains ausgetauscht werden bzw. müssen im lokalen Grafikspeicher vorliegen. Da der Austausch über das PCI-Express-Interface stattfindet, dürfte hier auch der Flaschenhals zu suchen sein.

Drop-in Libraries – Beschleunigen automatisch die BLAS- und FFTW-Berechnungen in Applikationen um bis zu Faktor acht durch den Austausch der vorhandenen CPU-Libraries durch die GPU-Varianten.

Multi-GPU Scaling – Neu angelegte BLAS- und FFT-GPU-Libraries skalieren automatisch über bis zu acht GPUs in einem Single Node und liefern über neun TFLOPS Double-Precision-Leistung pro Node. Es werden größere Workloads als je zuvor unterstützt (bis zu 512 GB). Multi-GPU Scaling lässt sich auch mit der neuen BLAS Drop-in Library nutzen.

Schematische Darstellung des Unified Virtual Memory
Schematische Darstellung des Unified Virtual Memory

Wie gesagt, zur GTC 2014 erwarten wir weitere Erkenntnisse zu CUDA 6 und eventuelle Ankündigungen im Hardware-Bereich könnten auch einen Ausblick auf das geben, was uns auf dem Desktop in den kommenden Monaten erwarten wird.