> > > > GTC 2010: DirectCompute

GTC 2010: DirectCompute

Veröffentlicht am: von

NVIDIA_GTCIm Rahmen der Einführung in das Thema DirectCompute versuchte NVIDIA die Frage zu beantworten, warum überhaupt GPUs verwendet werden sollen, um komplizierte Berechnungen durchzuführen. GPUs bieten in der Theorie eine höhere Rechenleistung, als dies aktuell CPUs können. Reduziert auf die Anzahl der FLOPs liegen GPUs sowohl bei der Rechenleistung unter DirectX 10 und 11 auf Hardware-Basis deutlich vor den modernen Prozessoren. Doch so ohne weiteres ist dies nicht möglich, denn eine effiziente Verarbeitung von Daten kann nur über eine Aufteilung eines Problems oder einer Aufgabe in viele kleine erfolgen. Soweit keine Überraschungen, denn dies ist bereits seit geraumer Zeit bekannt und wird auch dadurch deutlich, dass Prozessoren über immer mehr Kerne verfügen und sowohl dort, als auch bei den GPUs, die Verarbeitung auf möglichst vielen Kernen Vorrang vor dem Takt hat.

GTC2010_DC_02_rs GTC2010_DC_03_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

GPUs bieten einen hohen Daten-Durchfluss, aber auch eine hohe Speicher-Latancy. Daher muss die Zuteilung der Speicheradressen zum jeweiligen Thread intelligent erfolgen. Konflikte beim Zugriff sind dabei natürlich zu vermeiden.

GTC2010_DC_04_rs GTC2010_DC_05_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

Eine effektive Nutzung der GPUs setzt verschiedene Gegegebenheiten voraus. So gilt bereits bei der Programmierung zu beachten, dass pro Hardware-Shader-Unit 8 Thread-Groups maximal zur Verfügung stehen. Noch weitaus wichtiger ist die limitierte shared-Memory von 48 kB. In jeder Hardware-Shader-Unit können bis zu 1536 Threads gleichzeitig ausgeführt werden.

GTC2010_DC_06_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

Eine hohe Effektivität wird auch nur dann erreicht, wenn alle Multiprozessoren auch genutzt werden. Die anfallenden Threads werden also in Thread-Groups zusammengeführt und jeder Multiprozessor sollte mindestens eine Thread-Group zur Verarbeitung vorliegen haben. Ein großes Problem ist aber der Austausch von Daten zwischen den verschiedenen Multiprozessoren innerhalb der Thread-Groups. Eine Möglichkeit wäre es die Daten global auf allen Multiprozessoren zu synchronisieren, was allerdings zu einem gewissen Overload führt, da auch Daten übertragen werden, die nur von einer weiteren Instanz verwendet werden. Es empfiehlt sich also die Daten gezielt an die gewünschte Thread-Group zu übertragen, was dem Programmierer allerdings einen höheren Code-Aufwand abverlangt. Möglich macht dies ein sogenannter Thread Group Shared Memory, der angelegt wird und zwischen verschiedenen Thread-Groups einen Datenaustausch erlaubt.

Werden Daten aber einer GPU zwischen der ALU und dem Speicher ausgetauscht, gehört zu jedem Datenblock ein gewisser Anteil an Informationen, welche die Adresse innerhalb des Speichers und weitere Details enthalten. Mit höherer Datenrate wird dieser Overhead ebenfalls immer größer und behindern eine vernünftige Skalierung der Performance. NVIDIA hat einige Mittel und Wege gefunden diesen Overhead zu reduzieren, was sich letztendlich in einer höheren effektiven Bandbreite niederschlägt.

GTC2010_DC_11_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

DirectCompute kann bei effektiver Programmierung also hochoptimierte Aufgaben übernehmen. Ein Beispiel ist an dieser Stelle die Rauschreduzierung auf Fotos. Ein Video stellt die Abarbeitung der verschiedenen Rausch-Frequenzen dar. Links ist Originalfoto zu sehen, rechts das überarbeitete. Eine weitere Anwendung das Einfügen eines Lens-Flare-Effekts in einer 3D-Szene oder die Verarbeitung von HDR-Fotos. Beides haben wir in einem Video zusammengeführt.

Ein großes Einsatzgebiet von DirectCompute zur Berechnung von rechenintensiven Daten, ist die Darstellung von Flüssigkeiten und hier Speziellen die Simulation von Wellen.

Weitere Links:

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

es liegen noch keine Tags vor.

Kommentare (0)

Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Computex 2017: Die neuen Gehäuse und Kühler

Logo von IMAGES/STORIES/LOGOS-2017/BE_QUIET_COMPUTEX_03_806C3817DA6249FFA945BED79171A26A

Die Computex ist die wohl wichtigste Komponentenmesse - und entsprechend zahlreich waren dann auch in diesem Jahr wieder die Neuvorstellungen in den Bereichen PC-Gehäuse und Kühlung. Unser Vor-Ort-Team konnte unseren Lesern die meisten Neuheiten gleich in einer ganzen Reihe von Videos... [mehr]

be quiet! zeigt zur Computex zwei neue Netzteile, ein Gehäuse und zwei Kühler...

Logo von IMAGES/STORIES/2017/BEQUIET

Die Computex nutzt be quiet!, um in den unterschiedlichsten Kategorien neue Produkte auszustellen. Wir konnten uns zwei neue Netzteile, ein Gehäuse und zwei Kühler ansehen. Das Highlight ist sicherlich die neue Netzteilserie Straight Power 11. Die einzelnen Modelle decken das Leistungsspektrum... [mehr]

MSI: X299-Lineup, GTX 1080 Ti Lightning Z und GT75VR Titan vorgestellt (inkl....

Logo von IMAGES/STORIES/2017/MSI

Der MSI-Stand auf der Computex war ziemlich gut besucht, allerdings auch nicht ohne Grund. Denn MSI hat zur Computex jede Menge Hardware-Neuheiten mitgebracht und der Öffentlichkeit vorgestellt. So konnten wir uns einen ersten Eindruck auf das X299-Mainboard-Lineup, auf die neue GeForce GTX 1080... [mehr]

Cooler Master belebt Cosmos- und HAF-Serie und stellt weitere Neuheiten vor...

Logo von IMAGES/STORIES/2017/COOLERMASTER

Im Test zum Cosmos II 25th Anniversary Edition hofften wir noch darauf, dass Cooler Master die Cosmos-Serie weiter ausbaut. Und tatsächlich hatte der Hersteller zur Computex ein neues Modell. Und auch die beliebte HAF-Serie wird in gewisser Weise wiederbelebt. Doch das sind noch längst nicht... [mehr]

250 US-Dollar pro Ticket: Spielemesse E3 öffnet sich für alle

Logo von IMAGES/STORIES/LOGOS-2017/E3_LOGO

Die Electronic Entertainment Expo – kurz E3 – in Los Angeles ist eines der wichtigsten Ereignisse der Spielebranche. In den vergangenen Jahren aber hat die Leitmesse an Wichtigkeit verloren – immer mehr Publisher und Hersteller blieben ihr fern und stellten ihre Neuheiten abseits der... [mehr]

Eindrücke vom ASUS-ROG-Fan-Event in Berlin

Logo von IMAGES/STORIES/2017/ASUS_ROG_EVENT

Am vergangenen Samstag enthüllte ASUS im Rahmen eines ROG-Events in Berlin nicht nur seine ROG GeForce GTX 1080 Ti Poseidon und stellte mit dem Maximus IX Extreme eines der teuersten Mainboards aus, sondern hatte natürlich auch zahlreiche andere, aktuelle Gaming-Produkte der „Republic of... [mehr]