1. Hardwareluxx
  2. >
  3. News
  4. >
  5. Allgemein
  6. >
  7. Vor-Ort/Messen
  8. >
  9. GTC 2010: DirectCompute

GTC 2010: DirectCompute

Veröffentlicht am: von

NVIDIA_GTCIm Rahmen der Einführung in das Thema DirectCompute versuchte NVIDIA die Frage zu beantworten, warum überhaupt GPUs verwendet werden sollen, um komplizierte Berechnungen durchzuführen. GPUs bieten in der Theorie eine höhere Rechenleistung, als dies aktuell CPUs können. Reduziert auf die Anzahl der FLOPs liegen GPUs sowohl bei der Rechenleistung unter DirectX 10 und 11 auf Hardware-Basis deutlich vor den modernen Prozessoren. Doch so ohne weiteres ist dies nicht möglich, denn eine effiziente Verarbeitung von Daten kann nur über eine Aufteilung eines Problems oder einer Aufgabe in viele kleine erfolgen. Soweit keine Überraschungen, denn dies ist bereits seit geraumer Zeit bekannt und wird auch dadurch deutlich, dass Prozessoren über immer mehr Kerne verfügen und sowohl dort, als auch bei den GPUs, die Verarbeitung auf möglichst vielen Kernen Vorrang vor dem Takt hat.

GTC2010_DC_02_rs GTC2010_DC_03_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

GPUs bieten einen hohen Daten-Durchfluss, aber auch eine hohe Speicher-Latancy. Daher muss die Zuteilung der Speicheradressen zum jeweiligen Thread intelligent erfolgen. Konflikte beim Zugriff sind dabei natürlich zu vermeiden.

GTC2010_DC_04_rs GTC2010_DC_05_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

Eine effektive Nutzung der GPUs setzt verschiedene Gegegebenheiten voraus. So gilt bereits bei der Programmierung zu beachten, dass pro Hardware-Shader-Unit 8 Thread-Groups maximal zur Verfügung stehen. Noch weitaus wichtiger ist die limitierte shared-Memory von 48 kB. In jeder Hardware-Shader-Unit können bis zu 1536 Threads gleichzeitig ausgeführt werden.

GTC2010_DC_06_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

Eine hohe Effektivität wird auch nur dann erreicht, wenn alle Multiprozessoren auch genutzt werden. Die anfallenden Threads werden also in Thread-Groups zusammengeführt und jeder Multiprozessor sollte mindestens eine Thread-Group zur Verarbeitung vorliegen haben. Ein großes Problem ist aber der Austausch von Daten zwischen den verschiedenen Multiprozessoren innerhalb der Thread-Groups. Eine Möglichkeit wäre es die Daten global auf allen Multiprozessoren zu synchronisieren, was allerdings zu einem gewissen Overload führt, da auch Daten übertragen werden, die nur von einer weiteren Instanz verwendet werden. Es empfiehlt sich also die Daten gezielt an die gewünschte Thread-Group zu übertragen, was dem Programmierer allerdings einen höheren Code-Aufwand abverlangt. Möglich macht dies ein sogenannter Thread Group Shared Memory, der angelegt wird und zwischen verschiedenen Thread-Groups einen Datenaustausch erlaubt.

Werden Daten aber einer GPU zwischen der ALU und dem Speicher ausgetauscht, gehört zu jedem Datenblock ein gewisser Anteil an Informationen, welche die Adresse innerhalb des Speichers und weitere Details enthalten. Mit höherer Datenrate wird dieser Overhead ebenfalls immer größer und behindern eine vernünftige Skalierung der Performance. NVIDIA hat einige Mittel und Wege gefunden diesen Overhead zu reduzieren, was sich letztendlich in einer höheren effektiven Bandbreite niederschlägt.

GTC2010_DC_11_rs

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

DirectCompute kann bei effektiver Programmierung also hochoptimierte Aufgaben übernehmen. Ein Beispiel ist an dieser Stelle die Rauschreduzierung auf Fotos. Ein Video stellt die Abarbeitung der verschiedenen Rausch-Frequenzen dar. Links ist Originalfoto zu sehen, rechts das überarbeitete. Eine weitere Anwendung das Einfügen eines Lens-Flare-Effekts in einer 3D-Szene oder die Verarbeitung von HDR-Fotos. Beides haben wir in einem Video zusammengeführt.

Ein großes Einsatzgebiet von DirectCompute zur Berechnung von rechenintensiven Daten, ist die Darstellung von Flüssigkeiten und hier Speziellen die Simulation von Wellen.

Weitere Links:

Social Links

Tags

es liegen noch keine Tags vor.

Das könnte Sie auch interessieren:

  • be quiet! präsentiert High-End-Netzteile, ein Airflow-PC-Gehäuse und zwei...

    Logo von IMAGES/STORIES/2017/BEQUIET

    be quiet! fährt zur CES groß auf: Man präsentiert neue High-End-Netzteile, ein PC-Gehäuse, das auf hohen Airflow ausgelegt wurde und auch noch zwei Prozessorkühler.  Die Dark Power Pro 12-Netzteile sind die ersten be quiet!-Netzteile mit 80-PLUS-Titanium-Zertifizierung und einem... [mehr]

  • Mein Tag auf der gamescom 2019 in Köln

    Logo von IMAGES/STORIES/2017/GAMESCOM

    Auch dieses Jahr fand wieder die weltweit größte Messe für Computer- und Videospiele - gemessen an der Ausstellungsfläche und Besucheranzahl - in Köln statt. Die seit 2009 in der Domstadt ansässige gamescom stand ganz im Zeichen des Cloud-Gamings. Hardwareluxx hat sich gleich mit mehreren... [mehr]

  • Hardwareluxx wünscht frohe Weihnachten 2019!

    Logo von IMAGES/STORIES/2017/HARDWARELUXX

    Im Namen des gesamten Hardwareluxx-Teams wünschen wir all unseren Lesern und Community-Mitgliedern ein fröhliches Weihnachtsfest: Genießt die ruhigen Stunden des Jahres mit vielen Plätzchen, Lebkuchen, dem einen oder anderen Glas Glühwein und natürlich mit vielem und leckerem Essen. Lasst... [mehr]

  • Die wichtigsten Pressekonferenzen der E3 2019 im Überblick

    Logo von IMAGES/STORIES/2017/E3_LOGO

    AMD hatte die diesjährige E3 2019 in Los Angeles fest im Griff. Eines der wichtigsten Themen war natürlich die Vorstellung der ersten Navi-Grafikkarten sowie die Enthüllung der kommenden Ryzen-Prozessoren der dritten Generation, die im Laufe des Sommers erscheinen werden. Doch auch die... [mehr]

  • Computex 2019 schloss mit neuem Besucherrekord

    Logo von IMAGES/STORIES/2017/COMPUTEX_LOGO_NEU

    Wir haben eine lange und anstrengende Messewoche hinter uns – die Computex eröffnete offiziell zwar erst am Dienstag der vergangenen Woche und lief bis zum Samstag, unsere Arbeit erstreckte sich aber fast über die komplette Woche. Die offiziellen Zahlen zur Messe zeigen stabile, wenn auch... [mehr]

  • CES 2020: XPG zeigt erste Monitore und Notebooks

    Logo von IMAGES/STORIES/2017/ADATA

    ADATAs Gaming-Label XPG deckt ohnehin schon unterschiedliche Segmente ab. Zur CES zeigt man jetzt sogar erste Monitore und Notebooks, aber auch das zylinderförmige PC-Gehäuse Volta. Dieses große Gehäuse befindet sich noch im Konzeptstadium und XPG sammelt noch Feedback dazu. In der gestreiften... [mehr]