> > > > NVIDIA GeForce GTX 1080 mit Pascal-Architektur im XXL-Test

NVIDIA GeForce GTX 1080 mit Pascal-Architektur im XXL-Test

DruckenE-Mail
Erstellt am: von

Seite 6: Fast Sync und SLI HD

Die fehlende Synchronisation zwischen der Ausgabe der Grafikkarten und der Darstellung durch das Panel des Monitors sind AMD mit FreeSync und NVIDIA mit G-Sync angegangen. Doch trotz oder gerade wegen dieser Synchronisation spielt das V-Sync weiterhin eine Rolle und ringt dem Nutzer auch ebenso weiterhin einige Kompromisse ab. Gerade sogenannten High-FPS-Games wie Counter-Strike, Dota 2 oder andere sind davon betroffen, denn hier sind die aktuellen High-End-Grafikkarten in der Lage hunderte von FPS auszugeben.

Fast Sync auf der GeForce GTX 1080Fast Sync auf der GeForce GTX 1080

Fast Sync auf der GeForce GTX 1080

Der Nutzer steht nun also vor der Wahl ob er V-Sync ein- oder ausschalten soll. Beide Methoden haben ihre Vor- und Nachteile. Während ein eingeschaltetes V-Sync vor allem ein Tearing (also die Darstellung von zwei verschobenen Frames auf einem Display-Scan) verhindert, wird durch das Verwerfen vieler Frames eine hohe Latenz erzeugt. Ausgeschalteten V-Sync reduziert diese Latenzen zwar wieder, sorgt aber für ein starkes Tearing. NVIDIA hat nun eine Methode entwickelt, in der der Render Buffer vom Display Buffer getrennt wird – Decoupling Render and Display nennt NVIDIA dies. Der Buffer wird dazu in drei Bereiche aufgeteilt: Front Buffer, Back Buffer und Last Rendered Buffer. Diese Buffer werden nun als eine Art Zwischenspeicher verwendet und nur der gerade zuletzt fertigestellte Frame wird an das Display ausgeliefert.

Mit Fast Sync werden keine Frames mehr zurückgehalten und damit unnötig verzögert. Ebenso werden die Latenzen reduziert. Zudem bewegt man sich mit Fast Sync hinsichtlich der Latenzen fast auf Niveau von ausgeschaltetem V-Sync. Ein Tearing ist bei Fast Sync ebenso nicht möglich. Fast Sync soll nicht nur für aktuelle Grafikkarten mit Pascal-GPU angeboten werden, sondern auch auf älteren Architekturen. Alle Maxwell-GPUs werden sicherlich dabei sein. Wie weit NVIDIA aber zurückgehen möchte, steht derzeit noch nicht fest.

Fast Sync im Control Panel des NVIDIA-Treibers
Fast Sync im Control Panel des NVIDIA-Treibers

Fast Sync noch einmal im Detail

Für alle diejenigen unter euch, die genauer wissen wollen, wie Fast Sync funktioniert, haben wir noch einmal etwas genauer nachgesehen. Die Game Engine liefert einen Frame an die DirectX-API bzw. den Treiber. Animation Time und Draw Calls werden über den Treiber an die GPU übertragen, woraufhin diese den gerenderten Frame an den Frame Buffer liefert. Daraus wird dann der Scan erstellt, der für die Darstellung auf dem Display sorgt.

Traditionelle Methode der Render Pipeline für die Ausgabe der Frames
Traditionelle Methode der Render Pipeline für die Ausgabe der Frames

Bei aktviertem V-Sync wird der Game Engine nun gesagt, dass diese nur so viele berechnen soll, wie auf dem Display dargestellt werden können (60 FPS, 90 FPS, 120 FPS, 144 FPS, etc.). Dies sorgt allerdings dafür, dass ein eventuell getätigter Input (eine Mausbewegung oder ein Tastendruck auf der Tastatur) erst verzögert mit in das Rendering einbezogen wird. Mit ausgeschaltetem V-Sync werden so viele Frames wie möglich geliefert, die Verzögerungen sind damit kurz, allerdings kann es zu einem Tearing kommen.

NVIDIA trennt nun die Auslieferung des Frames an den Frame Buffer von der Ausgabe durch die GPU. Daher stammt auch die Bezeichnung Decoupled Render and Display. Innerhalb der kompletten Rendering Pipeline kann die Rendering Stage, also von der Game Engine bis hin zur GPU, weiterhin Frames rendern, die dann nur temporär im Frame Buffer gespeichert werden. Die Display Stage ist davon abgetrennt und arbeitet in gewisser Weise eigenständig. Für die Game Engine wirkt also alles wie ein ausgeschaltetes V-Sync. Es werden so viele Frames wie möglich berechnet und jeder Input durch den Nutzer fließt in diesen Prozess mit ein. Im Frame Buffer entscheidet Fast Sync dann, welcher Frame passend zur Displayausgabe synchron läuft und gibt diesen aus.

Decoupled Render and Display
Decoupled Render and Display

Dazu musste NVIDIA den Frame Buffer aber in drei Bereiche aufteilen. Front Buffer und Back Buffer arbeiten weiterhin wie ein Double Buffered V-Sync. Im Front Buffer befindet sich der Frame, der durch das Display ausgegeben werden soll. Im Back Buffer wird der gerade gerenderte Frame vorgehalten. Zwischen diesen beiden Buffern wird normalerweise hin und hergewechselt, wenn V-Sync verwendet wird. In einem neuen neuen Last Rendered Buffer wird für Fast Sync nun der aktuellste gerenderte Frame vorgehalten – genau wie im Back Buffer. Man hat also eine Kopie des Back Buffer im Last Rendered Buffer.

Decoupled Buffer - Front, Back und last Rendered Buffer
Decoupled Buffer - Front, Back und last Rendered Buffer

Hat der Front Buffer seinen Frame ausgeliefert, wird als nächster Frame derjenige aus dem Last Rendered Buffer genommen und der Prozess beginnt von vorne. Da zwischen den Buffern keine Frames kopiert werden, werden die Buffer einfach umbenannt. Der Buffer aus dem gerade für das Display gescannt wird ist der Front Buffer. Der Buffer in den gerade aktiv ein Frame gerendert wird, ist der Back Buffer und der Buffer der gerade den zuletzt gerenderten Frame vorhält ist der Last Rendered Frame. Eine neue Flip-Logik in der Pascal-Architektur kontrolliert diesen Prozess. Allerdings sollen wie gesagt auch ältere Architekturen dazu in der Lage sein.

SLI HD

In einem SLI-System erfolgt der Abgleich der fertig gerenderten Frames über die dazugehörigen SLI-Brücken. Theoretisch wäre die Übertragung auch per PCI-Express-Interface möglich, allerdings ist die Bandbreite dort limitiert und auch die Latenzen sind höher, als es die Anforderungen von SLI meist erlauben. NVIDIA verwendet daher einen oder zwei SLI-Anschlüsse auf seinen Karten. Die High-End-Modelle verfügen meist über zwei dieser Anschlüsse, während es in der Mittelklasse nur noch einer ist und im Low-End-Segment komplett darauf verzichtet wird. In Notebooks und auch im Low-End-Bereich ist manchmal ein SLI-Abgleich per PCI-Express möglich, allerdings sind die Bildrate und die Auflösung dann meist deutlich geringer, so dass dies kein größeres Problem ist.

Schematische Darstellung der SLI-HD-Brücken
Schematische Darstellung der SLI-HD-Brücken

Mit dem Aufkommen immer höher auflösender Displays sowie Bildwiederholungsraten von 144 Hz und mehr werden die Anforderungen an den Frame-Austausch via SLI-Brücken aber auch immer größer. Die Verbindung der SLI-Anschlüsse wird üblicherweise mit 400 MHz, also dem gleichen Takt wie die Ansteuerung der Display-Ausgänge betrieben. Im vergangenen Jahr aber haben Hersteller wie ASUS, EVGA und MSI spezielle SLI-Bridges vorgestellt, die nicht mehr mit 400 MHz arbeiten, sondern mit 540 MHz zu Werke gehen. Die damit einhergehende Erhöhung der Bandbreite kommt vor allem solchen Systemen zu gute, die einen Monitor mit mehr als 144 Hz oder der 4K-Aufösung betreiben. Allerdings sollen diese SLI-Brücken nicht so funktioniert haben, wie sich die Hersteller das vorgestellt haben – so NVIDIA.

Wer zukünftig ein Multi-Monitor-Setup mit besonders hoher Auflösung verwendet und dazu auch noch ein SLI-System bestehend aus zwei GeForce GTX 1080 oder GTX 1070 betreibt, wird in Zukunft per Treiber darüber in Kenntniss gesetzt, dass die verwendete SLI-Brücke nicht in der Lage ist, die notwendige Bandbreite zur Verfügung zu stellen. Dann muss eine der neue SLI-HD-Brücken erstanden werden, die NVIDIA selbst anbieten möchte. Die Brücken sind in verschiedenen Längen erhältlich. Je nachdem wie viele Slots Platz zwischen den Karten ist, muss eine passende Brücke erstanden werden. Wird ein anderes Mainboard mit einem größeren oder kleineren Abstand verbaut, muss eine neue Brücke gekauft werden. Flexible Brücken möchte NVIDIA nicht anbieten, da diese sich nicht in einer dafür notwendig hohen Qualität fertigen lassen. Über Preise macht NVIDIA noch keine Angaben.

NVIDIAs Empfehlungen sehen die alten Brücken für eine Auflösung bis zu 2.560 x 1.440 Pixel bei 60 Hz vor. Darüber hinaus, also ab 2.560 x 1.440 Pixel und ab einer Bildwiederholungsrate von 120 Hz sollen die neuen Brücken eingesetzt werden.

Empfehlungen seitens NVIDIA

Auflösung:

1.920 x 1.080 Pixel

2.560 x 1.440 Pixel
bei 60 Hz

2.560 x 1.440 Pixel
bei 120 HZ

4K 5K Surround
Standard-Brücke Ok Ok - - - -
LED-Brücke Ok Ok Ok Ok - -
Neue Brücke

Ok

Ok Ok Ok Ok Ok

Die obigen Bildergalerie zeigt ein SLI-Gespann aus zwei GeForce GTX 1080 sowie die SLI-Brücken in den zwei Größen. NVIDIA möchte die Sinnhaftigkeit der neuen SLI-Brücken auch mit einigen Messwerten untermauern. Dazu wurden in einem SLI-System Frametime-Messungen mittels FCAT vorgenommen:

Frametime-Messungen zweier GeForce GTX 1080 im SLI mit neuer und alter SLI-Brücke
Frametime-Messungen zweier GeForce GTX 1080 im SLI mit neuer und alter SLI-Brücke

Während die schwarze Linie die Schwankungen in den Frametimes mit einer alten SLI-Brücke zeigt, ist die blaue Linie deutlich flacher. Aus Benchmarks verwendete NVIDIA Mittelerde: Shadow of Mordor bei einer Auflösung von 11.520 x 2.160 Pixel.