> > > > Optimierte VRAM-Timings steigern Mining-Leistung um 30 Prozent

Optimierte VRAM-Timings steigern Mining-Leistung um 30 Prozent

Veröffentlicht am: von

mining2Im Zuge unseres Artikels zu den Optimierungen für das GPU-Mining haben wir zwar bereits elf Grafikkarten in den unterschiedlichsten Einstellungen und für drei Alt-Coins getestet, allerdings ist das Thema damit noch nicht ganz ausgereizt. Anders als bei den aktuellen Grafikkarten mit NVIDIA-GPU, kann bei den AMD-Grafikkarten das BIOS in der Art angepasst werden, dass auch die VRAM-Timings optimiert werden können. Dieses Thema haben wir im ursprünglichen Artikel komplett außen vorgelassen, wollen dies nun aber nachholen.

Zunächst einmal aber noch ein paar Worte zum aktuellen Zustand der Kryptowährungen bzw. des Minings mit GPUs. Nahezu alle Währungen haben in den vergangenen sechs Monaten im Kurs um etwa 60 % eingebüßt. Allerdings macht es den Eindruck, als seien die Kurse damit auch wieder etwas stabiler geworden. Die täglichen und wöchentlichen Kursschwankungen sind geringer geworden. Wie bereits mehrfach angeführt, kann man sich über den Sinn und Unsinn von Kryptowährungen streiten, allerdings macht es nicht den Eindruck, als würden diese in naher Zukunft wieder verschwinden. Die Blockchain-Technologie insgesamt ist sinnvoll und hat mit den Währungen derzeit nur einen prominenten Anwendungsfall. Dies könnte und wird sich sicherlich auch noch ändern.

Zudem bleibt es dabei: Aufgrund des Strompreises und den Anschaffungskosten lohnt der Betrieb eines Mining-Systems hierzulande nur in Ausnahmefällen. Die Hersteller allerdings investieren weiterhin in entsprechende Hardware – wie zuletzt auf der Computex zu sehen war. Dabei betreiben die Hersteller solcher Mining-Karten einen recht großen Aufwand für diese neue "Spezialhardware". Es wird nicht einfach eine GPU mit Speicher kombiniert und auf ein bestehendes PCB verlötet, auf dem dann die Display-Anschlüsse nicht bestückt werden. Im Falle von PC-Partner oder besser Sapphire werden sogar neue Dual-GPU-Karten entwickelt. Diese basieren allerdings auf der Radeon RX 470 und damit auf der betagten Ellesmere-GPU. Zudem kommt kein PCI-Express-Bridge-Chip zum Einsatz, da dieser zu teuer wäre, sondern die GPUs werden über das PCI-Express-x2-Interface mit jeweils nur einer Lane angebunden.

Hintergrund der VRAM-Timings

Die Geschwindigkeit des Speichers hat einen großen Einfluss auf die Mining-Leistung einer Grafikkarte. Dies gilt für solche Karten mit AMD-GPU ebenso wie für solche mit NVIDIA-GPU. Nun haben wir im ersten Schritt der Optimierung am Takt von GPU und Speicher, sowie an der Leistungsaufnahme gedreht und konnten damit beispielsweise bei gleicher Rechenleistung die Leistungsaufnahme um 70 W reduzieren, was natürlich einen deutlichen Anstieg der Effizienz zur Folge hat.

Der Takt ist aber nur einer der Faktoren, der für die Leistung des VRAMs eine Rolle spielt. Ein weiterer sind die Timings und diese kennen wir schon vom DDR-Arbeitsspeicher auf dem Mainboard. Neben dem Takt gibt es hier auch Angaben wie 18-19-19-39-1T, welche die wichtigsten Settings beim Speicher sind, es gibt aber noch Dutzende weitere Timings.

Ebenso ist es beim GDDR5-Speicher der Grafikkarten. In einem sogenannten Strap werden die Timing-Informationen der einzelnen Hersteller festgehalten. Der VRAM auf den aktuellen Grafikkarten stammt von Herstellern wie Elpida (gehört nun zu Micron), Sk Hynix, Micron oder Samsung. Je nachdem welcher Hersteller bzw. Chip zum Einsatz kommt, sind auch die Timings andere.

Die Timings und der Takt werden im BIOS in Abhängigkeit zueinander gespeichert. Je höher der Takt, desto weniger aggressiv sind die Timings normalerweise. Es gilt eine gute Mischung aus Takt und Timings zu finden, damit die Leistung am Ende optimal ist. Es bringt wenig nur die Timings oder nur den Takt zu optimieren.

Es gibt nun drei Wege:

1. Selbst Hand anlegen und das BIOS derart optimieren, dass die verbesserten Straps zum Einsatz kommen.

2. Es gibt fertigt konfigurierte Straps für bestimmte Kombinationen aus GPU und Speicherhersteller, die einfach nur noch ins BIOS "kopiert" werden müssen.

3. Ein fertig optimiertes BIOS für die eigene Grafikkarte verwenden. Diese BIOS-Versionen der beliebtesten Karten sind im Internet in entsprechenden Foren zu finden.

Bevor wir nun loslegen können, müssen wir also wissen, welcher Speicher zum Einsatz kommt. Dies wird uns beispielsweise mittels GPU-Z angezeigt. In diesem Fall verbaut ist Speicher aus dem Hause Samsung. Außerdem können wir mit GPU-Z die BIOS-Datei auslesen, was mittels der Schaltfläche (Pfeil) unterhalb der AMD-Radeon-Logos möglich ist. Diese BIOS-Datei können wir anpassen und später wieder auf die Karte flashen. Für das Flashen bietet sich der Einsatz von ATIWinFlash an.

An dieser Stelle kann nun ein fertig optimiertes BIOS für die jeweilige Karte verwendet werden oder aber wir gehen einen Schritt weiter und optimieren eigenhändig.

Dazu müssen wir das eben ausgelesene BIOS im Polaris BIOS Editor öffnen. Es gibt aktuell das Problem, dass es von der beliebtesten Version 1.6.7 viele mir Viren und anderer Maleware verseuchte Versionen im Netz gibt. Wir haben hier einen Screenshot der Version 1.4.1, die zwar einige Werte falsch interpretiert, die eigentliche Modifikation der Timings aber ermöglicht. Rechts unten ist die Tabelle zu sehen – links die Angaben zur Taktrate des Speichers und rechts daneben der Strap zu den Timings. Das rechte Bild zeigt die einzelnen Timings in Form der Straps noch einmal etwas deutlicher.

Es ist nur notwendig die Timings zu den schnellsten Taktraten anzupassen, da die Karte ja während des Minings mit den schnellsten Taktraten laufen soll. 1.750, 2.000 oder 2.250 MHz sind hier die typischen Schritte – je nachdem welcher Takt am Ende anliegt.

Wie auch schon bei den BIOS-Versionen gibt es fertig optimierte Straps für die jeweiligen Speicherhersteller. Diese können per Polaris BIOS Editor einfach in die jeweiligen Felder geschrieben werden. Mittels des SRBPolaris-Editors können wir aber auch die Straps manuell anpassen. Ein Strap-Editor hilft uns dabei die einzelnen Werte in einen fertigen Strap zu verwandeln.

Jeder Wert im HEX-Code des Straps entspricht einem bestimmten Speichertiming. Genauer wollen wir an dieser Stelle nicht darauf eingehen, da dies wie auch bei den Timings für Arbeitsspeicher ein sehr komplexes Thema ist.

Es gibt einige grundsätzliche Herangehensweisen, die die Arbeit mit den Timings vereinfachen können. So macht es häufig Sinn, die Timings für sagen wir 2.000 MHz mit denen für 1.750 MHz zu überschreiben. Bei niedriger Taktfrequenz sind die Timings aggressiver, können aber häufig auf die höhere Taktfrequenz übertragen werden. Dazu ist es dann nicht notwendig, Kenntnisse über jede einzelne Timing-Einstellung zu haben.

Wie gesagt, es gibt in den einschlägigen Foren diverse Einträge zu den vorgefertigten Straps bei bestimmten Taktfrequenzen des Speichers. Es kursiert auch eine Tabelle, welche einige der Timings direkt gegenüberstellt. In der Szene der Miner gibt es Nutzer, die jedes einzelne Timing testen, um auch wirklich das Optimum aus der Karte zu bekommen. Dies nimmt sehr viel Zeit in Anspruch und kann auch nicht auf jeden Speicher übertragen, sondern muss immer wieder ausgetestet werden. Am Ende muss die Karte 24 Stunden am Tag und sieben Tage die Woche stabil laufen.

Rechenleistung mit Timings-Optimierung

Wir haben uns nun die Leistung und Effizienz der Sapphire Nitro Radeon RX 470 8G D5 Mining Edition und Pulse Radeon RX 580 8GD5 noch einmal mit optimierten VRAM-Timings angeschaut.

Betrieben wurden diese einerseits mit den folgenden Taktraten:

  • Sapphire Pulse Radeon RX 580 8GD5: 900 MHz GPU-Takt / 1.800 MHz GDDR5-Takt
  • Sapphire Nitro Radeon RX 470 8G D5 Mining Edition: 1.000 MHz GPU-Takt / 2.000 MHz GDDR5-Takt

Wir konnten die Karten mit dem angepassten BIOS aber noch einmal etwas höher takten und erreichten dabei die folgenden Werte, die wir ebenfalls in den Tests berücksichtigen:

Sapphire Pulse Radeon RX 580 8GD5: 1.120 MHz GPU-Takt / 2.050 MHz GDDR5-Takt
Sapphire Nitro Radeon RX 470 8G D5 Mining Edition: 1.120 MHz GPU-Takt / 2.050 MHz GDDR5-Takt

Wir haben die optimierten Timings von Sapphire bekommen, denn hier hat man bereits ausführliche Tests gemacht – auch weil diese Karten in den eigenen Mining-Rigs zum Einsatz kommen. Die dazugehörigen BIOS-Dateien können wir gerne zur Verfügung stellen.

Ethereum-Mining

Claymore 11.6

MH/s
Mehr ist besser

Durch die schärferen Timings steigt die Leistung massiv an. Auch wenn wir den GPU- und Speichertakt nicht weiter erhöhen, können wir die Hash-Leistung bereits um 25 bis 30 % steigern. Mit den noch einmal verbesserten Taktraten steigt die Rechenleistung noch einmal leicht an.

Ethereum-Mining

Leistungsaufnahme

Watt
weniger ist besser

Die Leistungsaufnahme wird durch die veränderten Timings nicht beeinflusst bzw. die Änderungen liegen innerhalb der Messungenauigkeiten. Durch die etwas erhöhten Taktraten der weiteren Optimierung steigt die Leistungsaufnahme wieder leicht an.

Ethereum-Mining

Effizienz

Watt pro MH/s
weniger ist besser

Da die veränderten Timings keinerlei Einfluss auf die Leistungsaufnahme haben, steigt die Effizienz durch die gesteigerte Hash-Leistung natürlich noch einmal deutlich an. Diese ist mit den höheren Taktraten zwar wieder etwas geringer, aber immer noch deutlich besser als ohne die optimierten Timings.

Fazit

Wir hatten das Thema VRAM-Timings im ersten Artikel zur den optimierten GPUs ausgeklammert, da das Thema von den Nutzern noch einmal deutlich mehr abverlangt, als einfach nur 3-4 Regler in einem Overlocking-Tool zu schieben. Wir wollten dies aber nicht ignorieren, auch weil es einige Fragen dazu gab. Die Ergebnisse sind sehr erstaunlich und in dieser Form auf viele Karten mit AMD-GPU übertragbar – besonders aber auf die Radeon RX 470/480 bzw. Radeon RX 570/580. Dies gilt aber nicht nur für Ether aus dem Ethereum-Netzwerk, sondern auch für Monero und einige andere Alt-Coins. Für jede Kryptowährung können andere Timings bzw. ein anderes Verhältnis für Takt und Timings günstig sein. Insofern sind die Möglichkeiten für die Optimierung nahezu unbegrenzt. Ein Plus im einstelligen Prozentbereich spielt im Mining bereits eine große Rolle. Wir sprechen hier durch die optimierten Timings aber sogar von 25 bis 30 % und dies ist damit ein Faktor, der nicht zu ignorieren ist.

An dieser Stelle kommt eine auf das Mining optimierte Hardware wieder ins Spiel. Mit einer solchen Optimierung ist aber nicht die Kühlung oder eine andere Funktion der Karte gemeint (die hauptsächlich die Kosten für die Hardware reduzieren sollen), sondern die Möglichkeit viele BIOS-Versionen auf der Karte zu speichern. Im Falle der Sapphire Nitro Radeon RX 470 8G D5 Mining Edition sind es derer beispielsweise vier und so kann der Nutzer dieser Karte neben einem Gaming-BIOS auch noch drei weitere ablegen – eines beispielsweise auf Ethereum und eines auf Monero hin optimiert. In jedem Fall sollte bei Änderungen des BIOS immer ein Backup vorhanden sein, auf das wieder gewechselt werden kann.

Die Messungen zeigen, welchen Einfluss die optimierten Timings auf die Hash-Leistung haben können. Wir hätten dies in diesem Umfang nicht erwartet. Allerdings ist das Optimieren der Timings auch sehr zeit-intensiv, zumindest aber muss eine ausreichend umfangreiche Recherche betrieben werden, damit die Timings auch zur eigenen Karte passen. Es gibt einige Anleitungen im Netz, die den Nutzer dabei unterstützen können.

Social Links

Ihre Bewertung

Ø Bewertungen: 3.4

Tags

Kommentare (12)

#3
customavatars/avatar3377_1.gif
Registriert seit: 15.11.2002
www.twitter.com/aschilling
[printed]-Redakteur
Tweety
Beiträge: 30676
Zitat Chasaai;26407260
die Leistung steigt massiv an? Wo?


Vorher: 22-23 MH/s
Nachher: 30-31 MH/s

Das kann man durchaus so bezeichnen.
#4
Registriert seit: 08.03.2013

Leutnant zur See
Beiträge: 1162
Zitat Chasaai;26407260
die Leistung steigt massiv an? Wo?


Was vergleichst du? Mit Stock? Das steigt die Hashrate immens.

Bei "VRAM Timings" vs. "Timing/Takt-optimiert" ist es natürlich ein geringerer Unterschied, das stimmt.
#5
Registriert seit: 10.03.2005

Oberleutnant zur See
Beiträge: 1490
andere Werte sehe ich auch nicht in der Grafik? Im vgl. zu stock ists immens ja. im vgl. zu standard oc eigentlich "messungenauigkeit" zumindest wird das Wort bei verbrauch verwendet, der ebenfalls um 5% steigt.

was.ich mich Frage, wer macht das schon ernsthaft. wenn ich n Mining rig betreibe ists wie im profi Segment, was zählt ist Stabilität.
nichts ist ärgerlicher als der Ausfall einer gpu aufgrund von Instabilität und dem Mining Verlust der damit einhergeht bis mans merkt.

"normales" oc ist auf der gpu schon nicht wirklich auf Stabilität hin überprüfbar.
beim ram ebenfalls nicht, vlt mit memtest mit massivem Aufwand. erst recht bei subtimings erst recht auf der gpu.

für den Test bin ich aber sehr dankbar, solche interessanten Nischen sachen ließt man viel zu selten. Hatte damals meine 7950 mit vram timings versorgt. da war oc aber auch noch interessanter als heut
#6
customavatars/avatar220369_1.gif
Registriert seit: 05.05.2015
Steiamoak
Oberleutnant zur See
Beiträge: 1310
Das müsste sich ja auch auf die Gaming Leistung auswirken oder?
#7
Registriert seit: 08.03.2013

Leutnant zur See
Beiträge: 1162
Zitat Bullseye13;26407779
Das müsste sich ja auch auf die Gaming Leistung auswirken oder?


Nicht wirklich, weil Ethereum fast rein von Speicher Geschwindigkeit profitiert.
Beim Gaming gehts mehr um Core Clock. Also es wird sicher paar FPS mehr sein, aber nicht so so ein riesen Unterschied.

Zitat Chasaai;26407537

was.ich mich Frage, wer macht das schon ernsthaft. wenn ich n Mining rig betreibe ists wie im profi Segment, was zählt ist Stabilität.
nichts ist ärgerlicher als der Ausfall einer gpu aufgrund von Instabilität und dem Mining Verlust der damit einhergeht bis mans merkt.


Ordentliche Timings bringen ja keine Instabilität. Ich denk die Profis werden da ein paar stabile (weniger aggressive) BIOS bereit haben und die einfach drauf flashen. Wäre ja verschenktes Potential wenn nicht.

Ausfall gibts auch keinen, da sich die Mining Rigs automatisch neu starten. z.B. hat der Claymore Miner einen Watchdog eingebaut, der GPU erkennt wenn sie freezen. Startet dann automatisch den Rechner neu. Rigs dürfen mal crashen, ist kein Beinbruch. Durch einen Neustart verliert man 2-3 Min (je nachdem ob SSD oder Festplatte)

Bei einem normalem Rechner bzw. dem eigenen PC bin ich voll bei dir. Da würd ich nie im Leben die Timings der GPU anfassen. Mining Rigs sind jedoch mehr ein Werkzeug. Man verliert bei einem Absturz auch nix, also die Shares gehen nicht verloren oder sowas.

Ich hab ehrlich gesagt im Internet fast noch keinen Miner gesehen, der nicht das BIOS modifiziert hat. Das gehört bei AMD Karten quasi dazu wie das Amen in der Kirche :D

Vielleicht 10-15 Minuten Aufwand (wenn man eine Testbench hat) und dann deutlich mehr Hashrate. Why not?! Wenn es nicht stabil läuft, einfach den VRAM Takt senken. Neu flashen muss man nicht unbedingt. (seltene Ausnahmen)

Wer das nicht will, kann auch auf Nvidia Karten setzen. Die brauchen das nicht. Plug-and-play.
#8
customavatars/avatar251652_1.gif
Registriert seit: 15.04.2016

Matrose
Beiträge: 29
Soll sich das GPU-Mining nicht jetzt quasi erledigt haben? Da wurde doch jetzt so ein Teil vorgestellt, so dass die GPU-Miner sozusagen "chancenlos" seien!?
#9
customavatars/avatar6158_1.gif
Registriert seit: 13.06.2003
RheinMain
Admiral
Beiträge: 9683
Jupp - Hardware ASICs.

Gegen die sehen die GPUs keinen Stich.

Die 5 besten Bitcoin-Mining Hardware ASICs 2017 (Vergleich)
#10
Registriert seit: 08.03.2013

Leutnant zur See
Beiträge: 1162
Kommt auf den Algorithmus an.

Der Equihash ASIC (z.B. Z9 Mini) hat defintiv die GPUs zerstört.
Beim Ethereum ASIC (Antminer E3) nicht wirklich so, der ist quasi nur so effektiv wie ein normales Mining-Rig.

GPU Mining wird es weiterhin geben in Form von XMR (Monero) und neuerdings RavenCoin. Die sind stark gegen ASIC.

Wobei ich mir sicher bin, dass jetzt viele Leute aussteigen werden. Also eBay Kleinanzeigen wird sicher voll mit Grafikkarten :D
#11
customavatars/avatar137213_1.gif
Registriert seit: 13.07.2010

Flottillenadmiral
Beiträge: 5158
Man darf auch nicht die Weiterentwicklung außer Acht lassen. Antminer sind nicht so anpassungsfähig und schon beim nächsten fork eventuell wieder draußen.

Wie matrickz sagt alles eine Sache des Algorithmus und der Anpassung. POS wäre auf jeden Fall schonender für alle.
#12
customavatars/avatar88446_1.gif
Registriert seit: 01.04.2008
Schweiz, Solothurn
Obergefreiter
Beiträge: 73
"Wir haben die optimierten Timings von Sapphire bekommen, denn hier hat man bereits ausführliche Tests gemacht – auch weil diese Karten in den eigenen Mining-Rigs zum Einsatz kommen."
Könnte ich die optimierten Timings der Sapphire Pulse RX 580 haben? Vielen Dank schonmal.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

NVIDIA Titan V: Volta-Architektur im Gaming-Test

Logo von IMAGES/STORIES/2017/NVIDIA-TITANV

In der letzten Woche hatte NVIDA noch eine Überraschung für uns parat: Die brandneue NVIDIA Titan V wurde vorgestellt. Damit gibt es das erste Consumer-Modell mit der neuen Volta-Architektur, das auch für Spieler interessant sein kann, in erster Linie aber auch professionelle Nutzer ansprechen... [mehr]

Sapphire Radeon RX Vega 64 Nitro+ im Test

Logo von IMAGES/STORIES/2017/SAPPHIRE-VEGA

Heute ist es endlich soweit: Wir können uns das zweite Custom-Design der Radeon RX Vega anschauen. Dabei handelt es sich um die Sapphire Radeon RX Vega 64 Nitro+, die besonders durch die Kühlung auf sich aufmerksam machen will. Drei Slots, drei Axiallüfter und sogar eine spezielle... [mehr]

Mega-Roundup: 14 aktuelle GeForce-Grafikkarten in 11 Blockbuster-Spielen...

Logo von IMAGES/STORIES/2017/GPU_BLOCKBUSER_VGL_ZOTAC-TEASER

In Kooperation mit Zotac Auch in diesem Jahr veranstalteten die Spielepublisher wieder ein regelrechtes Feuerwerk an neuen Videospielen. Vor allem in den letzten Wochen des Jahres wurden zahlreiche neue Triple-A-Titel veröffentlicht, wie beispielsweise ein neues "Call of Duty",... [mehr]

Die GeForce RTX 2080 Ti und RTX 2080 Founders Edition im Test

Logo von IMAGES/STORIES/2017/GEFORCERTX2080

Heute nun ist es endlich soweit und wir präsentieren die vollständigen Leistungsdaten und Messwerte zu den beiden ersten Karten der GeForce-RTX-20-Serie von NVIDIA. Nach der Vorstellung der Pascal-Architektur im Mai 2016 sind die neuen Karten für NVIDIA in vielerlei Hinsicht ein... [mehr]

Die ersten Custom-Modelle der GeForce GTX 1070 Ti im Test

Logo von IMAGES/STORIES/LOGOS-2017/GTX1070TI-LOGO

Nach der Vorstellung aller Details dürfen wir heute die Leistungswerte der GeForce GTX 1070 Ti veröffentlichen. Dabei stand uns dieses Mal keine Founders Edition zur Verfügung, die nur von NVIDIA verkauft wird, dafür aber einige Custom-Modelle. Diese stammen aus dem Hause ASUS, Inno3D und... [mehr]

AMD Radeon RX Vega 64 im mGPU-Test

Logo von IMAGES/STORIES/2017/AMD_RADEON_RX_VEGA_64_56_TEST

In den letzten Tagen war es so weit. Wir hatten endlich Hard- und Software zusammen, um die Radeon RX Vega 64 im mGPU testen zu können. Zum einen halten wir die ASUS ROG Strix Radeon Vega 64 OC Edition in Händen, zum anderen hat AMD den Radeon Software Crimson ReLive Edition 17.9.2... [mehr]