> > > > VRAMFS: VRAM der Grafikkarte als schnellen und flüchtigen Speicher verwenden

VRAMFS: VRAM der Grafikkarte als schnellen und flüchtigen Speicher verwenden

DruckenE-Mail
Erstellt am: von

nvidia-pascal-logoRamdisks sind ein beliebter Weg zumindest etwas freien Arbeitsspeicher für spezielle Anwendungen zu verwenden. Großer Vorteil dieses Speicher ist die simple Tatsache, dass diese deutlich schneller als jede SSD sind. Statt des Arbeitsspeichers wird beim VRAMFS mit Hilfe eines Linux-Kernels, FUSE und OpenCL der Speicher der Grafikkarte verwendet. Je nach Anbindung der Grafikkarte über das PCI-Express-Interface sind damit Lese- und Schreibraten von 2 GB pro Sekunde möglich. Schnelle, per PCI-Express angebundene SSDs kommen auf 1.200 / 800 MB pro Sekunde. Bei per SATA angebundenen Flash-Speichern ist derzeit bei 500 / 500 MB das Ende der Fahnenstange erreicht. An dieser Stelle wollen wir einfach nur Server-SSDs benennen, die ebenfalls per PCI-Express angebunden sind und bereits heute Datenraten von 6,7 GB pro Sekunde für das Lesen und 4,4 GB pro Sekunde für das Schreiben von Daten erreichen. Der Preis liegt hier aber bereits im fünfstelligen Bereich.

NVIDIA Pascal-Modul mit 3D Memory
NVIDIA Pascal-Modul mit 3D Memory

Nun zurück zum VRAMFS: Diese befinden sich noch in einem recht frühen Entwicklungsstadium. Bei Grafikkarten, die im Consumer-Segment bereits 4 oder 6 GB Grafikspeicher erreichen, wird die Verwendung von VRAMFS in Zukunft aber immer rentabler und bis dahin wollen die Entwickler auch die Geschwindigkeit noch erhöhen. Die Datenrate von etwa 2 GB pro Sekunde soll sich noch steigern lassen, zumal im Hinblick auf bis zu 6 GB pro Sekunde über klassische Ramdisks noch kein echter Vorteil zu erkennen ist. Das Bandbreitenlimit von PCI-Express ist das Ziel. Bei PCI-Express 3.0 und den vollen 16 Lanes wären dies 15,754 GB pro Sekunde, beim kommenden PCI-Express 4.0 sogar schon 31,508 GB pro Sekunde.

Als Tool kommt für den Aufbau eines VRAMFS ein Linux mit FUSE zum Einsatz. Das Linux verwendet einen Userspace, der außerhalb des Kernels auf das externe Dateisystem zugreifen kann. Die Grafikkarte muss mindestens OpenCL 1.1 unterstützen. FUSE dient dabei nur dem Umgang mit dem Dateisystem, während die eigentliche Zugriffe auf den Speicher mittels der OpenCL-Schnittstelle ausgeführt werden. Schreibzugriffe können asynchron erfolgen, währen das Lesen von Daten synchron ausgeführt wird.

Wer sich einmal an einem VRAMFS versuchen möchte, der findet den dazugehörigen Code bei Github unter MIT-Lizenz.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (11)

#2
Registriert seit: 20.12.2003
Karlsruhe
Fregattenkapitän
Beiträge: 2567
Also Datenbanken profitieren massiv von schnellem I/O. Nicht jedes Stück entwickelte Hardware wird für den Consumer Markt gebaut. Bei kleinen bis mittelgroßen Datenbanken dürfte VRAMFS bald häufiger eingesetzt werden.

Diese "Supercomputer" bietet zB SAP an, große Cluster mit mehreren hundert TB an Arbeitsspeicher genau für Datenbanken. So Eins ist aber natürlich für die meisten mittelständischen Betriebe unbezahlbar.

Mal ein bisschen über den Tellerrand hinausschauen.
#3
Registriert seit: 17.01.2005

Kapitänleutnant
Beiträge: 1650
Naja, bevor ich meine Datenbank auf flüchtigem ram laufen lasse muss noch einiges passieren.
Gerade bei lächerlichen 2GB/s,
zum Vergleich hab ich hier noch ne baby-EVA von 2005 welche auf 1,5GB/s kommt.... das Teil ist fast 10 Jahre alt....
Datenbanken laufen auf SANs -> keinen single point of failure

das teil ist höchstens für Workstations interressant, aber eben nur, wenn der Speicher schneller als SSDs (Verbünde) und in erster Linie des Normalen Arbeitsspeichers ist...
Im Konzept liegt hier einfach das Problem, dass PCIe als Flaschenhals dazwischen liegt, und den hätte man bei nder PCIe SSD auch, warum also nen proGB teure GPU verbauen?
#4
customavatars/avatar24904_1.gif
Registriert seit: 13.07.2005

Flottillenadmiral
Beiträge: 4261
Zitat TCS;22968889
Im Konzept liegt hier einfach das Problem, dass PCIe als Flaschenhals dazwischen liegt, und den hätte man bei nder PCIe SSD auch, warum also nen proGB teure GPU verbauen?


Erstmal Meckern.

Irgendwer gibt sich Mühe die brachliegenden Speicher sinnvoll zu nutzen.

Das Konzept ist ja bereits verhandenes sinnvoll zu nutzen.....geplant war das natürlich vorher nicht. Wieso denn nicht den PC noch etwas beschleunigen, wenn in der Grafikkarte zukünftig 4 GB ungenutzt zur Verfügung stehen....sinnvoll.
#5
customavatars/avatar44491_1.gif
Registriert seit: 08.08.2006
Weinböhla (Sachsen)
Moderator
Beiträge: 31938
Zitat TCS;22968889
das teil ist höchstens für Workstations interressant, aber eben nur, wenn der Speicher schneller als SSDs (Verbünde) und in erster Linie des Normalen Arbeitsspeichers ist...
Im Konzept liegt hier einfach das Problem, dass PCIe als Flaschenhals dazwischen liegt, und den hätte man bei nder PCIe SSD auch, warum also nen proGB teure GPU verbauen?


Ich werf dazu mal folgendes in den Raum:
What Is NVLink? Making the World

Ich denke nicht, dass dieses Konstrukt, wie hier erwähnt mit PCIe überhaupt ansatzweise wirklichen Sinn ergibt. NV-Link wurde aber seinerzeit ebenso wie Pascal im gleichen Atemzug genannt. Und 50-200GB/sec Durchsatz ist dann doch eher schon was, wo man drüber nachdenken kann ;)
Wenn man mal schaut, auf nem anständig ausgestatteten Xeon S2011-3 mit Quadchannel und brauchbaren DDR4 Speichertaktraten bekomme ich A) bedeutend mehr Platz (pro CPU bis zu 1,5TB RAM, wenn ich das richtig sehe) und B) erreichr mit DDR4-2133 schon im Quadchannel eine Datenrate von 55+GB/sec (gemessen, also nicht theoretischer Natur)
Ne RAM Disk wäre also durchaus mit sowas anzudenken... Faktor 100 schneller als eine SSD mit 6G SATA Anschluss und immernoch bedeutend bessere Latenzen ;)
-> Problem ist nur, das kostet unsummen Geld. Große 32GB Module für DDR4 in Reg. ECC Ausführung gehen auch mal für nen tausender das Modul über den Tisch. Und mit 32GB Modulen kommt an "nur" auf 384GB RAM. Die 64er und 128er Module sind aber deutlich im Preis drüber... Wobei es letztere wohl aktuell noch gar nicht gibt.
#6
customavatars/avatar93634_1.gif
Registriert seit: 22.06.2008
Bielefeld
Kapitän zur See
Beiträge: 3596
Zitat Sir Diablo;22968695
Mal ein bisschen über den Tellerrand hinausschauen.


Auf keinen Fall. Eventuell stellt man sonst fest, dass man selbst völlig unwichtig am Markt ist und sich keiner dafür Interessiert was einem selbst wichtig ist. Dan bleibt man lieber in der Mitte des winzigen Tellers und fühlt Wichtig. ;-)
#7
Registriert seit: 20.12.2003
Karlsruhe
Fregattenkapitän
Beiträge: 2567
In-Memory-Datenbanken gibts schon seit ein paar Jahren. Klar ein SPOF ist schei***, es ist aber immer eine Abwägung zwischen Ausfallsicherheit und Performance. Mit BBUs, redundaten Netzteilen, Write-Back etc. ist das IMHO aber kein Problem mehr.
#8
Registriert seit: 17.01.2005

Kapitänleutnant
Beiträge: 1650
Zitat Oyko Miramisay;22968925
Erstmal Meckern.

Irgendwer gibt sich Mühe die brachliegenden Speicher sinnvoll zu nutzen.

Das Konzept ist ja bereits verhandenes sinnvoll zu nutzen.....geplant war das natürlich vorher nicht. Wieso denn nicht den PC noch etwas beschleunigen, wenn in der Grafikkarte zukünftig 4 GB ungenutzt zur Verfügung stehen....sinnvoll.


Was nützt brachliegender Speicher, wenn er schlichtweg zu lahm ist.
und 4GB sind ja jetzt auch nicht weiß Gott wie viel....

Darum kam ich auf Workstations -> wo ist denn sonst so ne GPU mit so viel VRam verbraucht, nur wird die samt ram dann aber auch meist sinnvoller genutzt ;)
Gesunde Kritik hat noch niemanden geschadet ;)

@fdsonne
Ohne PCIe aber mit NV-Link und den ~50-200GB/s schauts anders aus -> wäre schon eher ne idee
Klar kostet der Ram-ansatz mehr, ist aber dafür OS-unabhängig und software unabhängig einsetzbar
und die 4-8GB von der GPU kosten auch wieder nicht die Welt
#9
customavatars/avatar44491_1.gif
Registriert seit: 08.08.2006
Weinböhla (Sachsen)
Moderator
Beiträge: 31938
Zitat TCS;22968988
@fdsonne
Ohne PCIe aber mit NV-Link und den ~50-200GB/s schauts anders aus -> wäre schon eher ne idee
Klar kostet der Ram-ansatz mehr, ist aber dafür OS-unabhängig und software unabhängig einsetzbar
und die 4-8GB von der GPU kosten auch wieder nicht die Welt


Ich mein ja nur... Bin mir selbst noch nicht ganz im klaren darüber, wie NV dieses NV-Link da integrieren will... Und vor allem, was die mit "CPU" meinen.
Sprich wenn das vielleicht gar nicht der Hauptprozessor ist, sondern irgendwas anderes, dann wirft das ganz andere Fragen auf. Man sprach in Verbindung mit Pascal bzw. dessen Nachfolger auch schon über eine Kombination mit einer ARM based CPU direkt auf der Grafikeinheit und keiner konnte sich damals so recht vorstellen, für was das sein soll.

Ggf. sehen wir ja demnächst irgendwann von NV so ne Art PC im PC. ;) Also ein Konstrukt mit ARM CPU, NV-Link und Pascal GPU, sauschnell untereinander angebunden und für spezielle Workloads mit extremen Vorteilen behaftet. Dann ergibt auch die Ansage von vor ein paar Monaten Sinn, dass NV irgendwie ähnliches zum HSA Ansatz von AMD plant umzusetzen. ;)
Für den Heimanwender sehe ich aber hier auch klar bis jetzt keinen wirklichen Bedarf, wenn er nicht gerade Hobbymäßig da sonstwelche Software nutzt.
#10
Registriert seit: 01.04.2011
L.-E.
Bootsmann
Beiträge: 549
Zitat TCS;22968889
Naja, bevor ich meine Datenbank auf flüchtigem ram laufen lasse muss noch einiges passieren.
Gerade bei lächerlichen 2GB/s,
zum Vergleich hab ich hier noch ne baby-EVA von 2005 welche auf 1,5GB/s kommt.... das Teil ist fast 10 Jahre alt....
Datenbanken laufen auf SANs -> keinen single point of failure


Genau so ist es. Ich hatte eine EVA4000 und EVA10000 am Laufen, sie bedienten unsere DB-Server für Oracle und SAP (DB war ebenfalls eine Oracle). Und I/O war nie der Flaschenhals in dem ganzen, auch nicht bei Auswertungen und etc. Ausserdem, welcher richtige Server hat bitte eine Grafikkarte??? Ich hatte nur Itaniums und UltraSparcs da, kein x86 Müll. Aktuell sind es Power8 mit AIX. Wenn man Oracle am Laufen hat, dann gibt man der DB einfach fett Speicher und das nutzt sie dann auch. Wenn I/O Flaschenhals werden sollte, gibt es ganz andere Möglichkeiten.
#11
Registriert seit: 20.12.2003
Karlsruhe
Fregattenkapitän
Beiträge: 2567
Dass die Verbindung zwischen GPU und CPU mittels NVLINK auch zu Stande kommt, muss die CPU auch einen entsprechenden Controller haben. Ich glaube kaum, dass Intel oder AMD 2016 (oder jemals) eine solche x86 CPU anbieten werden.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Roundup: 5x GeForce GTX 1070 mit Custom-Design im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/5X-GTX1070/GTX1070_CUSTOM_ROUNDUP-TEASER

Nachdem wir bereits eine Reihe von Boardpartner-Karten der NVIDIA GeForce GTX 1080 ausführlich getestet haben, holen wir gleiches nun für das kleinere Schwestermodell nach, denn auch von der NVIDIA GeForce GTX 1070 gibt es viele Custom-Modelle mit höheren Taktraten, eigenen Kühlsystemen und... [mehr]

Drei Custom-Modelle der GeForce GTX 1060 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/3X-GTX1060/GTX1060_ROUNDUP_TEST-TEASER

Anders als bei der GeForce GTX 1080 und GeForce GTX 1070 trudelten wenige Stunden nach unserem Test zur Founders Edition der NVIDIA GeForce GTX 1060 schon die ersten Boardpartner-Karten mit teils höheren Taktraten, eigenem Kühlsystem und überarbeitetem Platinenlayout ein. Sie dürften... [mehr]

NVIDIA GeForce GTX 1080 mit Pascal-Architektur im XXL-Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Heute ist es soweit: NVIDIA läutet mit der GeForce GTX 1080 und GTX 1070 auf Basis der Pascal-Architektur den diesjährigen Neustart bei den Grafikkarten ein. In Kürze wird wohl auch AMD seinen Beitrag zu diesem Thema leisten. Vor zehn Tagen lud NVIDIA die gesammelte Fachpresse nach Austin ein... [mehr]

Roundup: 5x GeForce GTX 1080 im Custom-Design im Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Nachdem wir uns die Founders Edition der GeForce GTX 1080 und GeForce GTX 1070 bereits angeschaut haben, folgen nun fünf Retail-Modelle, die wir in aller Ausführlichkeit unter die Lupe nehmen wollen. Aus den vielen Boardpartnern und unterschiedlichen Modellen haben wir uns solche von ASUS, EVGA,... [mehr]

AMD Radeon RX 480 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/RADEON-RX480/RADEON-RX480-REFERENCE-LOGO

Es ist also soweit: AMD startet die großangelegte Zurückeroberung des Grafikkartenmarktes mit der Radeon RX 480, die als erste Grafikkarte der Polaris-Generation mit gleichnamiger Architektur erscheint und die wir uns genauer anschauen können. Dabei versucht sich AMD an einem anderen Ansatz im... [mehr]

PowerColor Radeon RX 480 Red Devil im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/POWERCOLOR-RX480/POWERCOLOR-RX480REDDEVIL-LOGO

Mit der Radeon RX 480 will AMD zurück zu alter Stärke und hat daher über Monate hinweg die PR-Trommel geschlagen. Letztendlich dabei herausgekommen ist eine sehr gute Karte für einen niedrigen Preis, die aber nicht in allen Bereichen zu überzeugen weiß. Wohl größtes Manko der Karte sollte... [mehr]