ISC19

Intel präsentiert DAOS – eine Speicherengine für das HPC

Von Andreas Schilling
Dienstag, 18.06.2019 um 16:01 Uhr

Intel präsentiert DAOS – eine Speicherengine für das HPC

Auch wenn wir uns diesen Aspekt noch nicht selbst anschauen konnten, so spielt die Unterstützung von Optane DC Persistent Memory durch die Xeon-Scalable-Prozessoren der zweiten Generation alias Cascade Lake eine große Rolle im Aufbau des Ökosystems. Der Optane DC Persistent Memory bildet eine Zwischenebene zwischen den Caches des Prozessors und schnellen NVMe-Laufwerken. In der Praxis soll sich der Vorteil aus dem Einsatz von Optane DC Persistent Memory vor allem durch die geringen Latenzen und die höheren Kapazitäten ergeben.

Auf Aspekte wie die verschiedenen Betriebsmodi sowie die Vorteile hinsichtlich der Latenzen, aber auch die Nachteile im Vergleich zu klassischem DRAM, sind wir in einem gesonderten Artikel bereits genauer eingegangen. Mit einer neuen Storage Engine auf Basis von Open-Source-Software stellt Intel auf der International Supercomputing Conference einen neuen Software-Stack vor, der den Optane DC Persistent Memory besser für das High Performance Computing (HPC) zugänglich machen, bzw. die Vorteile besser nutzbar machen soll. Das Distributed Asynchronous Object Storage (DAOS) soll alle Vorteile eines schnellen Speicherstacks vereinen: Hohe Datenraten, geringe Latenzen und maximale IOPS.

Besonders wichtig ist dies für Anwendungen, die auf bestimmte Datenraten oder Latenzen angewiesen sind, bzw. die eine möglichst schnelle Berechnung gewisse Mindestanforderungen haben.

Bisher sind die Storage Engines noch auf die Verwendung verschiedener Speichertechnologien ausgelegt. Ähnlich wie für das NVMe-Interface gilt für DAOS, dass hier auf eine Auslegung dediziert für schnellen Non-Volatile Memory (NVM) wie eben NVMe-SSDs, aber auch den Optane DC Persistent Memory geachtet wurde.

So läuft DAOS komplett im Userspace, was schon einmal für reduzierte Latenzen aufgrund eines fehlenden Overheads sorgt. Weiterhin arbeitet DAOS nicht mehr blockbasiert und umgeht den Linux-Kernel für schnelle Zugriffe. Je nach Art der Daten (Metadaten für Datenblöcke oder anderweitige Daten) verbleiben diese im Optane DC Persistent Memory und sind über das Persistent Memory Development Kit (PMDK) schnell zugänglich.

Sogenannte Bulk-Daten, also größeren Datenmengen, werden auf den schnellen SSDs abgelegt, sollen aber, wenn es um die Latenzen geht, ebenso schnell im Zugriff des Systems sein. Der Zugriff erfolgt hier per Storage Performance Development Kit (SPDK). Intel spricht von Latenzen im Bereich von Mikrosekunden für die SSDs, während es üblicherweise hier Millisekunden sind. Daten auf dem Optane DC Persistent Memory sind schon mit Latenzen im Bereich von Mikrosekunden im Zugriff durch das System. Mit DOAS wird der komplette Speicherstack in dieser Hinsicht homogener.

DAOS ermöglicht diese schnellen Zugriffe aber nicht nur für Server, deren Speicher direkt am Prozessor angebunden ist, bzw. die sich im gleichen Node befinden. Per OpenFabric Interface (OFI) kann der Speicher auch in einem Remote Direct Memory Access (RDMA) mit extrem niedrigen Latenzen erreichbar gemacht werden. Dies spielt im HPC eine besonders wichtige Rolle, da Speicher hier in den seltensten Fällen exklusiv in einem Node oder für wenige Prozessorkerne verwendet wird. Über eine Emulationssschicht wird der HPC-Middleware wie Silo, MDHIM und Dataspaces ein Backend angeboten, über das auf DAOS zugegriffen werden kann

Intel sieht Technologien wie das Distributed Asynchronous Object Storage als essentiellen Baustein für den Aufbau moderner HPC-Systeme. Zwar konzentriert sich derzeit vieles auf das sogenannte Bare-Metal, also die Prozessoren und Beschleuniger, ohne ausreichend schnellen Speicher, der bestimmte Latenzen und IOPS garantieren kann, wird die Hardware aber nicht so einfach in der Lage sein, immer mehr Daten auch verarbeiten zu können.

DAOS befindet sich erst am Anfang einer langen Weiterentwicklung. Intel hat bereits eine Roadmap veröffentlicht, die bis ins Jahr 2022 reicht. Sowohl der Funktionsumfang als auch die unterstützte Software sollen in den kommenden Jahren immer weiter ausgebaut werden.

Quellen und weitere Links