NVIDIA und Mellanox wollen Supercomputer per AI schützen

Veröffentlicht am: von

ufm-cyber-aiZusammen mit der Ampere-Architektur bzw. der gigantischen GA100-GPU präsentierten NVIDIA und Mellanox auch die ersten Früchte der engeren Zusammenarbeit durch den Kauf des israelischen Netzwerkspezialisten. In den DGX-Systemen finden sich unter andere gleich mehrere ConnectX-6 Lx SmartNICs von Mellanox. Die EGX A100 ist eine Erweiterungskarte mit GA100-GPU ist direkt mit den ConnectX-6 Lx SmartNICs bestückt.

Heute nun kündigt man mit der UFM Cyber-AI eine neue Hard- und Softwareplattform vor, die vor allem Supercomputer absichern soll. Im Unterschied zum klassischen Datacenter sind Supercomputer meist anders abgesichert – vor allem wenn es sich um öffentlich betriebene Systeme handelt, die von unterschiedliche Institutionen genutzt werden. Hier bekommen deutlich mehr Nutzer von außen Zugriff, als dies in den meisten Datacentern der Fall ist.

Vor wenigen Wochen kursierte die Meldung, dass gleich mehrere deutsche Supercomputer offline genommen werden mussten. Davon betroffen waren das Leibniz-Rechenzentrums (LRZ) in Garching bei München, das Jülich Supercomputing Centre (JSC), das High Performance Computing Center (HLRS) in Stuttgart sowie weitere kleinere Systeme. Auch in Europa ist es bei einigen Systemen zu Ausfällen gekommen. Forschungsergebnissen sind dabei nicht abhanden gekommen, dafür aber sollte Schadsoftware eingeschleust werden und der eigentliche Schaden wurde dadurch angerichtet, dass die Systeme eben nicht wie geplant arbeiten konnten. Über die vergangenen Jahre hinweg hab es auch vermehrt Zweckentfremdungen von Supercomputer – das Bitcoin-Mining war dabei nur der einfachste Fall des Missbrauchs der Rechenleistung.

UFM Cyber-AI soll genau dies verhindern und es dabei erst möglich machen, solche Angriffe schnell zu erkennen. Ein auf bestimmte Anwendungsfälle ausgelegtes Datacenter kann sich auch besser gegen alle restlichen Bereiche schützen. Ein Supercomputer wird im Zweifel aber für viel mehr Anwendungen genutzt und ist zudem auch noch nach außen hin deutlich offener.

» zur Galerie

Bei der UFM Cyber-AI handelt es sich um ein Stück Hardware, auf der ein trainiertes Deep-Learning-Netzwerk läuft. Diese erkennt unzulässige Zugriffe und Anwendungen, die auf dem Supercomputer laufen und sperrt diese bzw. gibt eine Meldung an die Administrationsebene heraus.

Außerdem soll UFM Cyber-AI per Echtzeit- und historischer Telemetrie den Ausfall einzelner Komponenten vorhersagen können. Anstatt erst nach einem Ausfall einer Komponente reagieren zu können, können kritische Komponenten proaktiv getauscht werden.

» zur Galerie

Der Unified Fabric Manager (UFM) ist seit Jahren eine von Mellanox angebotene Plattform für das Monitoring, Management, Leistungsoptimierung und Konfiguration von InfiniBand-Netzwerken. Mit UFM Cyber-AI wird die Funktion der Plattform nun um eine automatische Erkennung von Angriffen und Ausfällen erweitert.