Seite 5: Benchmarks: Simulationen

Kommen wir zu im High Performance Computing (HPC) üblichen Anwendungen wie Simulationen. LAMMPS ist ein sogenannter Large-scale Atomic/Molecular Massively Parallel Simulator, der unter anderem Molekulardynamik-Simulation ausführen kann. Im Mocassin wird über eine Monte-Carlo-Simulation ein ionisierter Nebel im Weltraum simuliert. NAMD ist wieder ein Programm zur Simulation molekulardynamischer Prozesse.

Auch hier werden wieder so viele Threads wie möglich benötigt bzw. die Kerne können von der Software mit Hyper Threading bestmöglich ausgelastet werden, so dass diese Option natürlich aktiviert war. Das SNC2 war bis auf die LAMMPS-Simulationen abgeschaltet.

LAMMPS Molecular Dynamics Simulator

20.000 Atome

ns/Tag
Mehr ist besser

LAMMPS Molecular Dynamics Simulator

Rhodopsin-Molekül

ns/Tag
Mehr ist besser

Für die Simulation mittels LAMMPS ist natürlich zunächst einmal auch wieder die Anzahl der Kerne entscheidend. Da die Xeon-Prozessoren aber auch auf die AVX-512-Befehlssatzerweiterungen zurückgreifen können, können sie diesen Nachteil zumindest teilweise kompensieren. Somit ist ein Xeon Platinum 8380 auch mal schneller als der EPYC 7713. Aber auch ein EPYC 7443 mit seinen 24 Kernen kann schneller sein, als die beiden Xeon-Modelle mit 28 Kernen, was die Verbesserungen der Leistung über die Zen-3-Architektur verdeutlicht.

Monte Carlo Simulation

Nebel 2019-03-24

Sekunden
Weniger ist besser

Für den Mocassin-Benchmark und die darin verwendete Monte-Carlo-Simulation spielt nicht die Anzahl der Kerne die wichtigste Rolle, sondern hier geht es auch um die Kernleistung bzw. damit kombiniert den zur Verfügung stehenden L3-Cache und davon haben die EPYC-Prozessoren im Vergleich zu den Xeon-Modellen reichlich. Entsprechend sehen wir den EPYC 72F3 mit nur acht Kernen, aber dafür 256 MB an L3-Cache an der Spitze.

NAMD - Scalable Molecular Dynamics

ATPase Simulation (327.506 Atome)

Tage/ns
Weniger ist besser

Der NAMD-Benchmark ist wieder ein typischer Vertreter einer praxisnahen Anwendung, wo viele Kerne von Vorteil sind. Aber auch hier spielt das Subsystem mit dem L3-Cache eine Rolle.