Beim EPYC SMT an, Determinism auf Power, L2 Streaming Prefetcher aus, 1 NUMA node per CPU. Alle logischen Cores werden genutzt. Ich benche in der Grundstellung - schnelle Rechner müssen 10^10 nodes berechnen, langsamere weniger, der 265K nur 10^9 (sonst wäre der Wert noch niedriger). Large pages...