> > > > AMD und Microsoft arbeiten an einer bessere NUMA-Unterstützung

AMD und Microsoft arbeiten an einer bessere NUMA-Unterstützung

Veröffentlicht am: von

threadripper teaserVor einigen Tagen tauchten vermeintliche Leistungs-Probleme mit der NUMA-Implementierung (Non-Uniform Memory Access) bzw. dem Windows Scheduler bei der Verwendung von EPYC- und Ryzen-Threadripper-Prozessoren mit vier aktiven Dies auf.

Die Problematik ist die Folgende: Der Scheduler von Windows legt bei mehr als einem NUMA Node, ein sogenannter Best NUMA Node, fest. Neue Threads werden primär diesem einen Knoten zugeteilt, bereits vorhandene Threads auf die weiteren Knoten verteilt. Besitzt eine Anwendung nun mehr als einen Thread, kann dies dazu führen, dass das System zu einem Großteil damit beschäftigt ist, die Thread-Zuteilung auszuführen. In der Folge sind einige Programme deutlich zu langsam.

Hier kommt nun die Coreprio getaufte Software ins Spiel. Als NUMA Dissociater überwacht die Software alle aktiven Threads und legt diese im Falle der Ryzen-Threadripper-Prozessoren auf bestimmte NUMA-Knoten fest.

Noch vor Bekanntwerden der Problematik haben AMD und Microsoft offenbar an einer Lösung des Problems gearbeitet. Für den Windows Scheduler gibt es bereits einen Hotfix, der nur für Dual-NUMA-Systeme greift. Einen Best NUMA Node gibt es dann nicht mehr und mehrere Threads einer Anwendung werden nicht mehr derart verschoben. Für Systeme mit drei und mehr NUMA-Knoten, wie eben den Ryzen Threadripper 2990WX (Test) und Ryzen Threadripper 2970WX (Test), ist dies jedoch noch keine Lösung.

AMD sieht die in Coreprio angewendete Methode schon recht nahe einer möglichen Lösung für den Windows Scheduler bei mehr als zwei NUMA-Knoten. Man geht hier aber nicht näher ins Detail, wie eine Umsetzung letztendlich aussehen wird. Letztendlich hängt es nun von AMD und Microsoft ab, wann und wie es zu einer finalen Lösung des Problems kommt. Betroffen sind eigentlich nur die Ryzen-Threadripper-Prozessoren der zweiten Generation mit mehr als zwei aktiven Dies sowie die EPYC-Prozessoren in gleicher Konfiguration.

Mit den EPYC-Prozessoren der zweiten Generation sowie den möglichen Ryzen-Threadripper-Prozessoren der dritten Generation wird es aufgrund des Chiplet-Designs keine Probleme in der Thread-Zuteilung auf verschiedene NUMA-Knoten geben, denn diese Prozessoren werden als ein NUMA-Knoten umgesetzt und sind nicht mehrere NUMA-Entitäten.

Social Links

Ihre Bewertung

Ø Bewertungen: 5

Tags

Kommentare (7)

#1
customavatars/avatar135109_1.gif
Registriert seit: 24.05.2010

Kapitänleutnant
Beiträge: 1840
ob das wohl die Performance Probleme von x264 unter Windows mit den Threadrippern fixt?
#2
customavatars/avatar150117_1.gif
Registriert seit: 12.02.2011
Baden Württemberg
Kapitän zur See
Beiträge: 3264
"Betroffen sind eigentlich nur die Ryzen-Threadripper-Prozessoren der zweiten Generation mit mehr als zwei aktiven Dies sowie die EPYC-Prozessoren in gleicher Konfiguration."

Ach die erste Gen. ist gar nicht betroffen? Ein Grund mehr den 1950X zu behalten.
Wollte ja mal "just for funny" zum 2950X wechseln.
Wusste gar nicht das der so viel anders ist.
Hat AMD eine CPU verschlimmbessert, toll.
#3
Registriert seit: 13.12.2015
Tief in der Provence
Oberstabsgefreiter
Beiträge: 506
Die haben gar nichts verschlimmbessert, Windoof kann damit nur nicht richtig umgehen! Wenn man dem Scheduler gefixt ist sollte da noch etwas mehr raus zu holen sein. Es wäre auch müßig über ein Ei - Henne Problem zu diskutieren. Was war zu erst Da? Die Kerne oder der Scheduler? Wichtig ist nur das der große Fix schnell kommt.
#4
Registriert seit: 26.06.2006
Bodensee
Oberbootsmann
Beiträge: 913
@redfrog betrifft nur den 24 und 32 kerner
#5
Registriert seit: 26.06.2006
Bodensee
Oberbootsmann
Beiträge: 913
Doppelpost
#6
Registriert seit: 21.07.2006

Obergefreiter
Beiträge: 73
Sauber. Wird aber auch Zeit, freu mich drauf und bin gespannt. Vielleicht profitiert davon ja auch gleich die dritte Generation :D
#7
customavatars/avatar287074_1.gif
Registriert seit: 29.08.2018

Oberbootsmann
Beiträge: 950
Zitat REDFROG;26744667
ch die erste Gen. ist gar nicht betroffen?

Natürlich nicht.

Zitat
Wusste gar nicht das der so viel anders ist.

Du hast doch zu den Artikeln dazu fleissig kommentiert.
Das nächste mal solltest du die Artikel vielleicht auch lesen;)

Zitat
Hat AMD eine CPU verschlimmbessert, toll.

Bei TR 2000 sind beim 24C und 32 4 Dice aktiv, aber nur 2 Dice sind jeweils mit 128bit an den RAM angebunden.
2 Dice liefenr also nur Kerne + PCIe-Lanes, aber den RAM strechen sie über die Nachbar-Die an, mit der sie über HT verbunden sind.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren: