Aktuelles

Zen 4 offenbar mit AVX-512-Unterstützung

Thread Starter
Mitglied seit
06.03.2017
Beiträge
59.816
epyc-3rd-gen.jpg
AMDs aktuelle Zen-Generationen unterstützen noch kein AVX-512 und sind erst bei AVX2 angekommen. Zuvor, als gemeinsame Erweiterung und somit gemeinsame Nenner verwendet, wurden AVX, SSE und MMX. AVX-512 wurde mit der Skylake-Architektur eingeführt und findet bei Intel vor allem im Serverbereich Verwendung.
... weiterlesen
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.

Nimrais

Enthusiast
Mitglied seit
29.01.2010
Beiträge
3.613
Ort
CH
Bei Intel drückt der Befehlssatz ordentlich auf den Strombedarf. Wird spannend wie das bei AMD aussehen wird und wie weit runter der Takt dann fällt.
Hat AVX eigentlich schon Vorteile im Endkunden (Gaming-) Markt?
 

Stunrise

Experte
Mitglied seit
26.07.2017
Beiträge
468
Ort
Augsburg
Ich habe AVX512 seit 2017 und exakt 0 Anwendungen (abseits von Benchmarks) und 0 Spiele, welche das jemals verwendet haben. Auf den Endkundenmarkt hat das absolut keine Auswirkung.
 

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.062
Bei Intel drückt der Befehlssatz ordentlich auf den Strombedarf.
512 Bit breite Register brauchen entsprechend große Rechenwerke und die vielen Transistoren brauchen entsprechend viel Energie. Wie weit der Takt gesenkt werden muss, hängt dann davon ab wie viele Kerne die CPU hat, welchen Takt sie sowieso hat und natürlich aus welcher Fertigung sie stammt. Generell wird es wohl eher weniger werden, denn die bessere IPC der neuen Architekturen werden ja über immer mehr Transistoren erkauft und damit fällt der prozentuale Anteil der Transistoren in den AVX-512 Einheiten im Vergleich zu der Gesamtzahl der Transistoren eines Kerns.
hat man nicht dafür die gpu?
Die GPU ist für ganz andere Aufgaben als Befehlserweiterungen wie AVX-512. So ist der Overhead gewaltig, wenn man Berechnungen auf der GPU machen will, da ja erstmal die Daten und Befehl zu ihr übertragen werden müssen und dann müssen die Ergebnisse wieder zurück übertragen werden. Dies entfällt bei Befehlserweiterungen der CPU komplett, weshalb beide bzgl. ihrer Nutzung nicht wirklich in Konkurrenz treten und Befehlserweiterungen wie AVX-512 dann auch von AMD eingeführt werden, obwohl sie ja selbst auch GPUs produzieren.
Ich habe AVX512 seit 2017 und exakt 0 Anwendungen (abseits von Benchmarks) und 0 Spiele, welche das jemals verwendet haben.
Und wie willst Du das ermittelt haben? Selbst wenn die Anwendung oder das Spiel selbst es nicht aktiv nutzt, so kann aber z.B. ein Framework wie dotNet oder Java (z.B. bei BASE64) es nutzen. Wenn dann kein AVX-512 Offset im BIOS eingestellt ist, was per Default meistens der Fall ist, dann ändert sich da oft nicht einmal der Takt, wenn es nur ein Thread ist oder eben nur sehr kurz.
 

Stunrise

Experte
Mitglied seit
26.07.2017
Beiträge
468
Ort
Augsburg
@Holt
Du glaubst doch nicht, dass mein 7900X unter Luft mit 4,7Ghz AVX-512 läuft? Die AVX Offsets liegen bei -4 und -7 und dazu kommt ein 250w PowerLimit sowie ein 95°C Temperaturlimit, welche beide regelmäßig greifen. Unabhängig davon bringt mir AVX512 absolut nichts, wenn nur irgendeine "Nebenlibrary" das verwendet, die nur ein paar Promille der Auslastung verursacht.

Es steht dir aber frei ein Spiel zu nennen, das nachgewiesen von AVX512 profitiert. Alternativ auch eine Anwendung, die halbwegs realistisch auf einem Home-PC verwendet wird - ich kenne jedenfalls keine.
 

java4ever

Profi
Mitglied seit
12.01.2018
Beiträge
569
Ort
Darmstadt
Ich habe AVX512 seit 2017 und exakt 0 Anwendungen (abseits von Benchmarks) und 0 Spiele, welche das jemals verwendet haben. Auf den Endkundenmarkt hat das absolut keine Auswirkung.
Das liegt wohl daran, dass AVX512 bisher im Endkundenmark eine extreme Nische war.

Wenn AMD jetzt AVX512 einführt, könnte sich das ändern
 

Stunrise

Experte
Mitglied seit
26.07.2017
Beiträge
468
Ort
Augsburg
Ich sehe AVX512 irgendwann am Ende des Jahrzents in Apps und Spielen angekommen und davor keinen Millimeter. Wenn ich mir die AVX512 Subset Matrix ansehe, erkenne ich 20 Subsets unterhalb von AVX512, welche völlig unterschiedlich von den Prozessorgenerationen unterstützt werden. Im Mainstream hat auch Alder Lake Q4 2021 kein AVX zur Verfügung, selbst wenn AMD mit Zen 4 AVX512 einführt ist fraglich mit welchen Subsets und Intel muss auch nachziehen, damit überhaupt eine breite Basis über die Jahre im Bestand das Set unterstützt.
 

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.062
Eben, nur erst mit Ice Lake ist es im Notebooksegment eingeführt worden und im Desktop erst mit Rocket Lake, wobei es bei Alder Lake wieder "verschwindet", sofern man die e-Kerne aktiviert hat. Da die SW Entwicklung der Entwicklung der Hardware immer um Jahre nachhängt, ist es also kein Wunder, wenn es noch nicht so viele Programme gibt, die dies intensiv nutzen. Dazu stört es auch manche, dass bei intensiver AVX-512 Nutzung der Takt fällt, was gerade bei den Skylake-SP, die ja die ersten (zumindest verbreiteten) CPUs mit AVX-512 waren, recht deutlich ausfällt.
Im Mainstream hat auch Alder Lake Q4 2021 kein AVX zur Verfügung
Falsch, die Golden Cove Kerne haben AVX-512, aber die e-Kerne nicht und daher wird AVX-512 deaktiviert, wenn die e-Kerne aktiv sind. Man kann es aber wohl aktivieren, wenn man die e-Kerne deaktiviert hat.

Wenn AMD AVX-512 bringt, ist Intel schon einen Schritt weiter und wird mit Sapphire Rapids Advanced Matrix Extension (AMX) bringen. Auch wenn es für Heimanwender nicht so wichtig ist, im Serverbereich wo man ja zuweilen auch spezielle Software für ganz spezifische Probleme entwickelt und einsetzt, machen solche Befehlserweiterungen sehr viel Sinn.
 

Holzmann

The Saint
Mitglied seit
02.05.2017
Beiträge
33.607
Ort
dieser thread

freekymachine

Experte
Mitglied seit
02.08.2019
Beiträge
646
Die Prozessoren können AVX und/oder SSE parallel.
Teilweise bekommen wir gar nicht mit, wie der Prozessor das löst und der Software ist das auch teilweise egal.

Da geht/kommt n Befehl rein, Software will was, würde das z.b. eigentlich über SSE machen, aber CPU Hardware "weiß es besser" und setzt den Befehl in AVX um, weils schneller/effizienter ist, Befehlsketten in AVX intelligenter/kürzer/kompakter existieren als in SSE.
So sind z.b. Befehle unter AVX teilbar/verteilbar, die es unter SSE nicht sind und so die CPU sogar in der Lage ist, Software die eigentlich z.b. nur für 4 Kerne ausgelegt ist, auf 8 Kerne(oder einfach alle) zu verteilen.

War schon ein Experiment/Wagnis als Intel mit der ersten Gen. AVX anfing - ich erinner mich noch gut an die ersten Artikel von vor 10 Jahren, "das das gut ist, besser ist, sinnvoll ist" - was man da nicht gemunkelt, diskutiert hat.. Wobei die praktische umsetzung erstmal nicht so erfolgreich war, aber dann doch gut in Gang kam, klar die meisten AVX anwendungen sind für Server, aber AVX hat sich ja nun doch sehr weit verbreitet, ist der intelligentere Weg und man sieht es jetzt ja auch vermehrt bei den core i7 10000ern aufwärts.

..und jetz les ich das alles hier...
NC...

Das ist alles hochkomplexer kram, den wohl keiner von uns auch nur Ansatzweise begreift, Mathematik, Logic, CPU Befehlssätze, wie wann welcher, woher weiß CPU wann was zu tun ist, was sie machen könnte, welche Kette an Logikpfad eingeschlagen werden soll um eine aufgabe zu lösen...mann bin ich froh grad nicht im Klassenzimmer zu sitzen und and die Tafel gerufen zu werden :P

Aber wir sind mittlerweile soweit in der Technik, da reißt man mal nicht eben ein 20 Jahres Konstrukt um oder stellt es mal so eben um. Da sitzen 10.000x Dipl. Dr. Prof. Ing. dahinter, das ist weit hinter all dem was wir noch so in einen einzelnen menschlichen Kopf bekommen. (Und ich hab den shice 7 Semester stufiert und weiß nix! ^^)

Da schlägt man sich dann mit sowas rum ; Intel® Intrinsics Guide - Viel Spaß - Das ist seeeehr viel Software Wissen ...zum Glück bin ich dann doch eher in die Hardware gegangen, in dem Sinne hab ich mich da ausgeklinkt, könnte aber sicherlich nochmal ne Stunde drüber referieren, nur um zu zeigen wo das hingeht, und das das teilweise komplizierter ist als ne Sonde hinter Pluto zu schießen.
Und wir sind hier nicht auf Github, von den Leuten müsste das hier mal einer erklären, ich bin nicht der richtige dafür, müsste mich selbst sicherlich nochmal 2 bis 6 Stunden einlesen um überhaupt was von mir geben zu können.

Freuen wir uns das AMD AVX 512 bringt :) - ist gut, sinnvoll, wer weiß, wofür man das braucht/brauchen wird + dann gibs 2 Mega-Großkunden die wirklich unbedingt AVX512 brauchen und AMd hat das dann nicht?! = nogo, muss AMD auch machen, sonst kaufen die ja Intel :) ....und nein ; ich kenn auch noch kein Spiel das explizit AVX nutzt, aber sicherlich Elemente davon und auch Befehlssätze, Spiele bestehn heutzutage ja meist auch nicht mehr nur aus einer Kernel/Element und werden zusammengebaut aus mehreren Codes, die wiederum alle verschiedene Ansätze/Codes/Befehle nutzen.

Das ist ein Feuerwerk an Elektronen was da passiert... unbeschreiblich als ich das erste mal begriffen hab, was ein Motorola 6502 in TTL/assembler macht, zu sehen wie die Register eine 1 und 0 durch die Leitungen schieben, mit welchen Mitteln der Befehlssatz es einem ermöglicht eine Division durchzuführen ...und das teil hatte 5000 Transistoren mit 70 Befehlen ?! - vs Threadripper mit seinen 40 Milliarden +siehe die Intel AVX Liste (scroll...scroll...scroll) - die Vorstellung ist immer noch unbegreiflich das der Mist auch noch fehlerfrei funzt :)

naja, Holti liest das eh nicht, /bin auf seiner ignore...zum Glück^^ - aber wenn ich den schon lese bekomm ich manchmal ... naja
 

Spieluhr

Urgestein
Mitglied seit
17.03.2006
Beiträge
8.679
Ort
Dortmund
Ich habe AVX512 seit 2017 und exakt 0 Anwendungen (abseits von Benchmarks) und 0 Spiele, welche das jemals verwendet haben. Auf den Endkundenmarkt hat das absolut keine Auswirkung.
RenderMan ab Version 22.3 (aktuell ist es die 24er) nutzt AVX-512, und VirtualDub mit entsprechenden Plugin ebendso.
Der OpenSource Handbrake Video Encoder auch, wenn man zb. Matroska H265 MKV Codec konverted und der Befehlszeile die Endung ":asm=avx512" hinzufügt.
Vorteil beim encoden: ohne AVX-512 mittlere BsP ca. 76~112 / mit AVX-512 mittlere BsP ca. 178~208. Allerdings bei einer CPU Package Power bis 143W (bei i5 11400)

Games nutzen AVX-512 gar nicht und AVX2 eher selten.

AVX-512 ist eigentlich die höchste Last welche man auf einer CPU generieren kann, daher wird Raphael ja auch TDP bis 170 Watt mit bringen.
Braucht man das nicht, kann man es auch im UEFI deaktivieren.

edit: Linus Torwalds bekommt jedenfalls, nachdem er ggü. Intel schon mit seinen bösen Worten bzgl. AVX-512 auf taube Ohren gestoßen ist, nun auch noch von AMD eins auf die Nase. :fresse:
 
Zuletzt bearbeitet:

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.062
AVX-512 ist eigentlich die höchste Last welche man auf einer CPU generieren kann, daher wird Raphael ja auch TDP bis 170 Watt mit bringen.
Es kann sein das die TDP dann auf 170W steigt, die Tendenz der letzten Jahre ist ja, dass die TDP immer weiter steigt, aber ich halte es für weit hergeholt, dass dies wegen AVX-512 passiert. Dann würde es ja bedeuten, dass die CPU nur bei intensiver Nutzung von AVX-512 Befehlen so eine Leistungsaufnahme haben würde, bei Volllast ohne AVX-512 dann aber trotzdem weniger. Dies scheint mir doch sehr unwahrscheinlich, wenn die TDP dann 170W beträgt, so werden die sicher auch ohne AVX-512 Last erreicht werden und mit AVX-512 Last wird der Takt dann eben entsprechend gesenkt, wenn die Leistungsaufnahme der CPU innerhalb der 170W bleiben muss.
 

Spieluhr

Urgestein
Mitglied seit
17.03.2006
Beiträge
8.679
Ort
Dortmund
Naja Holt, CPU-Z zeigt mir die höchste PackagePower mit AVX-512, Handbrake zeigt mit die höchste PackagePower mit AVX-512.
Woran soll es sonst liegen? Es gibt ja auch nicht viel Anwendungen die diese Befehlzeilenerweiterung auch aktiv nutzen.
Ich habe hier 5 Converter, nur Handbrake kann AVX-512 und ist zugegeben mit entsprechenden Codec auch verdammt schnell dabei.

edit: Ich kann das ja gerne morgen mal testen und die Logs posten. In 3 Sims: ohne AVX, mit AVX2 und AVX-512.

Bei Games würde ich so etwas auch eher kontraproduktiv ansehen. Aber in Anwendungen befürworte ich das.

edit2: Taktsenkung bei AVX-512 aktiv passiert nicht. Habe gerade ein Probe-VID im Handbrake @ AVX-512 am konverten. Last liegt bei ca. 145W Package, VID ca. 1,35 und Takt bei 4.2~4,3, laut CPU-Z., ergo Maximum.
PLs @ Boarddefault 220/250W. Auch wenn die nie erreicht werden, die bleiben so.
 
Zuletzt bearbeitet:

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.062
Woran soll es sonst liegen?
Das liegt daran, dass Du einen 11400 hast und ein Boards welches es erlaubt die PL1 hochzusetzen, nur wird die CPU diese ohne AVX-512 eben kaum ausschöpfen, deren Takt also ohne AVX-512 Last nicht das Power Limit begrenzt und daher ist die Package Power mit AVX-512 höher. Stelle die PL1 (und PL2 oder warte bis Tau abgelaufen ist) mal auf 65W und dann wirst Du sehen, dass die Package Power mit und ohne AVX-512 gleich ist, aber der Takt mit AVX-512 geringer ausfällt. Das ist bei den CPUs mit vielen Kernen eher der Normalzustand als bei denen mit weniger Kernen.
 

Spieluhr

Urgestein
Mitglied seit
17.03.2006
Beiträge
8.679
Ort
Dortmund
Das liegt daran, dass Du einen 11400 hast und ein Boards welches es erlaubt die PL1 hochzusetzen
Ja das hab ich doch schon in Post #14 geschrieben. ;)

Warum sollte ich die power Limits herunter setzen und die Leistung beschneiden? Das Thema hatten wir doch schon einmal.
Bei solchen Anwendungen geht es um Leistung und Rechengeschwindigkeit, nicht um Verbrauch. Daher ja auch der Hinweis: "AVX-512 erzeugt die höchste Last bzw. Verbrauch/Watt".
Kann jeder ja gerne später mal mit Alder Lake testen. PLs entsprechend setzen, meinetwegen unlimited, E-Cores deaktivieren, AVX-512 aktivieren und dann meinetwegen lapidar mit CPU-Z AVX-512 benchen.
Da bei AlderLake PL1=PL2 eh auf 241W @ default gesetzt ist, könnte der garantiert mit AVX-512 und nur via P-Cores aktiv auch an diese Grenze kommen.
Was ich persönlich gerade beim Encoden nicht schlimm finde, denn dementsprechend schnell wird der auch mit dieser Software werkeln. AMD will das ja nicht nur aus Spaß an der Freude implementieren. ;)
 
Zuletzt bearbeitet:

freekymachine

Experte
Mitglied seit
02.08.2019
Beiträge
646
Holt hat n core i7 4770 oder so^^
der kann das alles gar nicht selbst testen, alles nur theorie, 0,00 praxis, verschwnde nicht deine lebenszeit :)
 

Spieluhr

Urgestein
Mitglied seit
17.03.2006
Beiträge
8.679
Ort
Dortmund
Nicht so Aggro. ;)

Man kann mit Holt schon gut texten, seine Aussagen sind auch meist stimmig.

Allerdings eine CPU bei leistungshungrigen Anwendungen gerade mit AVX-512 strikt auf TDP Line zu fahren ist ein Fail.
Da verliert man einiges an Leistung (auch bei AMD) und die paar Sekunden PL im TAU, da ist ein Video Encoding lang nicht fertig.
Wenn ich jetzt zb. die 11400, die einen Multi bis x44 (4,4GHz) besitzt, via PL strikt auf TDP 65 Watt limitiere (TAU nutzt mir bei AVX-512 Encoding zeitlich nix), kastriere ich die CPU auf max. 3,1GHz Taktung.
Dazu noch mit AVX-512 aktiv, verliere ich rund 50% an Leistung, da kann ich das auch irgendwo ganz bleiben lassen.
Außerdem liegt der Verbrauch ja wirklich nur beim Encoden inkl. AVX-512 an, danach geht die Package Power wieder runter auf ca. 12 Watt. Also alles gut. :)
 
Zuletzt bearbeitet:

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.062
Warum sollte ich die power Limits herunter setzen und die Leistung beschneiden?
Um den beschriebenen Effekt zu sehen.
Allerdings eine CPU bei leistungshungrigen Anwendungen gerade mit AVX-512 strikt auf TDP Line zu fahren ist ein Fail.
Das hängt davon ab was man möchte, man kann natürlich auch die Power Limits hoch und den Zieltakt so weit runterstellen, dass die CPUs auch mit voller AVX-512 Last diesen Zieltakt noch innerhalb der Power Limits schafft, also deswegen nicht runtertakten muss. Dies wegen aber wohl die wenigsten so wollen, denn natürlich verliert man sonst ohne AVX-512 Last ordentlich Leistung und muss dann trotzdem einen CPU Kühler verbauen der PL1 wegkühlen kann.
Dazu noch mit AVX-512 aktiv, verliere ich rund 50% an Leistung
Nein, denn die Leistung ist mit AVX-512 ungleich höher, wenn die Anwendung gut darauf optimiert ist und diese Mehrleistung überkompensiert den Taktverlust deutlich. Dies ist immer wieder schön an dem Test von 3D Particle Movement mit AVX-512 (gut optimiert) des Cannon Lake i3-U bei Anandtech sehen:
 

Infi88

Enthusiast
Mitglied seit
09.09.2010
Beiträge
1.195
Holt hat immer Recht, deal with it :LOL:. AVX 512 ist ne feine Sache, EPYC's und XEON's sind absolute Bestien damit, gut das AMD mitzieht (y). Mein nächster TempleOS Home Office PC brauch definitv auch AVX-512 support, damit wird man selbst in Excel Online zum Kolibri.
 

Tzk

Sockel A Legende
Mitglied seit
13.02.2006
Beiträge
20.202
Ort
Koblenz
Nein, denn die Leistung ist mit AVX-512 ungleich höher, wenn die Anwendung gut darauf optimiert ist und diese Mehrleistung überkompensiert den Taktverlust deutlich.
Korrekt, wobei das fettgedruckte der entscheidende Teil ist. Eine Anwendung die AVX-512 gerade so viel nutzt, das der Takt fällt, aber kein Leistungsvorteil daraus gezogen wird, ist wohl ohne AVX-512 besser dran. Da sind aber die Programmierer gefragt, Intel/AMD stellen ja nur den Befehlssatz bereit.
 

Stueckchen

Experte
Mitglied seit
29.03.2017
Beiträge
437
Das AMD entlich auch AVX512 können wird ist für die Anwendungen die es nutzen sehr gut und wenn mehr CPUs das können wird es auch mehr Code geben der es Nutz.
Denn mit dem Befehlssatzu zu rechnen ist fast immer schneller als ohne auch bei deutlich niedrigerem Takt.
Bei letzte Workstaition auf Arbeit wurde expliziet wegen AVX512 Intel und nicht AMD besorgt, trotz der mehrkosten.

Das ganze ist auch etwas vergleichbar mit den Apple M1 Chips, die sind ja gerade wegen des breiteren Befehlssatz/Registern (und der darauf abgestimmten Software) so schnell, bzw. so viel schneller als x86 bei deutlich gernigeren Leistungsaufnahme.
 

mr.dude

Urgestein
Mitglied seit
12.04.2006
Beiträge
6.441
Bei Intel drückt der Befehlssatz ordentlich auf den Strombedarf. Wird spannend wie das bei AMD aussehen wird und wie weit runter der Takt dann fällt.
Hat AVX eigentlich schon Vorteile im Endkunden (Gaming-) Markt?
Wobei das bei Intel generell für AVX gilt. Also auch vor AVX512 stieg der Strombedarf bei entsprechenden Workloads sichtbar.


Ich habe AVX512 seit 2017 und exakt 0 Anwendungen (abseits von Benchmarks) und 0 Spiele, welche das jemals verwendet haben. Auf den Endkundenmarkt hat das absolut keine Auswirkung.
Bei Spielen liegt das vor allem daran, dass Grafikschnittstellen wie D3D, OpenGL oder Vulkan traditionell mit 4-fach Vektoren einfacher Genauigkeit arbeiten, z.B. was Positionsdaten (xyzw) betrifft. Einfache Genauigkeit ist 32-bit, also 4 x 32 = 128. D.h. mit 128-bit Registern (SSE) konnte man das ganze schon recht gut beschleunigen. Man kann darüber hinaus natürlich auch noch weiter Performance rausholen. Aber dafür braucht es gut optimierten Code, was wiederum mehr Aufwand für Entwickler bedeutet. Ich denke da wird noch einige Zeit vergehen, bis es sich wirklich lohnt. Theoretisch könnten aber auch Spiele von solchen ISA Erweiterungen profitieren. Die meisten dieser Berechnungen übernimmt zwar eh der Grafikprozessor. Einiges muss aber weiterhin die CPU übernehmen. Ich denke aber, dass der Endkundenmarkt eher abseits von Spielen profitieren kann. Renderer, Transkoder usw machen ja im Grunde genommen nicht viel mehr, als Daten parallel zu verarbeiten. Dort lohnt es sich vermutlich am meisten. Und die müssen auch nicht immer mit einfacher Genauigkeit arbeiten. Von entsprechend breiteren Registern profitiert man dann auch.


AVX-512 ist eigentlich die höchste Last welche man auf einer CPU generieren kann, daher wird Raphael ja auch TDP bis 170 Watt mit bringen.
Welche TDP Klassen Raphael mitbringt, ist bisher unklar. Dazu gibt es noch keine offiziellen Informationen. Es gibt lediglich einen Leak zum AM5 Sockel. AM5 wird aber bekanntlich auch für mehrere Generationen genutzt. Also das muss nicht zwangsläufig was für Raphael bedeuten. Die TDP für AM5 steigt jedenfalls für normale luftgekühlte Systeme von derzeit 105W (AM4) auf 120W. Und das hat vermutlich weniger was mit AVX zu tun, sondern eher damit, dass man für den Mainstream Sockel in Zukunft mit mehr als 16 Kernen plant. Zudem sollen auch die Top SKUs in Zukunft eine iGPU bekommen. 170W ist quasi ein neues Enthusiasten Segment, was es in der Form für AM4 nicht gab, und vor allem auch auf wassergekühlte Systeme abzielt. Vorstellbar wären da natürlich ab Werk entsprechend hoch getaktete Sondermodelle. So wie man das schon mal mit der FX-9000 Reihe gemacht hat.
 

Spieluhr

Urgestein
Mitglied seit
17.03.2006
Beiträge
8.679
Ort
Dortmund
Holt, da hast du mal wieder etwas komplett aus den Zusammenhang gerissen.
Wenn ich jetzt zb. die 11400, die einen Multi bis x44 (4,4GHz) besitzt, via PL strikt auf TDP 65 Watt limitiere (TAU nutzt mir bei AVX-512 Encoding zeitlich nix), kastriere ich die CPU auf max. 3,1GHz Taktung.
Dazu noch mit AVX-512 aktiv, verliere ich rund 50% an Leistung, da kann ich das auch irgendwo ganz bleiben lassen.
Das gehört alles zusammen.

Na, dann zeig mir mal den Trick, wie du mit einer 11400 bei 65 Watt TDP, eingestellt als Maximalverbrauch, auf Maximaltakt 4,3GHz inkl. AVX-512 aktiv kommen willst.
Bin gespannt. und jetzt komm bitte nicht wieder mit PL1 und PL2 nach Intel Empfehlungen, denn dann habe ich höchstens den Effekt, dass ich für 28sek. auf höchsten Takt und bester Leistung mit AVX-512 takte und danach dann halt ebend mit beschnittener Leistung innerhalb TDP.
 

IronAge

Legende
Mitglied seit
05.02.2005
Beiträge
35.614
Ort
Porzellanthron

Auf dass Intel endlich das x265 Encoding via iGPU frei gibt.
 

Spieluhr

Urgestein
Mitglied seit
17.03.2006
Beiträge
8.679
Ort
Dortmund
@ Holt: Damit du es glaubst, hier mal Leistungswerte der CPU nach Intel PL-Empfehlungen "Performance" Setting (PL1: 65W / PL2: 158W / TAU: 56sek.) mit AVX-512 aktiv (CPU-Z).

CPU @ AVX-512 @ Intel PL Performance Setting nach 30 sek. (innerhalb TAU) - CPU-Z Benchscore MT 6410 / CPU Takt 4,3 GHz:
tdp-intelspec avx512 tau-in.png

CPU @ AVX-512 @ Intel PL Performance Setting nach 80 sek. (außerhalb TAU) - CPU-Z Benchscore MT 1640 / CPU Takt 3,1 GHz:
tdp-intelspec avx512 tau-out.png

Und hier Handbrake Video Encoding, einmal mit AVX-512 und einmal ohne AVX-512. Power Limits so wie das Board sie vorgibt PL1 220W / PL2 250W / TAU 28sek.

Handbrake ohne AVX-512 / Codec: Matroska H.265 MKV 2160p60 / Überwachung Temps/Wattage CoreTemp / erstellt nach 1min:
handbrake avx512 off.png

Handbrake mit AVX-512 / Codec: Matroska H.265 MKV 2160p60 / Überwachung Temps/Wattage CoreTemp / erstellt nach 1min:
handbrake avx512 on.png

Wenn Sie Handbrake einmal mit hinzugefügter und einmal ohne diese Option ausführen, werden Sie sehen, wie sehr Rocket Lake von AVX-512 in HEVC-Kodierung mit x265 profitieren kann. Wie Sie sehen können, hat der AVX-512 bei den Rocket Lake-Modellen, an denen wir dies getestet haben, die Leistung in unserem Encoding-Test um + 7,5% gesteigert. Etwas besser schneidet der Core i5-11400F ab, damit liegt der Boost bei +9 %. Laut Dokumentation könnte der Nutzen bei den langsamsten Presets vielleicht etwas besser sein. Letztendlich haben diese 512-Bit-Vektoroperationen einen relativ begrenzten Einfluss auf die x265-Codierung, es gibt keine lineare Leistungsskalierung im Vergleich zu 256-Bit-Vektoren (AVX2).
Also, man kann AVX-512 dazu schalten, muss es aber nicht. Es ist aber nicht verkehrt wenn die CPU das anbietet und man es nutzen möchte, denn wie man oben an meinen Testsetting sieht, liegt der Boost sogar über +9%, da die Presets niedriger eingestellt sind als hwcooling das getestet hat.

Ich vermute auch mal -aber das ist jetzt wirklich nur Spekulatius, also nicht wieder auf die Goldwaage legen- AMD wird mit Raphael u.a. AVX-512 auch nur deswegen implementieren, weil es ja auch Benchtools gibt (CPU-Z, AIDA64, SiSoft Sandra zb.) in denen man aktiv mit AVX-512 benchen kann. Und ich vermute auch, dass bei Raphael, im Gegensatz zu Alder Lake, dieses Feature @ default nich zwangsläufig in den Boardsettings deaktiviert sein wird um in solchen Benches wieder einen "künstlichen" Performanceboost zu ergattern. Rein von den Anwendungen her macht AVX-512 im Desktop Segment derzeit jedenfalls kaum Sinn um damit die Implementierung als dringend notwendig rechtfertigen zu können., Denn die Tools welches diese Befehlssatzerweiterung aktiv nutzen, sind sehr spärlich gesät.
Und es ist auch kein Irrglauben und das ist u.a. auch mit der Grund warum Raphael die TDP hoch schraubt, dass AVX-512 im Gegensatz zu AVX2, den Verbrauch der CPU rreal einiges steigert.
Das sieht man doch sehr schön an den ersten beiden Screens (XTU) und kann man gerne auch in der Dokumentation zu AVX-512 nachlesen.

Fazit: PL-Settings bleiben also so eingestellt wie das Board sie vorgibt, denn nur dann habe ich den besten CPU Workload! Nach Intel Empfehlungen wird die CPU (nach TAU) nur künstlich, leistungsseitig limitiert.
 
Zuletzt bearbeitet:

freekymachine

Experte
Mitglied seit
02.08.2019
Beiträge
646
Oh cool, hast du es doch gemacht :)
Ich würd wahrscheinlich auf der Arbeit Montag auch nochmal ähnliches gucken/testen, hab da zugriff auf Xeon 3467er.
Da bin ich jetzt doch etwas neugierig geworden "Wie sinnvoll kann AVX512 doch sein ?! ist es jetzt ?, kann es sein im besten Fall, wie verhält es sich uswusw ?"

Naja mit Holt, er hat gute und schlechte Tage, leider hab ich ihn in diversen Threads angetroffen, wo er absolout keine Hilfe war und sich dann einfach ausklinkt und nie wieder kommt.
(Und ich glaube nach deinem guten Post kommt der auch nicht wieder)
Vieles von dem was er von sich gab wirkte für mich wie ein "Google-Bot" - alles nachschlagen und nachplappern aber eigentlich gar nicht genau wissen worum es geht, wirkt/sieht dann professionell aus, hat aber 0 Grundlage - und oft gesehn, das er halt offensichtlich 0 Praxiserfahrung hat, konnte halt sehen wie Theorie und Praxis nicht zusammenfinden.
"Das steht so im Handbuch" - ja aber in der Realität ..passen auch 48GB auf ein X58, lassen sich auf einem X99 auch E7 Xeons betreiben, laufen SSDs auch noch 4 Jahre nachdem sie im Keller lagen, vs was die Hersteller+Holt von sich geben.
Oder der TE hatte ein Hardwareproblem und ich frag mich was zum Henker er da gelesen hat, bzw nicht gelesen hat," setzen Note 6, 0 Punkte, Thema verfehlt" - absolout nicht hilfreich, aber in jedem verdammten Thread muss er was von sich geben, überall, lebt hier^^, soviel Zeit hab ich niemals.

Zu seiner Verteidigung - ich hab auch Threads gesehn wo er tatsächlich sehr hilfreich war und Recht hatte und Probleme von TE lösen konnte oder wo sein Google nachschlagen richtig einsortiert war und er sinnvollen Kram von sich gegeben hat. Ich glaub der muss einfach mal nur an die UNI/FH für 2 Jahre, mal wieder mit Fachleuten auseinandersetzen, Praxiserfahrung und Theorie verschmelzen mit einem Dozenten der sagt "richtig/falsch/ja/nein/aus!" ^^
 

Spieluhr

Urgestein
Mitglied seit
17.03.2006
Beiträge
8.679
Ort
Dortmund
Vorsicht bei Xeon Prozis! Denn da stimmt Holts Aussage wieder, Xeon verringt @ AVX-512 den Takt, du würdest höchstwahhrscheinlich sogar Leistungseinbußen erleben. ;)

Das hat sich aber mit Desktop Rocket Lake erledigt:
Als der x265 zunächst die Assembly-Optimierungen unter Verwendung von AVX-512 erhielt, stellte sich heraus, dass diese die Leistung der Xeon-Prozessoren nicht um den gleichen oder einen besseren Faktor erhöhten, da sie die Taktrate verringerten. Mit anderen Worten, das kombinierte Ergebnis war eine Verlangsamung statt einer Beschleunigung. Und deshalb wurde beschlossen, diesen Code standardmäßig deaktiviert zu lassen – daher wird x265 ihn nicht verwenden, bis Sie ihn erzwingen (Sie können hier darüber lesen). Und diese Einstellung scheint seitdem gleich geblieben zu sein. Die Entwickler haben empfohlen, den AVX-512 einzuschalten, wenn Sie beispielsweise 4K mit sehr langsamen Einstellungen codieren. Wenn Ihr Prozessor jedoch auf eine feste Rate übertaktet wird oder aus anderen Gründen der AVX-512 seine Taktrate nicht reduziert, sollten Sie in der Regel einen Leistungsschub bemerken. Dies sollte hoffentlich auch bei Rocket-Lake-Prozessoren der Fall sein, die auf Z590-Mainboards ihren Takt hoch halten sollen, auch wenn AVX-512 aktiviert ist.

Denn wie du anhand meiner Handbrake Tests sehen kannst, hält meine Rocket den Takt und der Boost ist definitiv vorhanden. Umgerechnet bei den von mir verwendeten Presets fast 15%.
Also scheint gerade die kleine Rocket 11400 auf B560 sehr gut mit AVX-512 zu arbeiten, daher freu ich mich ja auch auf die 12400 Alder Lake ohne E-Core später dann auf B660.
Und weil die ja auch, da halt keine E-Cores und kein Hybrid Design, mit W10 und dessen Sheduler keine Performancenachteile haben dürfte, vieleicht sogar performer werkelt als unter W11.
Die anderen Alder Lake Prozis interessieren mich eher weniger. Zu teuer, W11 ist quasi Pflicht für perfekte Performance und gerade dieses W11 ist noch nicht bugfree mit non Hybrid CPU.
Hatte damit, wo ich das aktiv verwendet hatte, mehrere Games die gar nicht mehr funktionierten und 2x einen GreenScreen, wovon einer scheinbar auf einen Prozessor Bug der 11400 unter W11 beruhte.

edit: Hier der Screen

win2.png
 
Zuletzt bearbeitet:
Oben Unten