CCX mit 8 Kernen und 32 MB L3-Cache: AMD spricht über das Zen-3-Layout

Thread Starter
Mitglied seit
06.03.2017
Beiträge
112.372
zen3.jpg
Im Rahmen der Vorstellung der Ryzen-5000-Prozessoren hatten wir die bisher bekannten Details zur Zen-3-Architektur bereits durchleuchtet. Weitere werden mit dem Testbericht genannt werden, der am kommenden Donnerstag, den 5. November, erscheinen wird.
... weiterlesen
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Hoch spannend. Ich freu mich auf die nächste Generation, die kommt. :popcorn:
 
Macht ja insofern auch Sinn, als sie zuletzt eh nur Zen2 mit mindestens sechs Kernen verkauft haben, für die zwei CCX nötig waren - bis sie erst vor wenigen Monaten die Ryzen 3 3100/3300X vorgestelt haben. Aber selbst da bestand ja der 3100 aus zwei CCX und man hat anhand des 3300X gesehen, was ein CCX für Vorteile bringt.

Allerdings gibt es auch einen Nachteil: Wenn sie daran nichts geändert haben, kann man ja die Kerne in einem CCX nicht unterschiedlich takten und somit beim OC höchstens Unterschiede zwischen den CCX machen. Bei Ryzen 3000 konnte man bei den Versionen mit vier CCX diese tlw. schon deutlich unterschiedlich Takten und so einen merklich höheren Takt für Anwendungen für 4 oder 8 Kerne erreichen, bei denen mit nur zwei CCX gab es aber höchstens minimale Unterschiede, zumal ja kaum ein modernes Spiel nur 4 Kerne beansprucht.
So lassen sich dann bei allen Ryzen 5000 bis zum 5800X nur alle Kerne gleich takten, bei den beiden größeren gibt es dann nur zwei Stufen mit minimalen Unterschieden.

Da ist Intel, zumindest theoretisch, besser, da kann man jeden Kern einzeln takten.
 
Sollte mit dem neuen Layout dann nicht ein 8Kerner bei Anwendungen die max. 8Kerne unterstützen für Gaming am besten sein? Oder versucht ein 12Kerner bei Anwendungen die nur 8 Kerne nutzen die Kommunikation/Arbeit auf ein CCD zu beschrenken um die Latenzen über den IOD zu vermeiden?
 
Sollte mit dem neuen Layout dann nicht ein 8Kerner bei Anwendungen die max. 8Kerne unterstützen für Gaming am besten sein? Oder versucht ein 12Kerner bei Anwendungen die nur 8 Kerne nutzen die Kommunikation/Arbeit auf ein CCD zu beschrenken um die Latenzen über den IOD zu vermeiden?
Da muss AMD wohl wieder zusammen mit MS/Linux-Gemeinde am Scheduler arbeiten müssen. Der teilt der Anwendung die entsprechenden Kerne/Threads zu.
 
Sinn würde das ja machen... es wird ja gepredigt, dass mehr als 8 Kerne für Spiele wohl aktuell nicht notwendig sein... wenn dann ein Spiel innerhalb eines CCD läuft... kann das andere ja OBS oder sonstigen Kram übernehmen ohne die Performance vom Spiel großartig zu beeinflussen.
 
Sollte mit dem neuen Layout dann nicht ein 8Kerner bei Anwendungen die max. 8Kerne unterstützen für Gaming am besten sein? Oder versucht ein 12Kerner bei Anwendungen die nur 8 Kerne nutzen die Kommunikation/Arbeit auf ein CCD zu beschrenken um die Latenzen über den IOD zu vermeiden?
Ein 12 Kerner wird allerdings aus 2 CCD mit jeweils 6 Kernen bestehen und nicht 8+4 => die Einteilung erfolgt stets symetrisch
 
Guter Hinweis. Dann kaufe ich wohl direkt den 16Kerner. Bin auf Tests gespannt, insbesondere ob der 5800x beim Gaming irgendwelche Vorteile ausspielen kann, wenn keine Kommunikation über den IOD stattfinden muss.
 
wenn das so ist, werde ich wohl den 5950x kaufen müssen, effizienter und besseren takt potenzial usw !!!

da man den 5950x ein ccd deaktivieren kann 😉
 
Der Leistungssprung von Zen 3 scheint enorm zu sein, ein Mitglied von LTT hat einen Cinebench R20 Test vom 5600 X veröffentlicht : https://videocardz.com/newz/amd-ryzen-5-5600x-cinebench-scores-leak-ahead-of-launch , im Vergleich zum 1600 X doppelte Singlecoreperformance und 2000 Punkte mehr im Multicore, das ist wirklich sehr stark.
Alles schön und gut, aber wie siehts in Multicorespielen aus?
Die werden doch bestimmt auch so gut wie nicht verfügbar sein :/
 
Zuletzt bearbeitet:
Alles schön und gut, aber wie siehts in Multicorespielen aus?
Das kann ich dir leider noch nicht sagen.
392*2 ergeben keine 602.
Ich habe es gerade einmal bei mir getestet, 1600 X @stock mit 3200 cl 14 14 14 34 Ram 375 Singlecore und 2705 Multicore, hattest also recht, hatte ein falsche Zahl im Kopf. Aber das der 6 Kerner schneller ist als der alte 8 Kerner finde ich beeindruckend, du nicht ? Das hat Intel nicht geschafft.
 
Das hat Intel nicht geschafft.
Solange die auf der alten Arch hängen kann da auch nichts bei rumkommen.

Was ja nächstes Jahr dann nicht mehr der Fall sein soll.

Dennoch muss man hier Gratulieren zu der Leistung.
 
Nur theoretisch, praktisch muss dann immer eine Differenz von 1Ghz zwischen den Cores sein, was das Ganze sinnlos macht. Es geht nur sinnvoll pro CCX und das bringt auch nur viel auf dem 3900X/3950X. Da kann man dann schon Differenzen von ~200MHz zwischen den CCX erreichen.
 
Ja, jede Entscheidung hat ihre Vor- und Nachteile. Die Nachteile dieser Zen 3 Optimierung:
- Wenn ein Prozess nur 4 Kerne nutzt, kann er auf dem gleichen CCX arbeiten und wenn er nur 16MB Cache braucht, ist der 16MB Cache schneller als der 32MB Cache
- Wer CCD/CCX OC betreibt, kann die 4-Kern Abteile genauer tunen als die 8-Kern Komplexe

Nun ist es aber so, dass die meisten Anwendungen nicht auf eine explizite Kernanzahl geschrieben sind und man mehr als nur eine Anwendung auf nem Rechner zu laufen hat - ansonsten würden wir auf FPGAs zocken. Entsprechend hat AMD Zen 3 so optimiert, dass die Nachteile kaum bis gar nicht mehr ins Gewicht fallen und die Vorteile maximiert werden.

Wir haben vor nicht allzu langer Zeit um 2-3% Differenzen hier im Forum noch Grubenkämpfe um die beste CPU gehabt und jetzt wo AMD mal eben 20% oben drauf legt sind die 20% egal und wir kramen irgendwelche edge-cases die weniger als 1% Performance-Differenz vs eine "theoretisch steif optimierte Zen 2 Pipeline" (die es in der Praxis nicht gibt) haben raus?

Außerdem boostet jeder Kern unter nicht-manuell Settings selbstständig und mit einer guten Wahl der Umgebungsparameter ist die Differenz zum manuell voll getunten Chip so langsam völlig Banane geworden. Selbst buildzoid (!) ist dazu übergegangen die Rahmenparameter zu optimieren, anstatt seine Zeit mit CCD/CCX OC zu vergeuden. Das wird mit Zen 3 nicht anders sein.
 
Verstehe nicht was du meinst. Du kannst doch auch beim 3000er den Takt jedes einzelnen Cores steuern. Nur die Stromversorgung pro CCX ist gesetzt.
Man erdenkt sich Konstellationen um etwas negatives schreiben zu können
 
Ja, jede Entscheidung hat ihre Vor- und Nachteile. Die Nachteile dieser Zen 3 Optimierung:
- Wenn ein Prozess nur 4 Kerne nutzt, kann er auf dem gleichen CCX arbeiten und wenn er nur 16MB Cache braucht, ist der 16MB Cache schneller als der 32MB Cache
- Wer CCD/CCX OC betreibt, kann die 4-Kern Abteile genauer tunen als die 8-Kern Komplexe
Das ist für 0,00001% der Käufer relevant, die mit denen man als Firma Geld verdient interessieren sich nicht dafür, da läuft alles stock und es wird auf die stock Leistung und den Stromverbrauch geguckt.
 
Außerdem boostet jeder Kern unter nicht-manuell Settings selbstständig und mit einer guten Wahl der Umgebungsparameter ist die Differenz zum manuell voll getunten Chip so langsam völlig Banane geworden. Selbst buildzoid (!) ist dazu übergegangen die Rahmenparameter zu optimieren, anstatt seine Zeit mit CCD/CCX OC zu vergeuden. Das wird mit Zen 3 nicht anders sein.
Das ist wohl eine Vergeallmeinerung, die man so nicht stehen lassen kann.
Wer viel MC Anwendungen hat (rendern/encoden usw.) kann mit CCX OC entweder den Verbrauch gewaltig senken, oder die Performance bei selben Verbrauch steigern.
Wobei die CPU im Idle auch nicht mehr als stock verbraucht.
Ein R9 3900XT wird hier beim CB20 mit 7096cb und seinen typischen 142W PPT gemessen. Mit ein wenig optimierung erreiche ich 7193cb...aber nicht mit 142W, sondern mit 90W.
Wenn ich PPT von 142W ausnutze sind es anstatt der 7096cb mit 7935cb doch ein wenig mehr.
So als völlig Banane würde ich das also nicht sehen.

KurzGedacht

Verstehe nicht was du meinst. Du kannst doch auch beim 3000er den Takt jedes einzelnen Cores steuern.

Kannst Du mir das mal zeigen?
 
Zuletzt bearbeitet:
Das ist wohl eine Vergeallmeinerung, die man so nicht stehen lassen kann.
Wer viel MC Anwendungen hat (rendern/encoden usw.) kann mit CCX OC entweder den Verbrauch gewaltig senken, oder die Performance bei selben Verbrauch steigern.
Wobei die CPU im Idle auch nicht mehr als stock verbraucht.
Ein R9 3900XT wird hier beim CB20 mit 7096cb und seinen typischen 142W PPT gemessen. Mit ein wenig optimierung erreiche ich 7193cb...aber nicht mit 142W, sondern mit 90W.
Wenn ich PPT von 142W ausnutze sind es anstatt der 7096cb mit 7935cb doch ein wenig mehr.
So als völlig Banane würde ich das also nicht sehen.
Das Beschriebene geht aber auch stark in Richtung "Ryzen Clock Tuner" - ist ja nicht so, als dass es nicht schon ne Lösung dafür gäbe. ;)
Beim TR kann man durch ein einheitliches Frequenzniveau durchaus noch etwas für seine Multi-Core Anwendungen rauskitzeln, bei Spielen hat das aber kaum bis gar keinen Effekt. Die Cinebench-Resultate sind ja auch nicht 1:1 auf Spiele übertragbar, jedoch schon auf Produktivitätssoftware. Das liegt halt daran, dass bei Spielen die Latenzen ein Problem sind und das hat AMD mit Zen 3 so richtig schön aufgebohrt. Du konntest Zen 2 auch auf 5.3GHz mit LN2 prügeln - hat in Spielen aber trotzdem nix gebracht.

Deswegen ja auch mein Satz mit den "Grubenkämpfe wegen 2-3%". In Produktivitätsanwendungen stimme ich dir aber zu.
 
Ich verstehe aber auch nicht ganz, wieso man bei Ryzen die einzelnen Cores nicht manuell takten kann (bzw. warum die dann 1GHz Differenz haben müssen), wenn der Boost das doch so fein kann (AFAIK 25MHz-Schritte, also viel feiner als bei Intel?).
Natürlich macht das nicht wahnsinnig viel aus, aber ich würde meinen, ab einer gewissen Optimierung der restlichen Paramater bringen 50-100MHz mehr Coretakt noch deutlich mehr als nochmal ein paar MHz Speichertakt. V.a. sind dem anderen Parametern ja auch Grenzen gesetzt.
Ein 3600 leidet ja wohl momentan schon darunter, dass man ihn mit Ach und Krach auf 4,3GHz Allcore kriegt, während aber alle schnelleren Ryzen einzelne Cores um 100-400MHz höher takten.

Als nicht Ryzen-Besitzer rede ich aber wie ein Blinder von der Farbe. Ich wüsste sowieso mal gerne, welche Taktraten @auto und mit CCX-OC den so in Spielen anliegen. Soweit ich das verstanden habe, ist der Boost-Takt ja nur das absolute Maximum für Singlecore, aber wann wird nurnoch ein Kern belastet. Bei den meisten neuen Spielen dürften ja inzwischen sowieso 6-8 Kerne genutzt werden, und wenn nicht läuft halt noch diverser Kram im Hintergrung.
 
Das Problem beim Ryzen 3000 ist, dass er nach ~4.3 bis 4.4GHz gar nicht mehr bei Spielen skaliert. Da kannste auch nen Takt von 5GHz ansetzten und da tut sich so gut wie gar nix mehr in Spielen, weil der Latenz-Flaschenhals übernimmt. Wenn du 60ns warten musst, bis der nächste Speicherdatensatz da ist, du aber bei 4.4GHz nur noch 59ns für die Berechnung brauchst, dann kannste das Teil auch auf 5GHz taken, bist in 50ns mit der Berechnung fertig und musst trotzdem noch 10ns warten, bis du den nächsten Datensatz bearbeiten kannst.

Der einzige Unterschied beim Takt liegt bei Anwendungen, die einen eher geringen Speicherdurchsatz, aber einen hohen Berechnungsaufwand haben - was viele Produktivanwendungen gerne mal sind. Dort kann man (wenn wir nen Threadripper nehmen) einen allcore- Wert einstellen, der da auf Grund der Funktionsweise der Software nochmal ordentlich was bringt. Da machen 3.9GHz vs 4.3GHz all-core durchaus noch was aus - auch da nähern wir uns dann so langsam der magischen 4.4GHz Grenze. (Ich denke der 32-Kern TR war ich Spielen gar nicht mal so übel)

Außerdem sind 32 oder gar 64 Kerne bei 4.4GHz schon sehr ordentlich was den Strombedarf angeht - mit Luftkühlung wird das da nix mehr.

Was das 1-Kern Tuning angeht ist das halt ne Frage vom FIT des Prozessors. Der regelt durch mehrere Parameter, wie viel welcher Kern grad saugen darf. Mit nem manuallen OC sägst du aber diese Parametrisierung kaputt und somit hast du dann nur noch ganze Kernkomplexe zum Tuning zur Auswahl. Jetzt kann man natürlich einfach 6 von 8 Kernen deaktivieren, einen auf exklusiv schalten und diesen dann ausmessen - bringt aber nix, da so ein einzelner Kern andere Leckströme erzeugt als 8 auf Vollast. Und damit isses dann auch wieder für die Katz.

PS: Am Ende nimmt man halt den Ryzen Clock Tuner, der ne Art Mischung aus auto und manuell macht und der setzt dir dann die Frequenzen da hin, wo sie nach deinen gesetzten Maximal-Beschränkungen stabil liegen. Das kommt recht nahe an das manuelle OC ran und auch dort kann man die "optimierten Parameter" von buildzoid eintragen und gewinnt nochmal 1-2% - vielleicht.
 
Zuletzt bearbeitet:
Neues vom 5600X der fälschlicherweise zu früh verkauft wurde:
IMG_20201103_122226.jpg


50ns! ChooChoo!
 
Der Lesewert ist beeindruckend! Kommt an mein STOCK 7800X (was 2400 MHz ist) heran, der Quad Channel hat.
 
Ja aber 50ns reicht das den, für die Spielekrone? :unsure:
 
Das werden wir ja bald wissen. Meine Plattform wurde definitiv geschlagen ^^
 

Nozomu,​


junger man, dein sys platform habe ich bereits am sommer 2017 geschlagen ^^ :rofl:
hier schau und staune, was so möglich war seit den ersten ryzen generation !!!
10-09-_2017_14-00-29.jpg
 
Ach die Gen lässt die gut und gern mit Übertaktung wieder hinter sich ^^
 
Ja aber 50ns reicht das den, für die Spielekrone? :unsure:
Das erreiche ich ja schon mit DDR4-2666 CL14 :LOL:
Freue mich trotzdem auf Zen3, also nicht unbedingt auf Vermeer, aber umso mehr auf Milan. Apropos Milan, wo bleibt eigentlich die deutlich wichtigere CPU ?
Desktop schön und gut, aber ich will das große Spielzeug haben !
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh