Aktuelles

Preise zu EPYC-Prozessoren mit 3D-V-Cache bekannt

Thread Starter
Mitglied seit
06.03.2017
Beiträge
64.957
milan-x.jpg
Bereits mehrfach hat AMD über die EPYC-Prozessoren mit 3D V-Cache gesprochen, was aber noch fehlt ist eine Vorstellung der konkreten Produkte. Bisher von AMD bestätigt wurden nur bis zu 64 Kerne und das Vorhandensein von zusätzlichen 768 MB an L3-Cache per 3D V-Cache. Die ersten Prozessoren werden bereits an SIs, OEMs und Hyperscaler ausgeliefert. Aus solchen Quellen stammten dann sicherlich auch die ersten Prozessoren, die getestet wurden.
... weiterlesen
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.

Crusha

Enthusiast
Mitglied seit
11.10.2009
Beiträge
1.246
Uff ist der EPYC 7343 für nen Consumer teuer :fresse2:
 

Zyxx

Urgestein
Mitglied seit
13.07.2010
Beiträge
2.269
Ich stecke jetzt in den Daten der vorherigen Epycs nicht drin.
Kann man hier sehen das im Vergleich zu den Vorgängern sich ebenfalls Grundtakt und Turbo nach unten verändert haben wie beim 5800x 3D?
Gibt es andere Änderungen die darauf hindeuten das der 3D Cache ein Problem darstellt?
 

sch4kal

Enthusiast
Mitglied seit
18.07.2016
Beiträge
3.230
Ich stecke jetzt in den Daten der vorherigen Epycs nicht drin.
Kann man hier sehen das im Vergleich zu den Vorgängern sich ebenfalls Grundtakt und Turbo nach unten verändert haben wie beim 5800x 3D?
Gibt es andere Änderungen die darauf hindeuten das der 3D Cache ein Problem darstellt?
Du kannst doch die Tabelle anschauen ?! Modelle mit Zusatzcache takten niedriger und sind z.T. in höheren TDP einklassiert worden.
 

Zyxx

Urgestein
Mitglied seit
13.07.2010
Beiträge
2.269

The Game

Enthusiast
Mitglied seit
30.09.2007
Beiträge
1.118
Warum ist eigentlich der 7373X teuerer als der 7473X?
 

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.344
Uff ist der EPYC 7343 für nen Consumer teuer :fresse2:
Dies sind Server CPU und die sind nicht für Consumer bestimmt, sondern für Enterprise Kunden, denn die wenigsten Consumer brauchen und kaufen solche CPUs.
Kann man hier sehen das im Vergleich zu den Vorgängern sich ebenfalls Grundtakt und Turbo nach unten verändert haben wie beim 5800x 3D?
SRAM braucht auch Strom und bei so vielen Kernen bestimmt die TDP den Takt, so dass die Kerne eben einen geringeren Takt haben müssen, um die Leistungsaufnahme durch den zusätzlichen Cache zu kompensieren.
 

Zyxx

Urgestein
Mitglied seit
13.07.2010
Beiträge
2.269
SRAM braucht auch Strom und bei so vielen Kernen bestimmt die TDP den Takt, so dass die Kerne eben einen geringeren Takt haben müssen, um die Leistungsaufnahme durch den zusätzlichen Cache zu kompensieren.

Mir ging es um die Verhältnismäßigkeit der Taktänderungen aufgrund des Mehr an Verbrauch / Wärme. Aktuell gibt es für diese Art des Packaging des SRAM kaum belastbare Daten was den Zusatzverbrauch angeht. Das der SRAM nicht mit Luft betrieben wird, dürfte uns beiden klar sein ;)
In einer idealen Welt hätte TSMC die Fertigung der zugrunde liegenden Dies so weit verbessert, das Binning wäre so viel besser geworden, das "so krasse" Einschnitte im Takt wie beim 5800x zu 5800x 3D nicht nötig sein müssten.
Natürlich taktet der höher als die Epycs, weswegen im Endeffekt nur abwarten übrig bleibt.

Ich vermute fast, das AMD hier nicht nur aufgrund des aufgebrachten Stapelspeichers etwas auf die Bremse tritt, sondern auch, da die "alten" Boards unterstützt werden.
Andererseits scheint laut der Tabelle des Artikels hier die Taktbremse besonders bei den höher taktenden Modellen zu greifen, was dann wieder für eine Begrenzung der Abwärme und Leistungsaufnahme spricht. Etwas das bei niedrigen Taktraten weniger ein Problem ist.

Wie ich schon schrieb, abwarten.
Die großen Enthüllungen konnte ich jetzt nicht aus der Tabelle des Artikels ableiten, aber immerhin läßt es sich gut knobeln.
 

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.344
Mir ging es um die Verhältnismäßigkeit der Taktänderungen aufgrund des Mehr an Verbrauch / Wärme. Aktuell gibt es für diese Art des Packaging des SRAM kaum belastbare Daten was den Zusatzverbrauch angeht.
Das ist ja auch das erste mal, dass sowas gemacht wird. Die beiden Desktop Broadwell CPUs hatten zwar auch ein eDRAM, welches auch als L4 Cache für die CPU dient, aber da gab es halt keinen Vergleich zu Modellen ohne und es war DRAM und kein SRAM.
In einer idealen Welt hätte TSMC die Fertigung der zugrunde liegenden Dies so weit verbessert, das Binning wäre so viel besser geworden, das "so krasse" Einschnitte im Takt wie beim 5800x zu 5800x 3D nicht nötig sein müssten.
Die Welt ist aber nicht ideal und die Verbesserungen bei der Fertigung fallen nicht vom Himmel und sind auch nur schwer planbar. TSMC dürfte sich auch eher auf die neueren Fertigungsprozesse als die Optimierung des 7nm Prozesses konzentrieren. Fakt ist jedenfalls, dass die Taktraten gesenkt wurden und damit die Verbesserung des 7nm Prozesses offenbar die zusätzliche Leistungsaufnahme nicht kompensieren kann.
Ich vermute fast, das AMD hier nicht nur aufgrund des aufgebrachten Stapelspeichers etwas auf die Bremse tritt, sondern auch, da die "alten" Boards unterstützt werden.
Wieso? Für die Boards ist nur die Spannungsversorgung relevant und wenn sich die Spannungen und die gesamte Leistungsaufnahme nicht ändert, dann kann es dem Board egal sein ob die CPU die Leistung in den Kernen oder im zusätzlichen 3D V-Cache verbrät.
Andererseits scheint laut der Tabelle des Artikels hier die Taktbremse besonders bei den höher taktenden Modellen zu greifen, was dann wieder für eine Begrenzung der Abwärme und Leistungsaufnahme spricht.
Das ist doch kein Wunder, denn die haben ja alle 8 Chiplets und wenn jedes Chiplet mit 3D V-NAND nun sagen wir 8 Watt mehr braucht, zusammen also 64 W und ein Kern je 150MHz 1W einsparen kann, dann wären bei einem 64 Kerner diese 150MHz genug, bei einem 32 Kerner müssten die Kerne halt schon um 300MHz geringer takten um insgesamt ebenfalls 64 Watt einzusparen und bei einem 16 Kerner sind es dann halt 600MHz. Aber dies ist nur ein einfaches Beispiel, denn natürlich verhält sich die Leistungsaufnahme nicht linear zum Takt, wie man an diesem alten Test eines 3700X schön sehen kann:

Zen2_Watt_Performance.png


Natürlich dürfte die Kurve für die Zen3 EPYC anderes aussehen, einen Teil der Leistungsaufnahme macht ja auch das I/O Die aus und die Fertigung ist inzwischen weiterentwickelt worden, aber sie zeigt schön das Prinzip wie sich die Effizienz mit dem Betriebspunkt (also vor allem dem Takt) eben ändert und nicht linear verhält. Dies ändert aber nicht daran das der Mehrverbrauch durch die zusätzlichen SRAMs bei allem Modellen gleich ist, die haben ja alle 768MB L3 Cache und wenn man die Kompensation für diesen Mehrverbrauch auf mehr Kerne aufteilen kann, dann muss jeder von ihnen seinen Takt halt weniger stark senken.
 

fdsonne

Moderator
Hardwareluxx Team
Mitglied seit
08.08.2006
Beiträge
36.221
Ort
SN
Aber dies ist nur ein einfaches Beispiel, denn natürlich verhält sich die Leistungsaufnahme nicht linear zum Takt, wie man an diesem alten Test eines 3700X schön sehen kann:
Das ist falsch. Die Leistungsaufnahme verhält sich sehr wohl linear zum Takt. Und nicht nur das, der Takt geht sogar relativ klar 1:1 in den Verbrauch ein.
Vergleiche mal lieber nicht Endprodukt-Skalierungsbalken in einer theoretische Betrachtung ;) Was du wohl viel eher meinst ist der Umstand, dass A) Spannung notwendig ist und dazu unten ein Punkt kommt, wo man nicht mit weniger Spannung runter skalieren kann und oben ein Punkt kommt, wo man auch mit immer mehr Spannung nicht mehr sonderlich viel Taktzuwachs erzielt. Und B) dass eben diese Spannung im Quadrat in den Verbrauch eingeht. Je nachdem wo man sich zwischen beiden Punkten bewegt.

Man sieht an deinem Bild sehr schön den immer spitzer werdenden Anstieg im Verbrauch bei immer weniger Taktzuwachs. -> das liegt an der Spannung die oben immer weniger Takt zulässt. Und unten flacht die Kurve immer weiter ab, was ebenso an der Spannung liegt.
In einer idealen Welt hätte TSMC die Fertigung der zugrunde liegenden Dies so weit verbessert, das Binning wäre so viel besser geworden, das "so krasse" Einschnitte im Takt wie beim 5800x zu 5800x 3D nicht nötig sein müssten.
Natürlich taktet der höher als die Epycs, weswegen im Endeffekt nur abwarten übrig bleibt.
Naja, eigentlich nicht. Es findet doch hier gar keine Fertigungsprozessanpassung statt.
AMD nimmt 1:1 die gleichen Dies aus der Fertigung und packt in zusätzlichen Schritten da oben einen Cache quasi Huckepack drauf. Das ist nichts anderes wie bisher in der Basis - nur dass eben die Zusatzschritte oben drauf kommen. Logisch, dass man da über andere Mittel und Wege die Energieaufnahme irgendwie im Rahmen halten muss...

Btw. finde ich die Einschnitte gar nicht so krass. Keine Ahnung ob man dem bewusst so bisschen aus dem Weg geht oder ob es keine guten Vergleichspaarungen gibt - aber bestenfalls taugt ja noch der Vergleich der großen 64C. Beide 280W, beide 64C. Und da ist der Taktverlust mit grob 10% im Base und gleich bei Max. Boost jetzt eigentlich überschaubar gering.
Bei den anderen passt das irgendwie alles nicht im Vergleich, da nicht klar ist, ob AMD die hohe TDP wirklich braucht oder nur aufgrund der wenigen Modelle im Angebot drauf schreibt. Es gibt auch nen Epyc 75F3 mit 280W bei 32C. Der nur unwesentlich höher taktet und das bei weit mehr als 225W eben auch nicht im Verhältnis steht.

Auch passt der Vergleich zu den vier aktiven CCD 128MB L3 Cache "alt" Modellen nicht. Denn die nutzen ja gerade den Vorteil des kleineren Ausbaus. Der 768MB L3 Cache Epyc muss hier alle acht CCDs aktiv haben.
EPYC 7443 udn EPYC 7343 sind also kein sinnvoller Vergleich. Den 16C mit 256MB gibts bspw. nur als Epyc 73F3 für 3500$ Liste, was auch mal schlapp doppelt so teuer als in der Tabelle ist.
Das ist ja auch das erste mal, dass sowas gemacht wird. Die beiden Desktop Broadwell CPUs hatten zwar auch ein eDRAM, welches auch als L4 Cache für die CPU dient, aber da gab es halt keinen Vergleich zu Modellen ohne und es war DRAM und kein SRAM.
Auch das ist falsch. Mensch Holt, was denn los heute?
Broadwell gabs sehr wohl auch ohne L4 Cache... Die wurden reihenweise in Notebooks verbaut - und kannste natürlich klar auch vergleichen.

Ich halte den Broadwell aber generell für einen ungünstigen Vergleichspartner - denn der L4 Cache beim Broadwell war weniger echter L4 Cache als weiterer zusätzlicher zwischen Speicher, den man idealerweise zusätzlich ansprechen MUSS, damit das auch nennenswert Punkte bringt. Denn jedes Datenpaket was aus dem L4 Cache irgendwo hin ging, musste IMMER in den L3 Cache geschrieben werden. Auch wenn von L4 in RAM ausgelagert wurde!
Das ist ein völlig anderes Prinzip als AMD hier angeht und skaliert auch völlig anders. AMD platziert hier sehr viel Cache zwischen Core(s) und RAM, weil die IF ultra lahm ist. Viel Cache = weniger Zugriffe über die IF, weil mehr Cache Hits. Beim Broadwell war der L4 Cache keine zusätzliche Stufe zwischen RAM und L3 Cache, sondern parallel zum RAM angebunden. Der GPU brachte das somit einer Bandbreite addiert von RAM und L4 Cache in Richtung Einsteiger dGPU Niveau. Und die IGP war damals auch bei Intel drastisch Bandbreiten limitiert. Manche Tools profitierten davon auch zusätzlich. Aber hier mit dem Epyc/Ryzen bzw. bei Intel auch ab Skylake mit L4 Cache ist das eine weitere echte Cachestufe zwischen RAM und L3. Bei der XBox damals hat Intel das sogar noch etwas mehr auf die Spitze getrieben, weil die Entwickler quasi den Cache einbinden mussten, damit der Spaß überhaupt skaliert. Beim PC/Notebook ging das natürlich genau so - nur hat sich keiner für Marktnischen den Aufwand gemacht. Übrig bliebt idR nur die Funktionen der GPU Treiber für die bessere GPU Skalierung.
 

Zyxx

Urgestein
Mitglied seit
13.07.2010
Beiträge
2.269
Daher schrieb ich ja, das es in einer idealen Welt so wäre.
AMD und TSMC haben garantiert versucht in den letzten Jahren zusammen den Ausschuss zu minimieren.
Es gab ein neues Stepping, eventuell gabs für die 3D Variante wieder kleine Anpassungen. Die wirken sich in teilen auch auf die Güte der Chiplets aus.

Mal abwarten was die Benchmarks zeigen werden, es gibt so viele Fragen auf meiner Seite. (Natürlich auch ob OC zurück kommt oder fern bleibt / bleiben muss).
Ich freue mich jedenfalls auf die nächste Zeit :)
 

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.344
Das ist falsch. Die Leistungsaufnahme verhält sich sehr wohl linear zum Takt. Und nicht nur das, der Takt geht sogar relativ klar 1:1 in den Verbrauch ein.
So ein Unsinn, schau nur auf die Kurve des 3700X, der braucht 35W bei 1,1GHz und 40W bei 2,1GHz, hier kostet ein GHz mehr Takt grade 5W. Bei 45W kommt er auf 2,8GHz und um hier 1GHz draufzulegen und auf 3,8GHz zu kommen, muss man schon 20W drauflegen und nicht nur 5W, also schon 4 mal so viel. In welches Welt ist das linear? Oder man schaut sich einen 12900 an, der mit 65W PL1 in Dauerlast läuft und vergleich ihn mit einem 12900K den dem Mainboard dauerhaft viermal so viel Leistung gönnt, aber damit wird er bei weitem nicht viermal so hoch takten, nicht mal doppelt so hoch.
Auch das ist falsch. Mensch Holt, was denn los heute?
Broadwell gabs sehr wohl auch ohne L4 Cache... Die wurden reihenweise in Notebooks verbaut
Boardwell ohne L4 Cache gab es nicht im Desktop und darauf bezog sich das " aber da gab es halt keinen Vergleich zu Modellen ohne", denn ein Vergleich zu den Notebook (oder HEDT oder Xeon mit Broadwell Kernen) CPU hingt eben gewaltig. Die Frage was heute los ist, sollte nicht ich mir stellen!
 

fdsonne

Moderator
Hardwareluxx Team
Mitglied seit
08.08.2006
Beiträge
36.221
Ort
SN
So ein Unsinn, schau nur auf die Kurve des 3700X, der braucht 35W bei 1,1GHz und 40W bei 2,1GHz, hier kostet ein GHz mehr Takt grade 5W.
Ja das steht da - was da aber nicht steht ist bei welcher Spannung der Takt erreicht wurde. Und genau das ist der springende Punkt. Takt geht 1:1 in den Verbrauch. Spannung zum Quadrat. Takt ohne Spannung geht aber nicht. Übrigens - das Bild was du dir raus pickst geht auch um was komplett anderes. Nämlich um den Vergleich von Powerlimit vs. UV. Technisch auch ein eher ungeeignetes Beispiel für deine Behauptung. Da im Powerlimit noch andere Regelmechanismen greifen um die Effizienz zu erhöhen. Um das kurz auszuführen - wenn ich UV auf meinem Ryzen betreibe, dann habe ich zwar Takt, aber der ist mehr oder weniger nichts sagend, weil die abgelieferte Leistung nicht der anliegenden Taktrate entspricht. Beim Powerlimit hab ich das so nicht. Da regelt der Takt und auch die Spannung sauber(er) und anliegender Takt passt zur abgelieferten Leistung. Inkl. der dann wieder auch passenden Verbrauchsangaben. Bei Zen2 ist/war das sogar schlimmer noch als bei Zen3 jetzt. Stichwort erreichen der Boosttaktraten seinerzeit.

Die IF braucht btw. auch schon allein ca. 15W oder sowas im Dreh, skaliert mit eigener Taktdomain (und auch anderer Spannung? Keine Ahnung). Bei mir sinds bisschen mehr, weil Dual CCD Ryzen. Der Rest bleibt für die Cores. Und da sieht man natürlich sehr schön, dass diese mehr oder weniger goldene Regel auch auf Zen2 komplett anwendbar ist. Ganz unten und ganz oben werden die Sprünge immer kleiner bzw. größer, weil ohne Spannung und Takt läuft der Laden nicht und oben brauchts immer mehr Spannung damit bisschen mehr Takt bei rum kommt. Deswegen schaut die Kurve auch so aus, wie sie ausschaut. Was auch immer du daran anzweifelst, erschließt sich mir ehrlich gesagt nicht...
... denn ein Vergleich zu den Notebook (oder HEDT oder Xeon mit Broadwell Kernen) CPU hingt eben gewaltig.
Nö, der ist exakt das, was den Unterschied aufzeigen würde, wenn du unbedingt Broadwell vergleichen willst. Und entkräftet nebenbei dazu deine Behauptung es gäbe keinen Vergleich beim Broadwell ohne L4 Cache - denn den gab es zweifelsfrei und nachweislich. Nur willst du ihn einfach nicht akzeptieren. Die beiden gesockelten Modelle im "Desktop" sind ja auch nur 1:1 umgelabelte Mobile Versionen. Stichwort Broadwell-H. Die anderen sind nur fest verlötet am Markt - warum also nicht objektiv vergleichen wenns ums vergleichen geht? Geht es doch? Oder doch vielleicht wieder mal nicht?
Die Frage was heute los ist, sollte nicht ich mir stellen!
Hat doch auch keiner behauptet, die Frage haben ICH dir gestellt... Weil es eigentlich untypisch für dich ist, einfach Behauptungen in den Raum zu stellen, die so gar nicht belastbar sind wie Takt würde sich nicht linear zum Verbrauch verhalten und den Käse mit dem Boardwell. Du behauptest zwar immer viel theoretisches Zeug, aber idR deckt sich das wenigstens noch halbwegs mit der Praxis. Hier aber ist das nicht der Fall - deswegen die Frage, was los ist ;)

Aber Wurst egal, eigentlich ist hier ja Epyc Thema... :wink:
 

Holt

Legende
Mitglied seit
05.07.2010
Beiträge
24.344
Takt geht 1:1 in den Verbrauch. Spannung zum Quadrat. Takt ohne Spannung geht aber nicht.
Eben und da man ohne eine bestimmte Spannung den Takt eben nicht erreichen kann, geht der Takt eben nicht 1:1 in den Verbrauch, da man eben nicht bei gleicher Spannung den Takt mal eben verdoppeln kann und die Spannungen sind eben auf den jeweiligen Takt abgestimmt.
Übrigens - das Bild was du dir raus pickst geht auch um was komplett anderes. Nämlich um den Vergleich von Powerlimit vs. UV.
Das ist zusätzlich auch noch drauf, aber es geht nicht nur darum, sondern eben in erste Linie darum zu sehen wie Takt und Leistungsaufnahme bei CB MT Last sind.
Nö, der ist exakt das, was den Unterschied aufzeigen würde,
Nein, der Unterschied zwischen komplett anderen CPU, nämlich mobilen und Desktop würde den Vergleich komplett verfälschen. Es wäre kein Vergleich wie beim 5800X und 5800X3D oder den EYPC Modellen mit und ohne 3D V-Cache.
Die beiden gesockelten Modelle im "Desktop" sind ja auch nur 1:1 umgelabelte Mobile Versionen. Stichwort Broadwell-H.
Ja, haben die eben auch weniger Takt und weniger TDP, von daher würde der Vergleich genauso hingen wie der Vergleich mit den HEDT oder Xeon Modellen.
Weil es eigentlich untypisch für dich ist, einfach Behauptungen in den Raum zu stellen, die so gar nicht belastbar sind wie Takt würde sich nicht linear zum Verbrauch verhalten
Dabei hast du doch selbst geschrieben, dass man für einen höheren Takt auch eine höhere Spannung braucht und diese dann im Quadrat eingeht, wobei ich mal bezweifeln würde, dass es die mathematisch exakt wäre, aber so grob dürfte es hinkommen und damit ist der Takt eben nicht linear zum Vergleich, da mit der Taktänderung eben immer auch Spannungsänderungen verbunden sind. Es wäre nur rein theoretisch anderes, wenn man bei gleicher Spannung auch deutlich unterschiedliche Taktraten erzielen könnte, was man aber nicht kann, außer wenn man eben die Spannung für geringere Taktraten unnötig hoch ansetzen würde, was man aber in der Praxis eben nicht macht. Für reale CPUs und erst recht solche wie die EYPC wo man nicht alles möglich im BIOS verstellen kann, stimmt die Aussage dass "Takt würde sich nicht linear zum Verbrauch verhalten" also sehr wohl und die Kurve des 3700X zeigt dies auch deutlich.
Du behauptest zwar immer viel theoretisches Zeug, aber idR deckt sich das wenigstens noch halbwegs mit der Praxis.
Wer behauptet denn jetzt theoretisches Zeug? Welche CPU hat in der Praxis denn einen Verbrauch der sich linear zum Takt verhält?
 
Oben Unten