> > > > AMDs 'Excavator' mit Intels AVX2

AMDs 'Excavator' mit Intels AVX2

DruckenE-Mail
Erstellt am: von

AMD Logo 2013Im GCC-Quellcode sind erstmals Optimierungen mit dem Namen „BDver4“ aufgetaucht. Dies deutet darauf hin, dass AMD an seinem Entwicklungs-Plan für die großen Architekturen festhält und zumindest bis Excavator weiterentwickelt. "BDver1" bezeichnet "Bulldozer", welcher erstmals 2011 eingeführt wurde und "BDver2" ist "Piledriver". Auf dieser Architektur mit leichten Verbesserungen basieren die aktuellen FX-CPUs und "Richland"-APUs. "BDver3" ist "Steamroller", welcher Ende des Jahres von AMD mit den "Kaveri"-APUs vorgestellt wird.

AMD-Roadmap fuer Opteron

Aus den Optimierungen geht hervor, dass AMD mit der Excavator-Architektur Intels Befehlssatz AVX2 unterstützen wird. AVX2 erweitert die 256-Bit-Gleitkomma-Operationen um 256-Bit-Integer-Operationen. Nichts destotrotz wird AVX2 auf der FPU ausgeführt, weswegen AMD diese entweder sehr stark aufbohren muss, wenn nicht sogar neu entwickeln. Die aktuelle FPU kann nämlich nur maximal die im XOP-Befehlssatz verwendeten 128-Bit-Integer-Operationen. Dieser Umstand könnte das Resultat hervorrufen, dass die Performance der FPU wieder deutlich steigt. Viel mehr ist leider noch nicht zu Excavator bekannt. Was aber bekannt ist ist, dass Steamroller ein sehr stark aufgebohrtes Frontend mit zwei Decodern pro Modul bekommen wird.

Social Links

Ihre Bewertung

Ø Bewertungen: 5

Tags

Kommentare (33)

#24
customavatars/avatar84710_1.gif
Registriert seit: 10.02.2008

Admiral
Beiträge: 15048
Es ging da wo du eingestiegen bist, aber um den Verbrauch. :wink:
#25
customavatars/avatar44491_1.gif
Registriert seit: 08.08.2006
Weinböhla (Sachsen)
Moderator
Beiträge: 31921
Zitat Mick_Foley;21274674
So 16 Threads kommen von vier realen Kernen und vier virtuellen? In meiner Rechnung brauche ich dafür acht Module bei AMD. Selbst wenn irgendwann ein Modul vier Threads ausführen könnte bleibt für Steamroller in 28nm immer noch das Problem, das Verbrauchsarm unter einen Headspreader zu Quetschen, so ein Ding würde bei einem Takt über 2 Ghz locker mehr als ein FX 8xxx verbrauchen, von 3,6 Ghz ganz zu schweigen. Dazu kommt noch die Frage wer sowas im Consumer-Markt kaufen soll? Halt ein feuchter Nerd-Traum...


Nicht unbedingt 16 ;)
Aber ich könnte mir vorstellen, das man ne Art vier Thread pro Modul Modell entwickelt bzw. plant. Sprich du nur noch zwei Module brauchst für 8 Threads... Vorteil -> die MT Performance sollte trotzdem vorhanden sein. Vorteil 2 -> man könnte mehr Aufwand und Ressourcen in die SingleThread Performance blasen. Eben abseits des Taktes, der nach oben hin so scheinbar eher schlecht skaliert (siehe FX9 mit 5GHz und unwesentlich mehr Leistung trotz 25% mehr Takt im vollen Turbo)

Würde zumindest auch zu der Spekulation bzw. dem Gerücht passen, das man auf Bald nur noch Modelle für den FM irgendwas Sockel bringen will und AM3(+) langsam ausläuft...
Aus meiner Sicht benötigt AMD auch langsam mal ne PCIe 3.0 fähige Kombo... :wink: halt mal wieder auf neuestem Stand der Schnittstellentechnik -> ob man sowas noch für Bulldozer/Vishera nachzieht!? Denke ich nicht...
Das stelle ich mir eher vor, das man da den FM irgendwas für nutzen werden wird.
#26
customavatars/avatar95983_1.gif
Registriert seit: 30.07.2008
Bayern
Leutnant zur See
Beiträge: 1106
Bin mal gespannt was dabei rauskommt, bei Amd bin ich mitlerweile sehr vorsichtig, an richtig große Leistungssprünge mag ich nicht mehr so recht glauben, wäre schon einmal froh wenn die TDP endlich mal bei 100 W oder darunter ist.
Mehr Leistung wäre auch fein aber an 20% mag ich garnicht glauben.
#27
customavatars/avatar84710_1.gif
Registriert seit: 10.02.2008

Admiral
Beiträge: 15048
Zitat fdsonne;21274871
Nicht unbedingt 16 ;)
Aber ich könnte mir vorstellen, das man ne Art vier Thread pro Modul Modell entwickelt bzw. plant. Sprich du nur noch zwei Module brauchst für 8 Threads... Vorteil -> die MT Performance sollte trotzdem vorhanden sein. Vorteil 2 -> man könnte mehr Aufwand und Ressourcen in die SingleThread Performance blasen. Eben abseits des Taktes, der nach oben hin so scheinbar eher schlecht skaliert (siehe FX9 mit 5GHz und unwesentlich mehr Leistung trotz 25% mehr Takt im vollen Turbo)

Würde zumindest auch zu der Spekulation bzw. dem Gerücht passen, das man auf Bald nur noch Modelle für den FM irgendwas Sockel bringen will und AM3(+) langsam ausläuft...
Aus meiner Sicht benötigt AMD auch langsam mal ne PCIe 3.0 fähige Kombo... :wink: halt mal wieder auf neuestem Stand der Schnittstellentechnik -> ob man sowas noch für Bulldozer/Vishera nachzieht!? Denke ich nicht...
Das stelle ich mir eher vor, das man da den FM irgendwas für nutzen werden wird.


Die 16 Threads kamen ja nicht von mir und auf die bezog ich mich, das dürfte selbst in deinem Ansatz dann Strom fressen. ;) Was den Wechsel auf FMx angeht, gehe ich das fest von aus, guck dir mal die aktuellen AM3+ Boards aus diesem Jahr an und was es für FM2 und Fm2+ gibt. Auch wenn AMD es nicht ausspricht, so scheint AM3+ doch in seinen letzen Zügen zu liegen.
#28
customavatars/avatar44491_1.gif
Registriert seit: 08.08.2006
Weinböhla (Sachsen)
Moderator
Beiträge: 31921
Gibts überhaupt neue Chipsätze? Ich glaube das ist doch noch alles mehr oder weniger aus Phenom II Zeiten, was wir da aktuell haben... Wenn AMD hier nichts neues bringt, scheint da wirklich nicht mehr viel zu kommen.
#29
customavatars/avatar84710_1.gif
Registriert seit: 10.02.2008

Admiral
Beiträge: 15048
Bei AM3+ ist im Endeffekt alles beim alten seit 7xx. Die "neueren" Chipsätze findet man meiner Meinung nach auf FM2 und FM2+. Ich meine mich zu erinnern, das Opteron mal meinte, die könnten die Board-Herstelelr theoretisch auch auf AM3+ Boards verbauen, da sie das nicht tun sehen sie da wohl weniger Markt drinne als im "APU-Sockel"
#30
customavatars/avatar43872_1.gif
Registriert seit: 31.07.2006

Fregattenkapitän
Beiträge: 2857
Bei AM3/+ war die SB850 das letzte große update, alle 9er bauen darauf auf.

Bei Excavator kann man zu 99% mit dem selben Fertigungsprozess rechnen wie beim Kaveri. AMD wird sicherlich zwei Generationen diesen Prozess verwenden und Excavator später im Jahr 2015 oder in 2016 auf einem neuen Prozess schrumpfen auf 14XM (=20nm FinFET) oder 14 FDSOI (=20nm FDSOI), mit starker Tendenz zu FDSOI, weil auch IBM diesen Prozess offenbar nutzen wird für seine CPUs, die ja auch z.T. bei GloFo hergestellt werden. TSMC scheidet hier gänzlich aus, weil AMD Verträge mit GloFo für CPU-Herstellung bis 2024 hat. Bezüglich der Fertgungsprozesse hab ich ja immer noch den starken Verdacht dass es sich immer um denselben Prozess handelt, da so eine Entwicklung 6-8 Jahre dauert und die Kooperationen schon früher festgelegt wurde, also gilt mMn folgendes:

28nm SHP GloFo = IBM 22nm SOI = AMD 22nm SOI, kommen ja auch annähernd gleichzeitig Produkte auf den Markt von IBM und AMD, das ist sicher kein Zufall.
14 FDSOI GloFo/STM = IBM 16nm ETSOI = Marketingnamen für 20nm FDSOI.

Mit 20nm Bulk planar braucht man übrigens weder bei CPUs noch GPUs zu rechnen, da gibts viel zu wenig Effizienzgewinn (ca. 15% mehr Takt/Watt im gereiften Zustand) und die durchschnittlichen Produktionskosten sind ca. 1/3 höher als bei 28nm. FinFETs und FDSOI kosten nur wenig mehr und steigern die Effizienz erheblich.

IBMs 16nm SOI alias offenbar GloFos 20nm SHP Prozesse sind alle gecancelt worden. War offenbar unrentabel, schon der 22nm-Prozess mit PDSOI von IBM sind wohl sehr groß ausgefallen, offenbar nennt GloFo deshalb den Prozess auch 28nm SHP. Es gibt da bei PDSOI bei der Strukturbreite eine Effizienzgrenze bei der das Ganze unrentabler wird als Bulk. Man ist auf die kleinste rentable Größe geschrumpft, weiter gehts dann mit FDSOI und später mit FDSOI und FinFET-Mischprozessen.

Ich glaube übrigens nicht mehr an einen weiteren 32nm Orochi Rev.D AM3+-Ableger. Die werden die Rev.D in Mengen ab jetzt produzieren und auf Halde legen um genug Reserve für die G34-Server zu haben und die C0 auf AM3+ abverkaufen. Ab nächstes Jahr wird man alles auf 28nm SHP umstellen, um genug Kapazität für IBMs Power8 zu haben, der ja offenbar auch bei GloFo mitgefertigt werden soll. Zudem gibt es evtl. noch einen vergrößerten Kaveri.
#31
customavatars/avatar38507_1.gif
Registriert seit: 12.04.2006

Flottillenadmiral
Beiträge: 5834
Zitat Mick_Foley;21274101
Intel hat aber im Moment auch den Meilenweit besseren Fertigungs-Prozess und ein Acht-Moduler bleibt ein feuchter Nerdtraum...

Wer Nerd genug ist, kann sich auch jetzt schon Prozessoren mit 8 Modulen holen. Aber DerGoldeneMesia sprach ja von Threads. Vielleicht bietet Excavator 4 Threads pro Modul. Der Die Shot vor einiger Zeit bietet zumindest die Grundlage für diese Spekulation. Dann würden auch 4 Module für 16 Threads reichen.


Zitat jrs77;21274227
Das AMD immer noch mit 32nm rumhantiert ...

Was hat 32 nm mit dem Thread zu tun? Vielleicht erst mal informieren und weniger rumnölen. Ausserdem werden die reinen nm Werte sowieso mehr und mehr Marketing. Steamroller wird bereits in 28 nm gefertigt. Da wird Excavator natürlich nicht wieder drüber liegen. Die Frage ist maximal, ob es bei 28 nm bleibt. Oder ob man auf 20 nm oder gar 14XM geht.
#32
customavatars/avatar84710_1.gif
Registriert seit: 10.02.2008

Admiral
Beiträge: 15048
Okay ich präzisiere:

[COLOR=#2A2A35]"Intel hat aber im Moment auch den Meilenweit besseren Fertigungs-Prozess und ein Acht-Moduler bleibt Consumer-Markt ein feuchter Nerdtraum..."[/COLOR]

Und an sechszehn Threads glaube ich auch mit einem Modul mit vier Threads pro Modul vorerst nicht am Markt. Kaum Software dafür vorhanden und AMDs Problem ist jetzt schon nicht die Breite...
[COLOR=#2A2A35]
[/COLOR]
#33
customavatars/avatar38507_1.gif
Registriert seit: 12.04.2006

Flottillenadmiral
Beiträge: 5834
Bei Servern ist genügend Bedarf an Threads vorhanden. Das ist nicht das Problem. Aber selbst im Client Bereich macht ein 4T Modul Sinn. Müssen ja nicht 4 Module sein. Aber Kaveri hat scheinbar nur 2 Module mit jeweils 2 Threads. Das wird kaum reichen, um sich CPU-seitig gegen i7 und die grösseren i5 ausreichend gut positionieren zu können. Das würde mit jeweils 4 Threads anders ausschauen. Selbst wenn es dann nicht für die grösseren i7 reicht, man spart Fläche, die man zB in eine üppigere iGPU investieren könnte. Oder man hat die Option auf 3 Module mit insgesamt 12 Threads, um CPU-seitig nachzulegen.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Core i7-6950X im Test: Dicker Motor, alte Karosse

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/6950X/6950X-LOGO

Intels letzter CPU-Launch ist schon eine Weile her - Ende Oktober 2015 testeten wir den Xeon E5-1230v5 auf Skylake-Basis, seitdem war zumindest im Desktop-Bereich nichts neues mehr vom Marktführer zu hören. Am heutigen Tag aktualisiert Intel endlich die High-End-Plattform und bringt mit dem Core... [mehr]

So schnell ist Kaby Lake: Erste eigene Benchmarks zum i7-7500U

Logo von IMAGES/STORIES/REVIEW_TEASER/INTEL_KABY_LAKE

Offiziell vorgestellt hat Intel die 7. Generation der Core-Prozessoren bereits Ende August, doch erst jetzt ist Kaby Lake in Form des ersten Notebooks verfüg- und damit testbar. Dabei handelt es sich um das Medion Akoya S3409 MD60226, in dem ein Core i7-7500U verbaut wird. Während das Notebook... [mehr]

Intel 'Kaby Lake': Die siebte Core-Generation im Detail vorgestellt

Logo von IMAGES/STORIES/LOGOS-2016/INTEL_7TH_CORE_GEN

Im Zuge der kommenden "Kaby Lake"-Plattform, deren breite Verfügbarkeit für das erste Quartal 2017 erwartet wird, nutzt Intel heute die Gelegenheit, die siebte Core-Generation offiziell im Detail vorzustellen und bereits ein paar Prozessoren auf den Markt zu bringen. Wir konnten uns bereits vor... [mehr]

Delid Die Mate im Test

Logo von IMAGES/STORIES/IMAGES/STORIES/GALLERIES/REVIEWS/2016/DDM/DDM

Seit der Ivy-Bridge-Generation verlötet Intel Die und Heatspreader nicht mehr miteinander, was leider in deutlich schlechteren Kern-Temperaturen resultiert. Abhilfe dagegen schafft nur das Delidding (das sogenannte „Köpfen“) der CPU sowie der anschließende Austausch der Wärmeleitpaste durch... [mehr]

Intel Core i7-7700K (Kaby Lake) nun ebenfalls in Benchmark gesichtet

Logo von IMAGES/STORIES/LOGOS-2015/INTEL3

Mittlerweile sind die ersten Benchmarks zum kommenden Intel Core i7-7700K (Kaby Lake) aufgetaucht und ergänzen damit die Werte zum Core i7-7500U. Die Ergebnisse wirken durchaus sehr glaubhaft, denn sie sind in der offiziellen Datenbank von Geekbench 4 zu finden. Getestet wurde der neue Prozessor... [mehr]

AMD nennt architektonische Details zu Zen - Summit Ridge mit Broadwell-E...

Logo von IMAGES/STORIES/LOGOS-2016/AMD-ZEN

Alle Journalisten, die von Intel auf das IDF eingeladen wurden, bekamen von AMD eine Einladung für ein eigenes Event im Hotel gegenüber. Also machte sich der Tross auf den Weg, um in einer Pressekonferenz neue Details über AMDs kommende Zen-Architektur und die Prozessoren zu erfahren. Erstmals... [mehr]