> > > > Offiziell: AMD will Speicher enger an die CPUs/GPUs binden

Offiziell: AMD will Speicher enger an die CPUs/GPUs binden

DruckenE-Mail
Erstellt am: von

AMD Logo 2013AMD wird bei der Entwicklung von (Grafik)-Prozessoren, also CPUs und GPUs, schon länger die Entwicklung von Technologien nachgesagt, die eine engere Anbindung von Speicher an die Rechenkerne erlauben. Zuletzt tauchten erste Gerüchte auf, die vom Einsatz des sogenannten Stacked oder 3D Memory in der kommenden APU-Generation "Carrizo" sprachen. In der nächsten GPU-Generation soll es dementsprechend HBM-Speicher sein, der zusammen mit Hynix SK entwickelt wird. Auch andere Hersteller sind auf ähnliches Wegen unterwegs bzw. haben diesen schon beschritten. Sony verwendete einen solchen Speicher bereits beim Cell-Prozessor der PlayStation 3 und auch Intel stattet die Iris Pro 5200 auf dem Core i7-4750HQ mit EDRAM-Speicher aus. In Zukunft dürfte ein solcher Speicher eine immer größere Rolle spielen. NVIDIA hat bereits angekündigt, dass die für 2016 erwartete "Pascal"-GPU über 3D-Memory verfügen soll.

AMDs Projekt
AMDs Projekt "Fastforward"

Nun ist ein PDF aufgetaucht (Link zum Dokument), dass bereits aus dem Februar 2014 stammt und von AMD veröffentlicht wurde. Große Beachtung hat es bisher offenbar nicht erfahren, denn die in der Präsentation beschriebenen Technologien beschreiben genau das, was in den Gerüchten seit Wochen und Monaten gemutmaßt wird. AMD hat einen gesamteinheitlichen Plan für seine Produkte, von denen Teile bereits heute den Planungen entsprechen. So sieht das Projekt "Fastforward" vor, bei den Prozessoren auf die Heterogeneous System Architecture (HSA) zu setzen - aktuelle APUs machen davon schon Gebrauch und dieser Trend wird sich auf weiter fortsetzen. Um möglichst viele Prozessoren miteinander zu verbinden, sollen schnelle Interconnects entwickelt werden. Diese basieren natürlich auch Glasfaserverbindungen und auch entsprechend schnelle Switches müssen dann zur Verfügung stehen. Dritten und ebenso wichtiges Glied in der Kette ist ein Stacked Memory mit hoher Speicherbandbreite. Diese drei Elemente möchte AMD zukünftig im Prozessor-Package vereinen.

AMDs Projekt
AMDs Projekt "Fastforward"

Noch einen Schritt weiter geht die Implementation des Speichers direkt im Prozessor-Die. Der sogenannte Processor-in-Memory (PIM) könnte Bandbreite und Latenzen noch einmal deutlich verbessern. Allerdings ist diese Technologie weitaus aufwendiger, als der Stacked oder 3D Memory, da mehrere Gigabyte an Arbeitsspeicher eine gehörige Chipfläche einnehmen würden und entsprechend klein gefertigt werden müssten. Bereits heute besteht die Chipfläche eines Prozessors bereits zu einem nicht unerheblichen Anteil aus Cache-Speicher.

AMD ist aber nicht das einzige Unternehmen, dass am Projekt "Fastforward" teilnimmt. Auch Intel, IBM und NVIDIA sind an den Forschungsgeldern beteiligt, die eine Höhe von mehreren Millionen US-Dollar erreichen. Finanziert wird das Projekt aus öffentlichen Geldern der US-Regierung.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (55)

#46
customavatars/avatar89889_1.gif
Registriert seit: 19.04.2008
PorscheTown
Flottillenadmiral
Beiträge: 5164
@jdl
Ich weiß jetzt nicht ob du den Thread hier schon kennst, aber ein Blick sollte es Wert sein: Alles rund um Compiler und Softwareentwicklung

Zum Rest mag ich mich nicht äußern, wenn das deine Erfahrungswerte sind, dann soll es so sein. ;)
#47
customavatars/avatar84710_1.gif
Registriert seit: 10.02.2008

Admiral
Beiträge: 15048
Mr Dude beglückt mal wieder die Welt mit seinem Fachwissen... Ich glaube irgendwie jdl hat da praxisnähere Erfahrung abseits des Spielens mit Encodern... :vrizz:
#48
Registriert seit: 06.05.2010

Stabsgefreiter
Beiträge: 371
Das glaub ich sogar. Allerdings outet sich dieser mit solchen Aussagen:
Zitat jdl
Das kann für die letzten 10 Jahre getrost ins Bereich der Legenden verbannen.

Dumm nur das Intel 2009 überführt wurde. Das ist nun aber gerade 5 Jahre her.
Es wurde vom FTC gefordert:
Zitat
...publish clearly that its compiler discriminates against non-Intel processors (such as AMD's designs), not fully utilizing their features and producing inferior code.

Intel hat nun eine Klausel, dass nur intel Prozessoren optimiert werden und eventuell auch andere:
https://software.intel.com/en-us/articles/optimization-notice
Und in der Praxis ist nunmal der intelcompiler der schnellste, auch wenn dieser auf AMD Prozessoren nicht soviel zulegt, wie er könnte, ist es trotzdem schneller. Ganz so schlimm wie damals als intelprozessoren um in einigen Benchmarkprogrammen 69% zulegten, wenn sie mit dem intelcompiler statt mit dem gcc compiler kompiliert wurden und AMD nur um 20% zulegte ist es nicht mehr. Aber das heute ein intelprozessor gleich zulegt wie ein AMD Prozessor, wenn der intel compiler statt dem gcc Compiler zum Einsatz kommt, wage ich doch zu bezweifeln. Kann man ja mal testen irgendeinen Opensource Benchmark mal mit gcc auf intel und Amd laufen lassen und dann mit dem intel Compiler mal sehen um wieviel intel und AMD zulegt.
#49
customavatars/avatar203609_1.gif
Registriert seit: 25.02.2014

Banned
Beiträge: 328
Dann mach das doch mal :)

Verstehe trotzdem nicht so recht was das alles mit dem Thema hier zu tun hat...
#50
customavatars/avatar84710_1.gif
Registriert seit: 10.02.2008

Admiral
Beiträge: 15048
Zitat neuli;22459872
Aber das heute ein intelprozessor gleich zulegt wie ein AMD Prozessor, wenn der intel compiler statt dem gcc Compiler zum Einsatz kommt, wage ich doch zu bezweifeln.


Würde mich persönlich auch wundern, ich würde meiner Konkurrenz auch nicht die selbe Sorgfalt bei der Optimierung entgegenbringen. Für mich ist entscheidend, dass AMD selbst keine Alternative bietet, die was taugt.

[COLOR="red"]- - - Updated - - -[/COLOR]

Zitat LDNVThe2Brain;22459885
Dann mach das doch mal :)

Verstehe trotzdem nicht so recht was das alles mit dem Thema hier zu tun hat...


Gar nichts, aber schon von Post 1 an... :D
#51
Registriert seit: 08.02.2011

Bootsmann
Beiträge: 712
Zitat Mick_Foley;22460193
Würde mich persönlich auch wundern, ich würde meiner Konkurrenz auch nicht die selbe Sorgfalt bei der Optimierung entgegenbringen.


Erstens das. Wie soll Intel aber auch wissen, welcher Code bei AMD am schnellsten läuft?
Zweitens: Warum sollte die gleiche Anwendung auf UNTERSCHIEDLICHEN Prozessoren auch gleich skalieren, nur weil man einen anderen Compiler nutzt?
#52
customavatars/avatar84710_1.gif
Registriert seit: 10.02.2008

Admiral
Beiträge: 15048
Zitat DSmon;22460220
Erstens das. Wie soll Intel aber auch wissen, welcher Code bei AMD am schnellsten läuft?
Zweitens: Warum sollte die gleiche Anwendung auf UNTERSCHIEDLICHEN Prozessoren auch gleich skalieren, nur weil man einen anderen Compiler nutzt?


Also die Arbeit das herauszufinden und anzupassen, kann Intel sich ruhig machen - kostet doch nichts! Alles andere wäre doch illegale Wettbewerbsverzerrung... :asthanos:
#53
Registriert seit: 09.04.2011

Leutnant zur See
Beiträge: 1107
Wir betreiben die System unter Linux, unter Windows mag es wieder anders aussehen.
Zitat neuli;22459872

Und in der Praxis ist nunmal der intelcompiler der schnellste,

Nein, das ist nicht automatisch der Fall, selbst auf Intel Hardware liefert der PGI Compiler des öfteren schnelleren Code als der Intel Compiler. Es hängt eindeutig vom Problem ab. Der GCC liefert ordentlichen Code und ist in den letzten Jahren besser geworden, aber bei den meisten Benchmarks liefert er schlechteren Code als die anderen beiden Compiler ab. Der Intel Compiler optimiert auch für AMD und hat dafür auch extra Compilerflags! Intel treibt da seit Jahren in anderer Form seine Spielchen. Dinge die auf AMD Hardware nicht funktionieren:
[LIST]
[*]vtune amplifier
[*]Thread Pinning (kostet 20-30% Performance bei HPC Code, man kann es mit Tricks im Code trotzdem aktivieren)
[*]MPI Analyzer
[*]FMA und VXA Code Erzeugung für AMD ist instabil, aber das spielt in der Praxis des HPCs ohnehin keine Rolle mehr.
[/LIST]

Generell ist der Autoparallelisierer sowohl von Intel wie auch PGI totaler Schrott, da ist man schneller und erfolgreicher wenn man mit OpenMP selbst Hand anlegt. Bei beiden Compilern werden nur Trivialschleifen parallelisiert und die kann man sehr schnell von Hand parallelisieren und es lohnt sich faktisch nie diese inneren Schleifen zu parallelisieren.
#54
Registriert seit: 10.03.2005

Oberbootsmann
Beiträge: 847
Zitat Mick_Foley;22459586
Mr Dude beglückt mal wieder die Welt mit seinem Fachwissen... Ich glaube irgendwie jdl hat da praxisnähere Erfahrung abseits des Spielens mit Encodern... :vrizz:


selbes gilt für dich und dein "Fachwissen"
#55
customavatars/avatar108709_1.gif
Registriert seit: 17.02.2009
Sachsen, Brandis b. Leipzig
Admiral
Beiträge: 16821
Leute... immer dasselbe. :fresse:
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Core i7-6950X im Test: Dicker Motor, alte Karosse

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/6950X/6950X-LOGO

Intels letzter CPU-Launch ist schon eine Weile her - Ende Oktober 2015 testeten wir den Xeon E5-1230v5 auf Skylake-Basis, seitdem war zumindest im Desktop-Bereich nichts neues mehr vom Marktführer zu hören. Am heutigen Tag aktualisiert Intel endlich die High-End-Plattform und bringt mit dem Core... [mehr]

So schnell ist Kaby Lake: Erste eigene Benchmarks zum i7-7500U

Logo von IMAGES/STORIES/REVIEW_TEASER/INTEL_KABY_LAKE

Offiziell vorgestellt hat Intel die 7. Generation der Core-Prozessoren bereits Ende August, doch erst jetzt ist Kaby Lake in Form des ersten Notebooks verfüg- und damit testbar. Dabei handelt es sich um das Medion Akoya S3409 MD60226, in dem ein Core i7-7500U verbaut wird. Während das Notebook... [mehr]

Intel 'Kaby Lake': Die siebte Core-Generation im Detail vorgestellt

Logo von IMAGES/STORIES/LOGOS-2016/INTEL_7TH_CORE_GEN

Im Zuge der kommenden "Kaby Lake"-Plattform, deren breite Verfügbarkeit für das erste Quartal 2017 erwartet wird, nutzt Intel heute die Gelegenheit, die siebte Core-Generation offiziell im Detail vorzustellen und bereits ein paar Prozessoren auf den Markt zu bringen. Wir konnten uns bereits vor... [mehr]

Delid Die Mate im Test

Logo von IMAGES/STORIES/IMAGES/STORIES/GALLERIES/REVIEWS/2016/DDM/DDM

Seit der Ivy-Bridge-Generation verlötet Intel Die und Heatspreader nicht mehr miteinander, was leider in deutlich schlechteren Kern-Temperaturen resultiert. Abhilfe dagegen schafft nur das Delidding (das sogenannte „Köpfen“) der CPU sowie der anschließende Austausch der Wärmeleitpaste durch... [mehr]

Intel Core i7-7700K (Kaby Lake) nun ebenfalls in Benchmark gesichtet

Logo von IMAGES/STORIES/LOGOS-2015/INTEL3

Mittlerweile sind die ersten Benchmarks zum kommenden Intel Core i7-7700K (Kaby Lake) aufgetaucht und ergänzen damit die Werte zum Core i7-7500U. Die Ergebnisse wirken durchaus sehr glaubhaft, denn sie sind in der offiziellen Datenbank von Geekbench 4 zu finden. Getestet wurde der neue Prozessor... [mehr]

AMD nennt architektonische Details zu Zen - Summit Ridge mit Broadwell-E...

Logo von IMAGES/STORIES/LOGOS-2016/AMD-ZEN

Alle Journalisten, die von Intel auf das IDF eingeladen wurden, bekamen von AMD eine Einladung für ein eigenes Event im Hotel gegenüber. Also machte sich der Tross auf den Weg, um in einer Pressekonferenz neue Details über AMDs kommende Zen-Architektur und die Prozessoren zu erfahren. Erstmals... [mehr]