NEWS

AMD zeigt erstmals Leistungsdaten zum Naples-Server-Prozessor

Portrait des Authors


AMD zeigt erstmals Leistungsdaten zum Naples-Server-Prozessor
35

AMD nutzte den RYZEN Tech Day auch, um weitere Details zu Naples, der Server-Variante auf Basis der Zen-Architektur zu verraten. Bereits im vergangenen Sommer begann AMD damit, die ersten Details dazu zu verraten. Bisher war aber wenig substantielles dabei, wenn man von der Angabe von 32 Kernen und 64 Threads pro Prozessor einmal absieht. Mit eben dieser Anzahl an Kernen sowie der Tatsache, dass in einem Dual-Socket-System 64 Kerne und 128 Threads zur Verfügung stehen, sieht sich AMD wieder gut aufgestellt, um im Server-Segment erneut anzugreifen.

Gefertigt wird der Naples-Prozessor natürlich ebenfalls in 14 nm, wobei an solche Prozessoren andere Anforderungen gestellt werden, was die Zuverlässigkeit betrifft, was sich unter anderem im Takt wiederspiegeln wird. Über konkrete Taktraten spricht AMD aber noch nicht. Stattdessen zeichnet sich ab, dass ein Naples-Prozessor aus vier Zeppelin-Dies zusammengesetzt wird. Diese Zeppelin-Dies bestehen sozusagen aus einem RYZEN-Achtkern-Prozessor, sind per Multi Chip Package (MCP) miteinander verbunden. Mit dem MCP hat AMD bereits in der Vergangenheit Erfahrungen gemacht. Nimmt man nun die gleichen Daten für die Größe und Komplexität eines Zeppelin-Dies im Vergleich zum einem RYZEN-Achtkern-Prozessor an, so landen wir hier bei 19,2 Milliarden Transistoren und einer Chipgröße von rund 800 mm.

Nun ist auch klar, dass ein einzelner Naples-Prozessor über acht Speichercontroller verfügt. Die 2x 4-Channel können mit jeweils 8 DIMMs entsprechend mit Speicher bestückt werden. In einem Dual-Socket-System stehen demzufolge 32 DIMMs zur Verfügung, die eine theoretische Bestückung von 4 TB an Speicher ermöglichen. Dies ist bisher in einem Dual-Socket-Server nicht machbar und stellt daher ein Alleinstellungsmerkmal dar. 128 PCI-Express-3.0-Lanes stehen ebenfalls noch zur Verfügung, was im Vergleich zur aktuellen Xeon-Generation ebenfalls ein deutlicher Vorteil sein dürfte, denn hier werden weitaus weniger Lanes angeboten. Im Falle des Intel Xeon E7-8894 v4 sind es nur 40 und selbst die Nachfolge-Generation soll auf nur 48 PCI-Express-Lanes kommen, die direkt über den Prozessor zur Verfügung gestellt werden können. Die 128 PCI-Express-Lanes eines Naples-Prozessors sind allesamt Multiplexed und können zur direkten Anbindung von SATA-Laufwerken oder Ethernet-Verbindungen verwendet werden. Ein Chipsatz ist mit den Naples-Prozessoren nicht mehr notwendig.

In einem Dual-Socket-System stehen allerdings nicht mehr die vollen 128 PCI-Express-Lanes zur Verfügung, sondern pro Prozessor nur noch 64. Jeweils 64 Lanes werden verwendet, um per Infinity Fabric die beiden Prozessoren miteinander zu verbinden. Die dazugehörige Bandbreite wird sich auf etwa 64 GB/s belaufen. Intels QPI kommt in der aktuellen Ausführung auf 25,6 GB/s (3,2 GHz × 2 Bits/Hz (Double Data Rate) × 16(20) (Data Bits/QPI Link Width) × 2 (bidirektionales Senden und Empfangen möglich) / 8 (Bits/Byte) = 25.6 GB/s). Welchen Einfluss ein schneller Interconnect hat, werden wir später noch sehen. Auf die von AMD öffentlich gemachten Details des Infinity Fabric haben wir bereits genauer betrachtet.

Natürlich darf auch der direkte Vergleich zu Intel nicht fehlen. Dabei wird Dual-Socket-System mit einem ähnlichen bestehend aus zwei Intel Xeon E5-2699 v4 verglichen.

Dual-Socket-Vergleich
  AMD Naples Intel Xeon E5-2699 V4
Anzahl der Prozessoren 2 2
Kerne 64 44
Threads 128 88
Speicherchannel 16 8
Speicherkapazität (16 GB DIMMs) 512 384
Speichertakt 2.400 MHz 1.866 MHz
PCI-Express-Lanes 8x 16 = 128 2x 40 = 80

Durch die höhere Anzahl an Prozessorkernen sowie der zur Verfügung stehenden Threads sieht sich AMD natürlich klar im Vorteil. Entscheidend ist an dieser Stelle aber, welche Leistung diese Kerne erbringen können. Dazu lieferte man auch gleich ein paar Benchmarks, auf die wir noch genauer eingehen werden. AMD ist aber auch die Unterstützung von Octa-Channel-DDR4 sowie die Unterstützung von mehr und schnellerem Speicher wichtig. Auch dazu hat man in den Benchmarks ein praktisches Beispiel.

[h3]Erste Benchmarks[/h3]

Erstmals liefert AMD auch ein paar Benchmarks. Diese wurden auf verschiedenen Server erstellt, um einen Vergleich mit Intel zu ermöglichen. Als Software kam dabei eine Analyse von seismischen Daten zum Einsatz, die bei der Erkundung von Bodenschätzen angewendet wird. Dabei wird ein Messfeld mit einer bzw. vier Milliarden Simulationspunkten in einem Grid verwendet. Die AVX-Instruktionen waren jeweils aktiviert, im Falle des Naples-Prozessors änderte sich der Takt des Prozessors nicht.

Datenschutzhinweis für Youtube



An dieser Stelle möchten wir Ihnen ein Youtube-Video zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Youtube setzt durch das Einbinden und Abspielen Cookies auf ihrem Rechner, mit welchen Sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf den Play-Button. Das Video wird anschließend geladen und danach abgespielt.

Ihr Hardwareluxx-Team

Youtube Videos ab jetzt direkt anzeigen

In einem ersten Benchmark wurde ein Intel-System mit 44 Kernen und 1.866 MHz schnellem Speicher gegen ein Naples-System verglichen, bei dem die Anzahl der CPU-Kerne ebenfalls auf 44 limitiert wurde und in dem der Speicher ebenfalls mit nur 1.866 MHz lief. Damit soll ein 1:1-Vergleich ermöglicht worden sein. Das Messgrid bestand aus 500 x 1.408 x 1.408, also insgesamt 991.232.000 Simulationspunkten. Bereits am Anfang wird deutlich, dass das Naples-System die Daten dennoch schneller in den Speicher laden und mit der eigentlichen Berechnung anfangen kann. Das Naples-System kann nicht nur die Iterationen schneller durchführen, sondern ist durch den Vorteil der schnelleren Speicherverarbeitung 18 s schnell, während das Intel-System 38 s benötigt. Noch extremer das Bild, wenn das Naples-System von der Leine gelassen wird. Arbeitetet es mit 64 Kernen und einem Speichertakt von 2.400 MHz, ist der Unterschied noch etwas größer.

Simulation seismischer Daten

10 Iterationen

Sekunden
Weniger ist besser

Werbung

Simulation seismischer Daten

10 Iterationen

Sekunden
Weniger ist besser

Simulation seismischer Daten

Durchschnitt der Iterationen

Sekunden
Weniger ist besser

Simulation seismischer Daten

Durchschnitt der Iterationen

Sekunden
Weniger ist besser

Schlussendlich wählt AMD auch noch einen Extremfall, in dem das Dataset auf 2.000 x 1.408 x 1.408 auf insgesamt 3.964.928.000 Simulationspunkte vergrößert wird. Das Intel-System ist gar nicht mehr in der Lage alle Daten in den Speicher aufzunehmen und bricht die Berechnung ab. Auch mit Skylake-EP will AMD den Vorteil des schnelleren und größeren Speichers noch vorzuweisen haben und auch die neuen NVDIMMs mit flüchtigem und nichtflüchtigem Speicheranteil werden von Naples unterstützt.

Nach dem erfolgreichen Start der RYZEN-Prozessoren für den Desktop sieht vieles danach aus, dass AMD auch bei den Servern zukünftig wieder eine Rolle spielen wird. Bisher kennen wir aber nur ein paar isolierte Ergebnisse, die keinesfalls ein Gesamtbild ergeben. Je nach Anwendungen kann sich die Leistung eines Prozessors unterscheiden und AMD hat sicher eine Anwendung gewählt, die dem Naples-Prozessor gut steht.

Während für die Veröffentlichung bisher immer noch von Sommer die Rede war, spricht AMD nun von einer Verfügbarkeit erster Systeme mit Naples-Prozessoren im zweiten Quartal 2017.

Quellen und weitere Links KOMMENTARE (35) VGWort