Seite 1: Kern-Monster: Intel Xeon E5-2600 v4 - Neue Server-CPUs mit bis zu 22 Kernen

Intel Xeon logoHeute ist Intels Zwei-Sockel-Serverlaunch: Zumindest auf dem Papier hat es Intel geschafft, seine neuen Server-Prozessoren mit dem Codenamen Broadwell-EP doch noch im ersten Quartal 2016 vorzustellen. Richtig losgehen wird es allerdings erst im zweiten Jahresviertel, welches bereits morgen beginnt. Im Vergleich zum Haswell-EP-Vorgänger werden die CPUs der neuen Xeon-E5-2600-v4-Familie im fortschrittlicheren 14-nm-Prozess gefertigt, was Platz für neue Rechenkerne und einigen Architekturverbesserungen schafft. Das Topmodell stellt nun bis zu 22 Cores statt wie bislang 18 Kerne zur Verfügung. Dafür sinken je nach Modell die Taktraten deutlich, was Intel anhand zahlreicher Architektur-Verbesserungen innerhalb der Broadwell-Architektur wieder ausgleichen will.

Drei unterschiedliche Dies

Für die Xeon-E5-2600-v4-Reihe wird es wie schon in der Vergangenheit wieder drei unterschiedliche Dies geben. Vom grundsätzlichen Aufbau hat sich nicht viel getan, hatte man diesen erst mit der Einführung von Haswell EP umgekrempelt. Je nach Ausführung sind bis zu zwölf Kerne über einen von zwei getrennten Ringen zusammengeschaltet. Für den Datenaustausch zwischen diesen beiden Ringbussen, die durch die L3-Segmente verlaufen, stehen zwei gepufferte Switches zur Verfügung. Daran angeschlossen sind auch die QPI- und Home-Agenten sowie die Speichercontroller, sodass die Kerne eines Rings nicht erst über den primären gehen müssen, um beispielsweise auf den Speicher zugreifen zu können. Bei den Topmodellen setzt Intel auf den HCC-Die (High Core Count), womit theoretisch bis zu 24 Rechenkerne verteilt auf zwei Ringe zu je 12 Cores bereitgestellt werden können. Das Flaggschiff der Xeon-E5-2600-v4-Familie wird davon allerdings lediglich 22 Cores scharf geschaltet bekommen. Die vollen 24 Kerne werden vermutlich der E7-Reihe vorbehalten bleiben, oder aber Intel schiebt im Laufe des Jahres noch weitere Modelle nach.

intel broadwell ep workshop 09 k
Das Flaggschiff-Die hält bis zu 24 Prozessor-Kerne bereit – im Xeon E5 2600 v4 sind davon allerdings maximal 22 aktiv

Für Modelle mit bis zu 14 Kernen gibt es das MCC-Die (Medium Core Count). Hier werden zehn bzw. fünf Cores über den oben genannten Ringbus angebunden, wobei hier einfach das untere Paar respektive der ganze rechte Block abgeschnitten und einzelne Kerne komplett abgestellt wurden, denn ein SKU mit 15 Cores gibt es nicht. Der kleinste LCC-Core (Low Core Count) besitzt hingegen nur noch einen einzigen Ringbus, an den maximal fünf Core-Paare und damit zehn Kerne zusammengeschaltet werden. Intel deaktiviert je nach SKU aber auch weitere Kerne – das kleinste Modell muss mit lediglich vier Cores auskommen.

Schnellerer RAM, geringe Die-Fläche

Unterschiede zwischen den drei Dies gibt es damit aber nicht nur bei der Kernanzahl, denn je weniger Rechenkerne vorhanden sind, desto geringer fällt die Kapazität der Caches aus. Hier gibt es je nach Ausführung nun maximal 60 bzw. 55 MB, 35 und 25 MB. Das Verhältnis zwischen Kern und Cache bleibt damit unverändert bei 1:2,5 - und das schon seit Sandy Bridge EP. Die Speichercontroller der neuen Xeons unterstützen bis zu drei DIMMs pro Kanal und können damit mit maximal 24 Riegeln umgehen. Intel spricht bei Vollbestückung von einer Kapazität von satten 3 TB pro Sockel. Die Speichercontroller kommen wie bei der Vorgänger-Generation wahlweise mit DDR3- oder DDR4-Speicher zurecht – auch 3DS-LRDIMMs werden unterstützt. Bei DDR4 gab es immerhin eine leichte Takterhöhung. Broadwell-EP unterstützt nun Module mit einer Geschwindigkeit von 2.400 MHz. Ebenfalls mit dabei soll nun auch Transactional Memory (TSX) sein, was Intel bei Haswell aufgrund eines Timing-Bugs komplett abgeschaltet hatte. Ansonsten stellt die neue Server-Generation 44 PCIe-3.0-Lanes (4x ESI) und zwei QPI-Buses zur Verfügung. Weitere Anpassungen an den QPI-Links hat Intel nicht vorgenommen, sie sind wie bisher mit maximal 9,6 GT/s am Werk, wobei nicht alle Modelle die höchste Geschwindigkeit bieten – auch Varianten mit nur 8,0 oder gar 6,4 GT/s gibt es.

All das bringt Intel auf einem 18,1 x 25,2 mm großen Die mit bis zu 7,2 Milliarden Transistoren unter. Damit bringt es Broadwell-EP auf eine Die-Fläche von rund 456 mm2 und ist somit trotz der weiter gesteigerten Kernanzahl deutlich kleiner geworden. Der HCC-Die von Haswell EP war mit fast 700 mm2 gut 45 % größer. Komplexer ist die neue Generation dank zusätzlicher Caches und Cores aber allemal geworden, die Xeon-E5-2600-v3-Prozessoren zählten bislang noch 5,69 Milliarden Schalteinheiten.

Ansonsten setzen die neuen Server-CPUs auf die Broadwell-Architektur, welche im Vergleich zu Haswell nur geringfügige Verbesserungen mit sich bringt. Dazu zählen unter anderem größere Instruktions-Scheduler und -Puffer, welche die einzelnen CPU-Cores effizienter mit Daten füttern und mehr Befehle verteilen können, sowie verkürzte Taktzyklen bei Vektor-Berechnungen und Gleitkomma-Multiplikationen. Hinzu kommen ein schnellerer Radix-1024-Dividierer und ein zusätzlicher nativer STLB mit 1-GB-Seiten und 16 Einträgen. Intels aktuellste Core-Architektur, die Skylake-Architektur, kommt bislang weiterhin nur im Desktop und Notebook zum Einsatz.

intel broadwell ep workshop 11 k
Ein Überblick über die neuen Server-CPUs der Xeon-E6-2600-v4-Familie

Gleicher Sockel, gleicher Preis

Ebenfalls wenig getan hat sich bei der restlichen Infrastruktur. Da auch weiterhin integrierte Spannungsregler (FIVR) bereitstehen, muss Intel nicht den Sockel wechseln und kann auf die bestehende Plattform weiter setzen. Die TDP liegt wie schon beim Vorgänger bei maximal 160 W, wobei sich die kleineren Modelle mit 55 bis 145 W TDP begnügen. Die Taktraten reichen je nach SKU von 1,7 bis 3,5 GHz im Basistakt, dank Turbo-Boost sind aber auch bis zu +18 weitere Taktstufen von jeweils 100 MHz möglich. Anwendungen, die vom AVX-Befehlssatz Gebrauch machen, müssen allerdings mit einem Takt von maximal 14 Spins auskommen – auch der AVX-Basistakt liegt bei den neuen Xeons deutlich darunter. Das war bei Haswell EP aber ebenfalls so. Dafür ist Turbo Boost sehr flexibel – selbst bei voller Kernauslastung liegen zwischen zwei und sechs Taktstufen über dem Basistakt an, was auch die Single-Thread-Performance beschleunigt. Dank SMT-Support (Hyperthreading) können die meisten SKUs bis zu zwei Threads pro Rechenkern abarbeiten. Im Vergleich zu den Modellen der Xeon-E5-2600-v3-Familie fallen vor allem die Angaben für den Basistakt niedriger aus. Hier fährt Broadwell EP teilweise 400 MHz zurück, den Unterschied gleicht der Boosztakt aber meist wieder aus.

Zum Start von Broadwell EP listet Intel 22 Modelle, die ihre Vorgänger beim Preis vollständig ablösen und die wir auf der nächsten Seite noch ausführlich vorstellen werden. Sie dürften durchaus als Vorbote für die Desktop-Ableger angesehen werden, welche Intel vermutlich in der zweiten Jahreshälfte bringen wird – hierfür könnten durchaus zehn Rechenkerne sowie höhere Taktraten rausspringen. Das bisherige Topmodell, der Intel Core i7-5960X, ist mit acht Kernen bestückt.

intel broadwell ep workshop 03 k
Die neuen Prozessoren in einem typischen Server-Gehäuse

Erste Leistungswerte

Im Rahmen eines Presse-Workshops am Standort in Hilsboro Anfang März stellte Intel seine kommenden Server-CPUs der Presse nicht nur ausführlich vor, sondern gab den anwesenden Journalisten in zahlreichen, intensiven Sessions mit vielen tiefgehenden Präsentations-Folien auch die Möglichkeit für Fragen. Dabei konnten wir uns ein erstes Bild von der Leistungsfähigkeit der neuen Prozessoren machen. Zwar lassen die Gegebenheiten sicherlich keine endgültige Leistungseinschätzung zu (vor allem in realen Server-Umgebungen), zeigen jedoch die Leistungsfähigkeit der neuen Plattform sehr gut auf.

intel broadwell ep workshop 04 k
Der Intel Xeon E5-2699 v4 ist pfeilschnell

Im Cinebench-Benchmark erreicht der Intel Xeon E5-2699 v4 im Tandembetrieb mit seinen 22 Kernen, 44 Threads, 55 MB L3-Cache (also insgesamt 88 Threads) und einem Takt von bis zu 3,6 GHz bei einer maximalen Leistungsaufnahme von 145 W satte 5.367 Punkte. Zum Vergleich: Ein Intel Core i7-3930K auf Sandy-Bridge-E-Basis erreicht hier mit seinen seinen zwölf Threads lediglich rund 1.096 Punkte und ist damit fast fünfmal langsamer. Ein Intel Core i7-4770K bringt es sogar auf nur 822 Punkte. In einer HPC-Umgebung erreicht die neue Plattform eine gut 46 % höhere Leistung als noch ein Intel-Xeon E5-2600-v3-Prozessor.