Seite 2: Haswell-E im Detail (1)

Im Vergleich zu "Haswell" bzw. "Haswell Refresh" ist "Haswell-E" ein wahres Monster. Auf einer Fläche von 355 Quadratmillimetern (17,6 x 20,2 mm) beherbergt der Chip ganze 2,6 Milliarden Transistoren. Selbst die Vorgänger-Generation war hier mit 1,86 Milliarden Schalteinheiten bzw. einer Fläche von rund 257 Quadratmillimetern (15,0 x 17,1 mm) nicht ganz so komplex. Die aktuellen Modelle der Core-i7-4700-Familie bringen es sogar nur auf 1,4 Milliarden Transistoren bzw. 177 Quadratmillimeter. Doch der Größenanstieg hat seinen Grund: War "Ivy Bridge-E" noch ein reiner Sechskern-Prozessor ist zumindest das Topmodell von "Haswell-E" eine waschechte Achtkern-CPU. Bei den beiden kleineren Ablegern wurden hingegen zwei Rechenkerne und Cache-Einheiten abgestellt. 

Trotzdem stellt auch "Haswell-E" an vielen Ecken und Kanten mehr oder weniger eine Verdoppelung gegenüber seiner Ursprungs-Architektur "Haswell" dar. Statt vier kann "Haswell-E" acht oder sechs Kerne beherbergen, statt maximal 8 MB Cache gibt es nun bis zu 20 MB und anstatt Dual-Channel-Speicher werden vier Kanäle unterstützt. Hinzu kommt ein komplett erneuerter Speichercontroller, der fortan mit dem neuen DDR4-Standard zurechtkommt. Nur die sonst übliche integrierte Grafiklösung ist komplett weggefallen, dafür war schlichtweg kein Platz und letztendlich ist die Zielgruppe des Prozessors wohl auch nicht an einer integrierten Grafik interessiert.

die k
Der Die des Intel Core i7-5960X zeigt acht Kerne und jede Menge Cache-Speicher.

Generell lässt sich "Haswell-E" eher mit Intels Server-Plattform vergleichen, denn wie bei den älteren "Ivy Bridge-E"- oder gar "Sandy Bridge-E"-Modellen besteht zwischen den Prozessoren für den Servereinsatz und für dem High-End-Desktop-Markt kaum ein Unterschied. Aufgrund des schnelleren Speicherinterfaces, des teureren Chipsatzes und der gebotenen Cache-Größen sind die neuen "Haswell-E"-Prozessoren eher etwas für professionelle Anwendungen und Enthusiasten. Nur durch die Optimierungen an der Architektur deckt sich diese mit den Sockel-LGA-1150-Prozessoren.

intel i7 5960x test-05
Im direkten Vergleich mit "Ivy Bridge-E" und "Haswell Refresh" fällt "Haswell-E" deutlich größer aus.

Neuer Sockel

Für seine neuen "Haswell-E"-Prozessoren musste Intel einen neuen Sockel einführen. Nahmen die bisherigen Modelle der "Sandy Bridge-E"- und "Ivy Bridge-E"-Generation noch im Sockel LGA2011 ihren Platz, ist es beim Intel Core i7-5960X und seinen beiden kleineren Ablegern der Sockel LGA2011-v3 geworden. Dieser ist leider nicht abwärtskompatibel und nimmt lediglich die neusten Vertreter auf. An der Montage des Prozessors hat sich allerdings nichts weiter getan. Auch unsere bisher für den Sockel LGA2011 verwendeten Kühler ließen sich problemlos montieren.

Apropos Kühler. Um der Abwärme von bis zu 140 Watt TDP Herr zu werden, wird Intel seine Boxed-Kühler auch mit einer All-In-One-Wasserkühlung ausliefern. Dann gibt es einen 120-mm-Radiator, der mit einem 120-mm-Lüfter bestückt ist, der mit 800 bis 2.200 Umdrehungen in der Minute arbeitet und so einen Luftdurchsatz von etwa 74 CFM erreichen soll. Die Geräuschkulisse soll hier zwischen 21 bis maximal 35 dB(A) liegen. 

intel i7 5960x test-05
LGA2011-v3: Ein neuer Sockel für die High-End-Plattform.

Turbo Boost 2.0

Mit seinen ersten Core-i7-Prozessoren führte Intel eine Technik ein, den Takt des Prozessors je nach Last einer Anwendung zu variieren und setzte hierzu die Power-Control-Unit ein. Um die Performance eines Sechskern- bzw. Achtkern-Prozessors auch bei Single-Core-Anwendungen zu verbessern, erhöht sich der Takt des betreffenden Cores automatisch. Wird hingegen keine Leistung benötigt, schalten sich die meisten Teile der CPU einfach ab, um Leistungsaufnahme und Abwärme einzusparen. Diese Prinzipien hat Intel bei seinen „Haswell-E“-Prozessoren beibehalten.

Die Logik, die hinter Intels Turbo Boost steckt, ist einfach: Werden beim Prozessor nicht alle Bereiche ausgelastet, so reicht die Kühlung aus, um Teile des Prozessors mit höheren Taktraten zu versorgen, um so die Leistung zu erhöhen. Da noch immer viele Anwendungen nicht für den Mehrkern-Betrieb ausgelegt sind, werden so vor allem Single-Thread-Anwendungen beschleunigt. Hierfür gibt es unterschiedliche Speed-Bins, von denen die neuen "Haswell-E"-Prozessoren mehrere unterstützen. Als Speed-Bin wird dabei ein Multiplikator-Schritt bezeichnet. 

Intels Core i7-3960X kannte dabei vier verschiedene Turbo-Stufen: War der Turbo-Modus ausgeschaltet, lag der Multiplikator "33" dauerhaft auf allen sechs Kernen an - der Takt belief sich so auf 3,3 GHz. Schaltete man Turbo Boost 2.0 hinzu, kam es auf den Lastzustand des Prozessors an, welcher Speed-Bin maximal angelegt werden konnte. Bei Belastung von sechs Kernen schaltete Intel im Vergleich zum Standard-Takt drei Speed-Bins auf. Wurden hingegen nur maximal vier oder zwei Kerne belastet, gab es jeweils einen Speed-Bin oben drauf. Die CPU taktete dann mit 3,6; 3,7; 3,8 oder maximal 3,9 GHz bei Belastung zweier Kerne. Diese Verteilung war beim "Ivy Bridge-E"-Nachfolger anders. Wurde nur ein Kern des Intel Core i7-4960X belastet, durfte sich dieser auf bis zu 4,0 GHz übertakten. Wurden hingegen bis zu drei Kerne gleichzeitig belastet, ist es mit einem Maximaltakt von 3,9 GHz ein Speed-Bin weniger. Bei Auslastung von bis zu vier Kernen sind 3,8 GHz und bei voller Last maximal 3,7 GHz möglich. Ohne Turbo-Boost rechnen alle sechs Kerne mit 3,6 GHz. 

Für "Haswell-E" hat Intel erneut Änderungen an den Turbo-Stufen vorgenommen. Werden beim Intel Core i7-5960X maximal zwei Kerne ausgelastet, erhöht sich die Taktfrequenz auf 3,5 GHz. Bei Belastung von drei bis acht Kernen sind es zwei SpeedBins weniger. Dann arbeitet die CPU mit 3,3 GHz. Der Basis-Takt liegt hingegen bei 3,0 GHz.

Auslastung Takt
3 bis 8 Kerne 3,3 GHz
1 bis 2 Kerne 3,5 GHz
Basis-Takt 3,0 GHz

 

intel haswell e praesentation-06
Der DIE des Intel Core i7-5960X zeigt acht Kerne und jede Menge Cache-Speicher.

Caches und Die-Aufbau

Kam beim Wechsel von "Sandy Bridge-E" auf "Ivy Bridge-E" nominell beim L3-Cache kein einziges Kilobyte hinzu, ist dies beim neusten Generationssprung wieder etwas anders. Das Topmodell kann auf insgesamt 20 MB L3-Cache vertrauen, während die beiden kleineren Modelle mit ihren sechs Kernen weiterhin auf einen 15 MB großen shared L3-Cache zurückgreifen können. Mit „Sandy Bridge“ führte Intel den Ring-Bus-Cache ein. Schaut man auf den DIE-Shot von „Haswell-E“, kann man diese Struktur weiterhin erkennen. Ein Ring-Bus bindet weiterhin die Cores und Caches, allerdings nicht mehr den entsprechenden Grafikkern, den hat Intel zugunsten der DIE-Größe bei „Haswell-E“ ausgespart.

Die Größen für den L1- und L2-Cache sind identisch geblieben - weiterhin spendiert Intel den Kernen je 32 kb für Daten und Instruktionen sowie 256 kb L2-Cache (unified, 8-fach assoziativ, low latency). Der L3-Cache ist zudem weiterhin ein "Inklusiv-Cache", besitzt also die Daten des L2- und L1-Caches, um in Idle-Zyklen die Kerne nicht aufwecken zu müssen, um an deren Daten heranzukommen.