Haswell-E im Test: Intel Core i7-5960X

Veröffentlicht am: von

intel i7 5960x test teaserZiemlich genau ein Jahr nach den ersten "Ivy Bridge-E"-Prozessoren lässt Intel den Vorhang für die Nachfolge-Generation fallen. Mit dem heutigen Tag sind der Intel Core i7-5960X, der Core i7-5930K und der Intel Core i7-5820K offiziell. Damit sattelt die Chipschmiede im Enthusiasten-Segment nicht nur auf die aktuellere "Haswell"-Architektur um, sondern bringt erstmals auch DDR4-Speicher und einen Achtkerner in den Desktop. Zudem wechselt man den Sockel und frischt seinen eigentlich schon zur Einführung betagten X79-Chipsatz auf. In diesem Artikel werfen wir einen näheren Blick auf das neue Flaggschiff, den Intel Core i7-5960X.

In den letzten Wochen hatte Intel mit seinen neuen "Haswell Refresh"- und "Devils Canyon"-Prozessoren eine Vielzahl neuer CPUs in den Handel geschickt. Doch wirklich Bahnbrechendes hat es mit ihnen nicht gegeben. Während erstere lediglich ein Speedbumb der ersten "Haswell"-Prozessoren sind und nur um wenige hundert Megahertz beschleunigt wurden, sollten die beiden "Devils Canyon"-Prozessoren vor allem beim Overclocking für deutlich bessere Ergebnisse sorgen. Auch wenn der Intel Core i7-4790K mit seinem Basis- und Turbo-Takt von 4,0 bzw. 4,4 GHz einer der schnellsten Core-Prozessoren ist, lässt er die Herzen ambitionierter Overclocker nur bedingt höher schlagen. Zu gering sind zumindest bei unserem Testmuster die Taktsteigerungen. Viel interessanter sind da die heute vorgestellten Prozessoren der "Haswell-E"-Reihe.

Mit ihnen bringt Intel erstmals einen Achtkern-Prozessor und DDR4-Unterstützung in den Desktop und frischt seinen X79-Chipsatz auf. Die neue X99-Generation bringt im Vergleich zum X79 nun ab Werk moderne USB-3.0-Schnittstellen mit sich und stellt eine größere Anzahl an SATA-III-Ports zur Verfügung. Beim Vorgänger mussten diese teils durch Zusatzchips hinzugefügt bzw. implementiert werden, was einige Mainboard-Hersteller auch getan haben. Im Vergleich zum Z97-Chipsatz bietet die neue X99-Plattform einige Lanes mehr, was sich vor allem bei schnellen Grafikkarten im Multi-GPU-Betrieb bemerkbar machen sollte. Dies gilt jedoch nicht für alle der drei heute vorgestellten Prozessoren, wie wir später aufzeigen werden.

Auf den nachfolgenden Seiten stellen wir die drei neuen "Haswell-E"-Prozessoren ausführlich vor und erläutern die wichtigsten Details zu DDR4, dem X99-Chipsatz sowie der "Haswell"-Architektur. Wie sich der Intel Core i7-5960X schlägt, erfährt man in diesem Artikel.


Im Vergleich zu "Haswell" bzw. "Haswell Refresh" ist "Haswell-E" ein wahres Monster. Auf einer Fläche von 355 Quadratmillimetern (17,6 x 20,2 mm) beherbergt der Chip ganze 2,6 Milliarden Transistoren. Selbst die Vorgänger-Generation war hier mit 1,86 Milliarden Schalteinheiten bzw. einer Fläche von rund 257 Quadratmillimetern (15,0 x 17,1 mm) nicht ganz so komplex. Die aktuellen Modelle der Core-i7-4700-Familie bringen es sogar nur auf 1,4 Milliarden Transistoren bzw. 177 Quadratmillimeter. Doch der Größenanstieg hat seinen Grund: War "Ivy Bridge-E" noch ein reiner Sechskern-Prozessor ist zumindest das Topmodell von "Haswell-E" eine waschechte Achtkern-CPU. Bei den beiden kleineren Ablegern wurden hingegen zwei Rechenkerne und Cache-Einheiten abgestellt. 

{jphoto image=60544}

Trotzdem stellt auch "Haswell-E" an vielen Ecken und Kanten mehr oder weniger eine Verdoppelung gegenüber seiner Ursprungs-Architektur "Haswell" dar. Statt vier kann "Haswell-E" acht oder sechs Kerne beherbergen, statt maximal 8 MB Cache gibt es nun bis zu 20 MB und anstatt Dual-Channel-Speicher werden vier Kanäle unterstützt. Hinzu kommt ein komplett erneuerter Speichercontroller, der fortan mit dem neuen DDR4-Standard zurechtkommt. Nur die sonst übliche integrierte Grafiklösung ist komplett weggefallen, dafür war schlichtweg kein Platz und letztendlich ist die Zielgruppe des Prozessors wohl auch nicht an einer integrierten Grafik interessiert.

die k
Der Die des Intel Core i7-5960X zeigt acht Kerne und jede Menge Cache-Speicher.

Generell lässt sich "Haswell-E" eher mit Intels Server-Plattform vergleichen, denn wie bei den älteren "Ivy Bridge-E"- oder gar "Sandy Bridge-E"-Modellen besteht zwischen den Prozessoren für den Servereinsatz und für dem High-End-Desktop-Markt kaum ein Unterschied. Aufgrund des schnelleren Speicherinterfaces, des teureren Chipsatzes und der gebotenen Cache-Größen sind die neuen "Haswell-E"-Prozessoren eher etwas für professionelle Anwendungen und Enthusiasten. Nur durch die Optimierungen an der Architektur deckt sich diese mit den Sockel-LGA-1150-Prozessoren.

intel i7 5960x test-05
Im direkten Vergleich mit "Ivy Bridge-E" und "Haswell Refresh" fällt "Haswell-E" deutlich größer aus.

Neuer Sockel

Für seine neuen "Haswell-E"-Prozessoren musste Intel einen neuen Sockel einführen. Nahmen die bisherigen Modelle der "Sandy Bridge-E"- und "Ivy Bridge-E"-Generation noch im Sockel LGA2011 ihren Platz, ist es beim Intel Core i7-5960X und seinen beiden kleineren Ablegern der Sockel LGA2011-v3 geworden. Dieser ist leider nicht abwärtskompatibel und nimmt lediglich die neusten Vertreter auf. An der Montage des Prozessors hat sich allerdings nichts weiter getan. Auch unsere bisher für den Sockel LGA2011 verwendeten Kühler ließen sich problemlos montieren.

Apropos Kühler. Um der Abwärme von bis zu 140 Watt TDP Herr zu werden, wird Intel seine Boxed-Kühler auch mit einer All-In-One-Wasserkühlung ausliefern. Dann gibt es einen 120-mm-Radiator, der mit einem 120-mm-Lüfter bestückt ist, der mit 800 bis 2.200 Umdrehungen in der Minute arbeitet und so einen Luftdurchsatz von etwa 74 CFM erreichen soll. Die Geräuschkulisse soll hier zwischen 21 bis maximal 35 dB(A) liegen. 

intel i7 5960x test-05
LGA2011-v3: Ein neuer Sockel für die High-End-Plattform.

Turbo Boost 2.0

Mit seinen ersten Core-i7-Prozessoren führte Intel eine Technik ein, den Takt des Prozessors je nach Last einer Anwendung zu variieren und setzte hierzu die Power-Control-Unit ein. Um die Performance eines Sechskern- bzw. Achtkern-Prozessors auch bei Single-Core-Anwendungen zu verbessern, erhöht sich der Takt des betreffenden Cores automatisch. Wird hingegen keine Leistung benötigt, schalten sich die meisten Teile der CPU einfach ab, um Leistungsaufnahme und Abwärme einzusparen. Diese Prinzipien hat Intel bei seinen „Haswell-E“-Prozessoren beibehalten.

Die Logik, die hinter Intels Turbo Boost steckt, ist einfach: Werden beim Prozessor nicht alle Bereiche ausgelastet, so reicht die Kühlung aus, um Teile des Prozessors mit höheren Taktraten zu versorgen, um so die Leistung zu erhöhen. Da noch immer viele Anwendungen nicht für den Mehrkern-Betrieb ausgelegt sind, werden so vor allem Single-Thread-Anwendungen beschleunigt. Hierfür gibt es unterschiedliche Speed-Bins, von denen die neuen "Haswell-E"-Prozessoren mehrere unterstützen. Als Speed-Bin wird dabei ein Multiplikator-Schritt bezeichnet. 

Intels Core i7-3960X kannte dabei vier verschiedene Turbo-Stufen: War der Turbo-Modus ausgeschaltet, lag der Multiplikator "33" dauerhaft auf allen sechs Kernen an - der Takt belief sich so auf 3,3 GHz. Schaltete man Turbo Boost 2.0 hinzu, kam es auf den Lastzustand des Prozessors an, welcher Speed-Bin maximal angelegt werden konnte. Bei Belastung von sechs Kernen schaltete Intel im Vergleich zum Standard-Takt drei Speed-Bins auf. Wurden hingegen nur maximal vier oder zwei Kerne belastet, gab es jeweils einen Speed-Bin oben drauf. Die CPU taktete dann mit 3,6; 3,7; 3,8 oder maximal 3,9 GHz bei Belastung zweier Kerne. Diese Verteilung war beim "Ivy Bridge-E"-Nachfolger anders. Wurde nur ein Kern des Intel Core i7-4960X belastet, durfte sich dieser auf bis zu 4,0 GHz übertakten. Wurden hingegen bis zu drei Kerne gleichzeitig belastet, ist es mit einem Maximaltakt von 3,9 GHz ein Speed-Bin weniger. Bei Auslastung von bis zu vier Kernen sind 3,8 GHz und bei voller Last maximal 3,7 GHz möglich. Ohne Turbo-Boost rechnen alle sechs Kerne mit 3,6 GHz. 

Für "Haswell-E" hat Intel erneut Änderungen an den Turbo-Stufen vorgenommen. Werden beim Intel Core i7-5960X maximal zwei Kerne ausgelastet, erhöht sich die Taktfrequenz auf 3,5 GHz. Bei Belastung von drei bis acht Kernen sind es zwei SpeedBins weniger. Dann arbeitet die CPU mit 3,3 GHz. Der Basis-Takt liegt hingegen bei 3,0 GHz.

Auslastung Takt
3 bis 8 Kerne 3,3 GHz
1 bis 2 Kerne 3,5 GHz
Basis-Takt 3,0 GHz

 

intel haswell e praesentation-06
Der DIE des Intel Core i7-5960X zeigt acht Kerne und jede Menge Cache-Speicher.

Caches und Die-Aufbau

Kam beim Wechsel von "Sandy Bridge-E" auf "Ivy Bridge-E" nominell beim L3-Cache kein einziges Kilobyte hinzu, ist dies beim neusten Generationssprung wieder etwas anders. Das Topmodell kann auf insgesamt 20 MB L3-Cache vertrauen, während die beiden kleineren Modelle mit ihren sechs Kernen weiterhin auf einen 15 MB großen shared L3-Cache zurückgreifen können. Mit „Sandy Bridge“ führte Intel den Ring-Bus-Cache ein. Schaut man auf den DIE-Shot von „Haswell-E“, kann man diese Struktur weiterhin erkennen. Ein Ring-Bus bindet weiterhin die Cores und Caches, allerdings nicht mehr den entsprechenden Grafikkern, den hat Intel zugunsten der DIE-Größe bei „Haswell-E“ ausgespart.

Die Größen für den L1- und L2-Cache sind identisch geblieben - weiterhin spendiert Intel den Kernen je 32 kb für Daten und Instruktionen sowie 256 kb L2-Cache (unified, 8-fach assoziativ, low latency). Der L3-Cache ist zudem weiterhin ein "Inklusiv-Cache", besitzt also die Daten des L2- und L1-Caches, um in Idle-Zyklen die Kerne nicht aufwecken zu müssen, um an deren Daten heranzukommen. 


Erinnern wir uns kurz an "Ivy Bridge" zurück: Im Vergleich zu "Sandy Bridge" hatte "Ivy Bridge" keine großartigen Veränderungen an der CPU-Architektur, denn "Ivy Bridge" war hauptsächlich ein "Tick" - es wurde eine neue Fertigungstechnologie eingeführt. Trotzdem waren 400 Millionen mehr 22-nm-Tri-Gate-Transistoren auf der CPU vorhanden, weshalb Intel gerne von einem "Tick+" gesprochen hatte. Doch diese hinzugefügten Transistoren gehörten alle zur Grafikeinheit von "Ivy Bridge". An der Struktur der CPU, am Aufbau, dem Memory-Controller und anderen Bereichen hat Intel nur Detailverbesserungen durchgeführt.

Wenn man die Architektur von "Haswell" bzw. "Haswell-E" nun betrachtet, kann man sich im Vergleich somit eigentlich auf "Sandy Bridge" beziehen. Erstmals gab Intel auf dem Intel Developer Forum (IDF) im September 2012 in San Francisco Einblicke in die "Haswell"-Architektur. Im Endeffekt hat Intel aber den groben Aufbau von "Sandy Bridge" beibehalten:

ringbus
Der Ringbus wurde erstmals mit "Sandy Bridge" eingeführt, um genügend
Leistung für die integrierte Grafik mitzubringen. Bei "Ivy Bridge" ist er in
unveränderter Art ebenso vorhanden, ähnlich sieht es bei "Haswell" und "Haswell-E" aus.

Veränderungen an den Kernen

Die neuen "Haswell-E"-Prozessoren bauen auf der altbekannten "Haswell"-Architektur auf und sind damit im Großen und Ganzen mit den kleineren Modellen zu vergleichen. Große Änderungen hat es mit Ausnahme des Speichercontrollers sowie des Cache- und Kernausbaus nicht gegeben.

Im September 2012 gab Intel erstmals einen Einblick in die "Haswell"-Architektur. Erstaunlicherweise berichtete man dort von einer Erhöhung der Single-Thread-Performance. Um dies zu erreichen, hat man einige Verbesserungen in die Kerne von "Haswell" integriert: Wie bei jedem Intel-Prozessor wurde wieder an der Branch-Prediction-Einheit gefeilt, das Front-End des Prozessors wurde massiv verbessert und die Puffer vergrößert, während gleichzeitig deren Latenz verbessert wurde. Hinzu kommt eine größere Bandbreite bei den Caches, deren Größe aber zumindest im L1- und L2-Bereich unverändert bleibt.

Intel erreicht durch eine Erhöhung der Buffer-Sizes eine bessere Parallelisierung von Workloads. "Haswell" und "Haswell-E" haben im Vergleich zu ihrer jeweiligen Vorgänger-Architektur in allen Bereichen (Out-of-Order Window, In-Flight Loads, In-Flight Stores, Scheduler Entries, Integer Register Files, FP Register Files und Allocation Queues) eine größere Buffer-Size. Dabei hat Intel aber aufgrund der Effizienz darauf geachtet, die Buffer auf einem aufeinander abgestimmten Niveau zu halten und nicht zu sehr aufzublasen - denn ungenutzte Buffer verbrauchen nur Strom, bringen aber keinen Geschwindigkeitsvorteil mehr.

Konkret hat Intel zwei Fused-Multiply-Add-Einheiten für AVX hinzugefügt, zwei zusätzliche Ports mit einer vierten Integer-ALU, eine zweite Sprungeinheit und eine Store-Adress-Einheit. Die Pipeline hat Intel beibehalten und sie nicht verlängert. Mit einigen Veränderungen entspricht sie also noch dem Vorgänger "Sandy Bridge" (und in der Basis sogar noch dem Pentium Pro). Die Größe des Out-of-Order-Window steigt auf 192 Einträge, "Sandy Bridge" besaß 168 Einträge. Gleichzeitig hat man die Reservation Station von 54 auf 60 Einträge aufgebohrt. Die Execution-Unit 7 entlastet die beiden Load/Store-Ports 2 und 3 durch eine dedizierte Store-Address-Einheit. Intel hat auch die physischen Register vergrößert, jetzt stehen 168 Einträge für das Floating-Point-Gleitkommaregister statt vorher 144 Einträge zur Verfügung, auch die Integer-Register wurden mit 168 Einträgen leicht erweitert (160). Als wichtige Veränderung hat Intel zudem die Größe des Unified-Translation-Lookaside-Buffers (L2 Unified TLB) auf eine Größe von 4K + 2M shared mit 1.024 Einträgen statt 512 Einträgen bei "Sandy Bridge" aufgebohrt. Wichtig war Intel die Beibehaltung der Länge der Pipeline und niedrige Latenzzeiten zu den Caches.

{jphoto image=28486}

Neue Befehlssätze: Advanced Vector Extensions 2

Ein weiteres neues Kernfeature für "Haswell" und "Haswell-E" sind Advanced Vector Extensions 2 (kurz Intel AVX2). Diese Befehlssatzerweiterung besitzt unter anderem jetzt 256-bit Integer Vectors, zudem wird Fused Multiply-Add (zwei Einheiten für AVX) unterstützt. Intel schafft es damit die Flops pro Taktzyklus zu verdoppeln. Als Resultat erhält man bei Anwendungen, die AVX2 nutzen, eine deutlich höhere Performance. Die Integer Instructions behandeln hauptsächlich den Bereich Indexing und Hashing, Kryptografie und Endian Conversion (MOVBE). Durch Fused Multiply-Add wird zudem das Rechenergebnis genauer, da bei einer getrennten Operation zwei Rundungsvorgänge vorhanden sind, bei der Abwicklung mit FMA jedoch nur einer enthalten ist.

Cache-Bandbreite und sonstige Verbesserungen

Spannend sind die Verbesserungen bei der Cache-Bandbreite. Während die Größe für den L1-Instruction- und Data-Cache weiterhin bei 32K und einer 8-fach assoziativen Anbindung geblieben sind, hat Intel die Load- und Store-Bandbreite im Vergleich zu Sandy Bridge von 32 Bytes pro Cycle auf 64 Bytes pro Cycle für Load und von 16 Bytes/Cycle auf 32 Bytes/Cycle für Store aufgebohrt. Der L2-Cache bleibt ebenso bei 256K und 8-Fach assoziativer Anbindung, auch hier bohrt man die Bandbreite zum L1-Cache auf 64 Bytes/Cycle auf.

Auch den System-Agent und den Last-Level-Cache hat Intel überarbeitet. Man bietet unter anderem mehr Bandbreite für den Shared-Last-Level-Cache durch neue, dedizierte Pipelines, die Data und Non-Data-Zugriffe parallel behandeln können. Für den System-Agent gibt es einen neuen Load-Balancer, der die Ressourcen effektiver verteilen kann. Zudem wird auch der DRAM Write Throughput durch bessere Queues und einen besseren Scheduler beschleunigt. Letztendlich hat Intel die Geschwindigkeit für Roundtrips bei Virtualisierung in VT-x noch einmal deutlich beschleunigt, hier liegt man jetzt unter 500 Zyklen pro Roundtrip.

Intel Transactional Synchronization Extension (TSX) mit Lock Elision

Damit Multi-Core-Prozessoren immer mit validen Daten arbeiten, gibt es sogenannte Locks. Greifen mehrere Threads auf den Speicher zu, wird der entsprechende Bereich zunächst gesperrt (Lock), um eine Veränderung während der Verarbeitung zu verhindern. Mit diesem Prinzip rechnet jeder Kern für sich ein valides Ergebnis aus, da die Daten immer aktuell sind. Im Normalfall sind diese zeitaufwändigen Locks allerdings überflüssig, da nur sehr selten mehrere Threads bei Speicherzugriffen auf denselben Bereich konkurrieren. Hierfür gibt es mit Haswell nun TSX und Transactional Memory: Ein Speicherzugriff kann auch ohne Lock geschehen, somit können schneller Daten zur Bearbeitung in den L1-Cache geladen werden. Allerdings muss es hardwareseitig einen Mechanismus geben, der konkurrierende Zugriffe erkennt und dann die Berechnung abbricht. 

"Haswell" und "Haswell-E" haben zwei derartige Mechanismen. Hardware Locked Elision arbeitet nach dem obigen Prinzip und berechnet bei einem Konflikt denselben Code noch einmal unter Berücksichtigung der Locks. Restricted Transactional Memory hingegen meldet einen Abbruch erst einmal an die Software, die dann durch einen vorgesehenen Codepfad selber entscheiden kann, ob er mit Locks arbeiten möchte oder die Transaktion später wiederholen möchte. Beide Mechanismen arbeiten im L1-Daten-Cache der CPUs, "Haswell" kann aber auch Teilbereiche in die L2-Caches swappen.

Optimierungen am Stromverbrauch 

Beim Stromverbrauch geht Intel den Weg weiter, möglichst alles abzuschalten, was nicht gerade benötigt wird. Interessant ist, dass Intel die Kerne vom LLC+Ring nun trennt und jeweils eine separate Frequency Domain anbietet. Dadurch soll eine genauere Steuerung der Taktraten möglich sein. Die Power Control Unit steuert dabei dynamisch das vorhandene TDP- oder Strom-Budget, wenn man ein Limit angibt. 

Neuer Stromsparmodus "S0ix Active Idle"

Intel hat "Haswell" und "Haswell-E" neue Power- und Idle-States verpasst. Zum einen hat man neue Funktionen im Power-State im C7-Modus untergebracht. Hier werden alle Takte gestoppt, die Spannung wird vom Hauptteil der CPU genommen - selbst, wenn das Display noch aktiv ist. Die aktuellen Ultrabooks bieten sogar Self-Panel-Refresh (SPR), also kann kein Display-Bild bestehen bleiben, während das Ultrabook sich in C7 befindet. Die Zeitspanne zum Aufwecken aus dem C7-Modus und zum Schalten in andere C-Modi hat Intel dabei um 25 Prozent beschleunigt.

Durch neue Idle-States - S0ix Active Idle - und eine neue C-State-Intelligenz möchte man den Stromverbrauch weiter senken - und schafft dies gegenüber "Ivy Bridge" auch massiv im Idle-Power-Bereich. Bei S0ix Active Idle wird der Energieverbrauch des Rechners auf S3/S4-Niveau abgesenkt, aber es gibt keine lange Aufwachzeit. Intel realisiert dies vollautomatisch in der Hardware in feinen Abstufungen. Durch die generelle Beschleunigung zwischen den C-States um 25 Prozent und neue Power-Management-Funktionen für die Peripherie sind deutlich schnellere Wechsel innerhalb der C-States möglich.

haswell power optimizers
Insbesondere der Wechsel zwischen Idle- und Aktiv-Betrieb wurde von Intel massiv verkürzt. S0ix als Platform-Level spart dabei zusätzlich Energie. 

System Agent (ehem. Uncore-Bereich)

Der System-Agent-Bereich der CPU hat zwar einige Optimierungen bezüglich der Stromspartechniken erhalten, ansonsten bleibt er aber größtenteils unverändert, mit Ausnahme des Memory-Controllers:

Memory-Controller

Eine der größten Änderungen von "Haswell-E" ist im Speichercontroller zu finden. Kam die ältere "Ivy Bridge-E"-Generation noch mit 1.866 MHz schnellen DDR3-Speichermodulen zurecht, arbeiten die neuen Modelle nun mit DDR4-Speicher zusammen. Ab Werk werden Module mit einer Geschwindigkeit von 2.133 MHz unterstützt. Mithilfe weiterer Teiler können aber auch noch schnellere Module verwendet werden. Derzeit gibt es Kits mit einer Geschwindigkeit von bis zu 3.200 MHz.

Keine Änderungen gibt es bei den Kanälen. Auch die neuen Modelle arbeiten im Quad-Channel-Betrieb und ermöglichen damit im Gegensatz zu "Haswell" oder "Haswell Refresh" deutlich höhere Speicherbandbreiten und RAM-Bestückungen. Bis zu 64 GB Arbeitsspeicher werden in den acht Speicherbänken zahlreichen X99-Mainboards unterstützt. Damit gibt es zumindest bei der maximalen Speicherkapazität keine weitere Aufstockung im Vergleich zu "Ivy Bridge-E". Zahlreiche Mainboard-Hersteller wie ASRock oder EVGA geben aber auch an, dass ihre Boards mit bis zu 128 GB Arbeitsspeicher bestückt werden können. Neu ist auch die Unterstützung des XMP-Profils in Version 2.0. Die beiden Vorgänger-Generationen unterstützen hier lediglich Version 1.3.

PCI-Express-Interface

Im Vergleich zum direkten Vorgänger hat sich nichts getan. "Haswell-E" und "Ivy Bridge" unterstützen schon beide PCI Express 3.0 - und da dieser Standard momentan immer noch State-of-the-Art ist, bleibt es bei 8 GT/s pro PCIe-Lane, also 984 MB/s. Mit einer theoretischen Bandbreite von 16 GB/s bei PCIe-3.0-x16 pro Richtung kommt man somit auf 32 GB/s Bandbreite insgesamt.

Direct Media Interface

An der Anbindung zwischen CPU und dem (X99-)Chipsatz hat Intel keine Veränderungen durchgeführt. Hier kommt die bekannte DMI 2.0 x4-Verbindung zum Einsatz. Der Platform-Controller-Hub wird also mit 5 GT/s angebunden, wobei diese Technik insgesamt auf 4 GB/s Übertragungsrate kommt. Dass Intel hier keine schnellere Anbindung gewählt hat, ist etwas verwirrend, denn in den letzten Jahren war ein Argument gegen eine größere Anzahl USB-3.0- und SATA-6G-Ports die Anbindung zum Prozessor: Man wolle den DMI-Bus nicht zum Flaschenhals werden lassen. Mit den neuen Chipsätzen hat Intel nun reichlich USB-3.0- und SATA-6G-Ports, trotzdem geht man wohl davon aus, dass die 4 GB/s Übertragungsrate zum Prozessor kein Problem darstellen.


Zum Start von "Haswell-E" wird es insgesamt drei Modelle geben, die allesamt eine maximale Leistungsaufnahme von 140 Watt TDP besitzen, aber Unterschiede innerhalb der Taktfrequenzen, der Cache-Ausstattung und der Anzahl der Rechenkerne machen. Bei der älteren Generation war dies ähnlich, wobei hier alle Modelle noch mit einer TDP von bis zu 130 Watt ausgezeichnet wurden. Während das Topmodell mit acht Kernen ausgestattet ist, muss der Einstiegs-Prozessor mit sechs Kernen auskommen. Die Taktraten belaufen sich je nach Modell auf zwischen 3,0 und 3,5 GHz im Basis-Takt. Dank Turbo Boost 2.0 sind Taktraten von bis zu 3,7 GHz möglich. Die Größe des L3-Caches beläuft sich auf zwischen 15 und 20 MB - deutlich mehr als das aktuelle Topmodell auf "Haswell"-Basis bereitstellt.

Die Kennzahlen der neuen Desktop-Modelle im Vergleich haben wir in folgender Tabelle zusammengefasst:

Desktop-Modelle Core i7
ProzessorCore i7-5960XCore i7-5930KCore i7-5820KCore i7-4790K
Preis 999 US-Dollar 583 US-Dollar 389 US-Dollar etwa 285 Euro
TDP 140 Watt 88 Watt
Kerne /
Threads
8
16
6
12
4
8
CPU-Frequenz 3,0 GHz  3,5 GHz 3,3 GHz 4,0 GHz
Turbo 8 Core 3,3 GHz - - -
Turbo 7 Core 3,3 GHz - - -
Turbo 6 Core 3,3 GHz 3,6 GHz 3,4 GHz -
Turbo 5 Core 3,3 GHz 3,6 GHz 3,4 GHz -
Turbo 4 Core 3,3 GHz 3,6 GHz 3,4 GHz 4,2 GHz
Turbo 3 Core 3,3 GHz 3,6 GHz 3,4 GHz 4,3 GHz
Turbo 2 Core 3,5 GHz 3,7 GHz 3,6 GHz 4,4 GHz
Turbo 1 Core 3,5 GHz 3,7 GHz 3,6 GHz 4,4 GHz
Speicherinterface Quad-Channel DDR4-2133 Dual-Channel DDR3-1600
L3-Cache 20 MB 15 MB 8 MB

Das Topmodell ist klar der Intel Core i7-5960X. Er besitzt die vollen acht Rechenkerne, kann auf einen 20 MB großen shared L3-Cache zurückgreifen und rechnet dank Turbo Boost mit einer Geschwindigkeit von bis zu 3,5 GHz. Der Basistakt liegt hingegen bei runden 3,0 GHz. Mit einem Preis von 999 US-Dollar ist er bei weitem kein Schnäppchen. 

Mit einem Preis von 583 US-Dollar zwar ebenfalls nicht günstig, aber immerhin etwas erschwinglicher ist das nächstkleinere Modell, der Intel Core i7-5930K. Er muss mit insgesamt sechs Kernen vorliebnehmen, die sich dafür mit einem Basis- und Turbo-Takt von 3,5 bzw. 3,7 GHz ans Werk machen. Aufgrund der reduzierten Kernanzahl sinkt auch die Größe des L3-Caches. Dem Prozessor stehen noch 15 MB davon zur Seite. 

Einstieg in die Welt von "Haswell-E" ermöglicht der Intel Core i7-5820K. Er besitzt ebenfalls einen 15 MB großen L3-Cache und sechs Rechenkerne, deren Geschwindigkeit allerdings auf 3,3 bzw. 3,6 GHz reduziert wurde. Um den Preissprung von 389 auf 583 US-Dollar rechtfertigen zu können und diesen nicht über einen leicht niedrigeren Takt ausmachen zu müssen, musste sich Intel etwas einfallen lassen: Im Vergleich zu den beiden größeren Modellen unterstützt der kleinste "Haswell-E"-Prozessor nicht mehr die vollen 40 PCI-Express-3.0-Lanes. Die Anzahl dieser ist auf maximal 28 Lanes begrenzt.

Damit können SLI- und CrossFire-Systeme im Doppel-Betrieb nicht mehr über die jeweils vollen 16 Lanes angesprochen werden. Bei einem Mainboard mit drei PCI-Express-3.0-Steckplätzen ist eine Konfiguration bei Vollbestückung von x16, x8 und x4 möglich. Bei Boards mit vier Steckplätzen hingegen x8, x8, x8 und x4. Die genauen Angaben sind jedoch auch abhängig vom jeweiligen Mainboard.

cpuz i7 5960x idlecpuz i7 5960x turbo

CPU-Z-Screens vom Intel Core i7-5960X - einmal im Idle, einmal unter etwas Last.


Beim Umstieg von "Sandy Bridge-E" auf "Ivy Bridge-E" hat es keinen neuen Sockel gegeben, nicht einmal ein neuer Chipsatz wurde eingeführt. Bei "Haswell-E" ist dies anders. Der inzwischen betagte X79-Chipsatz hat endlich ausgedient und springt gleich zwei Generationsstufen weiter. Gefertigt wird der Chipsatz noch im 32-nm-Verfahren, soll laut Intel aber nur eine maximale Leistungsaufnahme von etwa sieben Watt benötigen.

Setzte man beim Sockel LGA1366 noch auf einen QuickPath-Interconnect (QPI) zur Kommunikation zwischen Chipsatz und CPU, schwenkte man beim X79-Chipsatz auf ein DMI-Interface um. An der Anbindung zwischen CPU und dem Chipsatz hat Intel damit keine Veränderungen durchgeführt. Hier kommt die bekannte DMI 2.0 x4-Verbindung zum Einsatz. 

Der Prozessor selbst kann über maximal 40 Lanes mit PCI-Express-3.0-Grafikkarten kommunizieren. Damit ist bei dreifacher Bestückung der PCI-Express-x16-Slots eine Konfiguration von 2x x16 und 1x x8 möglich. Alternativ werden maximal fünf Steckkarten mit jeweils acht Lanes angebunden. Dies gilt jedoch nur für den Intel Core i7-5960X und den Intel Core i7-5930K. Der Intel Core i7-5820K ist hier auf maximal 28 Lanes beschränkt und erlaubt damit bei einem Mainboard mit drei PCI-Express-3.0-Steckplätzen eine Konfiguration von x16, x8 und x4. Bei Boards mit vier Steckplätzen hingegen x8, x8, x8 und x4.

intel haswell e praesentation-10
Der X99-Chipsatz bietet nun endlich USB 3.0 nativ an und vergrößert die Anzahl der SATA-Ports. 

Der Chipsatz stellt zehn SATA-III-Ports zur Verfügung, die jeweils einen Datendurchsatz von bis zu 6 Gb/s ermöglichen. Der ältere X79-Chipsatz war auf maximal sechs SATA-Ports begrenzt. Weiterhin werden über den Chipsatz acht PCI-Express-2.0-Lanes, ein Gigabit-Ethernet-Port, HD-Audio und Intels Rapid-Storage-Technology (RST) angebunden.

Mit einer schnellen SanDisk-SSD mit 120 GB haben wir einen kleinen Test gemacht, wie sich die USB-3.0-Performance von X99 im Vergleich zu X79 mit einem zusätzlichen USB-3.0-Controller schlägt. Gemessen wurde die sequentielle Schreib- und Leserate mit Atto bei unterschiedlichen Blockgrößen:

usb3 performance x99usb3 performance x79 

USB 3.0 Performance Vergleich:
Links: Intel X99, Rechts: Intel X79 mit Zusatzchip

Wie man sehen kann, ist der im X99-Chipsatz integrierte USB-3.0-Controller genau so schnell wie der Zusatzchip unseres ASUS P9X79. Unterschiede gibt es fast keine. 

Alle anderen Bereiche sind auf dem Diagramm praktisch unverändert. Intels Rapid-Storage-Technology ist natürlich mit an Board wie beim Z77-Chipsatz mit Rapid Start Technology, die das Booten von Windows-Systemen beschleunigen kann, indem Suspend-to-RAM und Suspend-to-Disk kombiniert wird. Notwendig hierfür ist eine SSD, auf die das System den RAM-Inhalt ablegen kann, um ihn dann nach dem Aufwecken des Systems wieder zurückzuspielen.


Eines der größten Highlights der neuen X99-Plattform dürfte die erstmalige Unterstützung von DDR4-Speicher im Desktop-Segment sein. Standardmäßig unterstützen alle drei neuen "Haswell-E"-Prozessoren DDR4-Speicher mit einer Geschwindigkeit von 2.133 MHz. Über weitere Speicher-Teiler können die Mainboard-Hersteller aber noch schnellere Module unterstützen. ADATA, Corsair und G.Skill haben bereits etliche Module und Kits angekündigt, die Geschwindigkeiten von 2.133, über 2.400 und 2.800 bis hin zu satten 3.200 MHz ermöglichen sollen. Im Vergleich zu DDR3, der teils scharfe Timings von CL9 ermöglichte, sind die Zugriffszeiten der ersten DDR4-Module nicht ganz so scharf und liegen meist bei CL16 oder CL15. Dies dürfte sich im Laufe der Zeit aber ändern, war dies beim Wechsel früherer Generationen doch ähnlich.

Dafür sollen die neuen Module dank einer Speicherspannung von 1,2 Volt deutlich sparsamer arbeiten als ihre DDR3-Vorgänger. Einige Module mancher Hersteller benötigen bei hohen Frequenzen allerdings etwas mehr Spannung. Bis zu 1,35 Volt werden hier verlangt.

intel i7 5960x test-20
Die X99-Plattform ist die erste Plattform im Desktop-Segment, die neuen DDR4-Speicher verlangt. 

Wie bei jeder neuen Speichergeneration üblich, erreichen die ersten Module aufgrund der teils deutlich entschärften Zugriffszeiten nicht ganz die Performance der Vorgänger-Generation. Die Speicherbandbreite unseres Intel Core i7-5960X liegt nur wenige Megabyte unterhalb der eines Intel Core i7-4960X und das obwohl die Taktraten zumindest auf dem Papier mit 2.133 zu 1.866 MHz ein höheres Ergebnis versprechen. Trotzdem profitiert "Haswell-E" von einem hohen Speichertakt, wie unsere nachfolgenden Benchmarks zeigen:

SiSoft Sandra 2012

Speicherbandbreite

GB/Sek.
Mehr ist besser

SiSoft Sandra 2012

Speicherbandbreite

GB/Sek.
Mehr ist besser

7-Zip 32M

MIPS
Mehr ist besser
 

7-Zip 32M

MIPS
Mehr ist besser

intel i7 5960x test-20
Damit DDR4-Module nicht in eine falsche Speicherbank gesteckt werden können, sind die Pin anders angeordnet.

Auf den ersten Blick ist DDR4-Speicher nicht von einem DDR3-Modul zu unterscheiden. Legt man die neue Generation der alten aber gegenüber, stellt man fest, dass die Pins anders angeordnet wurden und deren Anzahl erhöht wurde. Damit sich die Module einfach in die Speicherbank stecken lassen, sind die mittleren Pins etwas größer als die äußeren. Unser Speichermodul auf dem Foto ist also nicht kaputt. Die Zahl der Pins steigt von 240 Pins bei DDR3 auf 288 Pins bei DDR4.

memory


Die Testsysteme haben wir neu aufgebaut - entsprechend kommen bei diesem Vergleich die neuesten Treiber und Systemupdates zum Einsatz. Für alle Systeme haben wir eine Basisausstattung verwendet, die möglichst identisch belassen wurde. Ändern müssen wir natürlich neben der CPU das Mainboard und teilweise auch die Speicherausstattung. Folgende Basiskomponenten sind für alle Systeme identisch:

Für die Haswell-Modelle und kompatible Sockel-1150-Prozessoren setzten wir folgende Konfigurationen ein:

Für die Haswell-Refresh-Modelle setzten wir folgende Konfiguration ein:

Für die Ivy-Bridge-Modelle und kompatible Sockel-1155-Prozessoren setzten wir folgende Konfiguration ein:

Für den mitgetesteten Sockel 2011 setzten wir folgende Konfiguration ein:

Für den mitgetesteten Sockel 2011-v3 setzten wir folgende Konfiguration ein:

Für die mitgetesteten AMD-Modelle setzten wir folgende Konfiguration ein:

Als Software setzten wir Windows 8 64 bit ein, jeweils mit aktuellstem Service-Pack, Treibern und Benchmark-Versionen. Wir verwendeten für alle Systeme als Timings 9-9-9-24 1t, auch wenn dies von den Herstellern anders vorgesehen wird (z.B. Ivy Bridge: 11-11-11 2t mit vier Speichermodulen, 11-11-11- 1t mit zwei Speichermodulen), um Timing-Unterschiede möglichst nicht zu berücksichtigen.

Wie man sehen kann, haben wir einheitlich auf ASUS-Mainboards gesetzt. Hierbei ist jedoch teilweise durch eine automatische Übertaktung im Bios eine manuelle Turbo-Frequenz-Einstellung notwendig. Bei "Auto"-Settings setzt ASUS gerne mal auch für Volllast den höchsten Single-Core-Multiplikator an und übertaktet so automatisch die CPU. Diesen Effekt wollten wir hier natürlich nicht haben und setzten, sofern ASUS dies bei den Mainboards entsprechend umgesetzt hat, die Turbo-Frequenz manuell auf die von Intel spezifizierten Werte. Sofern möglich wurden alle Prozessoren mit bestmöglichen Einstellungen und aktiviertem Stromsparbetrieb betrieben.


Neue Stromspartechniken hin, 22-nm-Technik her - wichtig ist, was am Ende auf dem Tacho steht. Wir haben unser Komplettsystem einmal im Windows-Idle-Betrieb und einmal mit Prime 95 unter Volllast getestet, um herauszufinden, wie sich der Stromverbrauch von "Haswell-E" im Verbrauch zur Vorgängergeneration und anderen Prozessormodellen verändert hat. Wir verwenden dabei die Testsysteme, die wir auch für die Benchmarks verwendet haben (siehe Beschreibung auf der Seite "Testsystem"). Gemessen wird hier das Komplettsystem, inklusive einer Radeon-HD-7970-Grafikkarte. Der Stromverbrauch wird an der Steckdose gemessen, enthalten sind also auch Wirkungsverluste des Netzteils, wobei wir mit dem Seasonic P-660 ein sehr sparsames Modell mit 80Plus-Platinum-Zertifikat eingesetzt haben.

Im normalen Windows-Betrieb siedelt sich die neue Plattform knapp unterhalb der Vorgänger-Generation an. Unser Testsystem zog in dieser Disziplin 60,9 Watt Watt aus der Steckdose, während sich ein Intel Core i7-4960X mit X79-Mainboard noch 61,6 Watt genehmigte. Beim Intel Xeon 2687W waren es hingegen 63,6 Watt. Der Server-Prozessor besitzt ebenfalls acht Rechenkerne, entspringt aber noch der "Sandy Bridge"-Architektur. Zu erwähnen ist hier, dass das ASUS X99 Deluxe sehr gut ausgestattet ist und sogar ein WLAN- und Bluetooth-Modul mit an Bord hat.

Leistungsaufnahme (Gesamtsystem)

Idle

in Watt
Weniger ist besser

Auch die Leistungsaufnahme unter Last kann sich sehen lassen. Hier scheinen sich die Stromsparmechanismen und Optimierungen der "Haswell"-Architektur sowie der vergleichsweise geringe Takt des Intel Core i7-5960X bemerkbar zu machen. Unser Testsystem zeigte sich mit einer Gesamtleistungsaufnahme von 207,4 Watt etwas sparsamer als mit X79-Mainboard und Intel Core i7-4960X. Die Vorgänger-Plattform genehmigte sich hier mit 240,1 Watt 37 Watt mehr. Der achtkernige Xeon übertrumpft das Ganze noch mit 268,1 Watt, der "Sandy Bridge-E"-Vorgänger sogar mit bis zu 274,4 Watt.

Leistungsaufnahme (Gesamtsystem)

Last

in Watt
Weniger ist besser

Unser ASUS X99 Deluxe ist eines der bestausgestatteten X99-Mainboards, die es zum Start der neuen "Haswell-E"-Prozessoren zu kaufen geben wird. Wireless-LAN, Dual-Gigabit-Ethernet und Bluetooth 4.0 gehören hier zur Grundausstattung. Wir haben im nächsten Schritt zunächst alle nicht benötigten USB- und SATA-Ports abgestellt, den Onboard-Sound deaktiviert und auf alle anderen für den Test nicht benötigten Komponenten verzichtet. 

Sind alle nicht benötigten Komponenten des Mainboards abgestellt, so geht die Leistungsaufnahme unseres Testsystems um etwa neun Watt zurück. Das größte Sparpotential bekommt man dann, wenn man die Plattform mit nur einem einzigen DDR4-Modul betreibt. Dann spart man über 46 Watt. Erstaunlich! Vermutlich schaltet die CPU bei der Bestückung von weniger als vier Speichermodulen Teile des Speichercontrollers ab, um Strom zu sparen. Sobald der zweite Riegel aktiviert ist, schaltet sich wohl der zweite Controller hinzu, was den gewaltigen Anstieg der Leistungaufnahme erklären würde. Während acht Watt für ein DDR4-Modul da noch plausibel klingen, erscheinen die 30 Watt beim Wechsel von vier auf nur drei Module viel zu hoch - das wäre fast schon auf dem Niveau von Rambus-Speicher.

Ähnliche Ergebnisse konnten wir mit einem Gigabyte X99-UD7 WIFI samt einer Radeon HD 7850 feststellen, wenngleich die Differenz nicht ganz so groß war, aber in die gleiche Richtung abzielte. Mit vier DIMMs erreichte das System eine Leistungsaufnahme von bis zu 173,2 Watt. Mit drei bzw. zwei DIMMs senkte sich der Energiehunger auf 168,4 bzw. 156,6 Watt und mit nur noch einem Speicherriegel auf 134,6 Watt. Die Messung der Leistungsaufnahme am Gesamtsystem ist nicht die beste, vor allem aber genauste Methode. Dennoch gibt es einen ersten groben Ausblick.

Leistungsaufnahme (Gesamtsystem)

Last

in Watt
Weniger ist besser

Im nächsten Schritt haben wir überprüft, wie sich die Leistungsaufnahme im Hinblick auf die anliegende Vcore verändert. Bei Standardspannung von etwas weniger als 1,1 Volt genehmigt sich die CPU knapp über 210 Watt. Bei nur 0,95 Volt sind es knapp unter 175 Watt, bei satten 1,45 Volt fast 345 Watt. Insgesamt steigt die Leistungsaufnahme etwas stärker an als beim Intel Core i7-4770K.

leistungsaufnahme k

Auf den nachfolgenden Seiten jagen wir unseren Intel Core i7-5960X durch unseren altbewährten Benchmark-Parcours.


Wir beginnen mit einigen synthetischen CPU-Benchmarks:

SiSoft Sandra

Speicherbandbreite

GB/Sek.
Mehr ist besser

Auch wenn der neue DDR4-Standard auf dem Papier mit 2.133 zu 1.866 MHz die deutlich höheren Taktfrequenzen als die Vorgänger-Generation hat, fällt die Speicherbandbreite nicht wirklich höher aus. Im Gegenteil: Mit 46,29 GB/Sek. liegt die Speicherbandbreite knapp 200 MB unterhalb von "Ivy Bridge-E". Dies ist wohl auf die doch sehr hohen Speicherlatenzen zurückzuführen. In den kommenden Monaten wird sich das mit Sicherheit aber ändern. Im Vergleich zu "Haswell" fällt die Speicherbandbreite dank des Quad-Channel-Interfaces aber deutlich höher aus: Ein Intel Core i7-4790K bringt es in dieser Disziplin auf 21,52 GB/Sek.

SiSoft Sandra

Cache und Speicher

GB/Sek.
Mehr ist besser

Anders sieht es bei Cache und Speicher aus. Hier belegt der Intel Core i7-5960X mit 327,71 GB den ersten Platz. Rang 2 und 3 drei belegen die Achtkern-CPUs auf "Sandy Bridge-E"-Basis und der "Ivy Bridge-E"-Vorgänger mit sechs Kernen. Sie bringen es auf 255,0 und 234,7 GB in der Sekunde.

SiSoft Sandra

Kryptografie

GB/Sek.
Mehr ist besser

Die zusätzlichen Rechenkerne machen sich auch im Kryptografie-Test bemerkbar. Hier liegen die beiden Achtkern-Prozessoren klar in Führung, wobei unser heutiger Testkandidat mit 14,16 GB/Sek. in Führung liegt. Der Intel Xeon E5-2687W und der Intel Core i7-4960X siedeln sich mit 14,00 und 9,12 GB/Sek. dahinter an.

SiSoft Sandra

Arithmetik

GOPS
Mehr ist besser

Der Arithmetik-Test profitiert einerseits von einer möglichst hohen Taktanzahl, andrerseits von hohen Taktraten, denn unsere Server-CPU liegt mit ihren acht Kernen und Taktraten von bis zu 3,8 GHz klar in Führung, gefolgt vom Intel Core i7-5960X mit maximal 3,5 GHz.

wPrime v2.09

1024M

Sekunden
Weniger ist besser

Leistungsmäßig große Unterschiede zwischen den beiden Achtkern-Modellen gibt es hier nicht, wobei die neue "Haswell-E"-Generation leicht die Nase vorne hat.

TruCrypt 7.1a

50 MB

MB/Sek.
Mehr ist besser

Bei TrueCrypt erreicht der neue Intel Core i7-5960X 396 MB in der Sekunde und sichert sich damit abermals den ersten Platz in unseren Benchmarks-Charts. 


Wir starten mit den Anwendungs-Benchmarks:

Cinebench R11.5

Punkte
Mehr ist besser

Dank der acht Kerne und einer Taktrate von bis zu 3,5 GHz sichert sich der Intel Core i7-5960X auch im altbekannten Cinebench-Benchmark klar den ersten Platz, dicht gefolgt von unserer zweiten Achtkern-CPU, dem Intel Xeon E5-2687W, der es in dieser Disziplin auf immerhin 12,95 Punkte bringt. 

Frybench

Minuten
Weniger ist besser

Auch im Frybench-Benchmark sind die beiden Achtkern-Modelle die schnellsten Prozessoren unseres Testfeldes.

Gimp 2.8

Filtertest

Sekunden
Weniger ist besser

Was auch für unseren Filtertest des Bildbearbeitungsprogrammes Gimp gilt. Hier sichert sich allerdings wieder die Server-CPU den Sieg.

x264 HD Benchmark

32 Bit – Test 1

FPS
Mehr ist besser

x264 HD Benchmark

32 Bit – Test 2

FPS
Mehr ist besser

Keine großen Überraschungen gibt es beim x264-Benchmark. Hier liegt der Intel Core i7-5960X jeweils in Führung, gefolgt von der Server-CPU und seinem direkten "Ivy Bridge-E"-Vorgänger.


PoV Ray

Sekunden
Weniger ist besser

Der PoV-Benchmark scheint wohl vor allem von hohen Taktraten zu profitieren, denn hier spielt der Intel Core i7-4790K mit seinen 4,0 bis 4,4 GHz auf den vordersten Rängen und schlägt selbst unsere beiden Achtkern-Modelle, die sich mit bis zu 3,5 bis 3,8 GHz ans Werk machen. Groß sind die Abstände auf den vordersten Rängen aber nicht. 

WinRar

Komprimierung

Sekunden
Weniger ist besser

Beim Komprimierungstest von WinRar liegen die Mehrkern-Prozessoren ab der Hexa-Core-Klasse sowie die schnellsten Quad-Core-Modelle dicht beieinander auf dem ersten Platz. Mit gerade einer Sekunde Vorsprung sichert sich aber auch hier der neue Intel Core i7-5960X den ersten Platz. 

7-Zip

32M

MIPS
Mehr ist besser

7-Zip ist ebenfalls eine Paradedisziplin für Prozessoren mit besonders vielen Kernen. Hier liegen unsere beiden Achtkern-Prozessoren klar auf den vordersten Rängen.


Weiter geht es mit diversen Spielen und dem 3DMark 2011:

3DMark und 3DMark 11

Auch die neueste Generation des 3DMark wollen wir mit in den Benchmark-Parcours aufnehmen. Beim 3DMark 11 handelt es sich um den ersten vollständigen DirectX-11-Benchmark aus dem Hause Futuremark. Aus diesem Grund macht er auch ausgiebig Gebrauch von Tessellation, Depth of Field, Volumetric Lighting und Direct Compute. Obligatorisch ist natürlich auch die Unterstützung für Multi-Core-Prozessoren mit mehr als vier Kernen. Der Download ist in unserer Download-Area möglich.

3dmark11_2_rs 3dmark11_1_rs
3dmark11_4_rs 3dmark11_3_rs

Zum kostenlosen Download von Futuremarks 3DMark 11 gelangt man über diesen Link.

Futuremark 3DMark 11

Performance

Futuremark-Punkte
Mehr ist besser

Futuremark 3DMark

Cloud Gate

Futuremark-Punkte
Mehr ist besser

Zumindest was die Spieleleistung in synthetischen Benchmarks anbelangt hat hier die neue "Haswell-E"-Generation ebenfalls klar die Nase vorn im Vergleich zu "Ivy Bridge-E". Einzig im neuen 3DMark muss sich der Intel Core i7-5960X der achtkernigen Server-CPU geschlagen geben. 

FarCry 3

Der neuste Teil der Far-Cry-Serie basiert auf der Dunia Engine 2 und wurde von Ubisoft entwickelt. Es entführt den Spieler auf eine tropische Insel, wo er den Protagonisten Jason Brody spielt, der dort mit seinen Freunden Urlaub macht. Als er und seine Freunde von Piraten gefangen werden, gelingt es ihm als einzigen zu entkommen. Mit Hilfe der einheimischen Bevölkerung tritt er nun an, um seine Freunde zu retten und die Piraten zu besiegen. Far Cry 3 kann wie auch die ersten beiden Teile mit einer beeindruckenden Grafik überzeugen. Dabei kommt DirectX 11 in Verbindung mit Kantenglättung, Umgebungsverdeckung und schönen Texturen sowie einer hohen Detaildichte zum Einsatz, womit auch High-End-Grafikbeschleuniger an ihre Grenzen gebracht werden.

Screenshot zu Far Cry 3 Screenshot zu Far Cry 3
Screenshot zu Far Cry 3 Screenshot zu Far Cry 3

Zur Vollversion von Far Cry 3 gelangt man über diesen Link.

Far Cry 3

800x600, kein AA, niedrig

Bilder pro Sekunde
Mehr ist besser

Far Cry 3

1920x1080, Ultra

Bilder pro Sekunde
Mehr ist besser

Anders sieht es bei Far Cry 3 aus. Hier rechnet "Haswell-E" etwas langsamer als "Ivy Bridge-E" oder teils auch langsamer als die schnellsten "Haswell"- und "Haswell Refresh"-Prozessoren. Das ist wohl auf die vergleichsweise geringen Taktraten von maximal 3,5 GHz zurückzuführen. Der Intel Core i7-4790K rechnet hier vor allem unter FullHD mit seinem 4,0 bis 4,4 GHz ein gutes Stück schneller. Gravierend sind die Unterschiede allerdings nicht.

 

Anno 2070

Anno 2070 spielt entgegen seiner vier Vorgänger nicht mehr in der Vergangenheit sondern knapp 60 Jahre in der Zukunft. Das Spielprinzip blieb grundsätzlich gleich, das heißt fremde Inseln erkunden, besiedeln, Wirtschaftskreisläufe aufbauen, um die Bedürfnisse der unterschiedlichen Bevölkerungsteile zu befriedigen, und sich in der Diplomatie üben. Neu sind die drei Fraktionen: Die Ecos setzen auf regenerative Energie und erhalten die Natur, während ihr Gegenpart, die Tycoons, durch Schwerindustrie die Umwelt verschmutzen. Die dritte Fraktion, die Techs, ermöglicht es, neue Techniken zu nutzen und auf dem Meeresboden zu siedeln. Die großen Inseln, die lebendige Flora und Fauna und die fantastischen Wassereffekte der eigens von Related Designs entwickelten Engine (DX11) verlangen auf der höchsten Detailstufe der Grafikkarte einiges ab.

 
 

Zur Vollversion von Anno 2070 in unserem Preisvergleich gelangt man über diesen Link.

Anno 2070

1024x768. kein AA. niedrig

Bilder pro Sekunde
Mehr ist besser

Anno 2070

1920x1080, 4xAA, hoch

Bilder pro Sekunde
Mehr ist besser

Gleiches gilt für Anno 2070...


Black Ops 2 ist der letzte und aktuellste Teil der "Call of Duty"-Reihe, die nun aber eine Überarbeitung erfahren soll. Die Welt befindet sich inmitten eines zweiten kalten Krieges zwischen der Volksrepublik China und den Vereinigten Staaten um die kostbaren Metalle der Seltenen Erden. Das Verbot des Exports verleitet die USA dazu, mit einem Cyberangriff die chinesische Börse lahmzulegen. Es kommt zum Konflikt zwischen den beiden Parteien, der allerdings nicht offen ausgefochten wird.

Screenshot zu Call of Duty: Black Ops 2 Screenshot zu Call of Duty: Black Ops 2

Screenshot zu Call of Duty: Black Ops 2 Screenshot zu Call of Duty: Black Ops 2

Zur Vollversion von Call of Duty: Black Ops 2 gelangt man über diesen Link.

Call of Duty: Black Ops II

800x600, kein AA, niedrig

Bilder pro Sekunde
Mehr ist besser

Call of Duty: Black Ops II

1920x1080, 8xMSAA, hoch

Bilder pro Sekunde
Mehr ist besser

... und Call of Duty: Black Ops II ...

Metro 2033

Eine unwirtliche und verstrahlte Umwelt, Mutanten und ständige Bedrohungen - all diese Elemente nutzen die Ex-S.T.A.L.K.E.R. Entwickler 4A Games Studios, um den Spieler in die Welt von Metro 2033 zu entführen. Im Jahr 2033 hat sich die Menschheit mal wieder bekriegt und durch einen Atomschlag gegenseitig fast in die Luft gebombt. Eine Hand voll Überlebende hat sich in die Systeme der Moskauer U-Bahn zurückgezogen, um dort Zuflucht zu suchen. Zum Leidwesen der Flüchtlinge ist dieser Ort nicht ihre alleinige Heimat, auch feindselige Kreaturen, die sich an die giftige Atmosphäre gewöhnt haben, sind dort anzutreffen. Ihr Ziel: die verbleibenden Menschen ausrotten! Ob sie nun rohe Gewalt oder ausgeklügelte Taktik anwenden, es bleibt ihnen überlassen, wie sie das Ziel erreichen. Wie schon bei ihrem Erstlingswerk schaffen die Entwickler eine Wahnsinnsatmosphäre und lassen mit der A4-Engine (DX11) selbst moderne Grafikkarten an ihre Grenzen kommen.

Metro_1_rs Metro_2_rs
Metro_3_rs Metro_4_rs

Zur Vollversion von Metro 2033 in unserem Preisvergleich gelangt man über diesen Link.

Metro 2033

1920x1080, 4xAA, High, DX11

Bilder pro Sekunde
Mehr ist besser

... sowie für Metro 2033.

 

The Elder Scrolls V: Skyrim

Der fünfte Teil der The-Elder-Scroll-Reihe spielt in der namensgebenden Provinz Skyrim (dt. Himmelsrand). Die Handlung dreht sich um die Rückkehr der Drachen, wie sie in den "Elder Scrolls" vorhergesagt wurde. Der Spieler übernimmt die Rolle eines "Dovahkiin", eines Individuums mit dem Körper eines Menschen und der Seele eines Drachen. Der Spieler durchstreift bei dem Kampf gegen die Drachen opulente Städte mit verschlungenen Gassen und atemberaubende Landschaften, deren Grenze buchstäblich der Himmel ist. Mit seiner hohen Weitsicht und der detaillierten Vegetation bringt Skyrim so manches System ins Schwitzen.

Crysis1_rs Screenshot zu The Elder Scrolls V Skyrim
Screenshot zu The Elder Scrolls V Skyrim Screenshot zu The Elder Scrolls V Skyrim

Zur Vollversion von Elder Scrolls V: Skyrim gelangt man über diesen Link.

The Elder Scrolls V: Skyrim

1280x720, kein AA, niedrig

Bilder pro Sekunde
Mehr ist besser

The Elder Scrolls V: Skyrim

1920x1080, 8xFXAA, hoch

Bilder pro Sekunde
Mehr ist besser

Wie schon bei allen anderen Spiele-Benchmarks gibt es auch nichts anderes für The Elder Scrolls V: Skyrim zu sagen.


Abschließend an die Benchmarks möchten wir noch das Performance-Ranking aufzeigen. Darin haben wir alle Benchmarks berücksichtigt und gleich gewichtet. Als Basis diente dabei der jeweils langsamste Prozessor eines jeden Benchmarks. Die normierten Werte lassen den neuen Intel Core i7-5960X klar an die Spitze setzen. Selbst der ältere Achtkern-Prozessor auf "Sandy Bridge-E"-Basis ist langsamer. "Haswell-E" ist etwas elf Prozent schneller als sein Vorgänger. Die AMD-Prozessoren sind klar abgeschlagen. 

Performancerating

normalisiert

Mehr ist besser


Auf dieser Seite schauen wir uns das Performance-pro-Watt-Verhältnis der Prozessoren an. Hierfür haben wir die Leistung über allen Benchmarks in einen Index zu gleichen Teilen einfließen lassen und zur Leistungsaufnahme unter Last in Bezug gestellt. Das Ergebnis: Das Performance-pro-Watt-Verhältnis des Intel Core i7-5960X hat sich im Vergleich Core i7-4960X deutlich verbessert und zieht in dieser Disziplin mit einem Intel Core i7-4790K nahezu gleich. Nur der Intel Core i7-4770K und Intel Core i5-4760K liefern noch bessere Werte.

Performance-pro-Watt-Index

normalisiert

Mehr ist besser


Was bringt ein schneller Prozessor, wenn man ihn sich nicht leisten kann? Wir haben einen Blick in unseren Preisvergleich geworfen und die aktuellen Straßenpreise aller Prozessoren des Testfeldes miteinander verglichen. Gezählt wurde jeweils die günstigste Boxed-Version in unserem Preisvergleich in Deutschland. 

Zu beachten ist allerdings, dass sich die Preise meistens ein paar Tage nach dem Launch zugunsten der Neuvorstellungen verschieben, da die Shops die geringe Anzahl an lagernden Produkten zunächst zu einem höheren Preis an die Early Adopter verkaufen. Der Preis passt sich im Anschluss an.

Preis-Übersicht

Stand: 22. August 2014

in Euro
Weniger ist besser

Preis-Leistungs-Index

Stand: 22. August 2014

Mehr ist besser

Mit einem Preis von etwa 1.615 Euro ist die Server-CPU der teuerste Prozessor des Testfeldes und liegt damit in Sachen Preis-Leistung auf dem letzten Rang - dicht gefolgt von unserem heutigen Testkandidat und seinem Vorgänger sowie den "Sandy Bridge-E"-Prozessoren. Insgesamt bietet der Intel Core i7-4790K das beste Preis-Leistungs-Verhältnis. 


Keine Frage, der Intel Core i7-5960X gehört zu den schnellsten Prozessoren, die man aktuell für den Desktop kaufen kann. Doch wir wären nicht Hardwareluxx, wenn wir uns damit schon zufriedengeben würden. Wir haben dem neuen "Haswell-E"-Flaggschiff noch weiter eingeheizt und ihn im Overclocking-Test noch weiter beschleunigt. Unseren OC-Test haben wir dabei dreigeteilt und das Testmuster in drei verschiedenen Spannungs-Einstellungen an seine Leistungsgrenzen gezwungen. 

Im ersten Schritt loteten wir den höchst möglichen Takt mit Standard-Spannung aus, also etwa 1,080 Volt. Nach zahlreichen Belastungs- und Leistungstest konnten wir hier unserem Intel Core i7-5960X auf allen acht Kernen 3,9 GHz entlocken. Im zweiten Teil erhöhten wir die Spannung auf 1,35 Volt und suchten erneut nach den höchst möglichen Frequenzen. Am Ende standen hier 4,3 GHz auf dem Zähler. Mit noch einmal 0,05 Volt mehr erreichten wir weitere 100 MHz mehr.

cpuz i7 5960x oc1cpuz i7 5960x oc2

Insgesamt lässt sich der Intel Core i7-5960X damit sehr gut übertakten. Im Vergleich zum Basis-Takt gibt es immerhin ein Plus von 1,4 GHz, im Vergleich zum größten Turbo-Takt stehen am Ende 900 MHz mehr auf dem Tacho.

cpuz i7 5960x oc3 

Gleichzeitig wollen wir an dieser Stelle noch einmal auf unser Diagramm zur Leistungsaufnahme in Abhängigkeit der Spannung verweisen:

leistungsaufnahme k

Leistungsmäßig hatte unser maximales Overclocking wie folgt Auswirkung:

Cinebench R11.5

Punkte
Mehr ist besser

Futuremark 3DMark 11

Performance

Futuremark-Punkte
Mehr ist besser

Frybench

Minuten
Weniger ist besser

TruCrypt 7.1a

50 MB

MB/Sek.
Mehr ist besser

x264 HD Benchmark

32 Bit – Test 1

FPS
Mehr ist besser

x264 HD Benchmark

32 Bit – Test 2

FPS
Mehr ist besser


Neben unserem klassischen Benchmark-Parcours sowie den ersten OC-Tests werden die neuen "Haswell-E"-Prozessoren auch von ambitionierten Overclockern heiß erwartet. Natürlich hatten auch die BenchBros die Möglichkeit, sich etwas mit den neuen Prozessoren und dem dazugehörigen Chipsatz zu beschäftigen. Eine erst Erkenntnis ist dabei: Gute Modelle des Intel Core i7-5960X können bei allen acht aktiven Kernen in etwa 5.500 bis 5.600 MHz erreichen. Bereits bei ersten Tests schafften die BenchBros 5.750 bis 5.800 MHz und das auf einem MSI X99 SLI PLUS ohne deaktivierte Over-Current-Protection (OCP) und ohne große Optimierungen seitens des Board-Designs. Bei der Handhabung in Sachen Kühlung sind dabei keinerlei große Unterschiede zu den "Haswell"-Modellen auszumachen. Der Cold-Bug ist auch hier in typischen Bereichen zwischen -95 und -130 °C zu finden - abhängig von der CPU und der jeweils anliegenden Spannung.

Sollen oder müssen nicht alle acht Kerne des Core i7-5960X verwendet werden, ergibt sich doch eine Änderung zu den "Haswell"-Modellen, denn bei "Haswell-E" lässt sich jeder Kern einzeln abschalten. Man kann also Core0 bis Core 7 in einer beliebigen Reihenfolge und Anzahl auswählen, ohne dass dabei der Core0 immer aktiv sei muss, wie dies bei "Haswell" der Fall ist. Sollen also für eine bestimmte Benchmark-Kategorie nur ein oder zwei Kerne aktiv sein, können die besten Kerne frei gewählt werden. Allerdings eignet sich der Core i7-5960X nicht sonderlich für diese Disziplin, denn meist ist man selbst bei nur 1-2 aktiven Kernen weit vom Takt einer "Ivy-Bridge-E"-CPU emtfernt. 6.250 MHz konnten die BenchBros bei einem aktiven Kern erreichen - es sind also alle acht Kerne notwendig, um in dazugehörigen Benchmarks entsprechende Ergebnisse zu erreichen.

Intel Core i7-5960X unter LN2 (Bild: BenchBros)
Intel Core i7-5960X unter LN2 (Bild: BenchBros).

Ein paar Worte zur Methode der BenchBros, um aus mehreren Modellen des Core i7-5960X die besten herauszufiltern. Dazu werden die CPUs mit 4.800 MHz und allen acht aktiven Kernen gebootet. Mit möglichst geringer CPU-Spannung wird danach versucht in das Windows zu booten. Dabei wird noch nicht eine Kühlung mittels flüssigem Stickstoff verwendet, sondern unter Luft getestet. Typischerweise ist dabei eine Spannung von 1,25 und 1,43 Volt notwendig, wobei hier natürlich eine möglichst geringe Spannung das Ziel ist.

In einer zweiten Benchmark-Session konzentrierten sich die BenchBros besonders auf 2D-Scores. Dabei lief der Core i7-5960X mit Taktraten von 5.800+ MHz. Der Arbeitsspeicher rechnete hingegen mit einer Geschwindigkeit von 2.666 MHz bei Timings von CL11-12-12-28-260-1T - zum RAM später aber noch etwas mehr. Die internen Caches liefen mit 3.750 MHz - aber sowohl für den Ringspeicher als auch den Arbeitsspeicher sehen die BenchBros noch Luft. Weiterhin limitiert wird der Prozessoren durch die OCP des Boards. Das Limit lässt sich auf 63 Ampere einstellen, ein neues BIOS soll hier aber 127 Ampere ermöglichen, was deutlich mehr Luft lässt. Wie stark die OCP eingreift, zeigen folgende Ergebnisse:

Man kann gut erkennen, dass der fehlende Strom der Grund für die Limitierung ist und nicht etwa das Potenzial des Prozessors ausgeschöpft ist. Um sich die Werte einmal vor Augen zu führen: Wir reden hier über 63 Ampere auf der Eingangsseite der Spannungsversorgung (PWM) des Boards. Das Board hat nur einen 8-Pin-12V-Anschluss. Wenn man mal den Wirkungsgrad der PWM pessimistisch mit 80 Prozent annimmt, sind das (63 Ampere x 12 Volt) * 0,8 = 604 Watt. Rechnet man diese Leistung auf die anliegenden 1,68 Volt herunter, fließen im Prozessor Ströme von etwa 360 Ampere - unglaubliche Werte im Vergleich zu anderer (Mikro)-Elektronik.

Tests mit erweiterter OCP stehen noch aus. Die BenchBros rechnen damit, den Prozessor bei 1,75 Volt betreiben zu können, so dass ein Takt von 5.900 bis 6.000 MHz realistisch sein könnte.

Intel Core i7-5960X unter LN2 (Bild: BenchBros)
Intel Core i7-5960X unter LN2 (Bild: BenchBros).

Noch wenig erbauend sind die Erkenntnisse zum DDR4-Speicher, allerdings müssen hier noch weitere Tests folgen. DDR4-3335 mit CL16 konnten die BenchBros validieren. DDR4-3000 liefen auch mit CL12 im SuperPI 32M, allerdings war der Durchsatz derart gering, dass ein Vergleich zu den guten Ergebnisse mit DDR3 nur wenig Sinn macht. Offenbar arbeitet Intel hier noch am Micro-Code, der erst in die BIOS-Versionen der Mainboards einfließen muss. Zudem arbeitet der Ring-Takt ab einem gewissen RAM-Takt nicht mehr mit dem maximalen Mutliplikator, sondern senkt sich auf x12, was dem Durchsatz natürlich nicht sonderlich gut tut.


Mit dem Intel Core i7-5960X und dem dazugehörigen X99-Chipsatz hat Intel seine High-End-Plattform konsequent weiter entwickelt. Der Wechsel auf die aktuellere Architektur bringt nicht nur leistungsmäßig Vorteile, sondern auch bei der Energieeffizienz. Trotz der erstmals acht Kerne im Desktop kann sich die Leistungsaufnahme sowohl im 2D-Betrieb wie auch im 3D-Betrieb sehen lassen und stellt den Vorgänger vor allem unter Last in den Schatten. "Haswell-E" spart im Vergleich zu "Ivy Bridge-E" unseren Tests zufolge fast 30 Watt beim Gesamtsystem ein.

Leistungsmäßig braucht sich "Haswell-E" natürlich vor niemanden zu verstecken, führt das neue Desktop-Topmodell unsere Benchmarks doch fast immer an. Hier und da muss sich der Intel Core i7-5960X allerdings unserem zweiten Achtkern-Prozessor, dem Intel Xeon E5-2687W, geschlagen geben, der allerdings noch der "Sandy Bridge"-Generation entspringt, aber etwas höher getaktet ist. Vor allem aber bei Spielen muss das "Haswell-E"-Flaggschiff Federn lassen, was in erster Linie an den vergleichsweise niedrigen Taktraten von 3,0 bis 3,5 GHz liegt. Der Quadcore-Prozessor, Intel Core i7-4790K, mit seinen 4,0 bis 4,4 GHz zaubert hier je nach Einstellung und Spiel ein paar mehr Bilder in der Sekunde auf den Bildschirm. Gravierend sind die Unterschiede jedoch nicht.

Musste der X79-Chipsatz der Vorgänger-Generation noch mithilfe von Zusatzchips um USB 3.0 erweitert werden, sind die modernen USB-Anschlüsse nun serienmäßig mit dabei. Mit zehn SATA-III-Ports gibt es auch eine größere Anzahl an Serial-SATA-Steckplätzen. Größtes Highlight der X99-Plattform ist aber die Verwendung von DDR4-Speichermodulen, die damit erstmals im Desktop-Segment ihren Einsatz finden. Wie bei jedem Generationswechsel in Sachen Arbeitsspeicher üblich, sind hier aufgrund der teils sehr entschärften Timings allerdings keine großen Sprünge zu erwarten. Unsere Testplattform mit 2.133 MHz schnellen DDR4-Speicher und Timings von CL15 erreichte nur knapp das Niveau des Vorgängers, der mit 1.866 MHz schnellen DDR3-Speicher samt Timings von CL9 bestückt war. Insgesamt aber profitiert "Haswell-E" von hohen Taktraten und zeigt sich von den angelegten Timings fast schon gänzlich unbeeindruckt. Mit 2.800 MHz schnellen Modulen wird die 50-GB-Marke bei der Speicherbandbreite durchbrochen.

Doch mit der eigentlich nicht schlechten Leistung gaben wir uns nicht zufrieden und drehten im Overlcoking-Test weiter an den Taktreglern. Mit Spannungserhöhung auf 1,4 Volt konnten wir unser Testmuster des Intel Core i7-5960X mit 4,4 GHz betreiben und damit die CPU von ehemals 3,0 bzw. 3,5 GHz ordentlich beschleunigen. Overclocking ist allerdings immer Glückssache, weshalb unser Ergebnis lediglich als erster Richtwert anzusehen ist.

Der Preis aber dürfte viele potentielle Kunden vom Kauf abschrecken. Alleine für den Prozessor werden etwa 1.000 Euro fällig, für den DDR4-Speicher nochmals etwa 250 Euro, für das Mainboard etwa 250 Euro. Die kleinste CPU der "Haswell-E"-Reihe, der Intel Core i7-5820K, ist mit 384 US-Dollar zwar deutlich günstiger, jedoch unterstützt er nicht mehr die vollen 40 Lanes, welche sich vor allem bei schnellen Grafikkarten im Multi-GPU-Betrieb auszahlen dürften. Er ist auf 28 Lanes beschränkt und muss zudem mit nur sechs Rechenkernen auskommen. 

{jphoto image=60521}

Aufgrund der sehr hohen Rechenleistung, der fortschrittlichen Plattform und der guten Leistungsaufnahme, zücken wir mit Freuden unseren heiß begehrten Excellent-Hardware-Award. Herzlichen Glückwunsch!

intel core i7 5960x award 

Positive Aspekte des Intel Core i7-5960X:

Negative Aspekte des Intel Core i7-5960X: