Haswell im Test: Intel Core i7-4770K und i5-4670K

Veröffentlicht am: von

haswell logoIntels Tock ist da: Am heutigen Tag stellt Intel die neuen Haswell-Prozessoren vor. Sie lösen die bisherigen Ivy-Bridge-Modelle, wie den Core i7-3770K ab. Insgesamt sind es 13 Desktop-Prozessoren, die Intel vorstellt, hinzu kommen diverse Mobilprozessoren. Ebenso ist eine neue Chipsatzgeneration mit am Start. In diesem Test schauen wir uns die Desktop-Prozessoren genauer an, während wir in weiteren Tests die Mobilprozessoren unter die Lupe nehmen.

Wie immer steht am Anfang eines Intel-Launchartikels die Frage, ob es sich um einen "Tick" oder "Tock" handelt. Mit dem sogenannten Tick-Tock-Modell bezeichnet Intel den abwechselnden Wechsel der Architektur und Fertigungstechnik bei der Prozessorproduktion. Während Intels dritte Generation der Core-Mikroarchitektur ein "Tick" war und somit eine Verkleinerung der Fertigungstechnik (ein sogenannter "Shrink"), ist Haswell mit einer neuen Prozessorarchitektur ausgestattet, also ein "Tock". Man nimmt also die Fertigungstechnik des Vorgängers Ivy Bridge mit 22 nm Strukturbreite sowie den Tri-Gate-Transistoren und entwickelt die Kerne, Caches und den Grafikkern weiter.

Eine neue Architektur ist in der Regel immer etwas komplizierter, da manchmal kein Stein auf dem anderen gelassen wird. Glücklicherweise hat Intel nicht wie bei Sandy Bridge, dem letzten "Tock", viel über den Haufen geworfen, sondern die generelle Struktur der Core-Mikroarchitektur beibehalten. An Kernen, Caches, der Grafikeinheit, dem Speichercontroller und auch einigen anderen Besonderheiten hat man aber diverse Optimierungen durchgeführt, die zum einen zu einer höheren Leistung, zum anderen aber auch zu einem extremen Energieeinsparungspotential führen sollen. Alles, was in den letzten Jahren bereits über Haswell von Intel bekannt gegeben worden ist, bezog sich in irgendeiner Art und Weise auf einen niedrigen Energieverbrauch und eine effizientere Arbeitsweise.

Für diesen Test haben wir von Intel eine CPU erhalten - einen Intel Core i7-4770K. Das Topmodell wurde uns mit einem passenden Intel-Mainboard, dem DZ87KLT-75K, zur Verfügung gestellt. Weiterhin haben wir uns den Core i5-4670K ins Haus geholt, der sicherlich aufgrund des Preis-Leistungsverhältnis für die meisten Leser interessanter sein wird. Das Board besitzt natürlich auch den neuen Z87-Chipsatz. Andere kleinere Prozessoren haben wir - mangels Verfügbarkeit - versucht mit dem Core i7-4770K und dem Core i5-4670K zu simulieren.

haswell opener
Heute im Test: Intels neues Desktop-Flaggschiff,
der Core i7-4770K und sein kleiner Bruder Core i5-4670K
aus der Haswell-Familie.

Intels Core i7-4770K ist das neue Desktop-Topmodell und ersetzt somit den Core i7-3770K. Sein "K" im Namen verrät bereits seine Overclocking-Fähigkeiten, denn wie bei den bisherigen "K"-Modellen ist auch bei Haswell der i7-4770K unlocked. Das bedeutet, dass er im Vergleich zu den anderen Prozessoren keine festen Multiplikatoren und Turbo-Schritte hat, sondern es möglich ist, ihn manuell auf einen höheren Multiplikator zu setzen.

Alle neuen Desktop-Modelle setzen auf den neuen Sockel 1150. Er ist nicht mehr kompatibel zu dem bisherigen Sockel 1156/1155, sodass alte Prozessoren nicht in neue Z87-Boards eingesetzt werden können und neuere Haswell-Prozessoren nicht mehr in älteren Z77- oder P67-Mainboards zu betreiben sind. Damit man die Prozessoren nicht fälschlicherweise verbaut, sind sie auch mechanisch inkompatibel, passen also nicht in den jeweiligen verkehrten Sockel. Einen Ausreißer zum Sockel 1150 gibt es: Der Core i7-4770R kommt im sogenannten BGA-Format (Ball Grid Array). Intel ordnet ihn zwar bei den Desktop-Prozessoren ein, im Endeffekt ist er aber ein Zwitter, der eher für All-In-One-PCs (AIOs) Verwendung finden wird. Für eine Einordnung in den Desktop-Bereich sprechen seine Eckdaten und die TDP von 65 Watt. Er wird aber fest mit dem Mainboard verlötet.

Die Core i7-Modelle besitzen wie immer Hyperthreading und die größten Ausbaustufen, was Taktraten und Cache angeht. Intels Core i5-Modelle müssen ohne Hyperthreading auskommen und besitzen auch alle nur 6 MB L2-Cache. Auch hier gibt es einen beliebten Prozessor aus der "K"-Serie, den Core i5-4670K. Dieser Prozessor wird wohl den beliebten Core i5-3570K ablösen, der bislang in vielen preis-leistungs-optimierten Systemen steckte. Intel stellt zunächst einmal nur Core-i7- und Core-i5-Prozessoren aus der vierten Generation der Core-Prozessoren vor - auf die langsameren Core i3 muss man sich noch ein paar Tage gedulden. Der günstigste Einstieg in die Haswell-Welt ist der Core i5-4570 mit 192 US-$ Listenpreis. Genauso teuer ist der mit nur 35W stromsparende Core i5-4570T, dieser ist jedoch auch nur ein Dual-Core-Prozessor mit Hyperthreading und 4 MB L2-Cache.

Die Kennzahlen der getesteten Desktop-Modelle im Vergleich haben wir in folgender Tabelle zusammengefasst:

Desktop-Modelle Core i7 (Haswell)
ProzessorCore i7-4770KCore i7-4770Core i7-4770SCore i7-4770TZum Vergleich:
Core i7-3770K
Zum Vergleich:
Core i7-2700K
Preis 339 US-Dollar 303 US-Dollar 303 US-Dollar 303 US-Dollar 313 US-Dollar
(Alternate)
 289 Euro
(Alternate)
TDP 84 Watt 84 Watt 65 Watt 45 Watt 77 Watt  95 Watt
Kerne /
Threads
4
8
4
8
4
8
4
8
4
8
4
8
CPU-Frequenz 3,5 GHz 3,4 GHz 3,1 GHz 2,5 GHz 3,5 GHz 3,5 GHz
Turbo 4 Core 3,7 GHz 3,7 GHz 3,5 GHz 3,1 GHz 3,7 GHz 3,6 GHz
Turbo 3 Core 3,8 GHz 3,8 GHz 3,6 GHz 3,4 GHz
Turbo 2 Core 3,9 GHz 3,9 GHz 3,8 GHz 3,6 GHz 3,9 GHz 3,8 GHz
Turbo 1 Core 3,9 GHz 3,9 GHz 3,9 GHz 3,7 GHz 3,9 GHz 3,9 GHz
Speicherinterface Dual-Channel DDR3-1600
(Low Voltage Support)
Dual-Channel DDR3-1333
L3-Cache 8 MB 8 MB 8 MB 8 MB 8 MB 8 MB
Intel HD Graphics HD 4600 HD 4600 HD 4600 HD 4600 HD4000 HD 3000
Render Frequency (idle) 350 MHz 350 MHz 350 MHz 350 MHz 650 MHz 850 MHz
Graphics Turbo bis 1250 MHz bis 1200 MHz bis 1200 MHz bis 1200 MHz bis 1350 MHz bis 1350 MHz
PCIe 3.0 ja ja ja ja ja nein
Intel Secure Key ja ja ja ja ja nein
OS Guard ja ja ja ja ja nein
vPro, VT-d, TXT, SIPP nein, nur Nicht-K-Modelle ja ja ja nein, nur Nicht-K-Modelle ja
Unlocked Multiplikator ja nein nein nein ja ja
AVX ja, 2.0 ja, 2.0 ja, 2.0 ja, 2.0 ja, 2.0 nein

Hinzu kommt hier der Core i7-4770R, der mit nur 6 MB L2-Cache auskommen muss, dafür aber die Intel Iris Pro Graphics besitzt. Wie der Core i7-4770K hat der i7-4770R kein vPro, VT-d, TXT oder SIPP-Support. Zudem gibt es noch den Core i7-4765T als kleinsten Core i7, der mit nur 35 Watt TDP auskommen kann. Er ist von 2,0 bis 3,0 GHz getaktet, besitzt 8 MB L2-Cache und ansonsten identische Kennzahlen zu den normalen Core i7-Modellen.

Im Core i5-Bereich fällt zunächst Hyperthreading weg, auch der L2-Cache wird etwas kleiner:

Desktop-Modelle Core i5 (Haswell)
ProzessorCore i5-4670KCore i5-4670SCore i5-4670TCore i5-4670Core i5-4570Core
i5-4570S
Core i5-4570T
Preis 242 US-Dollar 213 US-Dollar 213 US-Dollar 213 US-Dollar 192 US-Dollar 192 US-Dollar 192 US-Dollar
TDP 84 Watt 84 Watt 45 Watt 65 Watt  84 Watt 65 Watt 35 Watt
Kerne /
Threads
4
4
4
4
4
4
4
4
4
4
4
4
2
4
CPU-Frequenz 3,4 GHz 3,1 GHz 2,3 GHz 3,4 GHz 3,2 GHz 2,9 GHz 2,9 GHz
Turbo 4 Core 3,6 GHz 3,4 GHz 2,9 GHz 3,6 GHz 3,4 GHz 3,2 GHz -
Turbo 3 Core 3,7 GHz 3,5 GHz 3,0 GHz 3,7 GHz 3,5 GHz 3,3 GHz -
Turbo 2 Core 3,8 GHz 3,7 GHz 3,2 GHz 3,8 GHz 3,6 GHz 3,5 GHz 3,6 GHz
Turbo 1 Core 3,8 GHz 3,8 GHz 3,3 GHz 3,8 GHz 3,6 GHz 3,6 GHz 3,6 GHz
Speicherinterface Dual-Channel DDR3-1600
(Low Voltage Support)
L3-Cache 6 MB 6 MB 6 MB 6 MB 6 MB 6 MB 4 MB
Intel HD Graphics HD 4600 HD 4600 HD 4600 HD 4600 HD 4600 HD 4600 HD 4600
Render Frequency 650 MHz 350 MHz 350 MHz 350 MHz 350 MHz 350 MHz 200 MHz
Graphics Turbo bis 1250 MHz bis 1200 MHz bis 1200 MHz bis 1200 MHz bis 1150 MHz bis 1150 MHz bis 1150 MHz
PCIe 3.0 ja ja ja ja ja ja ja
Intel Secure Key ja ja ja ja ja ja ja
OS Guard ja ja ja ja ja ja ja
vPro, VT-d, TXT, SIPP nein, nur Nicht-K-Modelle ja ja ja ja ja ja
Unlocked Multiplikator ja nein nein nein nein nein nein
AVX ja, 2.0 ja, 2.0 ja, 2.0 ja, 2.0 ja, 2.0 ja, 2.0 ja, 2.0

Wir testen in unserem Review zwar den Core i7-4770K als Topmodell, am Markt wird sich aber eher der mitgetestete Core i5-4670K als Topseller etablieren. Auch die kleineren Core i5-4570 sind interessant, ebenso der eventuell für kleine PC-Systeme geeignete i5-4570T mit nur 35 Watt TDP. Interessant ist, dass die Desktop-Topmodelle nun 84 Watt TDP mitbringen und nicht mehr 77 Watt TDP wie die bisherigen Ivy-Bridge-Desktop-CPUs. Hierbei könnte man darauf schließen, dass die Haswell-CPUs etwas heißer werden unter Volllast - auch wenn Intel sie im Idle-Betrieb auf Stromsparen getrimmt hat. Das werden wir später im Test überprüfen, allerdings hat Intel nun auch den Voltage Regulator mit auf dem Chip untergebracht - insofern ist systemweit kein höherer Verbrauch zu erwarten.

Wie in jedem CPU-Testbericht liefern wir am Anfang des Artikels natürlich auch einen CPU-Z-Screenshot. Hier sind für den Core i7-4770K und den Core i5-4670K die Features ersichtlich, die man oben an der Tabelle entdecken kann. Große weitere Änderungen bezüglich der Spannung haben sich aufgrund der identischen Fertigungstechnik nicht ergeben.

cpuz 4770kscpuz 4670ks

CPU-Z-Screens vom i7-4770K und i5-4670K

Das sieht alles recht erwartungsgemäß aus - also machen wir uns an die Architektur.


Erinnern wir uns kurz an Ivy Bridge: Im Vergleich zu Sandy Bridge hatte Ivy Bridge keine großartigen Veränderungen an der CPU-Architektur, denn Ivy Bridge war hauptsächlich ein "Tick", es wurde eine neue Fertigungstechnologie eingeführt. Trotzdem waren 400 Millionen mehr 22-nm-Tri-Gate-Transistoren auf der CPU vorhanden, weshalb Intel auch gerne von einem "Tick+" gesprochen hat. Doch diese hinzugefügten Transistoren gehörten alle zur Grafikeinheit von Ivy Bridge. An der Struktur der CPU, am Aufbau, dem Memory Controller und anderen Bereichen hat Intel nur Detailverbesserungen durchgeführt.

Wenn man die Architektur von Haswell nun betrachtet, kann man sich im Vergleich somit eigentlich auf Sandy Bridge beziehen. Erstmals gab Intel auf dem vergangenen Intel Developer Forum im September 2012 in San Francisco Einblicke in die Haswell-Architektur. Im Endeffekt hat Intel aber den groben Aufbau von Sandy-Bridge beibehalten:

ringbus
Der Ringbus wurde erstmals mit Sandy Bridge eingeführt, um genügend
Leistung für die integrierte Grafik mitzubringen. Bei Ivy Bridge ist er in
unveränderter Art ebenso vorhanden, ähnlich sieht es bei Haswell aus.

Mit Sandy Bridge führte Intel den Ring-Bus-Cache ein. Schaut man auf einen Die-Shot von Haswell, kann man diese Struktur weiterhin erkennen. Ein Ring-Bus verbindet weiterhin die Cores, Caches und die Grafik, auch der System Agent besitzt dieselben Funktionen:

haswell die1
Der Aufbau von Haswell unterscheidet sich nicht großartig von Sandy Bridge. 

Was hat sich nun bei Haswell im Vergleich zu Sandy Bridge verbessert?

Veränderungen an den Kernen

Im September letzten Jahres gab Intel erstmals einen Einblick in die Haswell-Architektur. Erstaunlicherweise berichtete man dort von einer Erhöhung der Single-Thread-Performance. Um dies zu erreichen, hat man einige Verbesserungen in die maximal vier Kerne von Haswell integriert: Wie bei jedem Intel-Prozessor wurde wieder an der Branch Prediction Einheit gefeilt, das Front End des Prozessors wurde massiv verbessert, die Puffer vergrößert und die Anzahl der Execution Units erhöht (von sechs auf nun acht), während gleichzeitig deren Latenz verbessert wurde. Hinzu kommt eine größere Bandbreite bei den Caches, deren Größe aber zumindest im L1- und L2-Bereich unverändert bleibt.

Intel erreicht durch eine Erhöhung der Buffer Sizes eine bessere Parallelisierung von Workloads. Haswell hat im Vergleich zur Sandy-Bridge-Architektur in allen Bereichen (Out-of-Order Window, In-Flight Loads, In-Flight Stores, Scheduler Entries, Integer Register Files, FP Register Files und Allocation Queues) eine größere Buffer Size. Dabei hat Intel aber aufgrund der Effizienz darauf geachtet, die Buffer auf einem aufeinander abgestimmten Niveau zu halten und nicht zu sehr aufzublasen - denn ungenutzte Buffer verbrauchen nur Strom, bringen aber keinen Geschwindigkeitsvorteil mehr.

Konkret hat Intel zwei Fused-Multiply-Add-Einheiten für AVX hinzugefügt, zwei zusätzliche Ports mit einer vierten Integer-ALU, eine zweite Sprungeinheit und eine Store-Adress-Einheit. Die Pipeline hat Intel beibehalten und sie nicht verlängert. Mit einigen Veränderungen entspricht sie also noch dem Vorgänger Sandy Bridge (und in der Basis sogar noch dem Pentium Pro). Die Größe des Out-of-Order-Window steigt auf 192 Einträge, Sandy Bridge besaß 168 Einträge. Gleichzeitig hat man die Reservation Station von 54 auf 60 Einträge aufgebort. Die Execution Unit 7 entlastet die beiden Load/Store-Ports 2 und 3 durch eine dedizierte Store-Address-Einheit. Intel hat auch die physischen Register vergrößert, jetzt stehen 168 Einträge für das Floating-Point-Gleitkommaregister statt vorher 144 Einträge zur Verfügung, auch die Integer-Register wurden mit 168 Einträgen leicht erweitert (160). Als wichtige Veränderung hat Intel zudem die Größe des Unified Translation Lookaside Buffers (L2 Unified TLB) auf eine Größe von 4K + 2M shared mit 1024 Einträgen statt 512 Einträge bei Sandy Bridge aufgebohrt. Wichtig war Intel die Beibehaltung der Länge der Pipeline und niedrige Latenzzeiten zu den Caches.

Neue Befehlssätze: Advanced Vector Extensions 2

Ein weiteres neues Kernfeature für Haswell sind Advanced Vector Extensions 2 (kurz Intel AVX2). Diese Befehlssatzerweiterung besitzt unter anderem jetzt 256-bit Integer Vectors, zudem wird Fused Multiply-Add (zwei Einheiten für AVX) unterstützt. Intel schafft es damit die Flops pro Taktzyklus bei Haswell zu verdoppeln. Als Resultat erhält man bei Anwendungen, die AVX2 nutzen, eine deutlich höhere Performance. Die Integer Instructions behandeln hauptsächlich den Bereich Indexing und Hashing, Kryptografie und Endian Conversion (MOVBE). Durch Fused Multiply-Add wird zudem das Rechenergebnis genauer, da bei einer getrennten Operation zwei Rundungsvorgänge vorhanden sind, bei der Abwicklung mit FMA jedoch nur einer enthalten ist.

Cache-Bandbreite und sonstige Verbesserungen

Spannend sind die Verbesserungen bei der Cache-Bandbreite. Während die Größe für den L1-Instruction- und Data-Cache weiterhin bei 32K und einer 8-fach assoziativen Anbindung geblieben sind, hat Intel die Load- und Store-Bandbreite im Vergleich zu Sandy Bridge von 32 Bytes pro Cycle auf 64 Bytes pro Cycle für Load und von 16 Bytes/Cycle auf 32 Bytes/Cycle für Store aufgebohrt. Der L2-Cache bleibt ebenso bei 256K und 8-Fach assoziativer Anbindung, auch hier bohrt man die Bandbreite zum L1-Cache auf 64 Bytes/Cycle auf.

Auch den System Agent und Last Level Cache hat Intel überarbeitet. Man bietet unter anderem mehr Bandbreite für den Shared Last Level Cache durch neue, dedizierte Pipelines, die Data und Non-Data-Zugriffe parallel behandeln können. Für den System Agent gibt es einen neuen Load-Balancer, der die Ressourcen effektiver verteilen kann. Zudem wird auch der DRAM Write Throughput durch bessere Queues und einen besseren Scheduler beschleunigt. Letztendlich hat Intel die Geschwindigkeit für Roundtrips bei Virtualisierung in VT-x noch einmal deutlich beschleunigt, hier liegt man jetzt unter 500 Zyklen pro Roundtrip.

Für einen Leistungsvergleich der Bandbreite haben wir mit CPU Rightmark die Cache Latenz (oben) und die Cache Bandbreite (unten) gemessen.

haswell dcaches

ivycachebandwidthssandybridge-bandwidths 

Cache-Latency-Vergleich:
Oben Haswell, Links Ivy Bridge, Rechts Sandy Bridge

haswell dlatencys

ivycachelatencyssandybridge-latencys 

Cache-Bandbreiten-Vergleich:
Oben Haswell, Links Ivy Bridge, Rechts Sandy Bridge

Die Performance ist fast so, wie sie von Intel versprochen wurde: Bei der Bandbreite der Caches sieht man durch alle Bereiche (L1, L2, L3), dass Haswell schneller an die Daten kommt - die Bandbreite ist also deutlich gestiegen. Die Latenzzeiten wollte Intel zwar möglichst gleich beibehalten, allerdings ist hier ein marginaler Anstieg zu erkennen, der aber wohl eher zu vernachlässigen ist.

Intel Transactional Synchronization Extension (TSX) mit Lock Elision

Damit Multi-Core-Prozessoren immer mit validen Daten arbeiten, gibt es sogenannte Locks. Greifen mehrere Threads auf den Speicher zu, wird der entsprechende Bereich zunächst gesperrt (Lock), um eine Veränderung während der Verarbeitung zu verhindern. Mit diesem Prinzip rechnet jeder Kern für sich ein valides Ergebnis aus, da die Daten immer aktuell sind. Im Normalfall sind diese zeitaufwändigen Locks allerdings überflüssig, da nur sehr selten mehrere Threads bei Speicherzugriffen auf denselben Bereich konkurrieren. Hierfür gibt es mit Haswell nun TSX und Transactional Memory: Ein Speicherzugriff kann auch ohne Lock geschehen, somit können schneller Daten zur Bearbeitung in den L1-Cache geladen werden. Allerdings muss es hardwareseitig einen Mechanismus geben, der konkurrierende Zugriffe erkennt und dann die Berechnung abbricht. 

Haswell hat zwei derartige Mechanismen. Hardware Locked Elision arbeitet nach dem obigen Prinzip und berechnet bei einem Konflikt denselben Code noch einmal unter Berücksichtigung der Locks. Restricted Transactional Memory hingegen meldet einen Abbruch erst einmal an die Software, die dann durch einen vorgesehenen Codepfad selber entscheiden kann, ob er mit Locks arbeiten möchte oder die Transaktion später wiederholen möchte. Beide Mechanismen arbeiten im L1-Daten-Cache der CPUs, Haswell kann aber auch Teilbereiche in die L2-Caches swappen.

Optimierungen am Stromverbrauch 

Beim Stromverbrauch geht Intel den Weg weiter, möglichst alles abzuschalten, was nicht gerade benötigt wird. Interessant ist, dass Intel die Kerne vom LLC+Ring nun trennt und jeweils eine separate Frequency Domain anbietet. Dadurch soll eine genauere Steuerung der Taktraten möglich sein. Die Power Control Unit steuert dabei dynamisch das vorhandene TDP- oder Strom-Budget, wenn man ein Limit angibt. 

Intels integrierter Spannungswandler (iVR)

Intel versorgt die CPU mit einer Spannung "VCCin" (Voltage Common Connector "in") von 1,75 Volt. Aus dieser Spannung VCCin generiert Intel alle notwendigen Spannungen für die CPU (z.B. Vcore). Intel nutzt immer noch die Voltage Identification VR 12.5, sodass von 0,5 bis 3,04 V Spannung angelegt werden können. Als minimalen Wert für den Berieb eines Haswell-Prozessors sieht Intel 1,65 Volt an, als maximalen 1,86 Volt. Im C6/C7-Modus sind es 1,5 bis 1,65 V bei 1,6V Sollspannung. Die Spannungswandler sind dabei für eine kurzzeitige Belastung von 100 A ausgelegt, für die integrierte GPU noch einmal 35 A. Für Dauerlast sieht Intel 85 A bzw. 25 A vor, wobei die TDP hier limitierend wirken soll.

Neben der Spannung für die CPU und den System Agent erhält auch die Grafik eine eigene Power Domain. Intel kann die Spannungen für die CPU also so steuern, wie gerade Leistung benötigt wird - das sollte auch die Active Power reduzieren oder gleichzeitig eine höhere Taktung und höhere Turbo-Modi möglich machen.

Für den Mainboardhersteller ergeben sich dadurch Einsparungspotentiale, da Intel den Spannungswandler in die CPU integriert. Die CPU-internen Spannungen Vring, Vgt, Vsa und Vioa, Viod müssen nicht mehr bereitgestellt werden. Es bleibt nur ein Spannungswandler für die Speichermodule (Vddq). Das spart am Layout-Design ein paar Euros und der Bereich um den Sockel kann etwas flexibler gestaltet werden.

Neuer Stromsparmodus "S0ix Active Idle"

Intel hat Haswell neue Power- und Idle-States verpasst. Zum einen hat man neue Funktionen im Power-State im C7-Modus untergebracht. Hier werden alle Takte gestoppt, die Spannung wird vom Hauptteil der CPU genommen - selbst, wenn das Display noch aktiv ist. Die kommenden Ultrabooks bieten dabei sogar Self-Panel-Refresh (SPR), also kann kein Display-Bild bestehen bleiben, während das Ultrabook sich in C7 befindet. Die Zeitspanne zum Aufwecken aus dem C7 Modus und zum Schalten in andere C-Modi hat Intel dabei um 25% beschleunigt.

Durch neue Idle-States - S0ix Active Idle - und eine neue C-State-Intelligenz möchte man den Stromverbrauch weiter senken - und schafft dies gegenüber Ivy Bridge auch massiv im Idle-Power-Bereich. Bei S0ix Active Idle wird der Energieverbrauch des Rechners auf S3/S4-Niveau abgesenkt, aber es gibt keine lange Aufwachzeit. Intel realisiert dies vollautomatisch in der Hardware in feinen Abstufungen. Durch die generelle Beschleunigung zwischen den C-States um 25% und neue Power-Management-Funktionen für die Peripherie sind deutlich schnellere Wechsel innerhalb der C-States möglich.

haswell power optimizers
Insbesondere der Wechsel zwischen Idle- und Aktiv-Betrieb wurde von Intel massiv verkürzt. S0ix als Platform-Level spart dabei zusätzlich Energie. 

System Agent (ehem. Uncore-Bereich)

Der System Agent Bereich der CPU hat zwar einige Optimierungen bezüglich der Stromspartechniken erhalten, ansonsten bleibt er aber größtenteils unverändert:

Memory Controller

Keine Änderungen gibt es beim Speicherinterface. Intel setzt immer noch auf den bekannten DDR3-1333/1600, auch Low-Voltage-Dimms und SO-Dimms (AIO-Plattformen) können weiterhin eingesetzt werden. Im Dual-Channel-Betrieb sind somit weiterhin rechnerisch 25,6 GB/s maximale Transferrate möglich. Interessant ist, dass auch weiterhin als größte Speicherkonfiguration nur 8-GB-Speichermodule (Dual-Rank x8 unbuffered non-ECC) eingesetzt werden können. In Z87-Mainboards und Mainboards mit den anderen Chipsätzen können also weiterhin nur 32 GB maximale Bestückung erreicht werden. Als Timings gibt Intel für DDR3-1600 10-10-10 mit 1t oder 2t Command Rate in der Spezifikation an, hier hat sich also ebenso nichts verändert.

PCI-Express-Interface

Auch hier bohrt Intel Haswell nicht auf: Schon Ivy Bridge bekam hier ein Update auf PCI-Express 3.0 - und da dieser Standard momentan immer noch State-of-the-Art ist, bleibt es bei 8 GT/s pro PCIe-Lane, also 984 MB/s. Mit einer theoretischen Bandbreite von 16 GB/s bei PCIe-3.0-x16 pro Richtung kommt man somit auf 32 GB/s Bandbreite insgesamt. Mit Intels Z87-Chipsatz ist auch ein Aufsplitten der Lanes für SLI und CrossFire möglich, die anderen Chipsätze unterstützen diese Aufsplittung nicht.

Direct Media Interface

An der Anbindung zwischen CPU und dem (Z87-)Chipsatz hat Intel keine Veränderungen durchgeführt. Hier kommt die bekannte DMI 2.0 x4-Verbindung zum Einastz. Der Platform-Controller-Hub wird also mit 5 GT/s angebunden, wobei diese Technik insgesamt auf 4 GB/s Übertragungsrate kommt. Das Intel hier keine schnellere Anbindung gewählt hat, ist etwas verwirrend, denn in den letzten Jahren war ein Argument gegen eine größere Anzahl USB3.0- und SATA-6G-Ports die Anbindung zum Prozessor: Man wolle den DMI-Bus nicht zum Flaschenhals werden lassen. Mit den neuen Chipsätzen hat Intel nun reichlich USB3.0- und SATA-6G-Ports, trotzdem geht man wohl davon aus, dass die 4 GB/s Übertragungsrate zum Prozessor kein Problem darstellen.


Intels Ziel ist es mit einer integrierten Grafik kleinere Grafiklösungen obsolet zu machen - das man mit einer GTX 780 oder ähnlichen Transistoren-Monstern nicht mithalten kann, ist Intel selber auch bewusst. Aber man möchte für kleinere Systeme, Ultrabooks oder günstige PC-Systeme die Möglichkeit schaffen, eine gute Grafik zu realisieren, um Videos zu schauen, Spiele zu spielen oder mehrere Displays anzusteuern. In den vergangenen Jahren hat man deshalb die Grafik stetig überarbeitet - und mittlerweile ein wirklich gutes Niveau erreicht.

Haswell-Grafik: GT3-Verbesserungen

Die Grafik von Intels Haswell-Modellen wird es in insgesamt vier Ausbaustufen geben: Für den Notebook-Bereich und den i7-4770R ist die "GT3"- und "GT3e"-Variante vorgesehen. Diese beiden Varianten unterscheiden sich durch einen Embedded-DRAM, den Intel mit auf die CPU setzt. Mit Embedded DRAM tauft Intel die Grafikversion Iris Pro 5200. Kommt nur die schnellere Variante zum Einsatz, aber ohne Extra-Speicher, nennt Intel das Paket Iris 5100 oder bei stromsparenden Modellen, wo ein paar Execution Units weniger zum Einsatz kommen, HD Graphics 5000.

Im Desktop-Bereich wird hingegen nur die GT2 eingesetzt. Diese besitzt weniger Execution Units und kommt auch immer ohne Embedded DRAM. Intel vermarktet diese Lösung unter HD Graphics 4600, 4400 und 4200. Auch eine abgespeckte GT1-Variante wird es für günstige Prozessoren geben:

Namensgebung der Intel-Grafik
GrafiklösungPC ClientsWorkstation/Server
GT3e Intel Iris Pro 5200 -
GT3 (28W) Intel Iris 5100 -
GT3 (15W) Intel HD Graphics 5000 -
GT2 Intel HD Graphics
4600, 4400, 4200
Intel HD Graphics
P4700, P4600
GT1 Intel HD Graphics -

Die Technischen Features der neuen Intel-Grafik haben wir in der folgenden Tabelle zusammengestellt. Intels HD Graphics 4000 und 2500 kommt dabei in Ivy-Bridge-Modellen zum Einsatz, die HD Graphics 3000/2000 in älteren Sandy-Bridge-Modellen. Intels HD Graphics 5x00 haben wir mit aufgelistet, auch wenn diese nur im Notebook-Bereich zu finden sein werden:

Vergleich Prozessor-Grafik
GrafikkernIntel HD Graphics 5000
(GT3, für Desktop nur i7-4770R)
Intel HD Graphics 4600
(GT2)
Intel HD Graphics 4000Intel HD Graphics 2500Intel HD Graphics 3000/2000
Unified Shader ja ja ja ja ja
Anzahl Execution Units 40 20 16 6 12/6
Media Processing
(Quick Sync/Clear Video)
ja, neue Video Quality Engine ja, neue Video Quality Engine ja, verbessert ja, verbessert ja
OS Optimierungen für Windows 7 und 8 für Windows 7 und 8 für Windows 7 und 8 für Windows 7 und 8 für Windows 7, Vista, XP
Frequenz maximal 1300 MHz maximal 1250 MHz maximal 1350 MHz
(aktuell: 1150 MHz)
maximal 1350 MHz maximal 1350 MHz
DirectX-Support in Hardware DX11.1  DX11.1 DX11 DX11 DX10.1
OpenCL 1.1 OpenCL 1.2 OpenCL 1.2  CPU/GPU CPU/GPU nur CPU
OpenGL Support OpenGL 4.0 OpenGL 4.0  OpenGL 3.1 OpenGL 3.1 OpenGL 3.0
Shader Model SM 4.1 SM 4.1
Dynamic Frequency Scaling ja ja ja ja ja
Maximale Auflösung 3840x2160 (DP) 3840x2160 (DP) 2560x1600 2560x1600 2560x1600
HDMI-Support 1.4 mit 3D 1.4 mit 3D 1.4 mit 3D 1.4 mit 3D 1.4 mit 3D
Anzahl Displays 3 (siehe unten) 3 (siehe unten) 3 3 2
Intel WiDi 4.1 4.1 3.0 3.0 2.1

Technisch hat Intel zunächst einmal die Features aufgebohrt: DirectX11.1 wird unterstützt, ebenso OpenCL 1.2 in Hardware (z.B. für Filter in Adobe Premiere Pro) und OpenGL 4.0. Zudem hat Intel die Bandbreite der Display Ports deutlich erhöht, sodass höhere Auflösungen möglich sind und bis zu drei Screens als Collage Display angeschlossen werden können. Die Möglichkeiten, welche Displays hier eingesetzt werden können, haben wir unten aufgelistet. Schaltet man auf 24 Hz, ist es sogar möglich 4Kx2K-Videos auf einem passenden Display auszugeben.

Durch die größere Anzahl an Ausführungseinheiten ergeben sich zudem Verbesserungen an den üblichen Video-Funktionen: Intels Quick Sync Video Technology ist schneller, das De- und Encoding funktioniert also zügiger. Als zusätzlicher Teil der Quick Sync Video Technology ist jetzt eine Video Quality Engine hinzu gekommen, die z.B. Videos entwackelt und Farbtöne korrigieren kann. Zudem hat Intel auch ein schnelleres JPEG & MPEG Decoding integriert (z.B. für Webcams).

Um die Ausführungseinheiten auch schneller mit Daten versorgen zu können, hat Intel auch die Architektur ein wenig aufgemöbelt: Die Fixed-Function-Einheiten in der 3D-Pipeline wurden verdoppelt, die Befehlsgeber haben einen Resource Streamer zur Seite gestellt bekommen - dadurch rendern die 3D-Szenen schneller.

Die Struktur der neuen Grafik ist in der folgenden Folie gut sichtbar. Intel nutzt denselben Aufbau für GT2/GT1 und GT3, bei der GT3 kommen nur eine höhere Anzahl an Ausführungseinheiten und somit auch größere Caches und Puffer zum Einsatz. Über die Größe des On-Chip-Caches schweigt man aber weiterhin.

Intel IDF 2013
Auf dem Intel IDF im April 2013 in Peking zeigte Intel den Aufbau der GT1/2/3-GPUs.

Embedded DRAM auf der CPU

Dieser Punkt ist natürlich spannend - aber im Desktop-Bereich eigentlich unwichtig, da Intel noch keine Prozessoren im Sockel 1150 verkauft, die Embedded DRAM haben. Für die GT3e-Modelle ist diese Technik vorgesehen, auch wenn sie nicht nur im Notebook-Bereich einen Geschwindigkeitsvorteil bringt, sondern auch im Desktop-Bereich interessant wäre.

Intel integriert bei den Top-Modellen Iris Pro insgesamt 128 MB Zwischenspeicher auf dem Prozessor-Kern, der im Endeffekt als Level-4-Cache fungiert. Auf ihn können nicht nur die Execution Units der Grafik zurückgreifen, sondern auch die Kerne selber. Da er mit 512 bit angebunden ist, ist der Speicher extrem schnell, was gerade Spielen zu einer beachtlichen Leistung verhilft, weil die Daten nicht in den sehr viel langsameren Arbeitsspeicher geschrieben werden müssen. Der Nachteil an einer solchen Lösung ist aber der hohe Preis und die zusätzlich entstehende Abwärme, weshalb Intel die Desktop-Modelle wohl nicht mit dieser Technik ausstatten wird.

Intel setzt den EDRAM direkt neben die Haswell-CPU mit auf den Chip. Man verwendet hier also ein Multichip-Package, wie man es bereits früher mit den ersten Dual-Core-Prozessoren oder der ersten Integration der Northbridge in die CPU vorgenommen hat. 

Display-Anschlussmöglichkeiten

Intel bewirbt Haswell mit der Fähigkeit, mehrere Monitore in einem Collage-Modus zusammen betreiben zu können. Effektiv kann man - je nach Anschlüssen auf dem Mainboard - bis zu drei Monitore verwenden. Dabei ist es sogar möglich, 4Kx2K-Auflösung zu fahren. Da die Anschlussmöglichkeiten maßgeblich von den zur Verfügung gestellten Ports abhängt, haben wir die Varianten, die Intel untertützt, in der folgenden Tabelle zusammengefasst:

Anschlussmöglichkeiten und Display-Auflösungen
Display 1Display 2Display 3Maximale Auflösung
Display 1
Maximale Auflösung
Display 2
Maximale Auflösung
Display 3
HDMI HDMI DP 4096x2304 @ 24 Hz
2560x1600 @ 60 Hz
3840x2160 @ 60 Hz
DVI DVI DP 1920x1200 @ 60 Hz 3840x2160 @ 60 Hz
DP DP DP 3840x2160 @ 60 Hz
VGA DP HDMI 1920x1200 @ 60 Hz 3840x2160 @ 60 Hz 4096x2304 @ 24 Hz
2560x1600 @ 60 Hz
eDP DP HDMI 3840x2160 @ 60 Hz 3840x2160 @ 60 Hz 4096x2304 @ 24 Hz
2560x1600 @ 60 Hz
eDP DP DP 3840x2160 @ 60 Hz 3840x2160 @ 60 Hz
eDP HDMI HDMI 3840x2160 @ 60 Hz 4096x2304 @ 24 Hz
2560x1600 @ 60 Hz

Maximal kann ein Mainboard dabei folgende Anschlüsse bieten:

Durch die Verwendung des neuen Display-Port-1.2-Standards ist es auch möglich, DP-Monitore per Daisy-Chaining anzubinden. Intel bietet hier die doppelte Bandbreite (im Vergleich zu DP1.1). Durch die Möglichkeit, drei Displays anzuschließen, wird für viele User die Notwendigkeit entfallen, auf eine dedizierte Grafiklösung zu setzen, wenn die Leistung derselben nicht benötigt wird. Die Flexibilität von Intels Onboard-Grafik ist hier vollkommen ausreichend - selbst für 4K2K oder ähnliches.

Interessant ist auch, dass Intel es erlaubt, eine Onboard-Grafik gleichzeitig mit der dedizierten Grafik in einem PCIe-x16-Slot zu betreiben. Dann kann der Anwender zwei Monitore an der PCIe-Lösung anschließen und bis zu zwei weitere an der Onboard-Grafik. Nur ein Drag-und-Drop ist zwischen den Monitoren verschiedener Grafiklösungen dann nicht möglich.

Displays können zudem auch per WiDi 4.1 angeschlossen werden, wenn das Mainboard die Option mitbringt. 


Für den Performance-Vergleich haben wir neben 3DMark und 3DMark 2011 die Spiele Metro 2033 und Anno 2070 ausgewählt. 

bmonboard3
bmonboard3
bmonboard3
bmonboard3

Eine deutliche Verbesserung ist in den Benchmarks zu sehen - teilweise kann Intel fast von einer Verdoppelung der Performance sprechen, wenn man den Intel Core i7-4770K mit dem Core i7-3770K vergleicht. Meistens erreicht die neue HD 4600 ungefähr 60 Prozent mehr Leistung als die HD 4000. Trotzdem: Einen 3D-Ego-Shooter mit anspruchsvoller Grafik und hoher Auflösung vermag die neue Grafik noch immer nicht darzustellen, aber es reicht für sogenannte Casual Games. Wenn man mit einer niedrigeren Auflösung und geringer Qualitätsstufe spielt, kann es sogar ein aktueller Blockbuster sein. Wenn man dann Blut leckt, könnte man sich immer noch eine Mittelklasse-Grafikkarte nachkaufen.

Treiber-Probleme, wie bei den Intel-Grafikkernen vor ein paar Jahren, sind nicht mehr an der Tagesordnung. Metro 2033 meckerte zwar mit einem Direct3D-Fehler, startete und lief aber ohne Probleme. Was allerdings immer noch passieren kann, sind kleinere Anzeigefehler. Beispielsweise traten bei 3DMark 11 kleinere Grafikfehler auf. Optische Unterschiede sind aber sowieso an der Tagesordnung, wenn man eine Onchip-Grafik mit einer High-End-Grafikkarte vergleicht.

Vergleicht man den den integrierten Grafikkern von Haswell mit AMDs-Trinity, so muss man die Konkurrenz noch immer als Sieger bei der 3D-Performance hervorgehen lassen. In fast allen Benchmarks hatte hier AMD die Nase vorne. Einzig der neue 3DMark scheint auf Intels Lösung etwas schneller zu laufen. AMD hat die Messlatte ein gutes Stück nach oben gesetzt und wird diese - wenn man aktuellen Gerüchten Glauben schenken kann - in den nächsten Tagen noch einmal nach oben setzen. Dann sollen die Richland-Nachfolger mit aufgemöbelter Grafikeinheit offiziell an den Start gehen.

Der Vollständigkeit halber haben wir auch den Stromverbrauch der Onboard-Grafiken im Gesamtsystem aufgeführt:

bmonboard3
bmonboard3

Auch hier hat Haswell einen Schritt nach vorne gemacht - der Verbrauch sinkt im Idle-Betrieb, unter Last ist der Verbrauch der Onboard-Grafik etwas höher, aber durch das Leistungsplus ist die CPU deutlich effektiver. Auch gegen Trinity sieht die Leistungsaufnahme sehr gut aus, vor allem unter Last schlägt man die aber leistungsfähigere AMD-Grafik fast um 45 Watt, beeindruckend! Trinity zeigt hier allerdings auch teilweise eine bessere Leistung, sodass diese Mehrleistung noch zu vertreten wäre. Intel liegt hier aber mittlerweile deutlich in Front, was die Leistung pro Watt betrifft. 


In den letzten Monaten haben wir über 20 Z77-Boards getestet - und eine ähnliche Armada an Boards stehen dem Käufer eines Haswell-Prozessors zur Verfügung. Die neuen Sockel-1150-Platinen basieren dabei auf der 8er-Chipsatzserie: Der Z87 (Codename Lynx Point) ist das Topmodell, aber es wird auch einige abgespeckte Chipsatzvarianten (H87, Q87, Q85) geben. Diese sind - wie schon in der Vergangenheit - teilweise etwas im Leistungsumfang beschnitten, beherrschen also beispielsweise kein Overclocking oder kommen mit weniger SATA6G/USB3.0-Ports.

Beginnen wir mit einem Blick auf die Chipsatz-Grafik zum Z87-Chipsatz:

haswell z78
Der Z87 besitzt jetzt mehr USB3.0-Ports, mehr SATA6G-Ports und ein paar andere kleine Verbesserungen. 

Viel hat sich hier offensichtlich nicht geändert. Ein paar USB3.0-Ports mehr, ein paar SATA-6G-Ports, aber sonst sieht alles relativ identisch aus im Vergleich zum Z77-Chipsatz. Das ist auch quasi korrekt, die Veränderungen haben eher unter der Haube stattgefunden:

Zunächst einmal hat Intel die digitale Display-Anbindung direkt in die CPU integriert, nur noch der analoge VGA-Part bleibt im Chipsatz. Es gibt auch für Q- und B-Chipsätze nun keine Möglichkeit mehr, PCI-Devices anzubinden - dies muss über einen separaten Wandlerchip passieren. Das SPI-Interface wurde etwas aufgebohrt (jetzt mit SFDP, Quad Read) und alle USB-Ports laufen jetzt über das xHCI.

Neu ist die sogenannte "I/O Port Flexibility". Hierbei ist es dem Anwender freigestellt, wie er die maximal zur Verfügung gestellten I/O-Anbindungen nutzen möchte. Intel stellt es frei, bis zu sechs USB3.0-Ports zu bieten, acht PCIe-2.0-Ports und bis zu sechs SATA6G-Ports. Welche Ports von den USB-Ports dabei zur schnellen USB3.0-Kategorie gehören, lässt sich frei einstellen. Das kann durchaus praktisch sein, wenn man ein Frontpanel mit vier USB3.0-Ports besitzt und an der I/O-Blende zwei weitere USB3.0-Ports haben möchte - oder umgekehrt.

Mit einer schnellen SanDisk-SSD mit 120 GB haben wir auch einen kleinen Test gemacht, wie die USB3.0-Performance von Z87 im Vergleich zu Z77 liegt. Gemessen wurde die sequentielle Schreib- und Leserate mit Atto bei unterschiedlichen Blockgrößen:

atto USB3 Z87satto USB3 Z77s 

USB 3.0 Performance Vergleich:
Links: Intel Z87, Rechts: Intel Z77

Wie man sehen kann, unterscheiden sich die beiden Controller nur geringfügig: An der Performance hat Intel bei USB3.0 nicht geschraubt, allerdings war man hier auch bereits sehr schnell unterwegs.

Alle anderen Bereiche sind auf dem Diagramm praktisch unverändert. Intels Rapid Storage Technology ist natürlich mit an Board, wie beim Z77-Chipsatz mit Rapid Start Technology, die das Booten von Windows-Systemen beschleunigen kann, indem Suspend-to-RAM und Suspend-to-Disk kombiniert wird. Notwendig hierfür ist eine SSD, auf die das System den RAM-Inhalt ablegen kann, um ihn dann nach dem Aufwecken des Systems wieder zurückzuspielen. Die Smart Response-Technik, also einfach ausgedrückt SSD Caching, war bereits beim Z68 dabei. Smart Connect als weitere Technik dient dem Synchronisieren des Systems, auch wenn der Monitor abgeschaltet ist. Die Funktion sucht dann automatisch nach Neuigkeiten, z.B. wird der Mail-Client synchronisiert. Auch diese Funktion gab es bereits beim Z77. Intels Identity Protection Technology, die Intels Anti Theft Technology und weitere vPro-Features unterstützt der Chipsatz natürlich ebenso.


Mit Ivy Bridge führte Intel die 22-nm-Fertigungstechnik ein. Dabei verkleinerte Intel nicht nur die Strukturen, sondern führte auch erstmals eine neue Transistor-Form ein, den Tri-Gate-Transistor. Bei dieser Transistorform umschließt das Gate den Transistor dreidimensional, somit werden Leckströme reduziert und die Energieeffizienz des Prozessors steigt. Die 22-nm-Fertigung hat Intel unverändert auch für Haswell übernommen.

1.4 Milliarden Transistoren hatte Ivy Bridge, bei einer Kern-Größe von 160 mm². Im Vergleich zu Sandy Bridge waren dies 400 Millionen Transistoren mehr (995 Millionen insgesamt, bei 216 mm²). Haswell hält diese Nummer, es sind weiterhin 1,4 Milliarden Transistoren, allerdings bei einer etwas größeren Kernfläche von 177 mm². Die Transistoranzahl ist maßgeblich für den Stromverbrauch, denn mehr Transistoren führen unweigerlich zu einer höheren Abwärme. Insofern dürfte Haswell also nicht mehr Energie verbrauchen als Ivy Bridge, da auch dieselbe Fertigungstechnik zum Einsatz kommt. Durch die im Architektur-Bereich bereits genannten Stromspartechniken sollten in Nicht-Volllast-Szenarien sogar deutliche Einsparungsmöglichkeiten existieren.

Intel hat seit einigen Jahren bereits alle Bereiche des Prozessors so gestaltet, dass sie bei Nichtnutzung abgeschaltet werden können (beispielsweise die großen L3-Caches, Kernbereiche oder die Onboard-Grafik). Hinzu kommen DDR3- und GT-Power-Gating. Zudem unterstützt Intel seit Ivy Bridge auch Low-Voltage-DDR3 (DDR3L), kann also auf Plattform-Ebene durch 1,35-V-DDR3 noch einmal ein paar Watt sparen.

Intels 22-nm-Transistoren mit Tri-Gate-Technik

Intel hat bereits auf vielen vorherigen Veranstaltungen einen Einblick in die neue 22-nm-Fertigunstechnik gegeben. Hier führte man bereits mehrmals an, dass die 22-nm-Technik in der Tat etwas Neuartiges ist: Im großen und ganzen sind die aktuellen, planaren Transistoren auf einem Design erstellt, welches bereits 1974 entwickelt und eingesetzt worden ist. Anschließend wurden diverse Tricks und Optimierungen implementiert, um die Leakage zu minimieren und die Transistoren bei einer kleineren Fertigungstechnik zu beherrschen – bis zum Jahr 2000 war dies kein größeres Problem, anschließend wurde die Leakage aber zu einem Problem. Die Hardwareluxx-Leser erinnern sich sicherlich an Northwood, Prescott und ähnliche Prozessoren, die mit dem Hitzeproblem zu kämpfen hatten.

Im Jahr 2003 setzte Intel bei der 90-nm-Technik auf Strained Silicon Transistoren für NMOS und PMOS-Transistoren, um Gate Oxide Scaling zu reduzieren und den Ansteuerungsstrom (drive current) zu verbessern. Mit der 45-nm-Technik führte Intel die High-k Metal Gate Transistoren ein, also ein neues Dielektrikum (SiO2) und ein auf Hafnium basierendes Metall-Gate. Auch hier konnte die Performance der Transistoren massiv verbessert werden, ohne Leakage-Probleme zu bekommen.

Mit der Einführung der 22-nm-Transistoren verändert man aber die Struktur der Transistoren selber.

Als Beispiel zeigte Bohr auf dem Intel Developer Forum 2011 eine Grafik für 22-nm-Transistoren mit unterschiedlichen Drive Current / Leakage-Werten – je nach Anwendungsbereich. Benötigt man einen schnellen Prozessor, muss man auch eine höhere Leakage in Kauf nehmen, kann aber auf der anderen Seite bei einer niedrigen Leakage eine höhere Performance erreichen. Im Endeffekt ist es also möglich, je nach den Anwendungsbereichen des fertigen Chips eine passende Prozessortechnik einzusetzen (High Performance, Standard Performance, Low Power).

trigate-performance

Bohr führte die Hauptvorteile der 22-nm-Tri-Gate-Fertigung an:

trigate-small

Den Aufbau der Transistoren kann man im obigen Bild schön sehen: Das Gate "umschließt" den Transistor besser und verhindert so das Durchsickern von Strömen.

Intel setzt für Ivy Bridge und Haswell den P1270-Prozess für die 22-nm-Prozessoren ein. Im Jahr 2013 steht allerdings schon der P1272 genannte Prozess mit 14 nm ins Haus. Auf SOC-Seite sind die Prozesse P1271 und P1273 für Low-Power optimiert, der 14-nm-Prozess ist ebenso für 2013 geplant. Herstellen wird Intel Haswell in insgesamt fünf Fabriken, die auf den 22-nm-Prozess umgerüstet sind. Neben den Fabriken in Oregon werden auch die beiden Fabriken in Arizona die Prozessoren herstellen. Hinzu kommt die Fabrik in Israel. 

Intel wird die 22-nm-Technik sowohl für die klassischen Prozessoren (Core, Xeon,...) wie auch für die SoC-Produkte einsetzen (Atom, etc.). Intel optimiert dabei auch die bestehenden Designs auf die neuen Tri-Gate-Prozessoren. Intel sieht hier einen Vorteil im Zusammenlegen der Design-Teams und fährt deshalb einen „Unified Design Approach“ und legt die bisherigen Teams (SoC, CPUs) zusammen, um besser und schneller auf neue Marktbereiche reagieren zu können.

In einer Galerie zu dem Thema haben wir Intels Folien zum Thema 22-nm-Technik hinterlegt:

{jphoto image=16170}


Neue Stromspartechniken hin, 22-nm-Technik her - wichtig ist, was am Ende auf dem Tacho steht. Wir haben also ein Komplettsystem einmal im Windows-Idle-Betrieb und einmal mit Prime 95 unter Volllast getestet, um herauszufinden, wie sich der Stromverbrauch von Haswell im Verbrauch zur Vorgängergeneration und anderen Prozessormodellen verändert hat. Wir verwenden dabei die Testsysteme, die wir auch für die Benchmarks verwendet haben (siehe Beschreibung auf der Seite "Testsystem"). Gemessen wird hier das Komplettsystem, inklusive einer Radeon HD 7970-Grafikkarte. Der Stromverbrauch wird an der Steckdose gemessen, enthalten sind also auch Wirkungsverluste des Netzteils, wobei wir mit dem Seasonic P-660 ein sehr sparsames Modell mit 80-Plus-Platinum-Zertifikat eingesetzt haben.

Unter Windows im Idle-Betrieb wurden von uns folgende Leistungswerte ermittelt:

bmonboard3

Im Vergleich zu Ivy Bridge holt Haswell noch ein paar Prozentpunkte raus - wobei wir hier mit unterschiedlichen Boards testen und Ivy Bridge durch das besser ausgestattete ASUS Maximus V Formula etwas benachteiligt ist. Im Endeffekt wird der Abstand bei einem Board mit ungefähr gleicher Ausstattung also etwas knapper ausfallen.

Unter Last wurden von uns folgende Leistungswerte ermittelt:

bmonboard3

Haswell zeigt bei uns also vor allen Dingen im Idle-Bereich eine deutliche Verbesserung - allerdings muss man einschränkend sagen, dass das Intel-Board sicherlich ein paar Watt weniger im Verbrauch auf die Waage bringt als die gut ausgestattete ROG-Platine von ASUS. Trotzdem sind die Einsparungen beachtlich, auch wenn man ein paar Watt zugunsten des Intel-Boards aufschlägt. Allerdings ist dies nicht alles: Im Idle-Betrieb war auch schon Ivy Bridge im entsprechenden C6/C7-Betriebsmodus, den Intel nun noch einmal verbessert hat. Unter Volllast hingegen soll der Prozessor ja entsprechend Gas geben - und Dank einer annähernd gleichen Spannung und derselben 22-nm-Fertigungstechnik unterscheiden sich Ivy Bridge und Haswell nur durch das verwendete Mainboard.

cpuz idle
Ein kleiner Grund für den niedrigeren Verbrauch ist auch die Taktfrequenz von 800 MHz und die niedrigere Spannung, die jezt bei Haswell im Idle-Betrieb anliegt.

Einige Verbesserungen, die Intel eingeführt hat, betreffen aber hauptsächlich den Betriebsmodus "zwischen" Volllast und Idle-Betrieb. Die Schnelligkeit des Hin- und Herschaltens zwischen den Stromsparmodi können wir mit diesen einfachen Idle- und Lasttests nicht richtig wiedergeben. Diese Optimierungen sollten sich auch im Betrieb niederschlagen. Trotzdem ist es bereits interessant zu sehen, dass Haswell schon deutliche Einsparungen mitbringt.


Bei einem Desktop-Prozessor mit "K" im Namen geht es natürlich auch ans Overclocking, denn diese Prozessormodelle sind "unlocked". Wir haben natürlich auch Intels neuen Core i7-4770K in unseren Overclocking-Parcours geschickt, um einen ersten Eindruck von der Übertaktungsfähigkeit der Prozessoren zu bekommen. Allerdings gibt es wie immer natürlich eine gewisse Schwankung unter den Modellen, sodass dies nur ein erster Blick auf die Übertaktungsfähigkeit ist.

Da Haswell auf die gewohnten 22-nm-Fertigungsstrukturen von Ivy Bridge zurückgreift und auch an der Pipeline keine großen Veränderungen vorgenommen worden sind, ist zu vermuten, dass sich die Übertaktungsfähigkeit in einem identischen Rahmen bewegt. Allerdings gibt es zwei größere Veränderungen bei Haswell, die das Ergebnis beeinflussen können. Zum einen ist der integrierte Spannungswandler (iVR) neu, zum anderen hat Intel die Möglichkeit bei Haswell implementiert, die Base Clock Rate mit Teilern vom Rest des Systems zu entkoppeln und somit eine Übertaktung über diese zu ermöglichen.

Auch bei anderen Punkten gab es kleine Veränderungen - so kann jetzt der Multiplikator auf insgesamt x80 angehoben werden:

Vergleich Overclocking-Features
CPU-ModellSandy BridgeSandy Bridge EIvy BridgeHaswell
Real-Time Core Ratio Change nein teilweise (non-turbo) ja, inkl. Turbo ja, inkl. Turbo
PL1, PL2, Tau & ICC Max. Overrides ja ja ja ja
SVID Extra Voltage ja ja ja ja
maximaler Prozessor-Multiplikator 57 unlimitiert 63 80
Real-Time-Veränderung
des GPU-Multiplikators
nein n.a. ja ja
DDR3-Ratio bis 2133 MHz bis 2400 MHz bis 2667 MHz bis 3200 MHz
DDR-Stufen 266 MHz 266 MHz 200 / 266 MHz 200 / 266 MHz
DDR Timings einstellbar ja ja ja ja
XMP-Version 1.2 1.2 oder 1.3 1.3 1.3
Base Clock Overclocking limitiert, +7% CPU Strap mit 1,25/1,67 Multiplikator, +7% limitiert, +7% CPU Strap mit 1,25/1,67 Multiplikator

Die Base Clock Rate ließ sich bei aktuellen Ivy-Bridge-Modellen und auch bei Sandy Bridge nur um ein paar Prozent übertakten. Der Grund ist relativ offensichtlich: Bereiche wie der Ring Bus, System Agent, der L2-Cache und die I/O-Controller hängen ebenso an der Base Clock Rate wie der Prozessortakt. Erhöht man die Base Clock Rate wird das System instabil, sobald einer dieser Bereiche instabil wird. Da Intel nur bei Sandy-Bridge-E-Prozessoren Teiler zur Verfügung gestellt hat (sogennanter CPU Base Clock Strap), war es nur bei diesem Prozessor möglich, die Base Clock Rate zu erhöhen.

Stellt man nun mit Haswell einen Takt von z.B. 125 MHz ein, lassen sich mit dem entsprechenden Teiler (1,25 oder 5/4) alle anderen Bereiche weiterhin mit 100 MHz betreiben. Die Stabilität wird somit nicht mehr stark limitiert. Allerdings sind auch hier der Flexibilität Grenzen gesetzt, denn bei einer höheren Base Clock Rate steigt natürlich auch der Referenztakt des System Agents wieder an. Bei 135 MHz sind es beispielsweise 108 MHz - und das könnte bereits wieder zu Problemen führen.

cpuz 125MHz-strap
Die Möglichkeit mit dem Bus Speed zu übertakten schafft die Möglichkeit, auch einen Nicht-K-Prozessor um z.B. 25% zu übertakten.

Unseren Core i7-4770K haben wir natürlich auch übertaktet und hierbei das Intel-Mainboard verwendet. Hier stehen zwar nicht allzu viele Optionen zur Verfügung, aber gerade bei den Spannungen ist zu erwarten, dass hier alle Boards in Zukunft dieselben Spannungsveränderungen mitbringen werden. Durch die Integration des Voltage Regulators ist es für die Mainboardhersteller einfacher, alle Optionen zu bieten. Demnach ist zu erwarten, dass auch ein 08/15-Mainboard in Zukunft recht gute Einstellungsmöglichkeiten für die Spannungen mitbringen wird. Ein High-End-Overclocking-Board mit allen Rafinessen wird somit von den Einstellungsmöglichkeiten fast dasselbe liefern wie ein 08/15-Board. Allerdings ist es natürlich möglich, dass das Overclocking-Board deutlich besser übertaktet, da der Hersteller das Board bezüglich des Strombedarfs und der Signallaufzeiten auf höhere Taktraten ausgelegt hat.

haswell voltage
Mit dem neuen Voltage Regulator auf der CPU wird es für den Hersteller einfacher, aber die Mainboardausstattungen werden einheitlicher. 

Exemplarisch haben wir die einstellbaren Spannungen aus zwei Boards aufgelistet, zum einen vom aus MSI Z87-GD65...

... und zum anderen vom ASUS Z87 Deluxe:

Mit dem Intel-Board kamen wir bei unserem Sample auf folgende Frequenzen:

cpuz 45ocscpuz 47ocs 

Links: Mit 4,5 GHz lief unser System ohne Probleme stabil. Dafür war noch nicht einmal
eine Spannungserhöhung notwendig.
Rechts: Mit Spannungserhöhung auf ca. 1,275 V gelang uns auch ein Betrieb mit 4,7 GHz.

cpuz undervoltings 

Undervolting: Auch mit knapp 0,9 V Spannung arbeitet der Core i7-4770K
noch zuverlässig mit spezifizierten Taktraten.

Wie bei Ivy Bridge darf man also bei den Haswell-Prozessoren auf einen Übertaktungserfolg zwischen 4,5 und 4,9 GHz hoffen, mit etwas Glück und guter Kühlung erreicht man eventuell auch die 5-GHz-Grenze. Sehr viel mehr Leistung wird man aus den Modellen aber mit konventioneller Kühlung nicht kitzeln können.

Da Ivy Bridge bereits bei Übertaktung recht warm wurde, haben wir auch für Haswell den Test gemacht und für verschiedene Spannungswerte die Leistungsaufnahme protokolliert. Daran kann man gut erkennen, wieviel zusätzliche Abwärme durch Übertaktung des Prozessors entsteht:

bmonboard3

Im Vergleich zu anderen CPUs verläuft diese Kurve noch recht linear. Trotzdem ist zu sehen, dass bei erhöhter Spannung die Leistungsaufnahme durchaus heftiger ansteigt. Der Verbrauch steigt normalerweise quadratisch zur angelegten Spannung. Wenn Intel für einen im Turbo-Betrieb arbeitenden Haswell-Prozessor eine TDP von 84 Watt vorsieht und wir im Lastbetrieb des Gesamtsystems knapp 115 Watt messen, dann kann man hochrechnen, welche Abwärme der Prozessor bei knapp 190 Watt generiert - die zusätzlichen 75 Watt gehen nämlich vollständig auf seine Kappe.

Interessant sind auch einige andere Optionen, die wir in den ersten Mainboards vorfanden, die uns zur Verfügung gestellt wurden. Ein MSI Z87-GD65 lieferte beispielsweise Einstellungsmöglichkeiten für die Taktfrequenzen des Ring Busses mit denselben Multiplikatoren wie für die CPU. Es gibt hier also beim Übertakten einiges zu entdecken. Eine Overclocking-Guide für Haswell werden wir nach der Computex in die Wege leiten.


Seit Ivy Bridge gibt es mehr Flexibilität bei den Speicherteilern. Während Sandy Bridge zunächst nur 1333, 1600, 1866 und 2133 MHz anbot und die Option 2400 MHz mangels Können quasi nicht verfügbar war, hatte Intel mit Ivy Bridge bereits die Bitte der Speicherhersteller erhört und weitere Speicherteiler hinzu gefügt. Konkret gibt es seit Ivy Bridge die Grundfrequenzen 200 und 266 MHz, hieraus bilden sich mit ganzen und halben Multiplikatoren die Taktraten des Speichers. Allerdings war es auch bei Ivy Bridge unmöglich, einen Takt von mehr als 2600 MHz wirklich stabil zu erreichen, sodass die oberen Frequenzen bis 3200 MHz im Bios zwar anwählbar waren, aber nicht stabil liefen.

Mit Haswell soll sich dies nun etwas ändern. Zum einen bringen diverse Speicherhersteller Haswell-optimierte Dual-Channel-Kits an den Markt, die auch wieder XMP 1.3 unterstützen, zum anderen wird es aber auch wieder bestimmte Overclocking-Serien geben, die mit extrem hohen Taktraten zurecht kommen können. G.Skill sendete uns hierfür beispielsweise ein 2933-MHz-Kit aus der Trident-X-Serie mit 2x 4 GB Kapazität. Leider konnten wir den Takt von 2933 MHz auf unserem Intel-Testboard nicht einstellen. Das Mainboard startete immer wieder mit der Meldung "Overclocking failed" durch.

asusbioss
Intel gibt den Prozessor offiziell bis 2666 MHz DRAM-Takt frei zum Übertakten,
aber es scheint noch höhere Multiplikatoren zu geben, über die
ASUS hier bis zu 3200 MHz Speichertakt einstellen kann.

Um den Speichercontroller von Haswell bis ans Äußerste zu bringen, schickte uns G.Skill zusätzlichen Arbeitsspeicher ins Haus, der der Trident-X-Reihe angehört und vor allem mit einem besonders hohen Takt bei vergleichsweise guten CAS-Latenzen auf sich aufmerksam machen kann. Der Hersteller hat die beiden 4-GB-Module mit bis zu 2933 MHz spezifiziert - bei einer Spannung von 1,65 Volt und CL 12-14-14-35. Optisch sind die Module in Rot und Schwarz gehalten, mit schwarzem PCB, was optisch zu den Republic-of-Gamers-Mainboards von ASUS oder der Fatal1ty-Serie von ASRock passen würde. Für ein Foto haben wir das Paar auf unsere Intel-Platine gesteckt:

IMGP9441s
G.Skills neue Trident DDR3-2400 kamen für den Overclocking-Test zum Einsatz.

Folgende Performancewerte konnten wir messen:

bmonboard3

Die Speicherbandbreite steigt von 1066 MHz bis 2666 MHz deutlich an. Muss man allerdings aufgrund der hohen Frequenzen die CAS-Latenzen etwas entschärfen, fällt der Performance-Unterschied im Vergleich zum jeweils vorangegangenen Test nicht mehr ganz so hoch aus. Dies ist beispielsweise beim Wechsel von 1866 auf 2133 MHz der Fall. Hier nimmt die Speicherbandbreite um knapp drei GB pro Sekunde zu, während sie bei anderen Tests schon bis zu vier GB Unterschied bringt. Haswell erreicht bei 2400 MHz die beste Performance.

bmonboard3

Gleiches gilt auch für 7-Zip. Hier nimmt die Leistung stetig zu.

Wir haben mit den G.Skill Trident-Modulen immerhin einen Takt von 2666 MHz erreicht:

cpuz ram
Schicke Frequenz: DDR3-2666 war bislang nicht ohne viel Glück und
Optimierung bei Ivy Bridge möglich. Haswell schafft es aus dem Stand.

Ein hoher Speichertakt kann bei einigen Anwendungen durchaus einen positiven Effekt haben. Allerdings lohnt sich der Kauf von ultrateuren DDR3-Kits sicherlich nur in wenigen Fällen, da mit einer schnelleren CPU oder einer schnelleren Grafikkarte oftmals ein höherer Performancegewinn möglich ist. Wer allerdings übertakten möchte, kann mit den neuen Prozessoren neue Grenzwerte austesten.


Die Testsysteme haben wir neu aufgebaut - entsprechend kommen bei diesem Vergleich die neuesten Treiber und Systemupdates zum Einsatz. Für alle Systeme haben wir eine Basisausstattung verwendet, die möglichst identisch belassen wurde. Ändern müssen wir natürlich neben der CPU das Mainboard und teilweise auch die Speicherausstattung. Folgende Basiskomponenten sind für alle Systeme identisch:

Für die neuen Ivy-Bridge-Modelle und kompatible Sockel-1155-Prozessoren setzten wir folgende Konfiguration ein:

Für den mitgetesteten Sockel 2011 setzten wir folgende Konfiguration ein:

Für die mitgetesteten AMD-Modelle setzten wir folgende Konfiguration ein:

Für den mitgetesteten AMD A6-3650 setzten wir folgende Konfiguration ein:

Als Software setzten wir Windows 8 64 bit ein, jeweils mit aktuellstem Service-Pack, Treibern und Benchmark-Versionen. Wir verwendeten für alle Systeme als Timings 9-9-9-24 1t, auch wenn dies von den Herstellern anders vorgesehen wird (z.B. Ivy Bridge: 11-11-11 2t mit vier Speichermodulen, 11-11-11- 1t mit zwei Speichermodulen), um Timing-Unterschiede möglichst nicht zu berücksichtigen.

Wie man sehen kann, haben wir einheitlich auf ASUS-Mainboards gesetzt. Hierbei ist jedoch teilweise durch eine automatische Übertaktung im Bios eine manuelle Turbo-Frequenz-Einstellung notwendig. Bei "Auto"-Settings setzt ASUS gerne mal auch für Volllast den höchsten Single-Core-Multiplikator an und übertaktet so automatisch die CPU. Diesen Effekt wollten wir hier natürlich nicht haben und setzten, sofern ASUS dies bei den Mainboards entsprechend umgesetzt hat, die Turbo-Frequenz manuell auf die von Intel spezifizierten Werte. Sofern möglich wurden alle Prozessoren mit bestmöglichen Einstellungen und aktiviertem Stromsparbetrieb betrieben.


Wir beginnen mit einigen synthetischen CPU-Benchmarks:

bmonboard3

Die Speicherbandbreite ist in erster Linie abhängig von den bereitgestellten Kanälen und dem Takt. Entsprechend liegen die Vier-Kanal-Modelle ganz vorne - der Core i7-3970X spielt aber natürlich wie der Core i7-3960X in einer anderen Preisklasse. 

Haswell liegt dicht an dicht mit IvyBridge. Nur wenige Megabyte trennen die beiden Plattformen. Im Schnitt sind aber rund 21 GB/Sek. möglich.

 

bmonboard3

Beim Cache- und Speichertest von SiSoft Sandra 2012 kann sich Haswell etwas deutlicher von seinen beiden Vorgängern absetzen. Die höheren Bandbreiten innerhalb der CPU und die angepassten Latenzen dürften hierzu ihren Teil dazu beigtragen aben - trotz gleicher Taktraten im Falle des Core i7-4770K. An vorderster Front sind auch hier die Sechskern-Prozessoren der SandyBridge-E-Reihe.

 

bmonboard3

Keine großen Unterschiede im Kryptografie-Test von SiSoft Sandra. Hier nehmen sich Haswell und IvyBridge nicht viel.

bmonboard3

Im Arithmetik-Test fallen die Unterschiede hingegen wieder etwas größer aus. Insgesamt können sich beide Haswell-Kandidaten vor das jetzt überholte IvyBridge-Flaggschiff setzen. Der Intel Core i7-3770K wird 130,64 zu 109,4K geschlagen. Im Großen und Ganzen keine Paradedisziplin von IvyBridge. Selbst dessen Vorgänger SandyBridge ist schneller.

bmonboard3

wPrime lassen wir mit 1024M berechnen - hier kommen alle Kerne zum Einsatz. Entsprechend liegen die SandyBridge-E-Modelle mit 12 Threads weit vorne. Größere Leistungsunterschiede zwischen 3770K und 4770K bzw. 3570K und 4670K sind allerdings ebenfalls nicht zu vermelden. 

bmonboard3

TrueCrypt setzen wir in der neuesten Version ein, wenn ein Prozessor AES-NI unterstützt, hat er also einen Vorteil. Im AES-Twofish-Serpent erreicht der Core i7-4770K immerhin 238 MB/s Durchsatz - der Core i7-3970X/3960X liegt aufgrund seiner höheren Kernanzahl noch vor ihm. Gleiches gilt für AMDs Vishera-Chip. Insgesamt schafft es Haswell sich um rund 10 bis 15 Prozent von IvyBridge abzusetzen.


Wir starten mit den Anwendungs-Benchmarks:

bmonboard3

Im Multi-CPU-Bereich des Benchmarks liegen die Prozessoren mit mehr Kernen vorne. Das Resultat vom Core i7-4770K kann sich trotzdem sehen lassen. Über einen Punkt kann er mehr als der Intel Core i7-3770K einfahren.

 

bmonboard3

Frybench ist derselbe Typ von Benchmark - und zeigt deshalb auch ähnliche Resultate.

 

bmonboard3

In unserem Gimp-Filtertest lassen wir ein großes 14-Megapixel-Bild durch verschiedene Filter laufen. Welche CPU die Arbeiten in kürzerer Zeit erledigt, hat gewonnen. Haswell ist wieder einmal mehr nur einen Hauch schneller und kann es sogar fast mit den deutlich teureren SandyBridge-E-CPUs aufnehmen. 

 

 

bmonboard3
bmonboard3

... und identisch sieht es auch im zweiten Video-Bearbeitungs-Test aus, auch hier kann sich Haswell gut positionieren.


bmonboard3

Gleiches Bild auch bei POV Ray. Hier bekämpft man sich ebenfalls fast mit SandyBridge. Die direkten IvyBridge-Vorgänger haben aber nur ein leichtes Nachsehen.

bmonboard3

Der kurze Kompressions-Benchmark zeigt eine 6 Prozent höhere Leistung vom Core i7-4770K zum Core i7-3700K.

bmonboard3

Der Kompressions-Benchmark von 7Zip schießt in dieselbe Richtung und kommt deshalb auf annähernd identische Ergebnisse wie WinRAR für alle CPUs. Etwas Federn lassen müssen die Core-i5-Modelle von IvyBridge und Haswell.


Weiter geht es mit diversen Spielen und dem 3DMark 2011:

3DMark und 3DMark 11

Auch die neueste Generation des 3DMark wollen wir mit in den Benchmark-Parcour aufnehmen. Beim 3DMark 11 handelt es sich um den ersten vollständigen DirectX-11-Benchmark aus dem Hause Futuremark. Aus diesem Grund macht er auch ausgiebig Gebrauch von Tessellation, Depth of Field, Volumetric Lighting und Direct Compute. Obligatorisch ist natürlich auch die Unterstützung für Multi-Core-Prozessoren mit mehr als vier Kernen. Der Download ist in unserer Download-Area möglich.

3dmark11_2_rs 3dmark11_1_rs
3dmark11_4_rs 3dmark11_3_rs

Zum kostenlosen Download von Futuremarks 3DMark 11 gelangt man über diesen Link.

bmonboard3
bmonboard3

Der Standardbenchmark beim Grafikkarten-Vergleich spricht auch auf unterschiedliche CPUs recht gut an - unter anderem auch wegen der eingebauten CPU-Tests. Allerdings erreicht der Core i7-3770K hier nur eine um 2,5 Prozent höhere Leistung als der Core i7-2700K, da die Grafikkarte natürlich in einem hohen Maße mit in die Endabrechnung eingeht.

 

FarCry 3

Der neuste Teil der Far-Cry-Serie basiert auf der Dunia Engine 2 und wurde von Ubisoft entwickelt. Es entführt den Spieler auf eine tropische Insel, wo er den Protagonisten Jason Brody spielt, der dort mit seinen Freunden Urlaub macht. Als er und seine Freunde von Piraten gefangen werden, gelingt es ihm als einzigen zu entkommen. Mit Hilfe der einheimischen Bevölkerung tritt er nun an, um seine Freunde zu retten und die Piraten zu besiegen. Far Cry 3 kann wie auch die ersten beiden Teile mit einer beeindruckenden Grafik überzeugen. Dabei kommt DirectX 11 in Verbindung mit Kantenglättung, Umgebungsverdeckung und schönen Texturen sowie einer hohen Detaildichte zum Einsatz, womit auch High-End-Grafikbeschleuniger an ihre Grenzen gebracht werden.

Screenshot zu Far Cry 3 Screenshot zu Far Cry 3
Screenshot zu Far Cry 3 Screenshot zu Far Cry 3

Zur Vollversion von Far Cry 3 gelangt man über diesen Link.

bmonboard3
bmonboard3

Bei Far Cry 3 drängeln sich SandyBridge, IvyBridge, Haswell und natürlich auch SandyBridge-E dicht an dicht in der oberen Hälfte der Hitliste. Haswell kann sich aber erneut einen kleinen Vorsprung erspielen. 

 

Anno 2070

Anno 2070 spielt entgegen seiner vier Vorgänger nicht mehr in der Vergangenheit sondern knapp 60 Jahre in der Zukunft. Das Spielprinzip blieb grundsätzlich gleich, das heißt fremde Inseln erkunden, besiedeln, Wirtschaftskreisläufe aufbauen, um die Bedürfnisse der unterschiedlichen Bevölkerungsteile zu befriedigen, und sich in der Diplomatie üben. Neu sind die drei Fraktionen: Die Ecos setzen auf regenerative Energie und erhalten die Natur, während ihr Gegenpart, die Tycoons, durch Schwerindustrie die Umwelt verschmutzen. Die dritte Fraktion, die Techs, ermöglicht es, neue Techniken zu nutzen und auf dem Meeresboden zu siedeln. Die großen Inseln, die lebendige Flora und Fauna und die fantastischen Wassereffekte der eigens von Related Designs entwickelten Engine (DX11) verlangen auf der höchsten Detailstufe der Grafikkarte einiges ab.

 
 

Zur Vollversion von Anno 2070 in unserem Preisvergleich gelangt man über diesen Link.

 

Anno 2070, 1920x1080, 4xAA, high

bmonboard3
bmonboard3

Deutlichere Sprünge gibt es bei Anno 2070. Hier konnte sich Haswell bei geringer Auflösung und wenigen Details sogar an die Spitze des Testfeldes setzen und SandyBridge in die Flucht schlagen. Der Intel Core i5 4760K tut sich hingegen mit dem Intel Core i5-3570K etwas schwerer. 


Black Ops 2 ist der letzte und aktuellste Teil der "Call of Duty"-Reihe, die nun aber eine Überarbeitung erfahren soll. Die Welt befindet sich inmitten eines zweiten kalten Krieges zwischen der Volksrepublik China und den Vereinigten Staaten um die kostbaren Metalle der Seltenen Erden. Das Verbot des Exports verleitet die USA dazu, mit einem Cyberangriff die chinesische Börse lahmzulegen. Es kommt zum Konflikt zwischen den beiden Parteien, der allerdings nicht offen ausgefochten wird.

Screenshot zu Call of Duty: Black Ops 2 Screenshot zu Call of Duty: Black Ops 2

Screenshot zu Call of Duty: Black Ops 2 Screenshot zu Call of Duty: Black Ops 2

Zur Vollversion von Call of Duty: Black Ops 2 gelangt man über diesen Link.

bmonboard3
bmonboard3

Gleiches gilt für Call of Duty: Black Ops II, wenngleich das neue Haswell-Flaggschiff seine Führung wieder an SandyBridge abgeben musste. Haswell und IvyBridge trennen nur wenige Prozentpunkte voneinander.

 

Metro 2033

Eine unwirtliche und verstrahlte Umwelt, Mutanten und ständige Bedrohungen - all diese Elemente nutzen die Ex-S.T.A.L.K.E.R. Entwickler 4A Games Studios, um den Spieler in die Welt von Metro 2033 zu entführen. Im Jahr 2033 hat sich die Menschheit mal wieder bekriegt und durch einen Atomschlag gegenseitig fast in die Luft gebombt. Eine Hand voll Überlebende hat sich in die Systeme der Moskauer U-Bahn zurückgezogen, um dort Zuflucht zu suchen. Zum Leidwesen der Flüchtlinge ist dieser Ort nicht ihre alleinige Heimat, auch feindselige Kreaturen, die sich an die giftige Atmosphäre gewöhnt haben, sind dort anzutreffen. Ihr Ziel: die verbleibenden Menschen ausrotten! Ob sie nun rohe Gewalt oder ausgeklügelte Taktik anwenden, es bleibt ihnen überlassen, wie sie das Ziel erreichen. Wie schon bei ihrem Erstlingswerk schaffen die Entwickler eine Wahnsinnsatmosphäre und lassen mit der A4-Engine (DX11) selbst moderne Grafikkarten an ihre Grenzen kommen.

Metro_1_rs Metro_2_rs
Metro_3_rs Metro_4_rs

Zur Vollversion von Metro 2033 in unserem Preisvergleich gelangt man über diesen Link.

bmonboard3

Metro 2033 zeigt IvyBridge ebenfalls leicht hinter Haswell. Die Unterschiede sind jedoch nur sehr sehr gering. 

 

Der fünfte Teil der The-Elder-Scroll-Reihe spielt in der namensgebenden Provinz Skyrim (dt. Himmelsrand). Die Handlung dreht sich um die Rückkehr der Drachen, wie sie in den "Elder Scrolls" vorhergesagt wurde. Der Spieler übernimmt die Rolle eines "Dovahkiin", eines Individuums mit dem Körper eines Menschen und der Seele eines Drachen. Der Spieler durchstreift bei dem Kampf gegen die Drachen opulente Städte mit verschlungenen Gassen und atemberaubende Landschaften, deren Grenze buchstäblich der Himmel ist. Mit seiner hohen Weitsicht und der detaillierten Vegetation bringt Skyrim so manches System ins Schwitzen.

Crysis1_rs Screenshot zu The Elder Scrolls V Skyrim
Screenshot zu The Elder Scrolls V Skyrim Screenshot zu The Elder Scrolls V Skyrim

Zur Vollversion von Elder Scrolls V: Skyrim gelangt man über diesen Link.

bmonboard3
bmonboard3

The Elder Scrolls V: Skyrim scheint Haswell etwas besser zu gefallen als noch IvyBridge. Fast 5 FPS trennen beide Generationen. 


Abschließend an die Benchmarks möchten wir noch das Performanceranking aufzeigen. Darin haben alle Benchmarks berücksüchtigt und gleich gewichtet. Als Basis diente dabei der jeweils langsamste Prozessor eines jeden Benchmarks. Die normierten Werte, zeigen Haswell vor seinen direkten Vorgänger. Im Schnitt leistet die Intel Core i7-4770K knapp zehn Prozent mehr. Auch der Vorsprung des kleineren Intel Core i5-4670K bewegt sich in etwa in diesem Rahmen. Insgesamt positionieren sich unsere beiden Haswell-Samples im oberen Drittel des Prozessoren-Testfeldes. Einzig SandBridge-E bietet dank der Kraft von sechs Kernen noch mehr Leistung. Weit abgeschlagen sind AMDs FX-Prozessoren und vor allem die kleinen APUs auf "Trinity"-Basis.

bmonboard3

Auf dieser Seite schauen wir uns das Performance-pro-Watt-Verhältnis der Prozessoren an. Hierfür haben wir die Leistung über allen Benchmarks in einen Index zu gleichen Teilen einfließen lassen und zur Leistungsaufnahme unter Last in Bezug gestellt. Folgende Prozessoren sind hier am effizientesten:

bmonboard3

Die Übersicht zeigt eindrucksvoll, was Intels neue Haswell-Architektur in Sachen Leistung und Effizienz zu bieten. Sowohl der Intel Core i7 4770K wie auch Core i5-4670K zeigen ein beeindruckendes Ergebnis, das selbst die kleineren IvyBridge-Prozessoren schlechter dastehen lässt. Aufgrund ihrer älteren SandyBridge-Kerne und der hohen Anzahl von sechs Rechenwerken, liefern die beiden SandyBridge-E-Modelle ein Performance-pro-Watt-Ergebnis ab, das sich nur in den unteren Regionen ausfindig machen lässt. Schlusslicht ist der AMD A10-5800K - zum großen Teil wohl der schlechten Rechenleistung geschuldet.


Was bringt ein schneller Prozessor, wenn man sich ihn nicht leisten kann? Wir haben einen Blick in unseren Preisvergleich geworfen und die aktuellen Straßenpreise aller Prozessoren des Testfeldes miteinander verglichen. Gezählt wurde jeweils die günstigste Boxed-Version in unserem Preisvergleich in Deutschland. Da dort der Intel Core i5-4670K noch nicht gelistet lag, nahmen wir hierfür den Alternate-Preis zum Vergleich heran, der auf unserem Lieferschein stand. Zu beachten ist allerdings, dass sich die Preise meistens ein paar Tage nach dem Launch zugunsten der Neuvorstellungen verschieben, da die Shops die geringe Anzahl an lagernden Produkten zunächst zu einem höheren Preis an die Early Adopter verkaufen. Der Preis passt sich im Anschluss an und dementsprechend kann sich das Preis-Leistungsverhältnis der Haswell-Prozessoren noch deutlich verbessern.

bmonboard3
bmonboard3

Mehrere Prozessoren fallen hier klar aus dem Rahmen:

Der Intel Core i7-3970X und der Intel Core i7-3960X sind mit Preisen von über 830 Euro deutlich zu teuer. Der neue Intel Core i7-4770K reiht sich dann allerdings schon wieder direkt dahinter ein. Der Preis von 335 Euro dürfte in den nächsten Tagen aber bestimmt noch etwas fallen. Zur Markteinführung liegen die Preise immer etwas zu hoch und pendeln sich erst ein paar Tage später ein. Dann hätte das neue Haswell-Flaggschiff durchaus noch Potential, den ein oder anderen Platz noch gut zu machen. Etwas besser sieht es für den Intel Core i5-4670K aus. Er reiht sich ins breite Mitelfeld und ist in Sachen Preis-Leistungs-Verhältnis fast schon in die Fußstapfen seines Vorgängers getreten. Der Unterschied ist hier nicht allzu groß. Ein sehr gutes Preis-Leistungs-Verhältnis bieten aber auch einige Modelle aus AMDs FX-Reihe.


Im letzten Jahr schrieben wir im Ivy-Bridge-Test: "Die Vorteile von Ivy Bridge liegen demnach im Detail." Eigentlich könnte man dieses Zitat im heutigen Test kopieren, auch wenn Haswell im Vergleich zu Ivy Bridge unter der Haube deutlich mehr zu bieten hat als Ivy-Bridge im Vergleich zu Sandy Bridge. Doch letztendlich durchbricht die neue Architektur nicht die nächste Schallmauer und hängt die Vorgängergeneration ab, sondern verbessert sie in allen Bereichen eher evolutionär. Der einzige Bereich, in dem Intel wirklich einen deutlichen Vorteil mit Haswell herausarbeiten kann, ist die integrierte Grafik.

Schaut man auf die reine CPU-Leistung, so ergibt sich je nach Benchmark ein Performancegewinn von 5 bis 10%, in einigen liegt Haswell auch etwas darüber. Dies ist im Endeffekt ein ähnliches Resultat wie bei Ivy Bridge im Vergleich zu Sandy Bridge. Im Endeffekt ist somit ein Core i7-2600K (Januar 2011) nur etwas langsamer als ein Core i7-3770K (April 2012), und dieser wiederum nur etwas langsamer als ein Core i7-4770K. Letztendlich stellt sich bei der CPU-Performance also die Frage, ob man für dieses Leistungsplus sein etwa zweieinhalb Jahre altes System über den Haufen werfen sollte. Wenn ein schon schneller oder sogar übertakteter Sandy-Bridge-Prozessor im Rechner steckt oder man im letzten Jahr ein Ivy-Bridge-System angeschafft hat, heißt die Antwort ganz klar: "Nein".

Evolutionär geht es mittlerweile auch beim Stromverbrauch zu. Während bei einem Notebook der Hersteller deutlich mehr optimieren kann, hakt es bei einem Desktop-System oftmals aufgrund der diversen  Möglichkeiten, die existieren, um ein System zusammenzubauen. Wenn Intel nun bei Haswell im Idle-Betrieb 5 Watt spart, obwohl bereits Ivy Bridge sehr stromsparend war, so ist dies auf die reine CPU-Stromaufnahme betrachtet ein sehr hoher Wert. In Desktop-Systemen wird dies aber durch hervorragend ausgestattete Mainboards mit Zusatzchips, zwei Gehäuselüftern oder einem CPU-Kühler mit Wasserkühlung bereits schon wieder eingerissen. Zwar macht Kleinvieh auch Mist, aber der Unterschied rechtfertigt eine Neuanschaffung eines Systems auch nicht wirklich.

Letztendlich darf man auf die Overclocking-Resultate gespannt sein, die in unserem Forum bald zu lesen sein werden. Unsere Modelle finden sich letztendlich dort wieder, wo auch Ivy Bridge den höchsten Takt erreicht hat. Wenn man nicht auf Extremkühlung setzt, wird ein Core i7-4770K sicherlich bei knapp 4,7 bis 5,0 GHz maximalem Takt ausgereizt sein. Ein höherer Takt ist somit auch nicht möglich. Wer braucht denn eigentlich dann eigentlich einen Desktop-Prozessor aus der 4. Generation der Core-Prozessoren?

IMGP9403s
Ohne Konkurrenz: Intels Core i7-4770K hat keinen Gegenspieler.

Die Antwort ist einfach: Eigentlich jeder, der einen neuen PC anschaffen will oder muss. Seitdem AMD im Desktop-CPU-Bereich schwächelt und die Prozessorleistung mit Intel nicht mehr vergleichbar ist, gibt es keine Alternative zu den Core-Modellen. Intel musste demnach gar nicht eine Leistungssteigerung von 30-40% hinlegen, um am Ball zu bleiben - es reichen die oben erwähnten fünf bis zehn Prozent. Auch hat man beim Stromverbrauch mittlerweile alles optimiert, was in den eigenen Händen liegt: Die Northbridge ist in der CPU, der PCIe-Controller, mittlerweile auch die Spannungswandler. Man nutzt für den Prozessor die hervorragende 22-nm-Fertigung mit Tri-Gate-Transistoren. So hat man nicht nur auf CPU-Ebene, sondern auch auf Platform-Ebene ein hervorragend energieeffizientes Produkt.

Schaut man auf die Kritikpunkte bei Ivy Bridge, so war die etwas unflexible Art des Übertaktens ein Kritikpunkt, den Intel mit der Möglichkeit, über die Base Clock Rate zu übertakten, eliminiert hat. Zudem war die Leistung der GPU trotz Verbesserung noch nicht ausreichend genug - und auch hier hat man mit der HD 4600 die Leistung noch einmal erhöht. Haswell ist also ein deutlich verbesserter Ivy Bridge und aufgrund des Mangels an Alternativen konkurrenzlos.

Eigentlich - und da folgt Intel dem Trend des Marktes - ist Haswell aber eher ein weiterer Schritt in Richtung Notebook-Markt. Das stimmt Desktop-Nutzer und Enthusiasten vielleicht etwas traurig, und da müssen wir zustimmen. Wir würden uns einmal wieder eine Enthusiasten-Plattform wünschen, die mit sechs oder acht Kernen, unvernünftigen Taktraten und großen Caches alles wegfegt, was in den Benchmark-Grafiken ganz oben steht. Allerdings ist Ivy-Bridge-E immer noch nicht in Sicht und der Haswell-E-Ableger Lituya Bay erst für das 1. Halbjahr 2015 geplant. Da werden wir also noch etwas warten müssen, bis im Desktop-Bereich die nächsten Rekorde fallen.

Gibt es Kritikpunkte bei Haswell? Nein, keine! Die Effizienz des Prozessors ist extrem gut, die Leistung ebenso. Im Overclocking ist man flexibel, die Z87-Plattform ist solide und hat gute Features. Auch die Grafik ist konkurrenzfähig und wird aufgrund der Leistung und der Features (Multi-Monitor-Betrieb) in günstigen Desktop-PCs einige dedizierte Grafikkarten überflüssig machen.

Positive Aspekte der Haswell-Prozessoren:

Negative Aspekte der Haswell-Prozessoren:

 4770kawards

In naher Zukunft werden wir uns diversen Z87-Mainboards widmen und natürlich auch passenden Kühlkörpern und Speicherkits. Weiterhin arbeiten wir auch an einer Overclocking-Guide zur neuen Prozessor-Generation. Zudem werden wir auch die integrierte Grafik noch ein wenig durchleuchten. Es kommen also in der nahen Zukunft noch einige Haswell-Tests.