Core i7-870, i7-860 und i5-750 - und Clarkdale

Veröffentlicht am: von

lynnfieldAb dem 08.09. darf man bei Intel-Prozessoren drei neue Modelle mit in Betracht ziehen: Intel stellt am heutigen Tage die drei Core i7- und -5-Modelle auf Basis des "Lynnfield"-Kerns vor. Nach den bisherigen, teuren "Bloomfield"-basierenden Modellen der Core i7-Serie soll Lynnfield es schaffen, die Nehalem-Technik auch zu einem interessanten Preispunkt anzubieten. Wir haben die Prozessoren durch einen großen Benchmark-Parcours gejagd, stellen aber auch Architekturdetails vor und gehen auf die Technik und Overclocking-Features ein.

Zunächst ein Wort in eigener Sache: Intels Prozessoren wurden bereits im Juli auf einigen asiatischen Webseiten getestet, wo man als Europäer zumindest die Leistungswerte und technischen Features erkennen konnte. Im August berichtete bereits ein deutsches Printmagazin von den neuen Prozessoren, weiterhin gelangten größere Mengen der Prozessoren im August in den Handel. Aus diesem Grund ist es wohl nicht erstaunlich, dass man sich als interessierter Internet-Nutzer bereits vor dem offiziellen Launch über alle Details in Tests und Reviews informieren konnte. Wir haben allerdings wie immer stillgehalten, da wir auf einem Pressebriefing ein Non-Disclosure-Agreement (Verschwiegenheitsabkommen) eingingen, um an sämtliche Lynnfield-relevanten Informationen aus erster Hand zu kommen und nicht Halbwahrheiten aus dem Internet verifizieren zu müssen. Das ist zum einen bequemer, aber auch sicherer, da man Informationen, die von Intel selber kommen, als valide bezeichnen kann.

Der Nachteil dieses NDAs ist, dass wir mit unserem Test mittlerweile praktisch kaum noch Neuheiten präsentieren und statt dessen "nur" gründlich und ausführlich über die vorgestellten Prozessoren schreiben können. In Zeiten des schnelllebigen Internets zählt jedoch für Webseiten nur die Pageimpression, die man durch solche Tests in der Regel nicht bekommt, da jede größere Webseite heute von dem Thema berichten wird. Die Verlockung anderer Webseiten, bereits vor der offiziellen Vorstellung von den Prozessoren zu berichten, können wir also verstehen. Da wir auch unseren Lesern, die bereits viel über Lynnfield gelesen haben, etwas Neues bieten wollen, haben wir aus diesem Grund auch erste Testergebnisse der Clarkdale-CPU (spätere Core i3- und Core i5-6xx-Serie) in 32-nm-Technik mit eingepflegt, da wir für diesen Prozessor kein offizielles NDA haben. Wir haben diesen Prozessor, wie so viele andere Webseiten, bereits über dritte Kanäle bekommen. Viel wird man allerdings in diesem Review zu der CPU nicht finden, dafür ist der Launch im Januar 2010 zu weit weg und viele Dinge des Prozessors liegen noch brach. Für ein tatsächliches, seriöses Review über diesen Prozessor ist es also noch viel zu früh. Deshalb behandeln wir dieses Thema auch nur knapp.


Nun aber zum eigentlichen Inhalt: Dem Test der Prozessoren.

alles

Im Bild: Die vier Sockel-1156-Prozessoren im Test
Core i7-870, i7-860, i5-750 und "i5-640"

Intels neue Lynnfield-Prozessoren richten sich an den Käufer, der einen schnellen PC zu einem guten Preispunkt kaufen will. Die Prozessoren sollen somit die mittlere Käuferschicht abdecken, zu der insbesondere die Spieler gehören. Um die Enthusiasten kümmert sich der Core i7-9xx mit dem Bloomfield-Kern, der durch das Triple-Channel-Speicherinterface und teurere Mainboards aber sehr viel teurer in der Anschaffung wird. Spar-PCs wird es mit dem Lynnfield aber sicherlich auch nicht geben, da vier Kerne und ein vernünftiges Board auch ein paar Euros kosten. Somit werden sehr günstige Rechner weiterhin auf Intels älterer Core2-Duo- und Quad-Technik am Markt bestehen bleiben, bis im Januar 2010 auch hier die Wachablösung vorgenommen wird.

Alle Features der neuen Prozessoren haben wir im Vergleich zum Bloomfield und den Core2-Modellen in der folgenden Tabelle zusammengefasst:

Modell Core i7-975 Core i7-950 Core i7-920 Core i7-870 Core i7-860 Core i5-750 Core i5-640 Core2 Quad Q9550s
Takt 3,33 GHz 3,06 GHz 2,66 GHz 2,93 GHz 2,8 GHz 2,66 GHz 3,06 GHz 2,8 GHz
Preis ab 836 € ab 469 € ab 223 € ab 530 €
ab 274 €
ab 182 €
110 € (geschätzt) ab 272 €
Prozessor-Features
Kerne,
Hyperthreading

4 Kerne,
Hyperthreading (8 Threads)

Vier Kerne,
Hyperthreading (8 Threads)
Vier Kerne,
kein HT
Zwei Kerne
Hyperthreading (4 Threads)

4 Kerne,
Kein HT

Turbo-Stufen 4-Core: 3,46 GHz
1-Core: 3,6 GHz
4-Core: 3,2 GHz
1-Core: 3,33 GHz
4-Core: 2,8 GHz
1-Core: 2,93 GHz
4-Core: 3,20 GHz
3-Core: 3,20 GHz
2-Core: 3,46 GHz
1-Core: 3,60 GHz
4-Core: 2,93 GHz
3-Core: 2,93 GHz
2-Core: 3,33 GHz
1-Core: 3,46 GHz
4-Core: 2,80 GHz
3-Core: 2,80 GHz
2-Core: 3,20 GHz
1-Core: 3,20 GHz
vorliegendes Modell:
4-Core: 3,2 GHz
1-Core: 3,33 GHz
kein Turbo
Speichercontroller Triple-Channel-DDR3
(DDR3-1066, XMP)
Dual-Channel-DDR3
(DDR3-1333, XMP mit 1600 MHz)
Dual-Ch.-DDR3
(DDR3-1333)
Dual-Ch.-DDR3
(DDR3-1333)
chipsatzabhängig
Caches 4x 32 kB Daten, 4x 32 kB Instruktion
4x 256 kB L2-Cache
8 MB Shared L3-Cache
2x 32 kB D/I-, 2x
256 kB L2-Cache
4 MB Shared L3
4x 32 kb D/I-, 2x
6 MB Shared L2
Cache
Anbindung QPI: 12,8 GB/s x2 QPI: 9,6 GB/s x2 interne Anbindung, extern nur DMI zur Southbridge FSB (1333 MHz)
Befehlssätze MMX, SSE,-2,-3,-4.1,-4.2, IA64, Virtualisierung kein SSE 4.2
Stromspartechniken C1E, Enhanced SpeedStep, C6 Core Disable C1E, EIST
TDP 130 W 95 W 73 W 65 W
Sockel LGA1366 (Land Grid Array) LGA1156 (Land Grid Array) LGA1156 Sockel 775
Fertigung 45 nm Fertigung, 300 mm Wafer,
P1266 High-k Metall-Gate
32 nm Fertigung,
P1268 High-k
45 nm Fertigung,
P1266 High-k
Chipgröße 263 mm²,
731 Millionen Transistoren

296 mm²,
774 Millionen Transistoren

nicht bekannt 164 mm²,
456 Millionen Tr.

Das Review haben wir in zwei große Teile gegliedert: Zum einen schauen wir uns die technischen Details der Prozessoren an und gehen hier beispielsweise auch auf die Stromspartechniken und Besonderheiten ein, die der Lynnfield mitbringt. Gespickt haben wir diesen "trockenen" Teil mit einigen Tests und Benchmarks zu der neuen Technik. In einem zweiten Teil haben wir uns schließlich der Performance gewidmet, wo wir die neuen Prozessoren gegen den Core2 und Core i7-975, sowie AMDs Flaggschiff Phenom II X4 965 antreten lassen haben.


Tick - Tock

Das Tick-Tock-Development-Modell von Intel schlägt gleichmäßig weiter: Intels „Tick“ im Jahr 2008, also die Einführung des Penryn, begeisterte durch die niedrige Stromaufnahme der 45-nm-Technik mit allen seinen Vorteilen. Durch die Verwendung von Hafnium und eines Metall-Gates schaffte es Intel, die neuen Core2-Modelle nicht nur etwas schneller, sondern vor allen auch stromsparender zu betreiben. Da im Tick-Tock-Modell in jedem zweiten Jahr eine Verbesserung der Fertigungstechnik ansteht, war im Jahr 2009 die neue Mikroarchitektur "Nehalem" fällig.

ticktocks

Dieser Tock erfolgte am 03. November 2008, also noch knapp vor Jahresende: Intels „Nehalem“ kam als Core i7 der 9xx-Serie auf den Markt. Während der Penryn im Vergleich zum Conroe nur Verbesserungen im Detail auf Architekturebene enthielt, brachte der Core i7 diverse Veränderungen mit sich, die deutlich tiefer greifen. Aus diesem Grund behält Intel bei den jeweiligen Tock-Schritten auch die Fertigungstechnologie bei. Ein gleichzeitiger Schritt auf eine neue Architektur und eine neue Fertigungstechnik wäre ein unberechenbares Risiko. Somit wird im nächsten Jahr mit Westmere ein Shrink des Nehalem anstehen - der nächste Tick auf die 32-nm-Fertigung. Schaut man weiter in die Zukunft, soll 2010/2011 mit dem Sandy Bridge wieder eine neue Mikroarchitektur kommen, dann natürlich auch in 32 nm.

Lynnfield als Codename für den Prozessor ordnet sich dazwischen ein: Es bleibt beim Lynnfield bei der Nehalem-Mikroarchitektur und man verwendet weiterhin 45-nm-Fertigungstechnik. Allerdings nutzt Intel bereits die Chipsatz-Architektur und den Sockel der kommenden 32-nm-Prozessoren, man schafft also somit die Plattformumgebung für den nächsten Tick.

Wieder ein richtiger Quad-Core-Prozessor

Intels erste Quad-Core-Prozessoren bestanden aus einem Multichip-Package, in dem man zwei Dual-Core-Prozessoren untergebracht hat. Diese zwei Penryn- oder Conroe-Dies kommunizierten miteinander über den FSB, der allerdings auch bereits durch den normalen Datenverkehr stark belastet wurde. Deshalb erntete Intel oftmals Kritik, auch wenn sich der FSB nur in einigen Anwendungen als Flaschenhals entpuppte. Jedoch konnte Intel durch diese Taktik günstiger und schneller Quad-Cores produzieren, da ein dediziertes Vier-Kern-Design kompliziert ist. AMDs Phenom-X4-Design war hingegen der erste native Quad-Core, also vier Kerne auf einem Prozessor-Die.  Vom Standpunkt der Produktion her ist das Bauen eines nativen Quad-Cores schwieriger, denn bei einem Fehler in einem der vier Kerne ist der Quad-Core insgesamt nicht mehr zu gebrauchen - ein Grund, warum AMD den Triple-Core-Prozessor Phenom X3 auf den Markt brachte. Seit Einführung des Core i7 verbaut auch Intel vier Kerne auf einem Siliziumstück, allerdings scheint man durch die 45-nm-Technik die Produktionsprobleme im Griff zu haben.

Lynnfield unterscheidet sich auch hier nicht vom Bloomfield. Aktuell scheint Intel auch keine Pläne zu haben, im Desktop-Bereich wieder Multi-Chip-Packages einzusetzen.


Modulares Design

Nicht jeder Anwender braucht einen Quad-Core, spätere Prozessoren sollen aber mehr als vier Kerne besitzen - deshalb ist das Core-i7-Design modular. In der aktuellen Ausführung verbaut Intel vier Kerne und einen 8 MB großen L2-Cache pro Die. Jedoch sind auch andere Kombinationen denkbar. Im nächsten Jahr wird Intel Desktop-Prozessoren auf den Markt bringen, die nur zwei Kerne besitzen (Clarkdale), dafür aber eine integrierte Grafik mitbringen. Auch ist ein nativer Sechs- und Achtkern-Prozessor im Serverbereich geplant. Erreicht wird dies durch eine Aufsplittung des Prozessors in einen „Core“-Bereich und einen „Uncore“-Bereich. Der Core-Bereich beinhaltet die Rechenkerne mit L1- und L2-Caches. Der Uncore-Bereich hingegen beinhaltet den Memory-Controller, die I/O-Funktionen, die QPI-Links und den L3-Cache. Diesen kann Intel variabel gestalten. So ist es einfach, die Dual-Core-Modelle mit nur 4 MB L2-Cache auszustatten.

core-uncores

Beim Lynnfield besteht der Core-Bereich aus vier Kernen, die mit dem
Bloomfield identisch sind. Der UnCore-Bereich enthält zusätzlich einen
PCIe-Controller und leichte Veränderungen im Vergleich zum Core i7-9xx.

Ein Die-Shot des Lynnfield zeigt die Aufteilung klar und deutlich - den PCIe-Controller hat Intel rechts angebaut, den DMI-Controller auf der linken Seite:

lfddielayout


Verbesserungen der Kerne

Die Architektur des Penryn, also die Core-Mikroarchitektur, hat Intel noch an einigen Stellen beim Bloomfield-Kern aufbohren können: Macrofusion wurde nun auch im 64-Bit-Modus unterstützt, ein neuer Loop Stream Detector beinhaltete nun auch die Decode-Funktion, weiterhin erkennt der Loop Detector Schleifen zuverlässiger. Wie bei fast jedem neuen Prozessor hat Intel auch die Branch-Prediction-Einheit wieder einmal verbessert. Hierdurch wird eine höhere Performance und ein niedrigerer Stromverbrauch erreicht, da bei einer fehlerhaften Sprungvorhersage der Arbeitsschritt erneut berechnet werden muss.

Die Execution-Engine hat Intel verändern müssen, da bei der Nehalem-Mikroarchitektur nun 128 µOps abgearbeiten werden können (Merom 96, Dothan 64). Um die Engine also ständig zu füllen, mussten vorgelagerte Strukturen verbessert werden. So besitzen die Reservation Station, Load Buffers und Store Buffers mehr Ressourcen.

Aber: Intel setzt für den Bloomfield-Prozessor und den Lynnfield-Prozessor dieselben Kerne ein - verändert hat sich also hier nichts.


Caches

Jeder Nehalem-Core (also sowohl Lynnfield als auch Bloomfield) besitzt einen 32 kB großen Instruction- und einen 32 kB großen Data-Cache.  Hinzu kommt ein 256 kB großer L2-Cache. Im Vergleich zum bisherigen 6 MB großen L2-Cache des Penryns ist dieser also deutlich kleiner, dafür aber sehr viel schneller angebunden. Zudem kann jeder Core auf seinen eigenen L2-Cache zugreifen. Einen ähnlichen gemeinsamen Cache wie beim Penryn gibt es erst auf L3-Ebene: Hier kommt beim Nehalem ein 8 MB großer Shared-L3-Cache (16-fach assoziativ) zum Einsatz. Alle Caches sind inclusive, alle L1-/L2-Register sind also auch im L3-Cache gespeichert. Der Nehalem besitzt einen Snoop-Filter, der alle Nachteile eines Inclusive-Caches ausmerzen soll.

Auch bei den Caches gibt es Unterschiede zwischen dem Core- und Uncore-Bereich: Die L1- und L2-Caches laufen auf Prozessortakt, also auf 2,66 bis 3,2 GHz, je nach Prozessormodell. Der Uncore-Bereich läuft hingegen auf einer anderen Taktfrequenz und somit auch der L3-Cache, der Bestandteil des Uncore-Bereiches ist.

Intel hat neue unified 2nd-Level-TLB (Translation-Lookaside-Buffers) implementiert, weiterhin können unaligned Cache Accesses (MOVUPS/D, MOVDQU) nun genauso schnell abgearbeitet werden, als wenn sie „aligned“ wären.

Hyperthreading

Intel besitzt mehrere Design-Teams, die sich abwechseln: Der Nehalem entstammt aus der Feder des Design-Teams in Oregon, die zuletzt mit der Pentium-4-Architektur eine Bruchlandung namens Prescott hingelegt hatten. Ein Feature besaß der Prescott jedoch, das ihm in einigen Benchmarks zu einer gehörigen Mehrperformance verhalf: Hyperthreading. Das gesammelte Know-How hat das Design-Team aus Oregon in die Core-Mikroarchitektur einfließen lassen und verhilft Hyperthreading nun zu einem Comeback in verbesserter Form.

hyperthreadings

Die korrekte Bezeichnung für Hyperthreading ist „Simultaneous Multithreading“, es können also zwei Threads zur gleichen Zeit von einem Kern bearbeitet werden. Aus diesem Grund sind im Taskmanager beim Core i7 auch acht Threads zu sehen: Jeder Kern kann zwei Threads abarbeiten, also sind maximal acht Threads gleichzeitig möglich. Hyperthreading bringt beim bestehenden Core-Design einen Vorteil, da die vierfach multiskalare Ausführungseinheit besser mit Aufgaben gefüttert werden kann. Hyperthreading bringt so einen Performancevorteil bei minimalen Kosten und minimal höherem Stromverbrauch, da nur wenige Transistoren pro Kern hinzukommen und somit die Die-Fläche kaum steigt.

Beim Lynnfield-Prozessor unterstützt nur der Core i5 kein Hyperthreading: Er besitzt nur reine vier Kerne ohne diese Funktion.

Exkurs: Performanceauswirkung von Hyperthreading

„Simultaneous Multi-Threading“ lässt sich im BIOS der meisten Mainboards abschalten - dann läuft der Core i7 nur mit seinen vier Kernen, er arbeitet dann nur einen Thread pro Core ab. Sinn macht die Abschaltung allerdings nicht mehr, während früher Hyperthreading bei einigen Programmen Probleme bereitete: Wenn eine Applikation noch nicht für den Multi-Thread-Bereich ausgelegt war oder die Workloads ungünstig aufgeteilt hat, konnte es zu kleineren Einbußen in der Performance kommen. Mittlerweile sind aber sämtliche Standardapplikationen und auch die Betriebssysteme für den Multi-Thread-Bereich optimiert - schon aufgrund der Multi-Core-Prozessoren. Probleme kann es allerdings noch in Spielen geben, wo die Performance leicht unter dem reinen Vierkern-Betrieb liegt.

Von Hyperthreading profitieren allerdings nur Programme, die ihre Workload auch auf mehrere Threads aufteilen können. Single-Task-Programme wie SuperPi nutzen nur einen Thread und zeigen deshalb keine Reaktion. Auch Programme, die beispielsweise vier Threads nutzen zeigen im Core i7 keine Beschleunigung, da sie aufgesplittet auf vier Kerne mit einer identischen Performance laufen. Hyperthreading macht dann nur für den Multi-Tasking-Bereich Sinn, wenn also mehrere Programme parallel ablaufen müssen (Virusscanner, Firewall, Backup-Software im Hintergrund).

Wir haben drei klassische Benchmarks ausgesucht, die alle mehr als vier Threads nutzen können und zeigen die Performanceauswirkungen von Hyperthreading in diesem optimalen Fall:

hyperthreading-benchmark

Für den Test schalteten wir den Turbo-Modus des Core i7 ab, um möglichst wenig Einfluss anderer Bereiche auf das Ergebnis zu haben. Wie zu sehen ist, hat Hyperthreading teilweise einen massiven Einfluss auf die Performance. Im 3DMark Vantage erreicht der Prozessor eine um 33% gesteigerte Leistung - vergleichend könnte man sagen, dass hier ein Sechs-Kern-Prozessor ohne Hyperthreading notwendig wäre, um die Leistung des Quad-Cores mit Hyperthreading zu erreichen. Derartig massiv sind die Geschwindigkeitsvorteile in anderen Bereichen nicht, auch wenn 11% mehr bei Cinebench und knapp 9 % mehr bei Sisoft Sandra ein sehr gutes Ergebnis sind.

Interessant ist natürlich gleichzeitig auch ein Blick auf den Energieverbrauch des Prozessors. Bei Cinebench 10 wurde ein Anstieg von 10 % gemessen - hier entspricht der Mehrverbrauch also ungefähr der zusätzlichen Leistung. Im Idle-Betrieb ändert sich der Energieverbrauch des Prozessors nicht.


Virtualisierung, SSE 4.2 und weiteres

Im Hinblick auf eine verbesserte Performance bei der Nutzung der Virtualisierung hat Intel die Latenzzeit zwischen den Wechseln zwischen virtuellen Maschinen beschleunigt und Extended Page Tables hinzugefügt, um die Anzahl der Wechsel zu minimieren. Durch eine Virtual Processor ID muss zudem der TLB bei Wechseln nicht mehr geleert werden.
Auch SSE hat Intel beim Nehalem zu SSE4.2 aufgebohrt: Neue Instruktionen kommen im Vergleich zum Penryn hinzu (STTNI, ATA). Veränderungen vom Bloomfield zum Lynnfield-Kern haben sich auch hier nicht ergeben.


4: Core-Bereich: Stromspartechnik Core Disable

Beim Stromverbrauch hat Intel mit dem Penryn-Kern die Messlatte hoch angelegt: Der Quad-Core-Prozessor QX9770 verbraucht deutlich weniger als AMDs Phenom X4, die entsprechenden Dual-Core-Modelle von Intel sind prädestiniert für den HTPC-Einsatz und ideal für Notebooks. Zudem schob man stromsparende Modelle wie den Q9550s nach, die für besonders energiesparende Umgebungen gedacht waren. Die Erwartungshaltungen beim Nehalem waren also hoch, zum einen, da auch eine neue Stromspartechnik zum Einsatz kommt, zum anderen, da Intel den Core i7 auf derselben stromsparenden Fertigungstechnologie aufbaut. Auch beim Core i7 setzt Intel also auf den P1266 genannten 45-nm-Prozess mit einem Hafnium-basierenden High-k-Material und Metal-Gate-Technik.

c6s

Im BIOS des ASUS-Maximus-III-Forumula findet sich eine Option für C6,
aber nicht mehr für C7 (bislang bei vielen X58-Boards vorhanden). Bloomfield und Lynnfield
unterstützen offiziell C6 als Power State.

Neben den bisherigen bekannten Features wie C1E und EIST (Enhanced Intel SpeedStep Technology) implementiert Intel beim Core i7 eine komplette Core-Abschaltung. Hierfür wurde eine Power Control Unit implementiert - ein Mikrocontroller, der die Spannungen, die Temperatur und die Frequenz des Prozessors im Auge behält. Geht der Prozessor vom aktiven Status (C0-State) in den Stromsparbetrieb C6, kann die Power Control Unit den unbenutzten Kern komplett deaktivieren. Während bisherige Prozessoren hier nur die Spannung im C6-Modus senken konnten, um die Leakage zu reduzieren, fällt durch die komplette Abschaltung keine Leakage mehr an.

integratedpowergates

pcus

Der Core i7 ist so in der Lage, schnell Kerne an- und abzuschalten. Er besitzt zwar immer noch nur einen Voltage Regulator, durch den unabhängigen C6-State für jeden Prozessor ist ein teures mehrstufiges Design jedoch nicht unbedingt notwendig. Penryn-Prozessoren konnten erst die Spannung senken, wenn alle Prozessoren nichts zu tun hatten und sparten erst dann einen Teil der Leakage ein. Beim Core i7 ist die Einsparung pro Core möglich, auch wenn die anderen noch aktiv sind. Übrig bleibt der Uncore-Bereich, den Intel in den üblichen C6-State bringen kann, wenn keine Arbeit zu verrichten ist.

Anhand eines kleinen Tests mit dem Core i7-870 haben wir versucht herauszufinden, wie viel Watt ein Kern tatsächlich verbraucht. Hierfür haben wir die CPU mit einer unterschiedlichen Anzahl aktiver Kerne (1, 2, 4) und aktiviertem/deaktiviertem Hyperthreading im Idle- und Last-Betrieb verglichen:

Stromverbrauch Core i7-870 Idle-Betrieb Last-Betrieb (2D)
1 Kern aktiv 120,3 Watt 153,0 Watt
1 Kern aktiv (Hyperthreading) 118,1 Watt 158,4 Watt
2 Kerne aktiv 118,0 Watt 172,7 Watt
2 Kerne aktiv (Hyperthreading) 117,7 Watt 184,0 Watt
4 Kerne aktiv 118,0 Watt 208,6 Watt
4 Kerne aktiv (Hyperthreading) 118,1 Watt 234,7 Watt


Sehr schön zu sehen: Egal, wie viele Kerne aktiv sind, im Idle-Betrieb beträgt die Leistungsaufnahme immer ungefähr 118 Watt. Daraus lässt sich ableiten, dass die Prozessoren im Idle-Betrieb abgeschaltet sind. Zu den Verbrauchern zählt hier also nur der L3-Cache sowie der restliche UnCore-Bereich, wobei natürlich auch hier Stromspartechniken greifen, die Intel schon bei früheren Prozessoren integriert hat.

Im Last-Betrieb sind deutliche Unterschiede zu erkennen. Die Differenz von einem Kern zu zwei Kernen mit Hyperthreading beträgt ca. 26 Watt, die Differenz von zwei Kernen zu vier Kernen mit Hyperthreading beträgt ca. 50 Watt. Somit lässt sich festhalten, dass jeder mit Hyperthreading betriebene Kern ungefähr 25 Watt verbraucht. Ein derartiges Verhalten konnten wir auch schon mit dem Bloomfield messen. Im Betrieb ohne Hyperthreading sinkt der Verbrauch signifikant, da die Kerne nicht so stark ausgelastet werden. Auch ist unser Test mit Cinebench 10 nicht repräsentativ für die 100%ige Auslastung, andere Programme, unter anderem Prime95 oder ähnliches, können die Kerne deutlich stärker auslasten. Intels Angabe von einer TDP von 95 Watt ist also beim Lynnfield äußerst knapp gewählt, da die vier Kerne alleine bereits eine derartige Auslastung besitzen können.


Foxton lautete ein Codename für eine geplante Übertaktungsfunktion im Itanium-Prozessor. Durch eine genaue Überwachung von Spannungen, eine genaue Justierung der Prozessorfrequenz und eine akkurate Temperaturüberwachung wollte Intel dem IA64-Prozessor die Möglichkeit verschaffen, sich bei besonderen Szenarien selbst zu takten. Diese Technologie ist der Vorläufer des im Core i7 implementierten Turbo Modus.

turbomodes

Turbo-Betrieb beim Bloomfield (Core i7-9xx):

Der Core i7 965 (Beispiel) ist in der Lage, seinen Multiplikator (x24) bei ausreichender Kühlung heraufzusetzen, wenn die Last es erfordert. Wenn beispielsweise eine Quad-Core-Applikation eine hohe Leistung fordert, kann er den Multiplikator auf x25 heraufsetzen und läuft so 133 MHz schneller. Intel garantiert diesen zusätzlichen „Speed-Bin“, da der Prozessor innerhalb der TDP betrieben wird. Ist die Kühlung also ausreichend, kann man eine Schippe drauflegen. Bei Single- oder Dual-Core-Anwendungen kann durch die Abschaltung der nicht verwendeten Kerne auch noch mehr Platz nach oben sein: Ist beispielsweise nur ein Kern aktiv, gibt Intel auch die Übertaktung um zwei Speed-Bins, also 266 MHz (Multiplikator x26) frei. Auch hier spielt die Power Control Unit eine entscheidende Rolle, denn sie überwacht die Umgebungsvariablen des Prozessors.

Turbo-Betrieb beim Lynnfield (Core i7-8xx und i5-750):

Je nach Modell gibt Intel beim Lynnfield sogar höhere Turbo-Stufen frei - der Core i7-870 kann beispielsweise von 2,93 GHz im Standardbetrieb auf bis zu 3,6 GHz mit Belastung auf einem Kern heraufgetaktet werden. Auch führt Intel hier die Möglichkeit ein, mit zwei Kernen bis zu 3,46 GHz Takt zu erreichen. In einigen Anwendungen ist der Core i7-870 deshalb fast so schnell wie ein Core i7-975, da dieser mit Turbo im besten Fall auch 3,6 GHz Taktfreuenz erreicht.

Wer sich selber also eine ausreichende Kühlung verschafft, kann nicht nur durch stumpfes Hochsetzen des Multiplikators übertakten, sondern eleganter durch Nutzung der Einstellungen für den Turbo Mode entsprechende Settings je nach Core-Belastung festlegen. Eine gute Kühlung ist allerdings notwendig, denn durch den Turbo-Betrieb verbraucht der Prozessor mehr Strom, da die Spannung für die höheren Speed-Bins kurzzeitig über das normale Maß hinaus hochgesetzt wird. Einzelne Boards unterstützen auch eine Änderung der einzelnen Turbo-Betriebsmodi im Bios.

Intel implementiert den Turbo-Mode, um auch Single-Core-Anwendungen zu beschleunigen. Durch die zusätzlichen Speed-Bins werden so auch ältere Anwendungen schneller, die noch nicht auf mehrere Kerne aufgeteilt werden können. Da die Frequenzeinstellungen komplett in Hardware gelöst werden, sind keine Zusatz-Tools notwendig. Anhand von drei Beispielen wollen wir die Wirkung des Turbo-Modes darstellen. Wir testen dabei den Core i7-965 einmal mit und ohne Turbo-Mode und haben ihn zudem ohne Turbo-Mode auf den jeweiligen höheren Speed-Bin getaktet.

turbo-cinebench

turbo-vantage

Unter voller Last auf allen Kernen geht Intel zwei Speed-Bins hoch - das entspricht ungefähr der Übertaktung auf 3,2 GHz. Der Single-Core-Vorteil ist hingegen höher:

turbo-superpi1m

Bei der Belastung von nur einem Kern setzt Intel gleich mehrere Speed-Bins drauf, entsprechend wird fast die Leistung eines auf 3,6 GHz übertakteten Core i7 erreicht. Kleine Schwankungen können entstehen, da die Power Control Unit den Prozessor im Turbo-Modus überwacht und bei höherer Temperatur den Turbo ausschaltet.


Der UnCore-Bereich besteht beim Lynnfield-Prozessor aus dem Memory Controller, einem 8 MB großen L3-Cache, dem QPI- und DMI-Controller zur Anbindung des Platform-Controller-Hubs P55, dem PCI-Express-Controller und ein paar Management-Funktionen. Im Vergleich zum Core i7-9xx ist der DMI-Controller und der PCI-Express-Controller in den Uncore-Bereich gewandert, da die Northbridge des Chipsatzes wegrationalisiert wurde. Allerdings gibt es noch weitere Veränderungen, performancerelevant sind vor allen Dingen Änderungen am L3-Cache und am Speicherinterface.

Der 8 MB Shared L3-Cache

Der Cache ist von der Struktur her unverändert - wird jedoch mit einer anderen Taktrate betrieben und ist deshalb schneller (oder auch langsamer) als der L3-Cache des Bloomfield. Beim Core i7-9xx wird der Cache mit der Uncore-Taktrate betrieben, diese ist immer mindestens der doppelte Takt des Speichertaktes. Wurde der Core i7-9xx also mit 1066 MHz betrieben, lief der Uncore-Takt mit 2133 MHz und somit auch der L3-Cache mit 2133 MHz. Verwendete man hingegen 1333 MHz schnellen Speicher, lief der L3-Cache mit 2666 MHz, bei 1600 MHz schnellem Speicher waren es 3200 MHz.

Beim Lynnfield-Prozessor Core i7-8xx und dem i7-750 ist dies nun anders. Beim Core i7-870 und Core i7-860 beträgt der UnCore-Takt 2400 MHz, wobei Intel hier zwischen den Lynnfield-Prozessoren differenzieren kann. Wie der UnCore-Takt ist auch der L3-Cache mit 2400 MHz getaktet, unabhängig vom Speichertakt. Der Takt des L3-Caches hängt nur noch von der Base Clock Rate ab, die - wenn das System nicht übertaktet ist - bei 133 MHz als Basistakt zugrunde liegt.

Beim Core i5-750 betrug der UnCore-Takt nur 2133 MHz, somit besitzt dieser auch nur einen mit 2133 MHz getakteten L3-Cache. Neben dem Fehler von Hyperthreading ist dies also ein weiteres Kennzeichen der Core i5-Serie.

corei7870-nb

UnCore-Takt beim Core i7-860 und i7-870

corei5750-nb

UnCore-Takt beim Core i5-750

Die Performance des Caches haben wir mittels Rightmark Memory Analyzer gemessen:

rmma_20090901_004409_0456

rmma_20090901_004158_0416

Durch den niedrigeren Takt hat der L3-Cache eine deutlich niedrigere Bandbreite im Vergleich zum Bloomfield.
Bei der Latenzzeit des L3-Caches scheint wiederum der Lynnfield minimal bessere Werte zu erzielen.

Allgemeines zum Speicherinterface:

Ein integrierter Speichercontroller kann aus Performancesicht sehr nützlich sein: AMD hielt mit der Integration des Memory-Controllers in den Athlon 64 den damaligen Pentium-4-Gegenspieler lange in Schach. Intel hingegen wehrte sich anfangs gegen eine derartige Lösung, da man mit der Integration in die CPU die Flexibilität etwas aus der Hand gibt: Mit einem neuen Chipsatz ließe sich schnell auf einen neuen Speichertyp umschwenken, ist der Speichercontroller erst einmal in der CPU integriert, muss ein neues Stepping her - und meistens wohl auch ein anderer Sockel oder ähnliches. Die Performancevorteile ließen Intel aber dann doch umdenken - mit der Nehalem-Architektur kam auch ein integrierter Speichercontroller.

Der Memory-Controller des Core i7-9xx:

Intel spendiert dem Core i7-9xx ein Triple-Channel-DDR3-Interface, welches man zunächst für den Betrieb mit DDR3-1066 freigibt. Eigentlich ist hier sehr viel mehr möglich, wir haben den Speichercontroller schon mit bis zu 2280 MHz betrieben. Auch sind schnellere Speichermodule am Markt verfügbar, Intel selber spezifiziert mit der XMP-Technik Module mit 1600 MHz. Doch selbst mit DDR3-1066 steht dem Prozessor eine Bandbreite von 25,5 MB/s zur Verfügung - und das bei extrem guten Latenzzeiten.

Der Core i7-965 bringt jedoch auch Möglichkeiten mit, den Speicher schneller laufen zu lassen. Im BIOS vieler Boards finden sich beim Einsatz eines Core i7-965 beispielsweise Optionen bis zu DDR3-2133 hin. Auch bei kleineren Modellen lässt sich der Speicher hochdrehen. Beachtet werden muss zudem, dass die Uncore-Taktrate vom DDR3-Takt abhängt - sie ist mindestens zweimal so hoch. Bei DDR3-2133 würden der Memory-Controller, der L3-Cache und die sonstigen Uncore-Bereiche demnach auf 4266 MHz laufen - oftmals wohl zuviel.


Der Memory-Controller des Core i7-8xx und i5-750:

Dem Lynnfield spendiert Intel nur ein Dual-Channel-Speicherinterface. Dafür setzt Intel den Takt hinauf, statt 1066 MHz dürfen nun 1333 MHz-Module zum Einsatz kommen. Auch XMP ist hier wieder mit am Start, so dürfen Speichermodule mit XMP im Core i7-870 und -860 auch mit 1600 MHz betrieben werden. Der kleinere Core i5-750 besitzt kein XMP und somit auch nicht die Möglichkeit, mit 1600 MHz Speicher offiziell zu laufen. Im Bios der Mainboards fehlt diese Option auch als Speichermultiplikator.

asusspeicher

ASUS bietet im Bios der Mainboards für den Core i7-870 Speichermultiplikatoren bis 12x bei unseren i7-8xx-Samples an.
Höhere Werte können nur über ein Anheben der Base Clock Rate erreicht werden.
Der Core i7-750 bietet sogar nur 1333 MHz als Maximalwert an.

Auf diversen Boardverpackungen sind auch Taktungen von 2133 MHz und mehr angegeben - diese erreicht man nur durch hinaufsetzen der Base Clock Rate (BCLK), da bei unseren Samples nur ein 12x-Multiplikator für den Speicher als Maximum einzustellen war. Es kann jedoch durchaus sein, dass die Verkaufsversionen andere Multiplikatoren besitzen, da Intel beim Bloomfield-Launch ebenso Samples mit beschränktem Speichermultiplikator an die Presse verteilte. Wir werden diesen Artikel updaten, sobald Informationen über die tatsächlichen Teiler verfügbar sind.

Der UnCore-Takt stieg beim Core i7-9xx immer mit an - beim Core i7-8xx ist dies nicht mehr der Fall. Der Uncore-Bereich wird hier immer mit 2400 MHz getaktet, unabhängig vom Speichertakt. So testeten wir dies mit den Einstellungen 800, 1066, 1333 und 1600 MHz, CPUZ zeigte uns jedoch immer denselben Northbridge-Takt von 2400 MHz an. Daraus folgt, das der Northbridge-Takt hier zwar nicht mehr limitiert bei der Übertaktung des Speichers über den Multiplikator, aber auch die Performance des Uncore-Bereiches etwas niedriger ist, als die Performance des Uncore-Bereichs des Core i7-9xx. Setzt man die Base Clock Rate hoch, steigert sich natürlich auch der Northbridge-Takt, da dieser von der BCLK abhängt.

speichers

Da ein Dual-Channel-Speicherinterface zum Einsatz kommt,
findet man nur noch vier Dimm-Slots auf den Mainboards.

Speicherperformance

In unserem Test des Core i7-9xx im Heft 01/2009 hatten wir überprüft, wie sich die Performance des Prozessors mit unterschiedlichen Speichereinstellungen (Takt, Timings) verändert. Diesen Test haben wir mit dem Lynnfield ebenso wiederholt.

memory

Es zeigen sich dieselben Resultate wie beim Bloomfield, auch in Real-World-Tests: Sisoft Sandra zeigt schön, dass die Bandbreite bei der Nehalem-Architektur fast nur vom Speichertakt abhängig ist. Die Timings sind nur für die Latenzzeit der Speicherzugriffe wichtig, die allerdings durch den integrierten Speichercontroller sowieso bereits sehr gut sind. Entsprechend lautet unsere Empfehlung beim Tunen eines Nehalem-Systems, zunächst den höchstmöglichen Speichertakt mit seinen Speichermodulen einzustellen, und erst im Anschluß die Timings auf möglichst gute Werte herab zu setzen.

Vergleicht man die Speicherbandbreite zwischen Bloomfield und Lynnfield, erkennt man, dass der Bloomfield beim Einsatz von zwei Speichermodulen die identische Performance erreicht, wie ein normales Lynnfield-System. Es scheint sich also beim Lynnfield auch beim Speichercontroller nichts geändert zu haben - es fehlt nur ein Kanal für das Triple-Channel-Interface.


Architektur: QPI - der neue Bus

Intels Front-Side-Bus ist in die Jahre gekommen, deshalb schwenkte Intel beim Bloomfield auf einen neuen Bus um. Dies geschieht nicht ohne Grund: Im Desktop-Bereich mag der FSB mit seinen aufgebohrten 1600 MHz und 12,8 GB/s Übertragungsrate noch ausgereicht haben, bei Dual-Prozessor-Maschinen und Servern teilen sich aber mehrere Prozessoren die Bandbreite des FSBs bei Zugriffen auf den Speicher und den Cache des fremden Prozessors. Hier war das Phenom- und Athlon-64-Design mit AMDs Hypertransport-Bus in der Vergangenheit überlegen, aufgrund der NUMA-Architektur konnte AMD gerade im Serverbereich Marktanteile gewinnen.
Intel entlastet nun durch zwei maßgebliche Änderungen das Nadelöhr Richtung Northbridge: Der Speichercontroller wandert in die CPU, weiterhin bohrt man den I/O-Bus auf. Statt des bis zu 12,8 GB/s schnellen FSBs (bei 1600 MHz) kommt eine Point-to-Point-Verbindung mit 12,8 GB/s zum Einsatz, bei der die Daten aber bidirektional gesendet und empfangen werden können. Insgesamt stehen also 25,6 GB/s pro Link zur Verfügung. Zukünftig möchte Intel auch den QPI-Link durch Takterhöhung noch beschleunigen. Per Overclocking ist das schon heute möglich.

Gerade bei Mehrsockel-Systemen bietet Intel aber mehrere QPI-Links pro Prozessor. Durch diese QPI-Links können auch Prozessoren miteinander kommunizieren. Mit dieser Architektur ist es auch möglich, auf den Arbeitsspeicher des anderen Prozessors in hoher Geschwindigkeit zuzugreifen. Diese so genannte Non-Uniform-Memory-Access-Architektur (NUMA) ähnelt der AMD-Implementierung im Serverbereich. Intel gibt dabei an, dass für einen Prozessor der Speicherzugriff auf den eigenen Speicher zwar durch die hohe Bandbreite und niedrige Latenzzeit zu empfehlen ist, der so genannte „Remote-Speicher“, also der Speicher eines anderen Prozessors, sei jedoch von der Performance her mit einer ähnlichen Latenzzeit zu erreichen wie bei einem Harpertown-System mit einem FSB von 1600 MHz.

qpis

Beim Lynnfield findet man den QPI-Takt allerdings nur für interne Zwecke, da er keinen QPI-Controller besitzt, um ihn mit mehreren Prozessoren zu koppeln. Der QPI-Controller bindet vermutlich nur intern den DMI- und PCIe-Controller an.

Architektur: DMI-Controller

Auch die bisherigen Intel-Plattformen besaßen einen DMI-Controller, allerdings nicht in der CPU, sondern in der Northbridge. Das Direct-Media-Interface (DMI) war bislang dafür verantwortlich, die Northbridge mit der Southbridge zu verbinden. Letztendlich hat sich daran nichts geändert, nur ist die Northbridge jetzt ein Teil der CPU - aus diesem Grund befindet sich in ihr auch ein Direct-Media-Interface zur Anbindung des Platform Controller Hubs P55. Auch die Bandbreiten sind im Vergleich zum X58 und den direkten Vorgänger-Chipsätzen nicht verändert worden.

Architektur: PCIe-Controller

Bislang hatte die Northbridge neben Management-Funktionen die Aufgabe, die Southbridge und die PCI-Express-Karten anzubinden. Der PCIe-Controller ist nun ebenso in die CPU gewandert. Intel bietet hier 16 Lanes nach PCIe-2.0-Standard, die auf zwei x8-Lanes aufgesplittet werden können, um CrossFire- oder SLI-Systeme aufsetzen zu können. Sobald eine Grafikkarte oder eine Erweiterungskarte im zweiten Slot betrieben wird, läuft der erste Slot nur noch mit x8-Lanes.

Weitere PCIe-Lanes besitzt der Platform Controller Hub (PCH), die zwar auch dem PCIe-2.0-Standard entsprechen, aber nur mit halber Bandbreite angebunden sind. Entsprechende 3-Way-SLI-Konfigurationen wären theoretisch also auch möglich, jedoch entsteht hier ein Flaschenhals an der dritten Karte, die über den PCH angebunden ist. Derartige Kombinationen sind also in dieser Art und Weise nicht empfehlenswert, hier ist der X58-Chipsatz und der Bloomfield als Prozessor einzusetzen.


Der Chipsatz wird zum PCH...

Intels neuer P55 Express Chipsatz ist eigentlich gar kein Chip"satz" mehr, da er nur noch aus einem Chip besteht. Intel nennt ihn deshalb auch Platform Controller Hub (PCH), er entspricht aber der bisherigen ICH-Serie mit ein paar neuen Features.

Zunächst einmal besitzt die PCH alles, was auch die ICH10R besessen hat: Sechs SATA-2.0-Ports besitzt auch der P55, auch hier können die Ports im RAID 0,1,5 und 10 sowie Matrix RAID gekoppelt werden. Die Ports 5 und 6 können nun auch für FIS-basierende Port-Multiplier genutzt werden, also beispielsweise zum Anschluß externer Storage-Boxen. Weiterhin hat Intel zwei zusätzliche USB-Ports integriert, insgesamt sind nun also 14 USB-2.0-Ports über zwei EHCI-Controller integriert. Mit dabei ist natürlich auch der Intel HD-Audio-Bus zum Anschluß eines HD-Audio-Sounds, sowie vier busmasterfähige PCI-Slots, sofern man diese noch benötigt. Integriert ist auch ein Low-Pin-Count-Interface, über das beispielsweise ein Super I/O oder ein TPM-Modul angeschlossen werden kann.

p55s

Interessant ist die Ausführung der PCI-Express-Ports, die sich in der P55-Southbridge befinden. Acht PCIe-Ports hat Intel hier integriert, die x1-Ports entsprechen der PCIe-2.0-Spezifikation. Jedoch hat man sie ausgebremst: Statt 5 GT/s liefern sie nur eine Bandbreite von 2,5 GT/s. Dadurch möchte man verhindern, dass das DMI-Interface zum Flaschenhals wird. Auch bietet Intel offiziell nicht die Möglichkeit, die PCI-x1-Lanes zu einer x4- oder x8-Lane zusammen zu schließen. Mehrere Hersteller werden dies jedoch anbieten, die Validierung hierfür müssen sie allerdings selbst übernehmen. Im Endeffekt funktioniert die Bündelung, ist aber nicht von Intel abgedeckt.

Letztendlich fällt auch noch ein PCIe-Anschluß für den "Flexible LAN PCIe" weg: Statt des bisherigen LAN-Anschlusses in der ICH10 bietet Intel zwar weiterhin die LAN-Logik im PCH-Chip, es muss also nur noch ein Physical Layer (PHY-Chip) angebunden werden. Dieser nutzt nun allerdings einen PCIe-Anschluß. Effektiv stehen dem Anwender also nur sieben Ports zur Verfügung. Setzt ein Hersteller also einen PCIe-x4-Port und zwei x1-Slots auf sein Mainboard, bleibt nur noch ein einzelner Port für Erweiterungsmöglichkeiten, wie zusätzliche SATA-, LAN- oder Firewire-Ports. Man wird also häufiger wieder über PCI angebundene Geräte bei P55-Mainboards vorfinden.

p55-chips

Der PCH (P55-Chipsatz) ohne Heatspreader

Neu ist auch der integrierte Clock Buffer Mode. Statt mehreren Taktgebern, die über das Mainboard verteilt sind, benötigt der P55-Chipsatz nur noch einen einzigen. Er bildet die notwendigen Takte aus diesem einen Signal und übermittelt diese elektronisch weiter. Die Ansteuerung wird über den P55-PCH geregelt - wie sich dies auf Overclocking-Fähigkeiten auswirkt, ist fraglich, auf jeden Fall bieten sich so aber andere Möglichkeiten zum Übertakten per Software.

Interessant sind auch die Verbrauchswerte: Da der Chipsatz praktisch nur noch eine Southbridge ist, kommt er mit 4,7 Watt aus - im Idle-Betrieb senkt er seinen Verbrauch auf 1,7 Watt. Im Vergleich zu den anderen bisherigen Chipsätzen wird somit klar, dass der Lynnfield durch die Integration der Northbridge eigentlich bei gleichem Takt deutlich mehr Strom verbrauchen müsste als ein Bloomfield-Prozessor - betrachtet man die gesamte Plattform, gleicht sich das natürlich wieder aus.


Fast alle unsere Leser interessiert natürlich, wie sich der neue Lynnfield beim Übertakten verhält. Erreichten letzte Bloomfield-Prozessoren recht einfach die 4-GHz-Grenze, so war dies bei unserem ersten Test aufgrund des Steppings noch nicht problemlos möglich. Mit dem D0-Stepping änderte sich dies, seit dem genießt der Core i7 in unserem Forum einen guten Ruf, wenn es um Overclocking-Resultate geht. Allerdings ist eine recht gute Kühlung wichtig, da die vier Kerne gerade mit höherer Spannung eine erhöhte Wärmeabgabe liefern.

Das Übertakten eines Core i7-8xx/Core i5-750 ist dem Übertakten eines Core i7-9xx sehr ähnlich, jedoch gibt es einige Unterschiede:

asus

ASUS zeigte auf dem ASUS Xtreme Global Summit in London einige
Tricks zum Lynnfield-Overclocking mit ASUS-Mainboards.

Weitere Unterschiede ergeben sich aus der Abhängigkeit der Taktraten untereinander:

Wir erreichten mit Luftkühlung und dem Core i7-870 einen relativ guten Takt mit 1,4 V VCore und 1,475 V IMC-Spannung:

corei7860-cpuz-oc

Setzt man die IMC-Spannung nicht hinauf, kommt man in unserem Fall nicht über eine Base Clock Rate von ca. 160 bis 170 MHz, sodass das Übertaktungsergebnis dann deutlich schlechter ausfällt.

Durch den im Vergleich zum Bloomfield deutlich niedrigeren Northbridge-Takt kommt man auch beim Speichertakt deutlich höher. Wir erreichten ohne größere Probleme mit dem höchsten Speicher-Multiplikator und 1,7 V Dimm-Spannung mit den Test-Modulen (OCZ DDR3-2133) einen Takt von 2360 MHz:

corei7860-cpuz-memory-oc

Damit erreichten wir eine Speicherperformance, die mit 27 GB/s für das Dual-Channel-Interface als sehr gut einzustufen ist:

corei7860-cpuz-memory-oc-perf

Weitere Overclocking-Tests und ein ausführlicher Overclocking-Guide sind in Arbeit.


Diesen Prozessor wird es erst im ersten Quartal 2010 im Handel geben: Intels "Clarkdale" wird der erste Dual-Core-Prozessor auf Basis der Nehalem-Architektur sein, allerdings schon in neuer Fertigungstechnik (32-nm-Fertigung). Damit gehört er schon zum nächsten "Tick", ist also ein Westmere-Prozessor, wie auch die kommenden 6-Kern-Prozessoren von Intel (Gulftown). Clarkdale wird in zwei unterschiedlichen Ausführungen auf den Markt kommen: Besitzt er den Turbo-Modus, wird er zum Core i5 6xx, besitzt er keinen Turbo-Modus, ist er ein Core i3 5xx. Beide Modelle werden jedoch Hyperthreading besitzen und somit vier Threads als Dual-Core-Prozessor gleichzeitig abarbeiten können. Durch die modulare Architektur der Nehalem-Architektur kommen die Zweikern-Prozessoren auch nur mit 4 MB L3-Cache. Durch die 32nm-Technik gibt Intel eine TDP von 73 Watt an, im Regelfall werden die Prozessoren allerdings darunter liegen.

clarkdales

Clarkdale von unten: Auch 1156 Pins, derselbe Sockel, aber andere
Widerstände auf der Unterseite im Vergleich zum Lynnfield

Die bislang bekannten Spezifikationen zum Clarkdale haben wir in der folgenden Tabelle zusammengefasst:

Prozessor-Name Kerne / Threads / L3-Cache Taktfrequenz Turbo-Boost TDP Preis in USD
(geschätzt)
Core i5-670 2 Cores / 4 Threads / 4 MB 3,46 GHz ja 73 Watt 284 US-$
Core i5-660 2 Cores / 4 Threads / 4 MB 3,33 GHz ja 73 Watt 196US-$
Core i5-650 2 Cores / 4 Threads / 4 MB 3,2 GHz ja 73 Watt 176 US-$
Core i3-540 2 Cores / 4 Threads / 4 MB 3,06 GHz nein 73 Watt 143 US-$
Core i3-530 2 Cores / 4 Threads / 4 MB 2,93 GHz nein 73 Watt 123 US-$
Pentium G6950 2 Cores / 2 Threads / 3 MB 2,8 GHz nein 73 Watt 87 US-$


Unsere CPU ist somit ein früher Zwitter: Sie ist zum einen für den Core i5 zu langsam, da sie mit 3,06 GHz getaktet ist, ist aber gleichzeitig mit Turbo-Technik ausgestattet und somit auch kein Core i3. Somit haben wir praktisch einen Core i5-640, den es aber vorerst nicht geben wird. Das zeigt auf der anderen Seite den frühen Status, den das Sample von uns hat - bis zum Launch wird sich also noch einiges ändern, sicherlich will Intel auch noch einige Steppings nachschieben. Zudem nutzen wir den Prozessor in einem normalen Lynnfield-Board, welches auch keine entsprechenden Bios-Optimierungen für den Clarkdale enthält. Sämtliche Tests, gerade die Stromverbrauchstests, sind also mit Skepsis zu sehen, hier wird sich noch einiges tun.

corei5-cpuz

Noch als "Genuine Intel(R) CPU" wird der Core i5-640 in CPU-Z gemeldet. Der Takt im Turbo-Betrieb
beträgt hier bei Last auf vier Threads 3,2 GHz.

Da der Clarkdale zur Nehalem-Architektur gehört, gibt es keine Unterschiede bei den Cores bezüglich der Features und Architektur. Der einzige Unterschied ist wieder einmal im Uncore-Bereich zu finden. Clarkdale besitzt nicht nur einen integrierten Memory-Controller, einen L3-Cache, einen PCIe-Controller und die DMI-Brücke zum P55, sondern auch einen integrierten Grafikkern. Diesen konnten wir allerdings noch nicht nutzen, da sowohl Treiber wie auch entsprechende Video-Ausgänge an den Mainboards fehlen. Die Grafikeinheit liegt brach, soll aber später einmal als schnelle integrierte Grafik überzeugen - wir sind gespannt. Clarkdale wird den integrierten Grafikkern mit den kommenden H55-Chipsätzen nutzen können. Gerüchten zufolge wird Intel den VGA-Anschluß einstellen und nur noch digitale Anschlüsse (HDMI, DVI und DisplayPort) nativ nutzen.

Neben den Standard-Tests, die man in unseren Benchmark-Grafiken findet, haben wir den Clarkdale natürlich auch übertaktet, die Ergebnisse (ca. 3,7 GHz) sind jedoch noch nicht berauschend. Wir vermuten, dass hier noch Bios-Optimierungen notwendig sind, um die CPU auf einen höheren Takt zu bringen, da bei anderen Vorberichten Taktraten von 4,5 GHz und mehr erreicht worden sind.


Für die Testsysteme der verschiedenen Plattformen verwendeten wir wo möglich identische Komponenten, um die Abweichung möglichst auf den Prozessor zu beschränken. So kamen für alle Systeme die folgenden Komponenten zum Einsatz:

Weiterhin haben wir versucht, die Systeme möglichst optimal einzustellen, ohne sie über ein normales Maß hinaus zu tweaken oder zu übertakten. So wurden gute Timings verwendet, ohne allerdings den Speicher besonders zu tunen, da hierdurch leichte Performanceverschiebungen entstehen können. Kleinere Änderungen in der Ausstattung der Systeme lassen sich jedoch nicht verhindern, da beispielsweise ein X58-System drei Speichermodule für den Triple-Channel-Betrieb verwendet. Daraus resultiert ein Speicherausbau von 6 statt 4 GB, der bei einigen wenigen Applikationen durchaus einen Geschwindigkeitsvorteil bringen kann.

Die Plattformen in der Übersicht:

AMD Phenom II X4 965

Intel Core2 Quad Q9550s und E8400

Intel Core i7-9xx

Intel Core i7-8xx, Core i5-7xx, Core i5-6xx

Es wurden zum Testzeitpunkt aktuelle Treiber verwendet und entsprechend ein frisch installiertes System verwendet. Weiterhin haben wir auch alle Benchmarks neu durchgeführt und wenn möglich mit aktuellen Softwareversionen und Patches getestet.



PCMark Vantage

Wir starten unseren Benchmark-Parcours mit PCMark Vantage. Hierbei geben verschiedene Applikations-Durchläufe einen Einblick in die Anwendungsperformance der Systeme. Einen großen Einfluß hat hier aber auch der Ausbau des Arbeitsspeichers sowie die Festplatte / SSD. Der PCMark Vantage ist kostenlos verfügbar und kann somit verwendet werden, die Leistung des eigenen Systems einmal gegenüber zu stellen. Über unseren Download von PCMark Vantage lässt sich das Programm schnell auf den eigenen Rechner ziehen.

ben-pcmark

Unser Testdurchlauf zeigt, dass die Core i7-9xx-Prozessoren und die Core i7-8xx-Modelle nicht weit auseinander liegen. Allerdings sind die Schwankungen in diesem Benchmark auch relativ hoch, zudem wirkt sich der höhere Arbeitsspeicherausbau der Bloomfield-Plattform sicherlich auch etwas auf das Ergebnis aus. Somit schneidet der Lynnfield im Vergleich sehr gut ab, wobei sich die Core i7-Modelle deutlich vor den älteren Plattformen (AMD, Core2 Quad, Core2 Duo) platzieren können.


Cinebench 10

Den Download von Cinebench 10 findet man ebenso in unserer Download-Datenbank. Der mittlerweile etablierte Benchmark misst die Performance eines Systems beim Rendering mit Maxons Cinema 4D. Es gibt mehrere Tests, wobei wir den reinen CPU-Benchmark verwenden und hier auch nur die Multi-Core-Version x-CPU testen. Der Workload wird hier auf alle verfügbaren Kerne und Threads aufgeteilt, es ist also ein reinrassiger Multicore-Benchmark. Aus diesem Grund liegen die Dual-Core-Prozessoren mittlerweile auch zurück.

ben-cinebench

Hier zählt vor allen Dingen die Taktfrequenz und die Anzahl der Kerne: So ergibt sich je nach Takt unter den Core-i7-Modellen eine klare Rangliste. Sie besitzen alle acht Threads und sind deshalb hier bevorteilt. Der Core i5-750 hingegen ohne Hyperthreading liegt trotz ähnlicher Architektur zurück. Er kann sich nur knapp vor AMDs Quad-Core ins Ziel retten. Die älteren Penryn-basierten Prozessoren kränkeln am Front Side Bus und der älteren Architektur.


Frybench

Da der Cinebench nur noch ein paar Sekunden dauert, hat sich in unserem Forum Frybench zu einem beliebten Benchmark-Tool entwickelt. Alles weitere zu diesem Benchmark findet sich in unserem Foren-Thread, in dem man auch eigene Ergebnisse zum Vergleich mitteilen kann. Der Rendering-Benchmark braucht auf einem normalen System gerne einmal 10 Minuten, nur mit hochgezüchteten Systemen schafft man bessere Resultate. Der Top-Prozessor Core i7-975 braucht beispielsweise immer noch knapp über sechs Minuten für den Durchlauf. Gemessen wird die Rendering-Zeit in Sekunden, ein geringeres Resultat ist also ein besseres.

ben-frybench

Ein starkes Ergebnis für Hyperthreading: Die sechs Core-i7-Modelle liegen klar in Führung, da sie acht Threads verwenden können. Trotz gleichem Takt liegt der Core i5-750 deutlich gegenüber dem Core i7-920 zurück. Auch hier platziert er sich kurz vor dem AMD Phenom II X4. Die Dual-Core-Modelle sind abgeschlagen, aber die Verbesserung vom E8400 zum kommenden i5-640 ist beeindruckend - die neuen Dual-Core-Prozessoren von Intel werden also überzeugen können.


Sisoft Sandra 2009

Auch den Download zu Sisoft Sandra findet man in unserer Download-Datenbank. Wir nutzen von dieser Software nur den Memory Benchmark zum Testen der Speicherbandbreite der Systeme. Es sind auch noch diverse weitere Tests in der Tool-Sammlung integriert (z.B. ein Wechseldatenträger-Benchmark oder ein Netwerk-Benchmark). Die Speicherbandbreite ist in GB/s angegeben.

ben-sisoft

Wie man sehen kann, liegen die Core-i7-9xx-Modelle mit Triple-Channel-Interface in Führung. Dahinter finden sich die Lynnfield-Prozessoren ein, die zwar nur mit einem Dual-Channel-Interface, dafür aber mit 1333 MHz Speichertakt ausgestattet sind. AMD ist mit dem Phenom auf einem sehr guten Niveau, die Modelle, die keinen integrierten Speichercontroller besitzen (Q9550S und E8400) hängen hinten dran.


7-Zip

7-Zip ist ein beliebtes Programm zum Komprimieren von Dateien und eine gute und schnelle Alternative zum in Windows implementierten Zip. 7-Zip besitzt eine integrierte Benchmark-Funktion, die wir hier für den Vergleich mit einer Wörterbuchgröße von 32 MB nutzen. Der Download von 7-Zip ist wie immer in unserer Downloaddatenbank möglich. Wir verwenden selbstverständlich die 64-Bit-Variante.

ben-7zip

Da 7-Zip auch etwas speicherlastig ist, liegen die Core-i7-9xx-Modelle hier knapp vor den gleichgetakteten Lynnfield-Modellen, die aufgrund des Dual-Channel-Interfaces etwas zurück hängen. Mehr Performance verliert der Core i5-750 jedoch durch das Fehlen von Hyperthreading. Er wird sogar vom Phenom II eingeholt und liegt nur knapp vor dem alten, aber etwas höher getakteten Q9550s.


TrueCrypt 6.2a

Als Verschlüsselungs-Benchmark haben wir dieses Mal TrueCrypt mit in den Benchmark-Parcours aufgenommen. Das Programm kann einzelne Dateien, Verzeichnisse oder ganze Datenträger mit unterschiedlichen Algorithmen verschlüsseln. Wir nutzen die integrierte Benchmark-Funktion mit einer Dateigröße von 100 MB. Die angegebenen Werte beziehen sich auf die Bandbreite pro Sekunde in MB/s.

ben-truecrypt

Hier bestehen nur geringe Unterschiede zwischen den Bloomfield- und Lynnfield-Prozessoren - und das Fehlen von Hyperthreading beim Core i5-750 macht sich wiederum bemerkbar.

 

WinRar 3.90 beta

WinRAR nutzen wir schon länger als Benchmark, mittlerweile ist die Version multithreading-fähig und profitiert in höherem Maße von Mehrkern-Prozessoren wie früher. Wir nutzen die Version 3.90 beta, die wir natürlich auch in unserem Downloadarchiv anbieten (WinRAR 3.90 beta downloaden).

ben-winrar

In diesem Benchmark liegen die Bloomfield-Modelle klar vor den Lynnfield-Prozessoren. Hier scheint also die Speicherbandbreite entscheident zu sein, während der reine CPU-Takt nur eine untergeordnete Rolle spielt. Durch Hyperthreading können sich die schnelleren Core i7-Modelle vom Core i5 absetzen. Der Core i5-640 schneidet sehr gut ab und erreicht als Zweikerner mit Hyperthreading fast die Performance des Phenom II X4.


iTunes WAV-Komprimierung

Durch iPod und iPhone ist mittlerweile auf fast jedem Rechner iTunes zu finden. Allerdings ist das Programm nicht nur sinnvoll, wenn man die gekauften Songs von Apple verwalten will, auch als Datenbank für eigene CDs eignet sich das Programm. So lassen sich CDs einfach auf den Rechner ziehen und dort in mp3-Files oder das hauseigene ACC-Format umwandeln. Wir haben mit der neuesten iTunes-Version (8.2.1 für Windows 64bit) jeweils eine 720 MB große Datei komprimieren lassen - einmal in das mp3-, einmal in das AAC-Format:

ben-itunes-mp3

ben-itunes-aac

Bei beiden Versuchen kommen die Lynnfield- und Bloomfield-Prozessoren bei gleichem Takt auch fast auf dieselbe Leistung. Da Apples iTunes nur mit maximal zwei Kernen läuft, können sich auch die älteren Prozessoren in der Rangliste nach vorne mogeln. Ein sehr gutes Ergebnis erreicht der Core i5-640.


POV-ray 3.7 beta 33

Als weiteren Rendering-Benchmark haben wir POV-ray 3.7 als beta-33-Version mit in den Testparcours aufgenommen. Wir rendern hier eine komplette Szene. Die Angaben sind die Bearbeitungszeit in Sekunden, hier ist ein kleinerer Wert also ein besserer.

ben-pov

In diesem Benchmark zählt die reine CPU-Performance, somit unterscheiden sich Lynnfield und Bloomfield bei gleichem Takt kaum in der Performance. Der Core i5-750 fällt aufgrund des fehlenden Hyperthreadings zurück. Gut schneidet der Core i5-640 ab, der sich zwischen den Phenom II X4 und den Core2 Quad Q9550s setzt - er erreicht als Zweikerner mit Hyperthreading also fast die Performance der älteren Vierkern-Prozessoren.


SuperPi

SuperPi ist bei unseren Overclockern sehr beliebt, das Tool läuft allerdings nur Single-Threaded ab, nutzt also nur einen Prozessorkern und kein Hyperthreading. In der Regel sind höhergetaktete Prozessoren schneller, auch die Speicherbandbreite hat einen gewissen Einfluß auf die Performance. Wir haben den 1M-Benchmarklauf durchgeführt, auch hier ist die Zeit in Sekunden angegeben, die niedrigeren Ergebnisse sind also die besseren.

ben-superpi

Erstaunlich gut ist der Core i5-640 unterwegs, der hier fast an die Leistung des teuren Extreme-Edition-Modells heran kommt. Je höher der Takt des Prozessors ist, desto schneller ist er in diesem Benchmark. Hyperthreading fällt nicht ins Gewicht. So kann auch der Core i5-750 relativ gut abschneiden. Die älteren Intel-Modelle und der AMD Phenom II X4 können bei diesem Benchmark gegen die neue Nehalem-Architektur nichts ausrichten.

 

wPrime 1024M

Dieser Benchmark ist sehr ähnlich zu SuperPi, allerdings werden hier Primzahlen berechnet. Statt eines Single-Core-Benchmarks handelt es sich bei wPrime auch um einen Multicore-Benchmark, da mehrere Threads in Anspruch genommen werden können. Hier haben mehrere Kerne und die Existenz von Hyperthreading also wieder einen größeren Einfluß auf die Performance.

ben-wprime

Der Lynnfield und der Bloomfield unterscheiden sich bei gleichem Takt kaum. Nur der Core i5-750 fällt aufgrund des Fehlens von Hyperthreading hinter den Core i7-920 zurück. Auch hier ist es erstaunlich, dass der Core i5-640 fast doppelt so schnell ins Ziel kommt, wie der alte E8400 - Intels nächste Dual-Core-Generation wird also durchaus schnell.


3DMark Vantage

Die Gaming-Benchmarks in diesem Test beginnen wir mit 3DMark. Der 3DMark Vantage als neueste Version ist natürlich auch stark Grafikkarten-lastig, hat aber mit der CPU-Score eine dedizierte Maßzahl zum Vergleich von der Prozessorleistung. Wir haben sowohl die Overall-, wie die CPU-Score aufgeführt, um einen Vergleich zum eigenen System zu ermöglichen. Um die 3D-Grafikpracht flüssig zu genießen, ist ein schneller PC notwendig. Der Download von 3DMark Vantage ist wie immer in unserer Download-Area möglich.

ben-vantage-all

ben-vantage-cpu

Die CPU-Score hat natürlich einen massiven Einfluß auf die Gesamtpunktzahl, aber die Grafikleistung ist auch abhängig vom CPU-Takt. Vergleicht man Bloomfield- und Lynnfield-Prozessoren mit gleichem Takt miteinander, so kann sich der Core i7-9xx etwas absetzen. Die Unterschiede sind allerdings sehr gering. Deutlicher ist das Fehlen von Hyperthreading beim Core i5-750 zu bemerken. Der Prozessor kommt so nur knapp vor dem Q9550s mit gleichem Takt ins Ziel.


Enemy Territory: Quake Wars (1.5)

Das Spiel Enemy Territory: Quake Wars messen wir mit einer Timedemo. In der Konsole (mit ^ aufzurufen) lassen sich diese mit dem Befehl "timenetdemo" aufrufen. Wir nehmen fünf Loops und bilden das arithmetische Mittel, um eine gleichmäßige Leistungsmessung zu erhalten.

ben-enemy

Auch in diesem Benchmark ist der Core i7-9xx etwas schneller als der Core i7-8xx bei gleichem Takt. Die höhere Speicherbandbreite der Bloomfield-Prozessoren wirken sich also etwas auf die Leistung aus. Die Unterschiede sind jedoch relativ gering, um die höheren Kosten der Bloomfield-Plattform zu rechtfertigen.

 

Company of Heroes

Den Company-of-Heroes-Benchmark lassen wir mit 1280 x 768 und High-Quality laufen. Wir erreichen damit zwar Frameraten über 200 fps, können aber eine Limitierung der Grafikkarte sehr gut ausschließen. Trotzdem sind die Unterschiede zwischen den Prozessoren minimal:

ben-company

Interessant ist, dass der Core i5-750 relativ gut platziert ist. Hier scheint das Spiel leichte Probleme mit Hyperthreading zu haben, denn sobald die Funktion bei den anderen Prozessoren deaktiviert wurde, stieg die Performance. Die schlechte Thread-Auslastung sollte eigentlich heutzutage nicht mehr vorkommen. Schaut man auf die restlichen Ergebnisse, sieht man zudem, dass das Spiel nicht für Multicore-Prozessoren optimiert ist. Zudem scheint die alte Core2-Plattform mit dem Spiel recht gut zu laufen - und auch der Phenom II X4 schneidet nicht schlecht ab.


Resident Evil 5 Benchmark

Ein neues Spiel, fordernd für die Grafikkarten, aber bei niedriger Auflösung auch ein guter CPU-Test. So ist der Benchmark Multicore-optimiert und somit für neue Mehrkern-Prozessoren geeignet. Wir verwenden die zweite Testumgebung, da diese etwas mehr auf die verwendete CPU Rückschlüsse lässt.

ben-resident

Die neuen Lynnfield-Prozessoren ordnen sich schön auf Bloomfield-Niveau ein und zeigen eine gute Performance. Der Core i5-750 fällt etwas hinter den Core i7-920 zurück, auch hier scheint ihm das Fehlen von Hyperthreading also ein paar Prozentpunkte zu kosten. Erstaunlich gut positioniert sich der Core i5-640, der mit seiner Leistung sogar den Phenom II X4 in Schach hält.

 

Far Cry 2

Bei Far Cry 2 handelt es sich um einen First-Person-Shooter aus dem Hause Ubisoft. Der Nachfolger des legendären Spieleklassikers basiert auf der eigens entwickelten Dunia Engine, wodurch beispielweise dynamisches Wetter, Tag- und Nachtzyklen und eine dynamische Vegetation realisierst werden. Das Spiel nutzt Mehrkernprozessoren, unterstützt sowohl DirectX-9 als auch -10 und besitzt eine integrierte Benchmark-Funktion, mit zahlreichen Einstellungsmöglichkeiten.

Zur Vollversion von Far Cry 2 in unserem Preisvergleich gelangt man über diesen Link.

ben-farcry2

Far Cry 2 zeigt das Phänomen, dass ein Prozessor ohne Hyperthreading schneller laufen kann. Ansonsten haben die Lynnfield-Prozessoren eine etwas geringere Performance aufzuweisen, die allerdings die höheren Plattform-Kosten der Bloomfield-Prozessoren kaum rechtfertigen würde. Die älteren Plattformen sind abgeschlagen, auch der Core i5-640 ist hier noch etwas langsam.


Call of Juarez

Call of Juarez ist ein erstklassiger Western-Shooter aus dem Hause Ubisoft, der bislang Seinesgleichen sucht. Mit viel Liebe zum Detail besticht der Shooter aus dem Jahre 2006 unter Verwendung von Techlands Chrome-Engine in erster Linie durch seine einzigartige Grafik und die atemberaubende Atmosphäre. Der Spieler schlüpft in die Rolle des flüchtenden Billy und des prügelnden Predigers Ray und erlebt ein Katz-und-Maus-Spiel der besonderen Art. Nutzen Sie Pferde zur Fortbewegung auf weitläufigem Gelände, lassen Sie sich im Mehrspielermodus vom Goldfieber packen, erleben Sie klassische Revolverduelle und befreien Komplizen aus dem Gefängnis. Call of Juarez bietet einfach alles, was es für einen standesgemäßen Western braucht und zeigt als eins der ersten Games - nach einem Update - welche Möglichkeiten die DirectX-10-API bietet. In einem Anspruchsvollem Benchmark-Tool lassen sich diese Effekte bestaunen.

Zur Vollversion von Call of Juarez in unserem Preisvergleich gelangt man über diesen Link.

ben-juarez

Eine typische Grafikkartenlimitierung: Da selbst bei niedriger Auflösung von 1280x1024 ohne Antialiasing die Resultate praktisch identisch sind, ist hier die CPU nicht gefragt, sondern die Grafikkarte. Ein schnellerer Prozessor bringt hier keinen nennenswerten Vorteil.


Street Fighter 4 Benchmark

Der bunte Benchmark vom Arcade-Spiel Street Fighter 4 ist das erste Mal in unserem Testparcours mit dabei. Allerdings ist auch er selbst bei niedriger Auflösung schnell Grafikkarten-lastig.

ben-streetfighter

Die Bloomfield-Prozessoren platzieren sich zwar in Reihe und Glied knapp vor den Lynnfield-Modellen, hier ist jedoch die Grafikkartenlimitierung schon sichtbar. Nicht ganz an diese Grenze kommen die letzten drei Prozessoren.

 

GTA4

Der dunkle Ganster-Shooter hatte aufgrund von instabilem Verhalten einen schweren Start, nach ein paar Patches läuft er jedoch. Wer Nico Belic durch das Spiel steuern möchte, benötigt jedoch für sämtliche Effekte und eine höhere Auflösung nicht nur eine schnelle CPU, sondern auch eine stattliche Grafikkarte. Wir haben eine typische Auflösung gewählt, um dies zu visualisieren.

ben-gta

GTA4 skaliert sehr schön auf schnellen Prozessoren - so können sich die schnelleren Core i7-9xx an die Spitze setzen, die Core i7-8xx-Prozessoren landen auf ähnlichem Niveau knapp dahinter. Auch hier scheint der Core i5-750 durch das fehlende Hyperthreading ein paar Prozent gut zu machen. Die vier weiteren Prozessoren im Test kommen nicht an die Limitierung der Grafikkarte heran. Neben einer potenten Grafikkarte braucht man bei GTA4 also auch eine gute CPU, am besten etwas oberhalb des Core i7-920 oder Core i7-860.


World in Conflict

Bei World in Conflict handelt es sich um ein Echtzeitstrategiespiel von Sierra Entertainment. Das Spiel wurde von Massive Entertainment, den Schöpfern der Ground Control Reihe, entwickelt und ist seit September 2007 in Europa erhältlich. World in Conflict bietet eine Singleplayer-Kampagne, die insgesamt 14 Missionen beinhaltet. Das Spiel fesselt den Spieler durch seine Reichhaltigkeit an Action und hoher Spielgeschwindigkeit gepaart mit einer zeitgemäßen Grafik. In diesem Fall haben sich die Programmierer dazu entschlossen den DirektX-10-Renderpfad zu nutzen, welcher im Game erstaunliche Bilder auf den Schirm zaubert.

Zur Vollversion von World in Conflict in unserem Preisvergleich gelangt man über diesen Link.

ben-wic

Hier liegt die Nehalem-Architektur geschlossen vorne - selbst der Core i5-640 kann den Q9550S und Phenom II X4 965 abhängen. Die Core i7-9xx-Modelle liegen zwar an der Spitze, die Core i7-8xx-CPUs platzieren sich aber in geringem Abstand direkt dahinter. Der Core i5-750 landet auf demselben Niveau wie der Core i7-920 - hier gibt es also keine Unterschiede zwischen der CPU mit und ohne Hyperthreading oder einem Zwei- und Dreikanal-Interface.


Heutzutage ist der Stromverbrauch eines Systems ein wichtiger Aspekt, da Prozessoren nicht mehr wenige Watt, sondern teilweise einen dreistelligen Verbrach aufweisen. Allerdings muss nicht nur der Verbrauch unter Last stimmen, sondern auch der Verbrauch im Idle-Betrieb. Hier ist es fast noch wichtiger, dass der PC nicht unnötig Strom verbraucht, der gar nicht benötigt wird. Denn während man im Internet surft, ein Word-Dokument verfasst oder Musik anhört, haben die Kerne der Prozessoren fast nichts zu tun - also sollen sie auch keinen Strom verbrauchen.

Durch Stromspartechniken hat Intel seine Prozessoren hier auf Vordermann gebracht. Von der einstigen Energieschleuder Prescott hat man über kleinere Fertigungstechniken (über die 65nm-Fertigunstechnik zur 45nm-Fertigungstechnik) und neuere Produktionstechniken und -materialien (Hafnium, Metal Gate) die Verlustleistung unter Last in den Griff bekommen, auf der anderen Seite aber durch intelligente Features wie C1E, EIST (Enhanced Intel Speedstep Technology), den Smart Cache und Core Disable auch den Stromerbrauch im Idle-Verbrauch extrem gesenkt. Mittlerweile ist nicht mehr Intel die Stromschleuder, sondern AMD, denn der Phenom II X4 965 ist aufgrund der höheren Spannung mittlerweile einer der heissesten Prozessoren am Markt.

Bei den neuen Core i7-Modellen muss man allerdings beim Vergleichen etwas aufpassen. Intel schrieb uns auf die Frage, welche Spannungen der Core i7 einstellt:

"At the time of manufacturing the operating VID voltage is tuned to the optimal voltage for power and performance. The VID voltage will vary from part to part and this is no different then on our previous generation processors (Bloomfield, Penryn, Conroe based). In addition on Nehalem based processors the processor will vary the VID voltage based on power and temperature when running. Previous generation processors (Penryn and before) used static VIDs for a given P-state frequency instead."

Daraus lassen sich zwei Dinge ableiten:

Unsere Messungen sind also für unser Testsystem mit unseren Prozessoren akkurat, bei der Verwendung von anderen Kühlkörpern, anderen Prozessoren aus einer anderen Charge oder anderen Programmen, die den Prozessor stärker/schwächer belasten, kann der Verbrauch sich also leicht verändern.

Wir haben drei Verbrauchmessungen vorgenommen, einmal "idle" unter Windows, einmal unter 2D-Last (Cinebench 10 xCPU) und einmal unter 3D-Last (Vantage, 1. Durchlauf).

ben-strom-idle

Im Idle-Verbrauch lag bei den Vierkern-Prozessoren bislang AMDs Phenom II X4 durch Cool'n'Quiet vorne, der Core i7-9xx konnte seinen Verbrauch gegenüber den Penryn-Prozessoren noch einmal leicht senken. Die neuen Core-i7-Modelle auf Basis des Lynnfield schlagen jedoch deutlich geringer zu Buche. Da der Kern praktisch nicht verändert wurde, ist die Einsparung hauptsächlich in der Northbridge zu suchen. Während der X58-Chipsatz noch relativ viel Strom benötigte, scheint die in dem Lynnfield-Kern integrierte Lösung sehr sparsam zu sein. Der Idle-Verbrauch ist mit der Radeon HD 4890 also wirklich sehr gut.

ben-strom-2d

Unter 2D-Last steigt natürlich der Verbrauch bei den Quad-Core-Prozessoren. Schaut man auf die Dual-Core-Modelle, liegt der Core i5-640 trotz höherem Takt und besserer Performance vor dem Core2 Duo E8400. Der Verbrauch des neuen Dual-Core-Modells ist also sehr gut, auch wenn hier noch Optimierungen bis zum Launch möglich sind. Der Core i5-750 verbraucht aufgrund des fehlenden Hyperthreadings etwas weniger. Anschließend reihen sich die Core-i7-8xx und -9xx-Modelle aneinander. Als Verbrauchssünder kann der Phenom II X4 965 angesehen werden, der bei relativ schlechter Performance den Spitzenwert mit nach Hause nimmt.

ben-strom-3d

Unter 3D-Last rücken alle Modelle etwas näher zusammen, da die Grafikkarte hier eine höhere Lastaufnahme aufweist und nicht alle Kerne verwendet werden. Hier verbraucht der Core2 Quad und der Phenom II X4 am meisten, alle anderen Modelle befinden sich auf einem guten Niveau.


Nun ist er also da, Intels neuer Streich - aber lohnt die Investition oder sollte man eher den teureren Core i7-9xx bevorzugen? Für das Gros der Anwender lautet die Antwort, dass die neuen Lynnfield-Prozessoren die bessere Wahl sind. In unseren Benchmarks gab es nur kleinere Unterschiede zwischen den gleichgetakteten Core i7-9xx und Core i7-8xx-Modellen, sodass man den Core i7-870 zwischen dem Core i7-950 und -940 sehen kann und das kleinere Core i7-860-Modell knapp unter dem Core i7-940 anzusiedeln ist. Preislich werden sich die Modelle in den nächsten Woche noch etwas attraktiver zeigen, da die Shops ersteinmal die Erstkäufer und Innovatoren etwas abschöpfen werden, bevor die Preise nach dem ersten Run auf die Prozessoren fallen werden.

Betrachtet man dazu den geringen Stromverbrauch, hat der Core i7-8xx einen weiteren Bonus gegenüber dem Core i7-9xx. Hinzu kommt eine ähnliche, wenn nicht bessere Übertaktbarkeit der CPU. Letztendlich sind die Plattformkosten als Argument zu nennen, da Sockel-1366-Mainboards im Handel teilweise über 100 Euro mehr zu Buche schlagen. Ein gut ausgestattetes Sockel-1156-Mainboard ist bereits für 160 Euro erhältlich, eine Core-i7-9xx-Platine kostet hingegen zwischen 200 und 350 Euro. Hinzu kommt der notwendige dritte Speicherriegel, um die Leistung auch tatsächlich aus dem Bloomfield heraus zu kitzeln. Damit sind die Speicherkits auch ein Kostenfaktor, wenn auch nicht ein allzu großer.

Somit ist für den Großteil der PC-Käufer der Lynnfield die richtige Wahl - wobei wir den Core i7-860 aufgrund seines deutlich besseren Preis-Leistungsverhältnisses empfehlen.

hintens

Für einige Anwender wird die neue Plattform jedoch nicht das Optimum darstellen: Wer auf Performance-Jagd ist und Benchmarkrekorde brechen will, wird dies nur mit einem X58-Mainboard und dem Core i7-9xx schaffen. Nicht umsonst stellt Intel heraus, dass diese Plattform für Enthusiasten gemacht ist. Auch die Extreme-Edition-Prozessoren werden nur für den Sockel 1366 gebaut. Letztendlich ist der X58 auch der einzige Weg, um sinnvoll mehrere Grafikkarten auf einem Mainboard unter zu bekommen. Wer SLI und CrossFire nutzen will, um zwei oder mehr Grafikkarten einzusetzen, sollte auch die paar Euro mehr in die Plattform investieren.

Intels Core i5-750 ist hingegen weder Fisch noch Fleisch: Zum einen kann er durch seinen niedrigen Preis punkten und setzt auch auf die günstige Lynnfield-Plattform, aber durch das Fehlen von Hyperthreading und den niedrigen Takt kann er sich nicht wirklich überzeugend in den Benchmarks präsentieren. Es hat schon einen Sinn, dass Intel für diesen Prozessor eine andere Kennzeichnung statt "i7" gewählt hat - das sollte dem Käufer auch bewusst sein. Er ist eher als Ersatz für Prozessoren wie den Q9550 und schneller ältere Quad-Cores zu sehen.

Im Vergleich zu Intels letzter Architektur und dem AMD Phenom II X4 kann der Core i5-750 allerdings auch noch überzeugen - allerdings ist das auch nicht wirklich schwer, da der Leistungszuwachs, der durch die Nehalem-Architektur im letzten Jahr erreicht worden ist, immens ist. Intels kleiner Core i5-640 gibt einen guten Ausblick darauf, dass auch Dual-Core-Prozessoren in einem halben Jahr ein deutlich höheres Geschwindigkeitsniveau erreichen werden.

Positive Aspekte des Core i7-8xx und i5-750:

Negative Aspekte des Core i7-8xx und i5-750:

Einen Award zücken wir für den
Core i7-870 und Core i7-860

Ein ideales System würde unserer Meinung nach aus einem Core i7-860 bestehen (274 Euro), hinzu kommen ein gutes Sockel-1156-Mainboard (z.B. ASUS P7P55D Deluxe, Gigabyte GA-P55-UD5 oder MSI P55-GD80, ca. 180 Euro) und 4 GB DDR3 (z.B. OCZ DDR3 PC3-15000 Platinum Low Voltage oder Corsair CMD4GX3M2A1600C8, ca. 100 bis 120 Euro). Für ungefähr 580 Euro bekommt man also den Unterbau, sodass mit Festplatte, optischem Laufwerk, Netzteil, Gehäuse und einer Radeon-HD-4890-Grafikkarte ein gutes Gaming-System ohne große Kompromisse für 800 Euro zu haben ist. Wer mit günstigeren Komponenten (Mainboard, Speicher,...) zurecht kommt, kann den Preis auf unter 700 Euro drücken - das wäre mit dem Core i7 9xx nicht möglich gewesen.

Weitere Links: