Test: Intel Core i7-980X Extreme Edition

Veröffentlicht am: von

core-i7-980xSechs Kerne sind "in": Am heutigen Tag stellt Intel den Core i7-980X als neues Prozessor-Flaggschiff vor. Wir haben die neue CPU für einen Test erhalten und präsentieren neben den technischen Details eine Reihe Benchmarks. Neben den sechs Kernen handelt es sich aber hauptsächlich um eine Verschmelzung der Nehalem- und Westmere-Architekturen, sodass viele bekannte Techniken auch im Prozessor mit dem Codenamen "Gulftown" schlummern.

Die technischen Details, die auf vielen Prospekten und Flyern aufgedruckt sein werden, sind schnell aufgeschrieben. Hier ein paar Vorschläge für die Marketing-Leute der Shops und Stores:

Wenn man sich allerdings diese Liste genauer ansieht, erkennt man nur eine stetige Entwicklung von der Nehalem-Architektur zur Westmere-Architektur - und entsprechend vom Bloomfield-Prozessor zum Gulftown. Im Vergleich zu Bloomfield (z.B. Core i7-975) besitzt der Core i7-980X natürlich zwei Kerne mehr und einen um 4 MB größeren L3-Cache aufgrund des modularen Designs des Dies. Die Taktfrequenzen belässt Intel gleich, und kann dies aufgrund der 32-nm-Technik auch ohne höhere Stromaufnahme bewerkstelligen. Diese und weitere technische Details des Kerns selber erbt der Gulftown vom Clarkdale, den Intel im Januar als Dual-Core-Prozessor vorgestellt hat.

aufmacher

Somit also nichts Neues? Nicht wirklich, denn die 32-nm-Technik kommt erstmals im High-End-Bereich zum Einsatz. Auch ist es interessant zu sehen, wie sich sechs Kerne im Alltagsbetrieb verhalten. Letztendlich kann der Prozessor Dank Hyperthreading auf 12 Threads zurückgreifen und ist mit dem Turbo-Betrieb in der Lage, sich auf 3,6 GHz hoch zu takten.

Prozessor Intel Core i7-8xx-Serie
Quad-Core
Intel Core i7-9xx-Serie
Quad-Core
Intel Core i7-9xx-Serie
Six-Core
Codename Lynnfield Bloomfield Gulftown
Platform Nehalem Nehalem Westmere
Sockel Sockel 1156 (LGA) Sockel 1366 (LGA) Sockel 1366 (LGA)
Spezifikationen der Kerne
Anzahl Cores 4 4 6
Hyperthreading ja, 8 Threads ja, 8 Threads ja, 12 Threads
Turbo-Betrieb ja ja ja
Core Disable ja ja ja
SSE SSE4.1 SSE4.1 SSE4.1 und 4.2
AES-NI nein nein ja
Spezifikationen des UnCore-Bereichs
Speichercontroller DDR3-1333,
Dual-Channel
DDR3-1066,
Triple-Channel
DDR3-1066,
Triple-Channel
QPI nur intern maximal 6,4 GT/s maximal 6,4 GT/s
Cache 8 MB L3-Cache 8 MB L3-Cache 12 MB L3-Cache
PCI-Express integriert, 16 Lanes extern, über X58 extern, über X58
Fertigung
Fertigungstechnik 45 nm HighK +
Metal Gate
45 nm HighK +
Metal Gate
32 nm HighK +
Metal Gate
TDP 95 W 130 W 130 W
Die-Size 296 mm² 263 mm² 248 mm²
Anzahl Transistoren 774 Millionen Transistoren 731 Millionen Transistoren 1,178 Millionen Transistoren

Der Preis des neuen Monsters hat sich natürlich gewaschen, er liegt wie immer bei Neuvorstellungen bei 999 USD. Er ersetzt im Endeffekt den Core i7-975 Extreme Edition, der zwar weiter verkauft wird, aber aufgrund des identischen Preises bei einer geringeren Kernanzahl uninteressant wird.

Hinzu kommt ein relativ teures Mainboard mit X58-Chipsatz, das aufgrund des Chipsatzes und des Triple-Channel-Interfaces in der Herstellung teurer ist. Ein entsprechendes Triple-Channel-Kit ist zudem teurer als ein Dual-Channel-Kit, sodass der Lynnfield Intels Variante für Mainstream- und Gaming-PCs bleibt, der Core i7-980X sich aber ganz klar an die Enthusiasten richtet.

cpuz 

CPU-Z zeigt die oben genannten Kennzahlen: 3,33 GHz,
im Turbo-Betrieb 3,46 bzw. 3,6 GHz und 12 MB L3-Cache.

Auf den nächsten Seiten werden wir den Prozessor genauer unter die Lupe nehmen. Einen weiteren ausführlichen Test präsentieren wir in unserer nächsten Ausgabe 04/2010.


Der Gulftown gehört zu Intels letztem "Tick" Anfang des Jahres: Mit der Westmere-Architektur hat Intel eine neue Fertigungstechnik eingeführt, die 32-nm-Technik. Alle zwei Jahre führt Intel eine entsprechend neue Technik ein: Nach dem Penryn 2008 und der 45-nm-Technik folgt 2010 die 32-nm-Technik - auf 22 nm wird man 2012 wechseln.

Diese Ticks werden begleitet durch die entsprechenden Architektur-Updates in den Jahren dazwischen ("Tock"). Hier war der Nehalem Intels Grundlage für die aktuelle Westmere-Architektur. Nehalem ist also weiterhin maßgebend - erst im nächsten Jahr wird Intel die Architektur der Kerne aufbohren (Sandy Bridge).

ticktocks

Der Gulftown gehört also zur Westmere-Platform mit der Nehalem-Architektur.

 

Ein richtiger Sechskern-Prozessor

Intels erste Quad-Core-Prozessoren bestanden aus einem Multichip-Package, in dem man zwei Dual-Core-Prozessoren untergebracht hat. Diese zwei Penryn- oder Conroe-Dies kommunizierten miteinander über den FSB, der allerdings auch bereits durch den normalen Datenverkehr stark belastet wurde. Deshalb erntete Intel oftmals Kritik, auch wenn sich der FSB nur in einigen Anwendungen als Flaschenhals entpuppte. Jedoch konnte Intel durch diese Taktik günstiger und schneller Quad-Core-CPUs produzieren, da ein dediziertes Vier-Kern-Design kompliziert ist. AMDs Phenom-X4-Design war hingegen der erste native Quad-Core, also vier Kerne auf einem Prozessor-Die. Vom Standpunkt der Produktion her ist das Bauen eines nativen Quad-Cores schwieriger, denn bei einem Fehler in einem der vier Kerne ist der Quad-Core insgesamt nicht mehr zu gebrauchen - ein Grund, warum AMD den Triple-Core-Prozessor Phenom X3 auf den Markt brachte. Seit Einführung des Core i7 verbaut auch Intel vier Kerne auf einem Siliziumstück, allerdings scheint man durch die 45-nm-Technik die Produktionsprobleme im Griff zu haben.

Der Core i7-980X ist der erste monolithische Sechskern-Prozessor. Auch hier sind sechs Prozessorkerne auf einem Silizium untergebracht. Entsprechende Pläne, zwei Prozessor-Dies in einem Gehäuse unterzubringen, hat Intel nicht. Aber es ist nicht unwahrscheinlich, dass man defekte Sechs-Kern-Dies als Quad-Core-Prozessoren verkauft. Entsprechende Pläne zu 32-nm-Quadcores sind aber noch nicht veröffentlicht worden.

 

Modulares Design

Mit der Einführung der Nehalem-Architektur führte Intel auch ein modulares Prozessordesign ein, welches es dem Hersteller auf einfache Art und Weise ermöglicht, unterschiedliche Prozessoren mit einer unterschiedlichen Kernanzahl auf den Markt zu bringen.

Nicht jeder Anwender braucht einen Quad- oder Six-Core, spätere Prozessoren sollen aber mehr als vier Kerne besitzen oder im Budget-Bereich weniger als vier Kerne - deshalb ist das Core-i7-Design modular. Beim Bloomfield  verbaut Intel vier Kerne und einen 8 MB großen L3-Cache pro Die. Beim Gulftown sind es nun sechs Kerne mit 12 MB L3-Cache. Auch der Clarkdale zeigt sehr schön das modulare Design, denn der Zweikern-Prozessor bietet nur 4 MB L3-Cache. Die Kerne sind dabei so aufgebaut, dass sie jeweils eine Cache-Zone mitbringen (siehe unten). Im Serverbereich sind auch Achtkern-Prozessoren mit 16 MB L3-Cache denkbar.

Erreicht wird dies durch eine Aufsplittung des Prozessors in einen „Core“-Bereich und einen „Uncore“-Bereich. Der Core-Bereich beinhaltet die Rechenkerne mit L1- und L2-Caches. Der Uncore-Bereich hingegen beinhaltet den Memory-Controller, die I/O-Funktionen, die QPI-Links und den L3-Cache. Diesen kann Intel variabel gestalten. So ist es einfach, die Dual-Core-Modelle mit nur 4 MB L2-Cache auszustatten - oder entsprechend mehr Kerne anzuhängen.

core-uncores

Diese Grafik zeigte Intel beim Bloomflield-Launch:
Eine variable Anzahl von Kernen koppelt Intel
mit dem UnCore-Bereich

Ein Die-Shot des Gulftown zeigt die Aufteilung klar und deutlich - sechs Kerne sind zu sehen, der L3-Cache und die entsprechenden I/O-, Memory-Controller und QPI-Links.

dieshot

Der Gulftown-Die ist durch die sechs Kerne also länglich und besitzt keine typische quadratische Form mehr.


Ein herausragendes Feature der Nehalem-Mikroarchitektur ist der Turbo-Betrieb. Mit der Turbo Boost Technology bietet Intel eine Möglichkeit, den Takt des Prozessors dynamisch anzuheben, wenn die Kühlung und die Stromversorgung dies erlauben. In den meisten Fällen ist dies der Fall - somit setzt der Prozessor bei den Kernen die Spannung leicht herauf und taktet den Prozessor um einen oder mehreren Speed-Bins hoch. Ein Speed-Bin entspricht dabei einem Multiplikator-Schritt, multipliziert mit der Base Clock Rate. Bei 133 MHz Base Clock Rate sind dies also 133 MHz mehr CPU-Takt.

Während einzelne Lynnfield- und Clarkdale-Prozessoren oder auch die Mobilprozessoren den Turbo-Modus sehr stark verwenden, besitzt der Gulftown eine ähnliche Arbeitsweise wie die vorherigen Bloomfield-Modelle. Sind alle Kerne aktiv und unter Last, kann sich der Prozessor von 3,33 GHz auf 3,46 GHz herauftakten. Sind fünf Kerne nicht ausgelastet, einer aber vollausgelastet, kann sich dieser Kern auf 3,6 GHz übertakten (zwei Speed-Bins).

turboboost

Gerade in Anwendungen, die von einem höheren Takt profitieren, aber nicht multithreaded programmiert sind, macht der Turbo-Betrieb einen Sinn. Aus diesem Grund hat er auch seine Vorteile bei Spielen, da der Prozessor sich aufgrund der Auslastung hier relativ häufig hochtakten kann. Allerdings besitzt z.B. der Core i7-870 ebenso wie der Core i7-975 und der Core i7-980X eine maximale Taktfrequenz mit Turbo von 3,6 GHz. Läuft also eine Anwendung tatsächlich nur auf einem einzelnen Kern, ist Intels "Mainstream-Prozessor" genauso schnell unterwegs wie das Topmodell - Unterschiede ergeben sich dann höchstens aus der Speicheranbindung.


Neben den bisherigen bekannten Features wie C1E und EIST (Enhanced Intel SpeedStep Technology) implementiert Intel beim Core i7 eine komplette Core-Abschaltung. Hierfür wurde eine Power Control Unit implementiert - ein Mikrocontroller, der die Spannungen, die Temperatur und die Frequenz des Prozessors im Auge behält. Geht der Prozessor vom aktiven Status (C0-State) in den Stromsparbetrieb C6, kann die Power Control Unit den unbenutzten Kern komplett deaktivieren. Während bisherige Prozessoren hier nur die Spannung im C6-Modus senken konnten, um die Leakage zu reduzieren, fällt durch die komplette Abschaltung keine Leakage mehr an.

integratedpowergates

pcus

Der Core i7 ist so in der Lage, schnell Kerne an- und abzuschalten. Er besitzt zwar immer noch nur einen Voltage Regulator, durch den unabhängigen C6-State für jeden Prozessor ist ein teures mehrstufiges Design jedoch nicht unbedingt notwendig. Penryn-Prozessoren konnten erst die Spannung senken, wenn alle Prozessoren nichts zu tun hatten und sparten erst dann einen Teil der Leakage ein. Beim Core i7 ist die Einsparung pro Core möglich, auch wenn die anderen noch aktiv sind. Übrig bleibt der Uncore-Bereich, den Intel in den üblichen C6-State bringen kann, wenn keine Arbeit zu verrichten ist.


Abschaltung beim Core i7-980X:

Anhand eines kleinen Tests mit dem Core i7-980X haben wir versucht herauszufinden, wie viel Watt ein Kern tatsächlich verbraucht. Hierfür haben wir die CPU mit einer unterschiedlichen Anzahl aktiver Kerne (1, 2, 4, 6) und aktiviertem/deaktiviertem Hyperthreading im Idle- und Last-Betrieb verglichen:

Stromverbrauch Core i7-980X Idle-Betrieb Last-Betrieb (2D)
1 Kern aktiv 137,7 Watt
152,2 Watt
1 Kern aktiv (Hyperthreading) 139,0 Watt
164,8 Watt
2 Kerne aktiv 138,7 Watt
165,3 Watt
2 Kerne aktiv (Hyperthreading) 142,9 Watt
191,9 Watt
4 Kerne aktiv 142,2 Watt
193,0 Watt
4 Kerne aktiv (Hyperthreading) 144,3 Watt
219,8 Watt
6 Kerne aktiv 144,2 Watt 220,0 Watt
6 Kerne aktiv (Hyperthreading) 143,9 Watt 239,6 Watt


Sehr schön zu sehen: Egal, wie viele Kerne aktiv sind, im Idle-Betrieb beträgt die Leistungsaufnahme immer ungefähr 138 bis 144 Watt. Daraus lässt sich ableiten, dass die Prozessoren im Idle-Betrieb abgeschaltet sind. Zu den Verbrauchern zählt hier also nur der L3-Cache sowie der restliche UnCore-Bereich, wobei natürlich auch hier Stromspartechniken greifen, die Intel schon bei früheren Prozessoren integriert hat.

Unter Last hat der Prozessor maximal 240 Watt auf der Uhr: Entsprechend verbrauchen alle sechs Kerne ungefähr 100 Watt brutto, bei einer Netzteileffizienz von 85% also ungefähr 85 Watt.

Bei den neuen Core i7-Modellen muss man allerdings beim Vergleichen etwas aufpassen. Intel schrieb uns auf die Frage, welche Spannungen der Core i7 einstellt:

"At the time of manufacturing the operating VID voltage is tuned to the optimal voltage for power and performance. The VID voltage will vary from part to part and this is no different then on our previous generation processors (Bloomfield, Penryn, Conroe based). In addition on Nehalem based processors the processor will vary the VID voltage based on power and temperature when running. Previous generation processors (Penryn and before) used static VIDs for a given P-state frequency instead."

Daraus lassen sich zwei Dinge ableiten:

Unsere Messungen sind also für unser Testsystem mit unseren Prozessoren akkurat, bei der Verwendung von anderen Kühlkörpern, anderen Prozessoren aus einer anderen Charge oder anderen Programmen, die den Prozessor stärker/schwächer belasten, kann sich der Verbrauch also leicht verändern.


Der UnCore-Bereich besteht beim Gulftown-Prozessor aus dem Memory Controller, einem 12 MB großen L3-Cache, dem QPI-Controller zur Anbindung des X58 und ein paar Management-Funktionen. Der UnCore-Bereich ist also bis auf den vergrößerten Cache identisch zum Bloomfield (Core i7-9xx-Serie). Die kleineren Lynnfield-Modelle besitzen aufgrund des integrierten Chipsatzes auch noch einen DMI- und PCI-Express-Controller. Hierfür ist bei der LGA-1366-Platform der X58-Chipsatz zuständig. 

Der 12 MB Shared L3-Cache

Der Cache ist von der Struktur her unverändert und wird auch wie beim Bloomfield getaktet:

Beim Core i7-9xx wird der Cache mit der Uncore-Taktrate betrieben, diese ist immer mindestens der doppelte Takt des Speichertaktes. Wird der Core i7-980X also mit 1066 MHz betrieben, läuft der Uncore-Takt mit 2133 MHz und somit auch der L3-Cache mit 2133 MHz. Verwendet man hingegen 1333 MHz schnellen Speicher, läuft der L3-Cache mit 2666 MHz, bei 1600 MHz schnellem Speicher sind es 3200 MHz.

Beim Lynnfield-Prozessor Core i7-8xx und dem i7-750 ist dies anders. Beim Core i7-870 und Core i7-860 beträgt der UnCore-Takt 2400 MHz, wobei Intel hier zwischen den Lynnfield-Prozessoren differenzieren kann. Wie der UnCore-Takt ist auch der L3-Cache mit 2400 MHz getaktet, unabhängig vom Speichertakt. Der Takt des L3-Caches hängt nur noch von der Base Clock Rate ab, die - wenn das System nicht übertaktet ist - bei 133 MHz als Basistakt zugrunde liegt.

Beim Core i5-750 beträgt der UnCore-Takt nur 2133 MHz, somit besitzt dieser auch nur einen mit 2133 MHz getakteten L3-Cache. Neben dem Fehlen von Hyperthreading ist dies also ein weiteres Kennzeichen der Core i5-Serie.

Der Core i7-980X zeigt bei Verwendung von 1333 MHz den typischen L3-Cache-Takt von 2,66 GHz:

gulftown-cache

UnCore-Takt beim Core i7-980X

Die Performance des Caches haben wir mittels Rightmark Memory Analyzer gemessen:

rmma_20100309_142357_0863s

rmma_20100309_143053_0417s

Die Cache-Performance des Core i7-980X ist identisch zu den bisherigen Bloomfield-Prozessoren.

Allgemeines zum Speicherinterface:

Ein integrierter Speichercontroller kann aus Performancesicht sehr nützlich sein: AMD hielt mit der Integration des Memory-Controllers in den Athlon 64 den damaligen Pentium-4-Gegenspieler lange in Schach. Intel hingegen wehrte sich anfangs gegen eine derartige Lösung, da man mit der Integration in die CPU die Flexibilität etwas aus der Hand gibt: Mit einem neuen Chipsatz ließe sich schnell auf einen neuen Speichertyp umschwenken, ist der Speichercontroller erst einmal in der CPU integriert, muss ein neues Stepping her - und meistens wohl auch ein anderer Sockel oder Ähnliches. Die Performancevorteile ließen Intel aber dann doch umdenken - mit der Nehalem-Architektur kam auch ein integrierter Speichercontroller.

Bei Intels Prozessor-Lineup der Core-i3/5/7-Serie gibt es drei Ausführungen des Speichercontrollers:

Der Memory-Controller des Core i7-9xx:

Intel spendiert dem Gulftown und anderen Modellen der Core i7-9xx-Serie ein Triple-Channel-DDR3-Interface, welches man zunächst für den Betrieb mit DDR3-1066 freigibt. Eigentlich ist hier sehr viel mehr möglich, wir haben den Speichercontroller schon mit bis zu 2280 MHz betrieben. Auch sind schnellere Speichermodule am Markt verfügbar, Intel selber spezifiziert mit der XMP-Technik Module mit 1600 MHz. Doch selbst mit DDR3-1066 steht dem Prozessor eine Bandbreite von 25,5 MB/s zur Verfügung - und das bei extrem guten Latenzzeiten.

Der Core i7-980X bringt jedoch auch Möglichkeiten mit, den Speicher schneller laufen zu lassen. Im BIOS vieler Boards finden sich beim Einsatz eines Core i7-965 beispielsweise Optionen bis zu DDR3-2133 hin. Auch bei kleineren Modellen lässt sich der Speicher hochdrehen. Beachtet werden muss zudem, dass die Uncore-Taktrate vom DDR3-Takt abhängt - sie ist mindestens zweimal so hoch. Bei DDR3-2133 würden der Memory-Controller, der L3-Cache und die sonstigen Uncore-Bereiche demnach auf 4266 MHz laufen - oftmals wohl zu viel.

 

Der Memory-Controller des Core i7-8xx und i5-750:

Dem Lynnfield spendiert Intel nur ein Dual-Channel-Speicherinterface. Dafür setzt Intel den Takt hinauf, statt 1066 MHz dürfen nun 1333-MHz-Module zum Einsatz kommen. Auch XMP ist hier wieder mit am Start, so dürfen Speichermodule mit XMP im Core i7-870 und -860 auch mit 1600 MHz betrieben werden. Der kleinere Core i5-750 besitzt kein XMP und somit auch nicht die Möglichkeit, mit 1600 MHz Speicher offiziell zu laufen. Im BIOS der Mainboards fehlt diese Option auch als Speichermultiplikator.

Auf diversen Boardverpackungen sind auch Taktungen von 2133 MHz und mehr angegeben - diese erreicht man nur durch hinaufsetzen der Base Clock Rate (BCLK), da bei allen Prozessoren nur ein 12x-Multiplikator für den Speicher als Maximum einzustellen ist.

Der UnCore-Takt stieg beim Core i7-9xx immer mit an - beim Core i7-8xx ist dies nicht mehr der Fall. Der UnCore-Bereich wird hier immer mit 2400 MHz getaktet, unabhängig vom Speichertakt. So testeten wir dies mit den Einstellungen 800, 1066, 1333 und 1600 MHz, CPU-Z zeigte uns jedoch immer denselben Northbridge-Takt von 2400 MHz an. Daraus folgt, das der Northbridge-Takt hier zwar nicht mehr limitiert bei der Übertaktung des Speichers über den Multiplikator, aber auch die Performance des Uncore-Bereiches etwas niedriger ist, als die Performance des Uncore-Bereichs des Core i7-9xx. Setzt man die Base Clock Rate hoch, steigert sich natürlich auch der Northbridge-Takt, da dieser von der BCLK abhängt.


Architektur: QPI - der neue Bus

Intels Front-Side-Bus ist in die Jahre gekommen, deshalb schwenkte Intel beim Bloomfield auf einen neuen Bus um. Dies geschieht nicht ohne Grund: Im Desktop-Bereich mag der FSB mit seinen aufgebohrten 1600 MHz und 12,8 GB/s Übertragungsrate noch ausgereicht haben, bei Dual-Prozessor-Maschinen und Servern teilen sich aber mehrere Prozessoren die Bandbreite des FSBs bei Zugriffen auf den Speicher und den Cache des fremden Prozessors. Hier war das Phenom- und Athlon-64-Design mit AMDs Hypertransport-Bus in der Vergangenheit überlegen, aufgrund der NUMA-Architektur konnte AMD gerade im Serverbereich Marktanteile gewinnen.

Intel entlastet durch zwei maßgebliche Änderungen das Nadelöhr Richtung Northbridge: Der Speichercontroller wandert in die CPU, weiterhin bohrt man den I/O-Bus auf. Statt des bis zu 12,8 GB/s schnellen FSBs (bei 1600 MHz) kommt eine Point-to-Point-Verbindung mit 12,8 GB/s zum Einsatz, bei der die Daten aber bidirektional gesendet und empfangen werden können. Insgesamt stehen also 25,6 GB/s pro Link zur Verfügung. Zukünftig möchte Intel auch den QPI-Link durch Takterhöhung noch beschleunigen. Per Overclocking ist das schon heute möglich.

Gerade bei Mehrsockel-Systemen bietet Intel aber mehrere QPI-Links pro Prozessor. Durch diese QPI-Links können auch Prozessoren miteinander kommunizieren. Mit dieser Architektur ist es auch möglich, auf den Arbeitsspeicher des anderen Prozessors in hoher Geschwindigkeit zuzugreifen. Diese sogenannte Non-Uniform-Memory-Access-Architektur (NUMA) ähnelt der AMD-Implementierung im Serverbereich. Intel gibt dabei an, dass für einen Prozessor der Speicherzugriff auf den eigenen Speicher zwar durch die hohe Bandbreite und niedrige Latenzzeit zu empfehlen ist, der so genannte „Remote-Speicher“, also der Speicher eines anderen Prozessors, sei jedoch von der Performance her mit einer ähnlichen Latenzzeit zu erreichen wie bei einem Harpertown-System mit einem FSB von 1600 MHz.

qpis

Beim Lynnfield findet man den QPI-Takt allerdings nur für interne Zwecke, da er keinen QPI-Controller besitzt, um ihn mit mehreren Prozessoren zu koppeln. Der QPI-Controller bindet vermutlich nur intern den DMI- und PCIe-Controller an.


Für viele unserer Leser ist das Übertakten eine Standardprozedur bei Komponenten - egal ob diese bereits sehr schnell sind oder nicht. Auch der Core i7-980X eignet sich hervorragend zum Übertakten, da er aufgrund seiner 32-nm-Fertigung und dem offenen Multiplikator sehr einfach übertaktet werden kann. Aber natürlich muss auch bei diesem Prozessor mit Vorsicht vorgegangen werden, denn ein zu starkes Übertakten kann den Prozessor zerstören - gerade dann, wenn die Spannungen erhöht werden.

Unser Modell schwankt zwischen 0,975 V im Idle-Betrieb und 1,150 V im Lastbetrieb. Im Vergleich zu den Bloomfield-Modellen sind es also ein paar Millivolt weniger. Da die 32-nm-Prozessoren eine geringere Betriebsspannung besitzen, sollte man sie auch beim Overclocking nicht mit ähnlich hohen Spannungen wie bei den Bloomfield-Prozessoren quälen. In der nächsten Hardwareluxx [printed] bringen wir einen Vergleich, in dem wir feststellen, welche Spannungen empfehlenswert und relativ unbedenklich sind.

Durch den freien Multiplikator ist es relativ einfach möglich, den Prozessor zu übertakten. Ohne Erhöhung der Spannung und Veränderung des Referenztaktes lässt sich der Prozessor bereits auf höhere Taktraten bringen. Den Turbo-Modus haben wir hierfür ausgeschaltet, damit die Spannungen und die Frequenzen sich nicht unkontrolliert ändern.

gulftown-oc

Natürlich wollten wir es dabei nicht belassen - eine Spannungserhöhung auf 1,25 V ist relativ ungefährlich, verursacht aber natürlich eine höhere Leistungsaufnahme beim Prozessor. Mit 1,25 V erreichen wir 4,13 GHz Taktfrequenz. Maximal probierten wir 1,35 V mit Luftkühlung aus. Die Leistungsaufnahme unter Last steigt hier bereits auf 325 Watt an - mit Luftkühlung sind wir hier definitiv am Maximum. Der maximale Takt war auch nur noch leicht auf 4,266 GHz zu steigern:

gulftown-oc-4266

Ein detaillierter Overclocking-Bericht findet sich in unserer nächsten Ausgabe.


Für die Testsysteme der verschiedenen Plattformen verwendeten wir wo möglich identische Komponenten, um die Abweichung möglichst auf den Prozessor zu beschränken. So kamen für alle Systeme die folgenden Komponenten zum Einsatz:

Weiterhin haben wir versucht, die Systeme möglichst optimal einzustellen, ohne sie über ein normales Maß hinaus zu tweaken oder zu übertakten. So wurden gute Timings verwendet, ohne allerdings den Speicher besonders zu tunen, da hierdurch leichte Performanceverschiebungen entstehen können. Kleinere Änderungen in der Ausstattung der Systeme lassen sich jedoch nicht verhindern, da beispielsweise ein X58-System drei Speichermodule für den Triple-Channel-Betrieb verwendet. Daraus resultiert ein Speicherausbau von 6 GB statt 4 GB, der bei einigen wenigen Applikationen durchaus einen Geschwindigkeitsvorteil bringen kann.

Teilweise setzen wir auf ältere Treiber, um keine Abweichungen aus Benchmarks früherer Tests zu erhalten.

Die Plattformen in der Übersicht:

AMD Phenom II X4 965

Intel Core2 Quad Q9550s und E8400

Intel Core i7-9xx

Intel Core i7-8xx, Core i5-7xx, Core i5-6xx, Core i3


PCMark Vantage

Wir starten unseren Benchmark-Parcours mit PCMark Vantage. Hierbei geben verschiedene Applikations-Durchläufe einen Einblick in die Anwendungsperformance der Systeme. Einen großen Einfluß hat hier aber auch der Ausbau des Arbeitsspeichers sowie die Festplatte / SSD. Der PCMark Vantage ist kostenlos verfügbar und kann somit verwendet werden, die Leistung des eigenen Systems einmal gegenüberzustellen. Über unseren Download von PCMark Vantage lässt sich das Programm schnell auf den eigenen Rechner ziehen.

ben-pcmark

Klarer Sieg für den Core i7-980X - mit sechs Kernen und 12 Threads setzt er sich klar an die Spitze. Unser Testdurchlauf zeigt, dass die Core i7-9xx-Prozessoren und die Core i7-8xx-Modelle nicht weit auseinander liegen. Allerdings sind die Schwankungen in diesem Benchmark auch relativ hoch, zudem wirkt sich der höhere Arbeitsspeicherausbau der Bloomfield-Plattform sicherlich auch etwas auf das Ergebnis aus.


Cinebench 10

Den Download von Cinebench 10 findet man ebenso in unserer Download-Datenbank. Der mittlerweile etablierte Benchmark misst die Performance eines Systems beim Rendering mit Maxons Cinema 4D. Es gibt mehrere Tests, wobei wir den reinen CPU-Benchmark verwenden und hier auch nur die Multi-Core-Version x-CPU testen. Der Workload wird hier auf alle verfügbaren Kerne und Threads aufgeteilt, es ist also ein reinrassiger Multicore-Benchmark. Aus diesem Grund liegen die Dual-Core-Prozessoren mittlerweile auch weit zurück.

ben-cinebench

Hier zählt vor allen Dingen die Taktfrequenz und die Anzahl der Kerne: So ergibt sich je nach Takt unter den Core-i7-Modellen eine klare Rangliste. Der Core i7-980X ist mit sechs Kernen und 12 Threads vorne. Die älteren Modelle besitzen alle acht Threads und sind deshalb im Mittelfeld. Der Core i5-750 hingegen ohne Hyperthreading liegt trotz ähnlicher Architektur zurück. Er kann sich nur knapp vor AMDs Quad-Core ins Ziel retten. Die älteren Penryn-basierten Prozessoren kränkeln am Front Side Bus und der älteren Architektur.


Frybench

Da der Cinebench nur noch ein paar Sekunden dauert, hat sich in unserem Forum Frybench zu einem beliebten Benchmark-Tool entwickelt. Alles weitere zu diesem Benchmark findet sich in unserem Foren-Thread, in dem man auch eigene Ergebnisse zum Vergleich mitteilen kann. Der Rendering-Benchmark braucht auf einem normalen System gerne einmal 10 Minuten, nur mit hochgezüchteten Systemen schafft man bessere Resultate. Der Top-Prozessor Core i7-975 braucht beispielsweise immer noch knapp über sechs Minuten für den Durchlauf. Gemessen wird die Rendering-Zeit in Sekunden, ein geringeres Resultat ist also ein besseres.

ben-frybench

Auch hier liegt der Core i7-980X mit seinen sechs Kernen klar in Führung - es folgen die Vierkern-Modelle mit Hyperthreading. Trotz gleichem Takt liegt der Core i5-750 deutlich gegenüber dem Core i7-920 zurück. Die Dual-Core-Modelle sind abgeschlagen.


Sisoft Sandra 2009

Auch den Download zu Sisoft Sandra findet man in unserer Download-Datenbank. Wir nutzen von dieser Software nur den Memory Benchmark zum Testen der Speicherbandbreite der Systeme. Es sind auch noch diverse weitere Tests in der Tool-Sammlung integriert (z.B. ein Wechseldatenträger-Benchmark oder ein Netzwerk-Benchmark). Die Speicherbandbreite ist in GB/s angegeben.

ben-sisoft

Wie man sehen kann, liegen die Core-i7-9xx-Modelle mit Triple-Channel-Interface in Führung. Dahinter finden sich die Lynnfield-Prozessoren ein, die zwar nur mit einem Dual-Channel-Interface, dafür aber mit 1333 MHz Speichertakt ausgestattet sind. AMD ist mit dem Phenom auf einem sehr guten Niveau, die Modelle, die keinen integrierten Speichercontroller besitzen (Q9550S und E8400) hängen hinten dran.

Der Core i7-980X ist etwas langsamer als die bisherigen Core-i7-9xx-Modelle, was wohl auf die etwas unterschiedlichere Cache- und Kernarchitektur zurückzuführen ist.


TrueCrypt 6.2a

Als Verschlüsselungs-Benchmark haben wir dieses Mal TrueCrypt mit in den Benchmark-Parcours aufgenommen. Das Programm kann einzelne Dateien, Verzeichnisse oder ganze Datenträger mit unterschiedlichen Algorithmen verschlüsseln. Wir nutzen die integrierte Benchmark-Funktion mit einer Dateigröße von 100 MB. Die angegebenen Werte beziehen sich auf die Bandbreite pro Sekunde in MB/s.

ben-truecrypt

Der Schritt von Six-Core zu Quad-Core ist hier fast ebenso immens wie der Schritt von Dual- auf Quad-Core. Der Core i7-980X schießt hier aufgrund der zusätzlichen Kerne an die Spitze.


iTunes WAV-Komprimierung

Durch iPod und iPhone ist mittlerweile auf fast jedem Rechner iTunes zu finden. Allerdings ist das Programm nicht nur sinnvoll, wenn man die gekauften Songs von Apple verwalten will, auch als Datenbank für eigene CDs eignet sich das Programm. So lassen sich CDs einfach auf den Rechner ziehen und dort in mp3-Files oder das hauseigene ACC-Format umwandeln. Wir haben mit der iTunes-Version (8.2.1 für Windows 64bit) eine 720 MB große Datei in das mp3-Format komprimieren lassen.

ben-itunes

Sowohl der Core i7-870X wie auch der Core i7-975 kommen praktisch fast zeitgleich ins Ziel - da iTunes nicht von mehreren Kernen profitiert, sind beide fast gleichauf.

 

SuperPi

SuperPi ist bei unseren Overclockern sehr beliebt, das Tool läuft allerdings nur Single-Threaded ab, nutzt also nur einen Prozessorkern und kein Hyperthreading. In der Regel sind höhergetaktete Prozessoren schneller, auch die Speicherbandbreite hat einen gewissen Einfluß auf die Performance. Wir haben den 1M-Benchmarklauf durchgeführt, auch hier ist die Zeit in Sekunden angegeben, die niedrigeren Ergebnisse sind also die besseren.

ben-superpi1m

Auch hier liegt der Core i7-975 knapp vor dem Core i7-980X - wie auch schon beim Speichertest. Da die RAM-Performance einen kleinen Einfluss auf diesen Benchmark hat, ist dies zu verstehen. Eventuell schaltet auch der Turbo-Modus nicht ganz so oft auf die höchste Performancestufe.

 

wPrime 1024M

Dieser Benchmark ist sehr ähnlich zu SuperPi, allerdings werden hier Primzahlen berechnet. Statt eines Single-Core-Benchmarks handelt es sich bei wPrime auch um einen Multicore-Benchmark, da mehrere Threads in Anspruch genommen werden können. Hier haben mehrere Kerne und die Existenz von Hyperthreading also wieder einen größeren Einfluß auf die Performance.

ben-wprime

Klarer Sieger: Der Core i7-980X. Mit sechs Kernen und 12 Threads ist der Prozessor den anderen Modellen deutlich überlegen, da wPrime ihn voll auslastet.


3DMark Vantage

Die Gaming-Benchmarks in diesem Test beginnen wir mit 3DMark. Der 3DMark Vantage als neueste Version ist natürlich auch stark Grafikkarten-lastig, hat aber mit der CPU-Score eine dedizierte Maßzahl zum Vergleich von der Prozessorleistung. Wir haben sowohl die Overall-, wie die CPU-Score aufgeführt, um einen Vergleich zum eigenen System zu ermöglichen. Um die 3D-Grafikpracht flüssig zu genießen, ist ein schneller PC notwendig. Der Download von 3DMark Vantage ist wie immer in unserer Download-Area möglich.

ben-vantage

ben-vantage-cpu

Woher die Performanceunterschiede kommen, sieht man im CPU-Teilbereich: Hier liegt der Core i7-980X klar in Führung. Die Unterschiede in der Gesamtscore beruhen auf der unterschiedlichen Kernanzahl im CPU-Test und der Frequenz. Auch wenn der Core i7-980X vielleicht nicht der Gaming-Prozessor schlechthin ist, eine gute 3DMark-Score schafft er aufgrund der Multicore-Unterstützung.

 

Company of Heroes

Den Company-of-Heroes-Benchmark lassen wir mit 1280 x 768 und High-Quality laufen. Wir erreichen damit zwar Frameraten über 200 fps, können aber eine Limitierung der Grafikkarte sehr gut ausschließen. Trotzdem sind die Unterschiede zwischen den Prozessoren minimal:

ben-company

Auch hier liegt der Core i7-980X knapp in Führung - allerdings sind die Performanceunterschiede in diesem Benchmark wohl kaum den Aufpreis der teureren CPUs wert. 


Far Cry 2

Bei Far Cry 2 handelt es sich um einen First-Person-Shooter aus dem Hause Ubisoft. Der Nachfolger des legendären Spieleklassikers basiert auf der eigens entwickelten Dunia Engine, wodurch beispielweise dynamisches Wetter, Tag- und Nachtzyklen und eine dynamische Vegetation realisierst werden. Das Spiel nutzt Mehrkernprozessoren, unterstützt sowohl DirectX-9 als auch -10 und besitzt eine integrierte Benchmark-Funktion, mit zahlreichen Einstellungsmöglichkeiten.

Zur Vollversion von Far Cry 2 in unserem Preisvergleich gelangt man über diesen Link.

ben-farcry2

Der Core i7-980X liegt hier erstaunlicherweise klar in Führung. Dies scheint an der Arbeit der Multicore-Optimierung von FarCry 2 zu liegen, denn das Spiel zeigt auch mit dem Core i5-750 eine sehr gute Leistung. Hyperthreading scheint dem Spiel nicht zu schmecken.


GTA4

Der dunkle Ganster-Shooter hatte aufgrund von instabilem Verhalten einen schweren Start, nach ein paar Patches läuft er jedoch. Wer Nico Belic durch das Spiel steuern möchte, benötigt jedoch für sämtliche Effekte und eine höhere Auflösung nicht nur eine schnelle CPU, sondern auch eine stattliche Grafikkarte. Wir haben eine typische Auflösung gewählt, um dies zu visualisieren.

ben-gta4

GTA4 skaliert sehr schön auf schnellen Prozessoren - so können sich die schnelleren Core i7-9xx an die Spitze setzen, die Core i7-8xx-Prozessoren landen auf ähnlichem Niveau knapp dahinter. Auch hier scheint der Core i5-750 durch das fehlende Hyperthreading ein paar Prozent gut zu machen. Die vier weiteren Prozessoren im Test kommen nicht an die Limitierung der Grafikkarte heran. Neben einer potenten Grafikkarte braucht man bei GTA4 also auch eine gute CPU, am besten etwas oberhalb des Core i7-920 oder Core i7-860.


World in Conflict

Bei World in Conflict handelt es sich um ein Echtzeitstrategiespiel von Sierra Entertainment. Das Spiel wurde von Massive Entertainment, den Schöpfern der Ground Control Reihe, entwickelt und ist seit September 2007 in Europa erhältlich. World in Conflict bietet eine Singleplayer-Kampagne, die insgesamt 14 Missionen beinhaltet. Das Spiel fesselt den Spieler durch seine Reichhaltigkeit an Action und hoher Spielgeschwindigkeit gepaart mit einer zeitgemäßen Grafik. In diesem Fall haben sich die Programmierer dazu entschlossen den DirektX-10-Renderpfad zu nutzen, welcher im Game erstaunliche Bilder auf den Schirm zaubert.

Zur Vollversion von World in Conflict in unserem Preisvergleich gelangt man über diesen Link.

ben-world-in-conflict

Hier liegt die Nehalem-Architektur geschlossen vorne - selbst der Core i5-640 kann den Q9550S und Phenom II X4 965 abhängen. Die Core i7-9xx-Modelle liegen zwar an der Spitze, die Core i7-8xx-CPUs platzieren sich aber in geringem Abstand direkt dahinter. Der Core i5-750 landet auf demselben Niveau wie der Core i7-920 - hier gibt es also keine Unterschiede zwischen der CPU mit und ohne Hyperthreading oder einem Zwei- und Dreikanal-Interface.


Wir haben drei Verbrauchmessungen vorgenommen, einmal "idle" unter Windows, einmal unter 2D-Last (Cinebench 10 xCPU) und einmal unter 3D-Last (Vantage, 1. Durchlauf).

ben-idle

Die kleinen Lynnfield-Prozessoren sind hier klar im Vorteil: Der X58-Chipsatz verbrät im Idle-Betrieb ordentlich Strom, was den Verbrauch der Bloomfield- und Gulftown-Prozessoren in die Höhe treibt. Im Vergleich zu den Vorgänger-Modellen, die auch im X58-Board sitzen, kann der Core i7-980X hier einen guten Wert abliefern und verbraucht am wenigsten Strom.

ben-2dlast

Unter Last genehmigt sich der Sechskerner über 250 Watt - das ist der drittschlechteste Wert. Berücksichtigt man aber die extrem hohe Performance im Cinebench, so relativiert sich das Ergebnis. Auch bleibt er mit sechs Kernen unterhalb der Verbrauchswerte des Core i7-975. Insgesamt geht der Stromverbrauch hier also auch in Ordnung.

ben-3dlast

Auch bei der Betrachtung mit 3D-Last liegt der Core i7-980X relativ gut: Hier zieht die Grafikkarte mehr Last, weshalb er sich weiter vorne positionieren kann. An die sparsamen Core i7-8xx-Prozessoren kommt er aber nicht heran. Da die 3D-Performance nicht unbedingt besser ist, ist für Spieler eventuell ein Lynnfield aus Verbrauchssicht die besser Wahl.


In einigen Benchmarks gibt es neue Rekorde: Der Core i7-980X kann vor allen Dingen in den Tests überzeugen, in denen alle Threads voll ausgelastet werden. Dann liefert er nicht nur ein wenig mehr Performance als die bisherigen CPUs, sondern ein wirklich dickes Performanceplus. Wer also viel rendert, berechnet oder komprimiert, wird den neuen Prozessor sicherlich für sinnvoll halten.

Vergleicht man die Performance in Anwendungen, in denen nicht alle Kerne genutzt werden können, so fällt der Vorsprung knapp aus - wenn überhaupt ein Vorsprung besteht. Oftmals kommt der 3,33 GHz schnelle Prozessor mit dem Core i7-975 ins Ziel, da dieser genauso schnell getaktet ist und auch mit identischen Spezifikationen (Speichertakt, Turbo-Betrieb) ausgestattet ist. Kleine Unterschiede bestehen dann nur noch aufgrund des größeren Caches des Core i7-980X.

In Spielen wiederum macht sich höchstens der Cache bemerkbar - und die Unterschiede zu den deutlich günstigeren Lynnfield-Prozessoren werden sehr klein. Hier lohnt es sich eher, ein paar hundert Euro in eine schnellere Grafikkarte zu investieren und auf einen Core i7-860 zu setzen, als Intels neues High-End-Flaggschiff einzubauen.

{gallery}/galleries/reviews/Corei7980X/{/gallery}

Schaut man auf den Stromverbrauch des Chips, so erreicht er ungefähr dieselben Werte wie ein Core i7-975. Im Idle-Betrieb ist er etwas sparsamer, kommt aber aufgrund der immer noch hohen Verbrauchswerte des X58 nicht an stromsparende Systeme heran. Ein Sechskern-Prozessor oder ein Quad-Core mit 32-nm-Technik für den P55 wäre hier die beste Variante - aber entsprechende Prozessoren lassen noch auf sich warten.

Unter Last liegt er mit dem Core i7-975 an der Spitze - liefert aber je nach Benchmark deutlich mehr Performance pro Watt. Gut gekühlt werden muss der Prozessor aber natürlich, was auch ein Grund ist, dass Intel den Prozessor mit einem neuen Boxed-Kühler kombiniert, der auf Heatpipes und ein Tower-Design setzt. Eine leise Kühlung ist mit diesem auf jeden Fall möglich, auch wenn 250 Watt im 2D-Betrieb verbraucht werden.

Overclocker werden wohl aufgrund der 32-nm-Technik ein paar MHz mehr aus der CPU herausholen können, als bei den bisherigen Bloomfield-basierenden Core i7-9xx. Deutlich mehr Takt konnten wir im Betrieb allerdings mit Luftkühlung nicht erreichen. In unserem nächsten Heft werden wir die CPU mit Wasser kühlen und sie ausgiebiger im Overclocking-Bereich testen. Eine Gemeinsamkeit besitzt sie jedoch mit den bisherigen Modellen: Aufgrund des UnCore-Taktes ist es immer noch schwierig, einen hohen Speichertakt mit der CPU zu erreichen.

Letztendlich ist es wie immer bei einer Extreme-Edition-CPU: Die 1000 Euro Kaufpreis werden nur die wenigsten Käufer auf die Ladentheke legen. Wer es dennoch tut, bekommt ein extremes Stück Hardware, welches leistungsmäßig am obersten Ende liegt und überzeugen kann. Allerdings wird für die meisten Anwender die Mittelklasse interessanter sein, da die Kosten hier deutlich niedriger liegen - bei kaum schlechterer Performance.

Positive Aspekte des Core i7-980X:

Negative Aspekte des Core i7-980X:


Klarer Award: Nur die Kosten sprechen
gegen den Einsatz des Core i7-980X.

 

Weitere Links: