Intel Core2 Duo und Extreme im Test

Veröffentlicht am: von

Ein großer Umbruch steht bevor: Bislang waren AMDs Prozessoren in Spielen die Nummer 1, auch den Titel der stromsparenderen Desktop-Prozessoren hatte man inne. Am 28.07. stellt Intel die neue Core2-Prozessorserie vor, die auf der Core-Architektur basiert. Mit dem Core2 Duo und dem Core2 Extreme kommen zwei Prozessorklassen auf den Markt, die AMD vom Platz an der Sonne verdrängen. Wir berichteten schon mehrfach in unserem Heft und online von den neuen Prozessoren, heute ist es uns aber auch möglich, erste Benchmarks der Core2-Modelle zu präsentieren. Fehlen darf natürlich auch nicht ein Blick auf die Overclockingfähigkeiten der neuen Prozessoren und eine Messung des tatsächlichen Stromverbrauchs.

Die neuen Prozessoren befinden sich wie gewohnt im Sockel-775-Layout. Allerdings bedarf es neuer Mainboards für die Prozessoren, da die bisherigen Boards größtenteils andere Voltage-Regulator-Module einsetzen, die mit dem Core2 Duo nicht zurecht kommen. Er besitzt ein anderes Power-Management und eine andere Spannung als die Pentium-D- und Pentium-4-Prozessoren, die trotz teilweise gleicher Fertigungstechnik eine höhere Spannung erhielten. Neue Mainboards mit i975X-Chipsatz sind meistens entsprechend gekennzeichnet, auch wird der Core2 Duo von den neuen X965-Chipsätzen von Intel und der neuen nForce-5-Serie von NVIDIA unterstützt.

Intel stellt die Modelle sowohl für den Mainstream- und Einsteigerbereich, wie auch für den High-End-Bereich vor. Als Einsteigermodelle dienen abgespeckte Core2-Prozessoren, die nur 2 MB L2-Cache besitzen und wir leider für diesen Test nicht zur Verfügung haben. Uns steht der E6700 mit 2.66 GHz und 4 MB L2-Cache sowie der X6800 mit 2.93 GHz und 4 MB L2-Cache zur Verfügung. Da der X6800 einen offenen Multiplikator besitzt, waren wir in der Lage, auch den E6600 mit 2.4 GHz und 4 MB L2-Cache zu simulieren. Als Vergleich dient natürlich zum einen der Pentium Extreme Edition 965, das bisherige Intel-Flaggschiff, wie auch die aktuellen AMD-Topmodelle, der FX-60 im Sockel 939 und FX-62 im Sockel AM2.

Der Conroe: 4 MB L2-Cache und zwei Kerne

Da die Core2-Prozessoren nicht mehr auf der Netburst-Architektur aufbauen, sondern auf der neuen Core-Architektur, sind weitaus mehr Veränderungen im Design zu finden als in der Tabelle zu erkennen. Diese Veränderungen wollen wir auf den nächsten Seiten erklären, bevor wir zu Benchmarks und Messungen kommen.

        

Intel veränderte trotz Ähnlichkeit der Taktfrequenzen zum Core Duo die zugrundeliegende Architektur deutlich. Durch diese Änderungen entstand wohl auch die größte Auswirkung auf die Performance. Bislang arbeiteten der Pentium M und auch der Pentium 4 mit einer dreifach multiskalar ausgelegten Pipeline. Der Core2 Duo besitzt ein vierfach multiskalares Design, er kann also 33 % mehr Befehle gleichzeitig abarbeiten als die bisherigen Prozessoren. Bildhaft vorstellen kann man sich dies mittels einer vierspurigen Autobahn, über die mehr Autos ohne Stau fahren können als bei einer dreispurigen Fahrbahn.

Auch wurde die Pipeline verändert: Statt einer 12-stufigen bzw. 31-stufigen Pipeline von Pentium M und Pentium D verwendet die Core-Architektur eine 14-stufige Pipeline, der man zusätzlich größere Puffer spendiert hat. Der L2-Instruction-Cache ist nun 32 kB groß. Zudem analysiert der Prozessor in der Pre-Dekodierphase, ob zwei aufeinanderfolgende Befehle zusammengefasst werden können. Durch Makro-Fusion können zusammengehörige Rechenschritte wie „Compare“ und „Jump“ in einem einzelnen Rechenschritt bearbeitet werden. In älteren Architekturen wurden diese Befehle getrennt abgearbeitet, benötigten also zwei Rechenschritte.

Mit Macro-Fusion ist es möglich, Instruktionen also schneller abzuarbeiten, wenn diese zusammen gehören. Im unteren Bild wurden bislang alle Befehle des Instruction Queues (oben links) einzeln abgearbeitet. Mit Marcro-Fusion können die Instruktionen "cmp eax, [mem2]" und "jne targ" zusammen abgearbeitet werden. Ein µ-Op steht dann für insgesamt zwei Operationen:

Insgesamt können durch Macro-Fusion also maximal aus dem L1-Cache fünf Instruktionen pro Taktzyklus geholt werden, wenn sich zwei µ-Ops zusammenfassen lassen. Mehrere Zusammenfassungen sind leider nicht möglich, da nur einer der vier Dekoder in der Lage ist, µ-Ops zusammen zu fassen.

Durch die kürzere Pipeline fällt ein Problem der Netburst-Architektur weg: Verspekuliert sich ein Prozessor an einem Schritt der Pipeline beim Vorherbestimmen von Ergebnissen, muss die Pipeline verworfen werden und wieder von Beginn berechnet werden. Also ist die Herausforderung bislang gewesen, durch sehr gute Prefetcher ein Verrechnen zu verhindern. Leider gelingt dies nicht immer - und wenn zu häufig eine komplette Pipeline verworfen werden muss, wird zum einen Strom für die erneute Berechnung verschwendet, zum anderen sinkt aber auch die Performance.

Mit einer 14-stufigen Pipeline ist dieses Problem nicht mehr so gravierend vorhanden, da die Anzahl der Stufen nun niedriger ist. Zudem hat Intel die Branch Prediction verbessert, die Sprungvorhersagen sind somit genauer und ein Leeren der Pipeline ist seltener nötig.


Wie immer ist bei Intel auch eine neue "SSE-Erweiterung" mit dabei. Dieses Mal heisst die Erweiterung aber nicht "SSE4", sondern trägt den Namen Advanced Digital Media Boost. Hinter diesem Namen verbirgt sich eine Sammlung von Verbesserungen. Zum einen Verstecken sich neue Multimedia-Instruktionen hinter dem Begriff. Die neuen Befehle sollen vor allen Dingen beim Encoding und Decoding von HD-Inhalten helfen.

Verbessert hat man die Abarbeitung der SSE-Befehle. Diese können nun Dank einer 128-Bit-Busbreite in einem einzelnen Taktzyklus abgearbeitet werden, beim Core Duo wurden noch zwei Taktzyklen benötigt. Hier war die Datenbreite noch 64 bit, somit musste der 128-bit-Befehl aufgesplittet werden in zwei Teile. Der Prozessor benötigte dann somit zwei Takte zum Berechnen. Da nun die Busbandbreite 128 bit beträgt, kann der Core2 die Befehle in einem Schritt abarbeiten. Somit spart man bei der Berechnung Zeit - und erhält den doppelten Durchsatz pro Taktzyklus.

Durch den größeren Durchsatz erreicht Intel auch ein zweites Ziel, welches man bei der Core-Architektur immer verwirklichen möchte: Man spart durch eine effizientere Nutzung des Prozessors Energie. Weiterhin wird die Load-Pipeline entlastet, da der zweite 64bit-Part nicht mehr nachgeladen werden muss.


Das Power-Management kennt man schon vom Pentium M - aber Intel hat es weiter verbessert.

Ein großer Nachteil der Desktop-Prozessoren von Intel war der hohe Stromverbrauch. Die Netburst-Architektur war kein Stromkünstler, erst nach Monaten baute Intel einen Stromsparmechanismus mit C1E und EIST ein. Damit ließ sich zumindest im Idle-Betrieb die Stromaufnahme deutlich senken, aber im Vergleich zu AMD hing man immer noch hinterher. Der Grund lag unter anderem in den hohen Taktraten der Prozessoren, die auch im Idle-Betrieb noch mit 2.8 GHz oder mehr arbeiteten.

Der Pentium M konnte hingegen seine Taktfrequenzen deutlich filigraner steuern und auch niedrigere Spannungen aufgrund niedrigerer Taktfrequenzen ermöglichen. Dieses Prinzip hat der Core2 Duo nun im Desktop-Bereich ebenso, wenn auch in verbesserter Form. Bislang konnten schon einzelne Cache-Bereiche abgeschaltet werden, wenn diese nicht verwendet wurden, dieses Prinzip hat man nun auf weitere Bereiche des Prozessors ausgedehnt. Als Beispiel sind in dem unten stehenden Modell die grünen Bereiche deaktiviert, die roten aktiviert:

Aber nicht nur durch das Abschalten der einzelnen Funktionsbereiche kann Strom gespart werden. Auch kann Intel über ein Split-Bus-System einen Bus so aufsplitten, dass der nicht verwendete Teil des Busses abgeschaltet bleibt und somit Strom gespart wird:

Alle Core-Prozessoren besitzen nun zudem einen Power Status Indicator (PSI-2), der den Status des Prozessors an externe Komponenten der Plattform übermitteln kann. So kann beispielsweise der Voltage Regulator effektiver arbeiten.

Das ein System mit einer niedrigeren Stromaufnahme auch leiser wird, sollte klar sein: Der CPU-Lüfter muss nicht mit maximaler Drehzahl arbeiten und eventuell kann auch ein Gehäuselüfter langsamer drehen, wenn weniger Wärme im Gehäuse entsteht. Zuletzt war es durchaus schwierig, mit einem Boxed-Kühler von Intel und zwei Gehäuselüftern auch gute CPU-Temperaturen zu erreichen, mit der niedrigeren Abwärme der Core-Prozessoren wird dies deutlich einfacher.

Zudem hat Intel das Thermal Management verbessert. Auf dem Chip sitzen nun mehrere "Digital Thermal Sensors", die nahe an den möglichen Hotspots im Kern integriert sind. Durch diese Scans ist es nun möglich, die Prozessortemperatur sehr viel genauer zu erfassen. Dadurch ist es möglich, den Sicherheitsabstand zu verringern, der bislang zwischen maximaler Kerntemperatur und gemessener Kerntemperatur besteht. Auch wird ein deutlich feineres Management ermöglicht - und eventuell können so Lüfter leiser drehen und besser aufeinander abgestimmt werden.

Auch ein automatisches Throttling bei zu hoher Temperatur ist wieder vorhanden: Die Taktfrequenz wird dann reduziert und die Spannung abgesenkt, um die Temperatur an den Hotspots zu senken.

In unserem Praxistest wurde natürlich auch der Stromverbrauch gemessen. Hier konnten die Core2-Prozessoren richtig auftrumpfen, denn nicht nur im Idle-Betrieb erreichten Sie eine hervorragende Performamnce, auch unter Last stieg die Verlustleistung in einem 2D-Benchmark, der beide Kerne vollständig belastete, nur um ca. 40 bis 50 Watt an. Unsere Messungen geben die Stromaufnahme des Gesamtsystems, abzüglich der Netzteileffizienz an.

Unser System ist mit 130 Watt Idle-Betrieb bei den Core2-Prozessoren sehr stromsparend unterwegs. Der Core2 Duo läuft dann mit einem Multiplikator von 6 bei 266 MHz Bustakt, also mit 1.6 GHz. Dies ist ein großer Vorteil gegenüber den Pentium D / Extreme Edition-Prozessoren. Der Pentium D konnte den Takt nur auf 2.8 GHz senken und besitzt dabei auch noch eine höhere Spannung.

Unter Last bleiben selbst AMDs hochgelobte Athlon-Prozessoren deutlich zurück, denn Cool'n'Quiet kann zwar unter Idle-Bedingungen gute Arbeit leisten, unter Last ist der FX-62 aber durch den hohen Takt und die 90nm-Technik mittlerweile auch schon ganz schön heiss und somit auch nicht so leicht zu kühlen wie der Core2 Duo. Die weiteren Unterschiede erklären sich durch die unterschiedlichen Mainboards: Für den Sockel-939-FX-60 verwendeten wir ein Mainboard mit CrossFire3200-Chipsatz, welches relativ sparsam ist, für den AM2 blieb nur der Griff zu einem nForce 590 SLI, welches aufgrund zwei vorhandener Chips recht viel Strom verbraucht.

    

Die Cache-Architektur der AMD-Prozessoren hatte im Vergleich zum Pentium D bislang einen Vorteil, da dieser Prozessor nur Daten in den Cache des anderen Prozessors übertragen kann, indem er den sowieso schon stark frequentierten FSB nutzt. AMD hat die beiden Kerne über eine Crossbar verbunden und somit ist ein Zugriff schneller möglich. Durch den SmartCache haben jedoch nun wieder der Core Duo und Core2 Duo die Nase vorne.

Die beiden Kerne der Dual-Core-Prozessoren verwenden einen gemeinsamen L2-Cache. Zunächst muss der FSB nicht mehr für den Datentransfer verwendet werden, wodurch die Ressourcen nun für den Speicher voll zur Verfügung stehen. Auch sind keine Daten im Cache doppelt vorhanden, da beide Prozessoren denselben Cache verwenden. Der Clou ist zudem, dass der SmartCache dynamisch auf beide Kerne aufgeteilt werden kann. Ist der erste Kern also beispielsweise gar nicht beschäftigt, steht dem zweiten Kern die komplette Cache-Größe zur Verfügung. Sind beide aktiv, reservieren sie sich genau so viel Platz, wie sie benötigen. Der Cache wird also effektiv genutzt.

Profitieren können im Vergleich also auch Single-Threaded-Anwendungen: Die Core2-Duo-Modelle mit 4 MB L2-Cache reservieren bei derartigen Applikationen die vollen 4 MB Cache für die einzelne Anwendung. Damit laufen auf den neuen Prozessoren auch diese Anwendungen etwas schneller.

Der SmartCache an sich bewirkt auch wieder ein erhöhtes Stromsparpotential. Der Bus wird weniger belastet:

Die zweite große Verbesserung betrifft den Speicherzugriff. Auch hier hat AMD bislang einen großen Vorteil durch den integrierten Memorycontroller. Durch diesen lässt sich eine extrem gute Latenz zum Speicher erreichen, die Performance ist entsprechend hoch. Allerdings hat ein derartiger Speichercontroller auch diverse Nachteile: Die Implementierung eines neuen Speicherstandards führt zu einem kompletten Redesign eines Prozessors und ist nur mit hohem Aufwand zu erreichen. Demnach legt man sich längerfristig auf einen Standard fest. Auch ist durch den integrierten Controller ein höherer Stromverbrauch in der CPU vorhanden.

Intel bleibt also beim gesplitteten Ansatz: Memorycontroller in der Northbridge des Chipsatzes, dadurch erkauft man sich eine höhere Flexibilität. Die Performance versucht man hingegen mit Intel Smart Memory Access zu erreichen. Zum einen hat man die Prefetch-Mechanismen verbessert und kann somit schneller die Daten in den Cache laden, die man tatsächlich benötigt. Das Ziel ist es, möglichst keinen Cache-Miss zu bekommen und sämtliche benötigte Daten direkt aus dem großen L2-Cache zu bekommen. Intel hat hierfür zwei Data- und einen Instruction-Prefetcher pro Kern, welche multiple Muster simultan behandeln können. Zusätzlich existieren zwei Prefetcher im L2-Cache. Ein Monitor reguliert die Agressivität und den Trafficbedarf.

Mittels Memory Disambiguation beschleunigt Intel zudem die Performance der Out-Of-Order Memory Pipelines. Das folgende Bild beschreibt einen Speicherzugriff in einem normalen System ohne Memory Disambiguation. Hier muss das System mit dem Laden der Daten X für "Load4" abwarten, bis die Daten des "Store3"-Befehls im Speicher geschrieben worden sind. Erst im Anschluss können die Daten gelesen werden für den Load4 - hierdurch entsteht eine Wartezeit (Latenz).

Mit Memory Disambiguation kann der Load4 bereits als erstes ausgeführt werden. Es findet somit eine getrennte Bearbeitung von Loads und Stores statt. Damit dies funktioniert muss der Prozessor vorher überprüfen, ob die Daten im Speicher durch vorherige Rechenschritte eventuell noch verändert werden. Würde diese Überprüfung nicht statt finden, würde der Prozessor eventuell mit falschen Daten rechnen. Aus diesem Grund muss der Prefetcher an dieser Stelle gute Arbeit leisten.

Die Technik ist dabei nichts neues für Intel: In der IA64-Technik setzt Intel bereits seit längerem derartiges ein.


Natürlich ist der Core2 Duo auch begehrenswertes Objekt bei allen, die noch ein bißchen mehr aus ihren Systemen herausholen können. Der Core2 Duo geht jedoch wie man es von Intel kennt mit einem festen Multiplikator zu Werke, kauft man einen E6700, so beträgt dieser z.B. 10. Mit diesem Multiplikator muss man nun leben, nach oben verändern kann man ihn nicht. Mit einigen Tools ließ sich zumindest beim Core Duo und Pentium M auch der Multiplikator nach unten verstellen und auch viele Bios-Versionen unterstützen dies - somit ist er zumindest schon einmal variabler zu takten als der Pentium D.

Da der Core2 Duo schon einen sehr hohen FSB besitzt, könnte man meinen, dass auch der FSB nicht wirklich gut zu übertakten ist. Allerdings erreichten wir in einem Intel D975XBX Bad Axe und in einem ASUS P5W DH Deluxe einen FSB von weit über 400 MHz. Ausgehend von den in der Default-Einstellung anliegenden 266 MHz lässt sich also noch einiges an Performance herausholen.

Zunächst testeten wir mit Intels Boxed-Kühlkörper und überprüften, wie hoch sich der Core2 Duo E6700 und Core2 Extreme X6800 übertakten lässt, wenn man die Spannung unberührt lässt. Wir ließen hierfür zwei Prime95-Instanzen laufen und erhöhten den Takt MHz für MHz über den FSB. Gleichzeitig behielten wir die Temperatur des Prozessors im Auge, damit er nicht zu throttlen beginnt.

Die Resultate können sich sehen lassen:

Links: Core2 Duo E6700 mit 3.27 GHz
Rechts: Core2 Extreme X6800 mit 3.53 GHz

Der Core2 Duo E6700 ließ sich auf ca. 3.300 MHz übertakten, der Core2 Extreme X6800 auf immerhin ca. 3.500 MHz. Dies sind zwar prozentual geringe Ergebnisse, allerdings haben wir auch noch nicht die Spannung des Prozessors erhöht. Dabei muss man recht schnell auf die Kühlung des Prozessors achten, denn durch eine Spannungserhöhung steigt die Verlustabgabe des Prozessors im Quadrat. Dies bekamen wir recht schnell zu spüren, als wir die Spannung auf 1.5 V heraufgesetzt haben. Der Prozessor erreichte in Kürze 89°C - dies ist definitiv zu viel. Aufgrund des Resultates testeten wir die Stromaufnahme unseres Systems mit verschiedenen Prozessorspannungen:


Stromaufnahme bei 1.3, 1.4, 1.5, 1.6 V bei 2.66 GHz

Erstaunlich: Mit 1.5 und 1.6 V verbraucht das System unter Last bereits extrem viel. Da diese Abwärmesteigerung nur vom Prozessor hervorgerufen wird, wird bei 1.5 V also bereits ungefähr 130 Watt abgeführt, bei 1.6 V sind es sogar 170 Watt. Erhöht man die Spannung des Core2 Duo/Extreme, nimmt also die Abwärme extrem zu. Aus diesem Grund sollte die Spannung bei dem Prozessor nur erhöht werden, wenn eine gute Kühlung vorhanden ist.

Wir empfehlen, mit dem Boxed-Kühlkörper die Spannung nicht zu verändern. Mit einem sehr guten Luftkühler, wie einem unserer Testsieger aus dem Heft 05/2006, welches in Kürze im Handel erhältlich ist, lassen sich je nach verwendetem Lüfter bis zu 1.5 V einstellen. 1.5 V oder mehr sollten nur mit einer Wasserkühlung oder einem TEC-Kühler betrieben werden.

Für einen kurzen Test überprüften wir auch mit 1.5V den maximalen Takt mit dem X6800. Hier erreichten wir sehr gute 3650 MHz mit einem Mittelklassekühler:

In unserem Forum sind bereits Berichte zu finden, dass mit einer aufwendigen Wasser- oder Kompressorkühlung auch Taktraten von über 4 GHz möglich sind. Auch uns ist dies gelungen, allerdings nur mit einer Vapochill LS (zu erwerben z.B. bei Watercooling.de):

Intels Vorstoß, in diesem Jahr noch einen 3.2 GHz-Prozessor (wohl Core2 Extreme X6900) bringen zu wollen, scheint also recht einfach möglich. Auf höhere Taktraten von 3.46 GHz werden Standard-CPUs im aktuellen Stepping aber wohl nicht kommen, höchstens durch sehr gute Kühlung und Spannungserhöhung.


Drei neue Chipsätze gibt es von Intel: Den P965, G965 und den Q965. Die erste Änderung ist das neue Namensschema: Statt ein "i" für Intel voranzustellen und dann eine Zahlenfolge folgen zu lassen, findet man nun ein "G", "P" oder "Q" zum Anfang. Q steht für "stability, manageability, graphics" und ist die optimale Plattform für den Businessbereich. "G" beschreibt eine Version mit integrierter Grafik, Video/3D-Support und ist die optimierte Variante für den Consumer. "P" ist wie bislang auch die Version ohne integrierte Grafik.

Zu dem einen neuen Chipsatz in verschiedenen Ausführungen gesellt sich der i975X als bestehender High-End-Chipsatz mit CrossFire-Support, hinzu kommen einige abgespeckte Varianten wie der 946GZ und 946PL, die nur zwei Dimms und DDR2-667 unterstützen und auch mit der neuen ICH8 nicht eingesetzt werden können. Zudem bietet der 946PL nur Support für die noch nicht vorgestellten Core2-Modelle mit 800 MHz FSB. Für den Performance-Fan und Hardwareluxx-Leser sind diese Modelle also wohl weniger interessant.

In der oben stehenden Tabelle sieht man am besten die Features der neuen Chipsätze auf Basis der X965-Plattform. Am interessanstesten sollte für den Consumer der G965 sein, der eine integrierte Grafik aufweisen kann, aber auch mit einer PCIe-Grafikkarte aufgerüstet werden kann. Der P965 ist hingegen für denjenigen, der bereits vorher weiß, dass er nicht auf eine integrierte Grafik zurückgreifen will.

Alle neuen Chipsätze besitzen gemeinsam den Support für FSB1066 und somit alle aktuellen Conroe-Modelle, vier Dimms können eingesetzt werden. DDR2-800-Module können im Dual-Channel-Modus betrieben werden. Weiterhin werden - je nach vorhandensein der integrierten Grafik - unterschiedliche neue Features unterstützt.

Gekoppelt werden die neuen Modelle mit der ICH8-Southbridge:

Wie in der Tabelle zu sehen ist, besitzen die neuen ICH8-Southbridges keinen ATA-Controller mehr: Wenn ein Mainboard also noch die alten Anschlüsse bereitstellen soll, muss der Hersteller entsprechend auf einen externen Controller über PCI oder PCI-Express zurückgreifen. In der Southbridge sind statt dessen nun vier bzw. sechs S-ATA-Anschlüsse zu finden. Die ICH8R-/DO-/DH-Southbridges können zudem wie immer mehrere Festplatten in einem Raid 0,1,5 oder 10 kombinieren. Auch die Matrix Raid Storage Technology ist integriert. Die kleinere ICH8 ist hingegen nicht in der Lage, RAID zu nutzen.

Verbessert hat Intel auch die USB-Ports: Mittels USB Port Disable können z.B. in Business-PCs die USB-Ports komplett deaktiviert werden, womit die Sicherheit steigt, dass Daten vom PC verschwinden oder Viren eingeschleppt werden. Die 10 USB-Ports nutzen nun zwei getrennte Dual-EHCI-Controller.

Auch ein Gigabit-Ethernet-NIC ist enthalten. Dieser wurde bislang über einen externen PCI- oder PCI-Express-Controller von den Mainboardherstellern integriert, nun ist er bereits in der Southbridge vorhanden. Die Gefahr, dass man einen billigen Gigabit-Ethernet-Chip auf dem Mainboard vorfindet, der nur über PCI angebunden ist, ist somit entkräftet, da die Hersteller den praktisch kostenlosen Gigabit-Ethernet-NIC ohne Probleme integrieren können. Auch der HD-Audio-Standard wird natürlich von der Southbridge unterstützt.

Weitere Verbesserungen betreffen wichtige Details: Durch ein Advanced Fan Speed Control ist ein besonders genaues Thermal Monitoring im System möglich. Durch mehrere Messpunkte und diverse direkt steuerbare Fan-Anschlüsse ist es möglich, die Temperatur im Gehäuse auf einem akzeptablen Niveau zu halten, aber dabei die Geräuschkulisse des Systems beachtlich zu senken. Mit der Intel Active Management Technology lassen sich die Business-PCs fernwarten, die Quick Resume Technology sorgt im HTPC für ein schnelles Ausschalten des Bildschirms.

Und NVIDIA und ATI?

Von ATI war im Vorfeld wenig zu hören, aber NVIDIA hat Neues: In Kürze werden wir ein ausführliches Review des neuen nForce 590 SLI für Intel präsentieren können. Das Referenzmainboard liegt uns schon vor, allerdings möchte NVIDIA noch bis zum Launch ein ausgereiftes Bios und ausgereifte Treiber bereitstellen. Lobenswert, denn so gewichtet man ein fertiges, ausgereiftes Produkt stärker, als das eventuelle gleichzeitige, aggressive Launchen mit dem Core2. Der nForce 590 SLI wird ähnliche Funktionen in der Sockel-775-Variante besitzen wie bei der Sockel-AM2-Variante, demnach darf man durchaus gespannt sein auf die Luxus-Mainboards mit diesem Chipsatz. Die NVIDIA-Chipsätze sind die einzigen Modelle für Intel-Prozessoren, mit denen SLI betrieben werden kann - Intels i975X und X965-Chipsätze bleiben weiter aussen vor.

    

"Gar nicht übel" sind die integrierten Grafiken von Intel. Zwar waren bislang damit keine großen 3D-Vergnügen zu schaffen, aber die Qualität ist im 2D-Betrieb sehr gut. Intel hat zudem bei der X3000, der neuen integrierten Grafik, einen Clou: Es ist die erste Grafik mit "Unified Shader" Architektur - sie besitzt also keine Vertex- und Pixelshader mehr, sondern (wie Intel sie nennt) Execution-Units, die sowohl Vertex-, wie auch Pixel- und Geometrieoperationen durchführen können. Intel verwendet hier 8 Execution Units, also weit weniger wie kommende Grafikkarten, dies reicht aber vollkommen aus, denn die integrierte Grafik soll möglichst stromsparend sein.

Interessant wird die Grafik vor allen Dingen durch einen uneingeschränkten Vista-Support. Damit ist man selbst mit einer integrierten Grafik in der Lage, sämtliche DX9c- und Vista-Features wie die Aero-Oberfläche genießen zu können. Zudem kann Intel die Execution-Units auch für Videoplayback und mpeg-Beschleunigung nutzen. Unter Intels Clear Video Technology findet man diverse Features, die zum einen das Videoplayback beschleunigen sollen (z.B. HD Decode, Windows Media Unterstützung, MPEG-2 HW-Beschleunigung), aber auch Funktionen, die die Bildqualität verbessern. Zum einen bietet die GMA X3000 Advanced Deinterlacing-Features, zum anderen hat man aber auch Farbverbesserungsoptionen eingebaut. Letztendlich besitzt Sie Support für HDMI.

Die Features der neuen und alten Grafik in der Gegenüberstellung findet man in der folgenden Tabelle:

Deutlich zu sehen ist also, dass Intel den Business-Chipsatz Q965 auch vom Consumer-Chipsatz G965 abgrenzt. Die Grafik der Consumer-Version ist deutlich leistungfähiger, bei der Business-Version ist die Hardware-T&L-Unterstützung und einige andere Features deaktiviert.


In unserem Leistungsvergleich stehen sich einige Prozessoren gegenüber. Zum einen testen wir die Core-Riege mit dem E6600, E6700 und X6800, zum anderen stellen wir auch ältere Netburst-Prozessoren (Pentium Extreme Edition 965 und Pentium D 960) sowie die Modelle von AMD (FX-60 mit Sockel 939 und FX-62 mit AM2) gegenüber.

Im folgenden sind die Testsysteme aufgelistet:

Alle Plattformen wurden mit aktuellstem Bios ins Rennen geschickt, auch sämtliche anderen Settings wurden optimal vorgenommen. Overclocking-Funktionen im Bios der Mainboards wurden deaktiviert, damit keine Verfälschung der Benchmarks stattfinden kann. Bei den Speichersettings haben wir darauf geachtet, ein optimales Ergebnis zu erzielen, aber kein System zu bevorteilen.

Interessant wird es, in wie weit sich der Core2 Duo von dem Netburst-Vorgänger absetzen kann. In unserem Core2-Testdrive konnten wir schon einen Einblick in die Performance geben. In diesem Artikel konnten jedoch auch einige andere Benchmarks mit zum Vergleich hinzugezogen werden, die beim Core2 Testdrive nicht zur Verfügung standen. So konnten wir nun auch einen Blick auf die Latenz und Bandbreiten werfen und miteinander vergleichen.

Wie oben zu sehen ist, verbessert Intel die Latenzzeiten zum L2- und L1-Cache im Vergleich zur Netburst-Architektur. Im Vergleich zeigt sich folgendes Bild:

Oben: Screenshot Sciencemark Memory-Test des Core2 Extreme X6800
Unten: Screenshot Sciencemark Memory-Test des Pentium Extreme Edition 965

Interessant ist bei diesem Test nur die L1-/L2-Latenz. Hier sieht man gerade im L2-Bereich eine deutlich geringere Latenzzeit bei den Zugriffen gegenüber der Netburst-Architektur. Zudem ist durch DDR2-800 auch die Speicherbandbreite etwas höher. Der Core2 Duo und Core2 Extreme besitzen also einen sehr schnellen L2-Cache.

Interessant ist auch wieder ein Blick auf das Cache-Diagramm:

Klar zu sehen: Intel hat den L1-Cache auf 32 kb für Daten und Instruktionen angehoben (ein Pentium D zeigt hier den starken Einbruch der Bandbreite bei 16 kb). Während der L1-Cache immer aufgrund der direkten Anbindung eine sehr hohe Bandbreite aufweisen kann, ist der L2-Cache im Vergleich schon langsamer. Nach dem Füllen der vollen 4 MB bricht die Performance ein, da im Anschluss die Daten an den Arbeitsspeicher übertragen werden müssen.

Aber: Sehr interesssant ist, dass kein harter Abfall stattfindet, sondern eher eine kleine Kurve zu sehen ist: Die Erklärung könnte im Vorhandensein der guten Prefetcher und Memory Disambiguation zu suchen sein, weshalb eine höhere Bandbreite erreicht wird, als eigentlich zur Verfügung steht. Auch gut zu sehen: Ein Pentium D 960 besitzt zwar zwei Kerne mit je 2 MB L2-Cache, die Bandbreite bricht aber bereits bei 2 MB ein. Ein Zugriff auf den Cache des anderen Kerns ist nur über den Bus - und somit mit langsamer Geschwindigkeit möglich. Beim Core2 Duo können aufgrund der 4 MB L2-Cache als "SmartCache" die vollen 4 MB mit voller Bandbreite genutzt werden.

    

LAME steht stellvertretend für die vielen mp3-Encoding-Programme. Es kann auf mehreren Threads laufen.

Der Core2 Extreme X6800 kann hier erstmals neue Rekordwerte zeigen. Aber selbst der kleine E6600 liegt noch vor einem Athlon 64 FX-62 beim Encoding. Während sich früher AMD- und Intel-Prozessoren also je nach Taktfrequenz an der Spitze ablösten, stehen jetzt die Core-Prozessoren deutlich an der Spitze.

Quicktime verwenden wir stellvertretend für die Video-Encoding-Programme, wobei wir ein Video mit hoher Qualität encodieren:

Auch hier ist der Vorsprung der Core2 Duo/Extreme-Modelle klar und deutlich zu sehen - wiederum liegt der E6600 klar vor dem FX-62.

Cinebench 2003 läuft teilweise perfekt multithreaded. So zeigen sich hier auch wieder neue Rekordwerte:

Traditionell ist AMD im OpenGL Software-L-Bereich sehr stark. Während man aber zuletzt mit dem FX-62 hier Intel in allen Bereichen dieses Lieblingsbenchmarks schlagen konnte, stehen nun wieder die Core2-Duo- und Extreme-Modelle an der Spitze. In drei der vier Benchmarks kann der E6600 auch wieder am FX-62 vorbeiziehen.


Der PC-Mark 2005-CPU-Test lässt die CPU mit diversen Sequenzen auf die Leistungsfähigkeit prüfen.

In dem CPU-Test des PCMark erreichen die Core-Prozessoren neue Rekordwerte. Noch nie sehr gut schnitten hier die AMD-Prozessoren ab, so liegen selbst die Netburst-Modelle über diesen. Fast 1.000 Punkte erreicht der X6800 aber mehr, als der bisherige Top-Prozessor von Intel, der Extreme Edition 965.

ABBYY Fine Reader ist ein Programm, mit welchem eine Schrifterkennung aus Dokumenten ausgeführt werden kann:

Unser PDF-Sample berechnet der Core2 Extreme X6800 in 26 Sekunden - ein 27 seitiges PDF-Dokument ist also in Kürze umgewandelt. Sehr gut schneiden hier im Vergleich auch die Netburst-Modelle ab. Der Pentium EE 965 kann sich mit Hyperthreading ebenso gut positionieren. AMDs Modelle sind im Vergleich zu den Core-Prozessoren nun schon recht weit zurückgefallen.

Ein "Insiderbenchmark" ist SuperPI 1.5 modXS - in unserem Forum wird er gerne für die Rekordjagd verwendet:

Neben den Pentium-M- und Core-Duo-Prozessoren war vor allen Dingen der AMD Athlon 64 beliebt, um sehr schnelle Ergebnisse für die Berechnung von Pi auf eine Million Stellen zu erhalten. Mittlerweile gibt es aber einen klaren Sieger: Durch den 4 MB L2-Cache und die neue Architektur legen die Core2-Modelle richtig zu und erreichen neue Rekordwerte.

7Zip besitzt einen integrierten Benchmark:

Auch in dieser einstigen AMD-Domäne liegen nun die Core2-Modelle in Führung. Klarer neuer Spitzenreiter ist der Core2 Extreme X6800 mit über 4100 MIPS.


Beginnen wir mit dem 3D-Benchmarks - hier steht zunächst Doom 3 auf dem Prüfstand:

Mit recht humanen Einstellungen für die Grafikkarte (1024x768, high) haben wir diesen Benchmark ausgeführt, um die Last auf den Prozessor zu schieben. Bei den kleineren Core2-Prozessoren scheint dies auszureichen, die Ergebnisse der beiden Top-Prozessoren, der E6700 und X6800, liegen aber sehr nahe beieinander. Dies ist ein Zeichen für eine zunehmende GPU-Limitierung in diesem Bereich. Erstaunlich ist, dass selbst der E6600 als "Einsteiger-Conroe" den bisherigen Spitzenreiter FX-62 hinter sich lassen kann.

Bei Far Cry testeten wir drei Level (Training, Research und Volcano):

In allen drei Benchmarks liegen die Core2-Prozessoren klar in Führung. Im Training-Level scheint wieder die GPU limitierend zu wirken, auch in den anderen Benchmarks sind die Performancesteigerungen nur gering, weshalb eine zunehmende GPU-Last wahrscheinlich ist. Klar sichtbar ist hingegen der Unterschied zwischen dem E6600 und dem FX-62 - praktisch schon weit abgeschlagen liegt Intels ehemalige High-End-Generation, die nun deutlich überflügelt wird.

Bei F.E.A.R. testen wir zwei Settings - einmal maximale Details, um auch die Grafikkarte zu fordern, und einmal die minimalsten Settings, jeweils bei 1024x768:

Im ersten Test ist die Überlegenheit der Core-Prozessoren wieder einmal klar: Sie führen mit Abstand, ob mit minimalen, average oder maximalen Frameraten. Im zweiten Test trägt die Grafikkarte die Hauptlast - in diesem Fall sieht man deutlich, dass bei F.E.A.R. bei weitem die GPU die größte Rolle spielt. Verwendet man die Average Frames als Maßstab, liegt der Core2 Extreme X6800 zwar immer noch klar in Führung, aber die Unterschiede sind marginal. Mit einer stärkeren Grafikkarte kann es aber zu Situationen kommen, wo die CPU gefragt ist: Dann ist das Szenario in der ersten Grafik treffender, der Core2 Duo/Extreme legt dann deutlich mehr zu.

    

Splinter Cell Chaos Theory testeten wir mit dem integrierten Benchmark, der seit dem Patch 1.04 enthalten ist.

Splinter Cell belastet die GPU in dem Benchmark sehr stark, deshalb liegen die CPUs näher beieinander. Klar zu sehen ist hingegen, dass die Netburst-Modelle eher etwas zurückhängen, während die Core- und AMD-Modelle etwas schneller sind - trotz GPU-Lastigkeit.

Den beliebten 3DMark 2006 können wir natürlich nicht auslassen:

Zusätzlich zum Standardtest ist auch ein Blick auf die CPU-Score interessant:

Im 3D-Test und im CPU-Test kommt der E6600 praktisch auf die Performance eines FX-62. Der E6700 und der X6800 schlagen den FX-62 klar. Während die Netburst-Modelle hier nicht gegen AMD mithalten konnten, liegen die Core-Modelle nun wieder klar in Führung.

Auch Aquamark 3 besitzt eine getrennte CPU-Score. Zunächst das Gesamtergebnis:

Und das seperate Aquamark 3 CPU-Ergebnis:

Auch hier liegen die Core-Prozessoren klar in Führung. Erstaunlich ist die Gesamtscore: Auf der Cebit 2005 erreichten wir mit einem auf maximalen Takt getrimmten, tiefgekühlten System gerade so 100.000 Punkte. Statt einem übertakteten High-End-System reicht jetzt ein Mainstream-Prozessor (E6600) mit einer Mainstream-Grafikkarte (GeForce 7900 GT), um auf höhere Punktzahlen zu kommen.

        

Intel ist zurück - mit beeindruckender Performance. Nach den Vorberichten zur Core-Architektur waren derartige Ergebnisse schon vorher zu sehen. Der gute Eindruck, den man in unserem Artikel zum Conroe Test Drive bereits bekam, manifestiert sich nun auch im realen Test. Die Core-Architektur besitzt ein gewaltiges Leistungspotential und kann sich in den meisten Benchmarks deutlich absetzen. So schafft es selbst ein E6600 mit nur 2.4 GHz oft, sich gegen das aktuelle Athlon 64 FX-62-Flaggschiff durchzusetzen und sich vor den teuren High-End-Prozessor zu setzen. Intels Core2 Extreme X6800 macht es sogar noch deutlicher: Der schnellste Prozessor am Markt ist aktuell der Core2 Extreme X6800 - mit beeindruckendem Vorsprung.

Daran wird sich auch so schnell nichts ändern. Intel wird im 4. Quartal noch einen drauf setzen und den X6900 mit 3.2 GHz vorstellen. Währenddessen wird vermutet, dass AMD auch noch einen FX-64 mit 3 GHz bringt - auf der bestehenden 90-nm-Technik. Hier muss bereits sehr gut auf Kühlung geachtet werden, damit diese Taktfrequenz erreicht werden kann. Aber selbst mit 3 GHz sollten die AMD-Prozessoren nicht in die Regionen vordringen können, die Intel bereits heute erreicht hat. Mit der 65-nm-Technik wird AMD zumindest gegen den hohen Stromverbrauch etwas unternehmen können und wohl auch die 3 GHz sicher erreichen. Doch mitterweile gibt es auch einige Gerüchte, dass die Nachfolgegeneration K8L sich verspätet. Ist zunächst also wieder alles blau in den nächsten Monaten?

Intel bringt die Core2-Prozessoren zu einem sehr guten Preis auf den Markt. Man könnte munkeln, dass dies nur deshalb passiert, weil der Wettbewerb mit AMD stärker geworden ist. Aber Intel kann sich die günstige Produktion auch erlauben. Die Prozessoren der Core-Architektur sind mit 143 mm² sehr viel kleiner als der Pentium D (280 mm²), deshalb passen mehr Prozessoren auf einen Wafer, die Prozessoren sind so schneller und günstiger zu fertigen. Intel produziert diese ausschließlich auf 300mm-Wafern im 65-nm-Verfahren. Aus diesem Grund wird selbst ein E6300 mit 183 US-Dollar Großhandelspreis äußerst wirtschaftlich hergestellt werden können.

Für unsere Leser, die übertakten, bricht eine neue Ära an: Bislang war die Herausforderung, irgendwie die am Ende beachtliche Abwärme der Athlon-64- und Pentium-D-Prozessoren abzutransportieren und mit Hilfe einer Wasserkühlung oder Luftkühlung aus dem Gehäuse zu bekommen. Übertakten kann man den Core2 Duo bereits ohne große Spannungserhöhungen und benötigt dafür nur eine gute Kühlung. In unseren Tests reichte bereits der Boxed-Kühler für einen Takt von 3.3 bis 3.5 GHz, mit einem sehr guten Modell aus dem Roundup in unserer Hardwareluxx [printed] 05-2006, die zum 19.07. erscheint, wird man sicherlich 3.5 bis 3.7 GHz erreichen können. Wer eine Wasserkühlung bereitstellen kann, darf auch die Spannung erhöhen: Doch hier zeigt sich, dass die filigranen 65-nm-Strukturen eine deutlich höhere Abwärme bei höherer Spannung erzeugen. Gute Kühlung ist hier also lebenswichtig, sonst hält der Core2-Prozessor nicht lange.

In den letzten Monaten berichteten wir in unseren Grafikkarten-Tests oft, dass die neue Karte bei niedrigen Auflösungen leider nicht mehr wirklich ihre Performance auspielen kann, weil der Prozessor zu schwach war. Erstaunlicherweise sieht man bei vielen Benchmarks in unserem Test, dass bei 1024x768 und hohen Details bereits nun wieder eine Limitierung auf Seiten der Grafikkarte vorliegt. Sehr interessant sind deshalb Überlegungen, wie ein Core2-System idealerweise aussehen sollte:

Auf den Markt kommen werden die Prozessoren am 28.07. - ab dann wird es wohl auch einige Modelle im Handel geben, auch wenn mit einer breiten Verfügbarkeit der Core2-Modelle wohl erst im August zu rechnen ist. Sobald die Prozessoren aber im Handel sind, kann es losgehen: Für den Performance-Freak ist wohl mal wieder ein Update fällig. Bei geringem Stromverbrauch bekommt man rekordverdächtige Performance - und das bei den kleineren Modellen auch noch zu einem hervorragenden Preis. Hardwareluxx zückt deshalb seit langen einmal wieder einen Excellent Hardware Award für einen Prozessor:

Weitere Links:

Am Ende ein paar Worte in eigener Sache:

Das Launch-Datum und der Zeitpunkt der Verfügbarkeit für die Core2-Duo- und Exteme-Prozessoren ist der 28. Juli. Ursprünglich hatte Intel vor, bis zu diesem Tag ein NDA (Non-Discolsure-Agreement) laufen zu lassen, um eine Berichterstattung über Performancedaten der Prozessoren den Medien zu untersagen. Einige Printmedien haben sich an dieses Datum entweder nicht gehalten oder geschickt das Eingehen eines NDAs umgangen (z.B. durch Fernbleiben bei offiziellen Veranstaltungen und durch den Kauf von "Evaluation-Samples" bei Ebay).

Wir standen für diese Performancedaten unter NDA und haben uns daran gehalten: Auch wenn unser Erscheinungsdatum mit dem 19.07. deutlich "näher" an dem Launchdatum lag, als bei einigen anderen Heften, beschränkten wir unsere Berichterstattung auf das Erlaubte. Erst im Nachhinein wurde leider das NDA vorgezogen und auf den heutigen 14. Juli gelegt. Wir hätten Ihnen bei rechtzeitiger Kenntnis des neuen Termins einen ausführlichen Testbericht auch legal im Heft bieten können - leider kam die Nachricht aber zu spät. Somit folgt ein ausführlicher Test heute auf der Webseite - umso besser, für Sie kostenlos und für uns "legal", weil ohne NDA-Verstoß oder sonstigen Verwirrungen.