Seite 2: Der Prozessor im Detail

Intels Tick-Tock-Strategie dürfte hinlänglich bekannt sein und Sandy Bridge-E ist die Auskoppelung aus der neuen Mikroarchitektur der Sandy-Bridge-Architektur in zweiter Generation und damit der Nachfolger der Gulftown-Prozessoren auf Basis der Westmere-Architektur. Im kommenden Frühjahr wird Intel dann auf den 22-nm-Fertigungsprozess wechseln. Entsprechend wird es zu Ivy Bridge zwei Serien geben: Einmal die Desktop- und Notebook-Variante auf Basis des Sockels 1155 und wohl auch im nächsten Jahr eine Variante für den professionellen Bereich (Ivy-Bridge-E).

Generell lässt sich der Sandy Bridge-E mit dem Sockel 2011 eher mit Intels Server-Plattform vergleichen - wie bei den älteren Sockel-1366-Modellen besteht zwischen den Prozessoren für den Servereinsatz und für den High-End-Desktop-Markt kaum ein Unterschied. Nur die Anzahl der QPI-Links und die Validierung für den Multiprozessorbetrieb sind hier zu nennen. Also kann man auch die Ausrichtung der Desktop-Variante erkennen: Aufgrund des schnellen Speicherinterfaces, des teuren Chipsatzes und der gebotenen Cache-Größen ist der Core i7-3960X eher etwas für professionelle Anwendungen und Enthusiasten.

Durch das Architektur-Update bekommt die High-End-Plattformen nun auch einige Features der Sandy-Bridge-Architektur, die wir schon ausführlich zur Einführung der Sandy-Bridge-Prozessoren vorgestellt haben. Im Endeffekt deckt sich die Technik aufgrund der identischen Architektur mit der der Sockel-1155-Prozessoren.

Intels Turbo Boost 2.0

Mit der Power Control Unit, die Intel mit dem ersten Core i7 eingeführt hat, führte Intel eine intelligente Lösung ein, den Takt des Prozessors je nach Anwendung zu variieren. Braucht man Single-Core-Performance, dann lässt sich der Takt weit anheben, bei Multi-Core-Performance immerhin noch um einen Speed-Bin. Und wenn die CPU idle ist, schalten sich die meisten Teile ganz ab. Diese Prinzipien hat Intel auch bei der neuen Sandy-Bridge-Generation beibehalten und ausgebaut.

sbe-pres-3-rs

Die Logik hinter Intels Turbo Boost ist einfach zu erklären: Werden bei einem Prozessor nicht alle Bereiche genutzt, reicht die Kühlung und die Auslegung der Stromzufuhr dafür, die genutzten Einheiten etwas schneller zu takten. Diese dürfen dann mehr Strom aufnehmen und etwas heißer werden, ohne die Funktion des Prozessors zu beeinträchtigen. Der Lohn der Arbeit: Berechnungen können schneller abgeschlossen werden.

Wichtig wurde dieses Prinzip erst mit Mehrkern-Prozessoren, da viele Anwendungen weiterhin nur auf einem einzelnen Kern laufen oder nicht gleichzeitig alle Kerne voll auslasten. Dann ist es möglich, die Effizienz des Prozessors mit Turbo Boost zu erhöhen.

Bei Intels bisheriger Turbo-Boost-Lösung in der Westmere-Architektur konnte auch bei der Nutzung aller Kerne der Takt um einen Speed-Bin gesteigert werden. Ein Speed-Bin entspricht im Endeffekt einem Multiplikatorschritt: Taktet der Prozessor im Standardbetrieb mit x34 als Multiplikator, darf er im Turbo-Betrieb mit x35 betrieben werden. Auch für den Betrieb mit einer kleineren als der maximalen Kernanzahl setzte Intel entsprechende Vorgaben um – so können die Kerne dann teilweise gleich mehrere Speed-Bins schneller arbeiten.

Mit Sandy Bridge hat Intel sich zu dem üblichen Turbo-Betrieb eine Art Boost 2.0 ausgedacht, eine Art thermisches Budget wird zugrunde gelegt. Die Idee dahinter kennt jeder von dem CPU-Kühler im eigenen PC: Nach dem Anschalten des PCs ist das Metall noch kalt, erst nach minutenlangen Berechnungen erwärmt es sich auf eine gleichmäßige Temperatur. Diese Trägheit bei der Kühlung macht sich Intel bei den sogenannten „Dynamic Range Turbo Frequency Limits" zu nutzen.

sbe-turbo2

Intel erlaubt es bei Turbo Boost 2.0, nicht nur den einen Speed Bin schneller zu arbeiten, der in der Spezifikation hinterlegt ist, sondern je nach Energiebudget und CPU-Temperatur auch eine noch höhere Taktung. Diese geht somit über die eigentliche TDP des Prozessors hinaus – aber nur so lange, wie die Power Control Unit aufgrund der Umgebungsvariablen dies zulässt. Ist das thermische Budget aufgebraucht, also der Kühler wärmer geworden, schaltet Intel zurück in den normalen Turbo-Betrieb. Mit diesem Dynamic-Range-Modus kann Intel die CPU noch weitere Speed-Bins höher takten. Entsprechend läuft dann ein Core i7-3960X beispielsweise statt mit 3,3 GHz mit 3,6 GHz bei Volllast auf allen sechs Kernen. Mit Last auf bis zu zwei Kernen läuft der Prozessor dann sogar mit 3,9 GHz.

 

Die Caches und der Die-Aufbau

Die Zahlen sprechen für sich: 15 MB shared L3-Cache sind extrem viel, aber bereits Intels Core i7-980X hatte 12 MB L3-Cache. Insofern ist nominell nicht viel hinzu gekommen - aber die Architektur des Caches hat sich geändert. Zum Einsatz kommt hier auch wieder der Ring-Bus der Sandy-Bridge-Architektur, allerdings ohne entsprechenden Grafik-Kern. Die Größen für den L1- und L2-Cache sind identisch geblieben - weiterhin spendiert Intel den Kernen je 32 kB für Daten und Instruktionen sowie 256 kb L2-Cache (unified, 8-fach assozialtiv, low latency). Der L3-Cache ist auch weiterhin ein "Inklusive-Cache", besitzt also die Daten des L2- und L1-Caches, um in Idle-Zyklen die Kerne nicht aufwecken zu müssen, um an deren Daten heranzukommen.

corei7_3960x-die-rs

Die Die-Fläche eines Core i7-3960X misst 20,8 x 20,9 mm (434,7 mm²) und beherbergt 2,27 Milliarden Transistoren. Vergleicht man dies mit dem Vorgänger, der auf 1,17 Milliarden Transistoren und eine Chipfläche von 248 mm² kommt, hat Intel hier also deutlich zugelegt. Einen besonders großen Teil nimmt hier natürlich der 15 MB große L3-Cache ein. Aber auch der Speicher-Controller und die I/O-Komponenten benötigen Platz. Dagegen sind die sechs CPU-Kerne schon fast die kleinsten Module des Die.

3960X-normal

Die bereits auf Seite zwei besprochenen technischen Daten des Core i7-3960X in einem CPU-Z-Screenshot bei einem Turbo-Takt aller Kerne von 3,6 GHz. Ohne Turbo wären es 3,3 GHz.

3960X-cool3960X-turbo

Im Idle-Betrieb taktet der i7-3960X auf 1,8 GHz herunter und senkt auch die Spannung ab (links). CPU-Z liest diese nicht korrekt aus und zeigt sogar eine höhere Spannung im Vergleich zum Turbo-Betrieb. Werden nur bis zu zwei Kerne belastet, können diese auch mit 3,9 GHz arbeiten (rechts).