Seite 3: Die Haswell-Architektur - die GT3-Grafik

Intels Ziel ist es mit einer integrierten Grafik kleinere Grafiklösungen obsolet zu machen - das man mit einer GTX 780 oder ähnlichen Transistoren-Monstern nicht mithalten kann, ist Intel selber auch bewusst. Aber man möchte für kleinere Systeme, Ultrabooks oder günstige PC-Systeme die Möglichkeit schaffen, eine gute Grafik zu realisieren, um Videos zu schauen, Spiele zu spielen oder mehrere Displays anzusteuern. In den vergangenen Jahren hat man deshalb die Grafik stetig überarbeitet - und mittlerweile ein wirklich gutes Niveau erreicht.

Haswell-Grafik: GT3-Verbesserungen

Die Grafik von Intels Haswell-Modellen wird es in insgesamt vier Ausbaustufen geben: Für den Notebook-Bereich und den i7-4770R ist die "GT3"- und "GT3e"-Variante vorgesehen. Diese beiden Varianten unterscheiden sich durch einen Embedded-DRAM, den Intel mit auf die CPU setzt. Mit Embedded DRAM tauft Intel die Grafikversion Iris Pro 5200. Kommt nur die schnellere Variante zum Einsatz, aber ohne Extra-Speicher, nennt Intel das Paket Iris 5100 oder bei stromsparenden Modellen, wo ein paar Execution Units weniger zum Einsatz kommen, HD Graphics 5000.

Im Desktop-Bereich wird hingegen nur die GT2 eingesetzt. Diese besitzt weniger Execution Units und kommt auch immer ohne Embedded DRAM. Intel vermarktet diese Lösung unter HD Graphics 4600, 4400 und 4200. Auch eine abgespeckte GT1-Variante wird es für günstige Prozessoren geben:

Namensgebung der Intel-Grafik
GrafiklösungPC ClientsWorkstation/Server
GT3e Intel Iris Pro 5200 -
GT3 (28W) Intel Iris 5100 -
GT3 (15W) Intel HD Graphics 5000 -
GT2 Intel HD Graphics
4600, 4400, 4200
Intel HD Graphics
P4700, P4600
GT1 Intel HD Graphics -

Die Technischen Features der neuen Intel-Grafik haben wir in der folgenden Tabelle zusammengestellt. Intels HD Graphics 4000 und 2500 kommt dabei in Ivy-Bridge-Modellen zum Einsatz, die HD Graphics 3000/2000 in älteren Sandy-Bridge-Modellen. Intels HD Graphics 5x00 haben wir mit aufgelistet, auch wenn diese nur im Notebook-Bereich zu finden sein werden:

Vergleich Prozessor-Grafik
GrafikkernIntel HD Graphics 5000
(GT3, für Desktop nur i7-4770R)
Intel HD Graphics 4600
(GT2)
Intel HD Graphics 4000Intel HD Graphics 2500Intel HD Graphics 3000/2000
Unified Shader ja ja ja ja ja
Anzahl Execution Units 40 20 16 6 12/6
Media Processing
(Quick Sync/Clear Video)
ja, neue Video Quality Engine ja, neue Video Quality Engine ja, verbessert ja, verbessert ja
OS Optimierungen für Windows 7 und 8 für Windows 7 und 8 für Windows 7 und 8 für Windows 7 und 8 für Windows 7, Vista, XP
Frequenz maximal 1300 MHz maximal 1250 MHz maximal 1350 MHz
(aktuell: 1150 MHz)
maximal 1350 MHz maximal 1350 MHz
DirectX-Support in Hardware DX11.1  DX11.1 DX11 DX11 DX10.1
OpenCL 1.1 OpenCL 1.2 OpenCL 1.2  CPU/GPU CPU/GPU nur CPU
OpenGL Support OpenGL 4.0 OpenGL 4.0  OpenGL 3.1 OpenGL 3.1 OpenGL 3.0
Shader Model SM 4.1 SM 4.1
Dynamic Frequency Scaling ja ja ja ja ja
Maximale Auflösung 3840x2160 (DP) 3840x2160 (DP) 2560x1600 2560x1600 2560x1600
HDMI-Support 1.4 mit 3D 1.4 mit 3D 1.4 mit 3D 1.4 mit 3D 1.4 mit 3D
Anzahl Displays 3 (siehe unten) 3 (siehe unten) 3 3 2
Intel WiDi 4.1 4.1 3.0 3.0 2.1

Technisch hat Intel zunächst einmal die Features aufgebohrt: DirectX11.1 wird unterstützt, ebenso OpenCL 1.2 in Hardware (z.B. für Filter in Adobe Premiere Pro) und OpenGL 4.0. Zudem hat Intel die Bandbreite der Display Ports deutlich erhöht, sodass höhere Auflösungen möglich sind und bis zu drei Screens als Collage Display angeschlossen werden können. Die Möglichkeiten, welche Displays hier eingesetzt werden können, haben wir unten aufgelistet. Schaltet man auf 24 Hz, ist es sogar möglich 4Kx2K-Videos auf einem passenden Display auszugeben.

Durch die größere Anzahl an Ausführungseinheiten ergeben sich zudem Verbesserungen an den üblichen Video-Funktionen: Intels Quick Sync Video Technology ist schneller, das De- und Encoding funktioniert also zügiger. Als zusätzlicher Teil der Quick Sync Video Technology ist jetzt eine Video Quality Engine hinzu gekommen, die z.B. Videos entwackelt und Farbtöne korrigieren kann. Zudem hat Intel auch ein schnelleres JPEG & MPEG Decoding integriert (z.B. für Webcams).

Um die Ausführungseinheiten auch schneller mit Daten versorgen zu können, hat Intel auch die Architektur ein wenig aufgemöbelt: Die Fixed-Function-Einheiten in der 3D-Pipeline wurden verdoppelt, die Befehlsgeber haben einen Resource Streamer zur Seite gestellt bekommen - dadurch rendern die 3D-Szenen schneller.

Die Struktur der neuen Grafik ist in der folgenden Folie gut sichtbar. Intel nutzt denselben Aufbau für GT2/GT1 und GT3, bei der GT3 kommen nur eine höhere Anzahl an Ausführungseinheiten und somit auch größere Caches und Puffer zum Einsatz. Über die Größe des On-Chip-Caches schweigt man aber weiterhin.

Intel IDF 2013
Auf dem Intel IDF im April 2013 in Peking zeigte Intel den Aufbau der GT1/2/3-GPUs.

Embedded DRAM auf der CPU

Dieser Punkt ist natürlich spannend - aber im Desktop-Bereich eigentlich unwichtig, da Intel noch keine Prozessoren im Sockel 1150 verkauft, die Embedded DRAM haben. Für die GT3e-Modelle ist diese Technik vorgesehen, auch wenn sie nicht nur im Notebook-Bereich einen Geschwindigkeitsvorteil bringt, sondern auch im Desktop-Bereich interessant wäre.

Intel integriert bei den Top-Modellen Iris Pro insgesamt 128 MB Zwischenspeicher auf dem Prozessor-Kern, der im Endeffekt als Level-4-Cache fungiert. Auf ihn können nicht nur die Execution Units der Grafik zurückgreifen, sondern auch die Kerne selber. Da er mit 512 bit angebunden ist, ist der Speicher extrem schnell, was gerade Spielen zu einer beachtlichen Leistung verhilft, weil die Daten nicht in den sehr viel langsameren Arbeitsspeicher geschrieben werden müssen. Der Nachteil an einer solchen Lösung ist aber der hohe Preis und die zusätzlich entstehende Abwärme, weshalb Intel die Desktop-Modelle wohl nicht mit dieser Technik ausstatten wird.

Intel setzt den EDRAM direkt neben die Haswell-CPU mit auf den Chip. Man verwendet hier also ein Multichip-Package, wie man es bereits früher mit den ersten Dual-Core-Prozessoren oder der ersten Integration der Northbridge in die CPU vorgenommen hat. 

Display-Anschlussmöglichkeiten

Intel bewirbt Haswell mit der Fähigkeit, mehrere Monitore in einem Collage-Modus zusammen betreiben zu können. Effektiv kann man - je nach Anschlüssen auf dem Mainboard - bis zu drei Monitore verwenden. Dabei ist es sogar möglich, 4Kx2K-Auflösung zu fahren. Da die Anschlussmöglichkeiten maßgeblich von den zur Verfügung gestellten Ports abhängt, haben wir die Varianten, die Intel untertützt, in der folgenden Tabelle zusammengefasst:

Anschlussmöglichkeiten und Display-Auflösungen
Display 1Display 2Display 3Maximale Auflösung
Display 1
Maximale Auflösung
Display 2
Maximale Auflösung
Display 3
HDMI HDMI DP 4096x2304 @ 24 Hz
2560x1600 @ 60 Hz
3840x2160 @ 60 Hz
DVI DVI DP 1920x1200 @ 60 Hz 3840x2160 @ 60 Hz
DP DP DP 3840x2160 @ 60 Hz
VGA DP HDMI 1920x1200 @ 60 Hz 3840x2160 @ 60 Hz 4096x2304 @ 24 Hz
2560x1600 @ 60 Hz
eDP DP HDMI 3840x2160 @ 60 Hz 3840x2160 @ 60 Hz 4096x2304 @ 24 Hz
2560x1600 @ 60 Hz
eDP DP DP 3840x2160 @ 60 Hz 3840x2160 @ 60 Hz
eDP HDMI HDMI 3840x2160 @ 60 Hz 4096x2304 @ 24 Hz
2560x1600 @ 60 Hz

Maximal kann ein Mainboard dabei folgende Anschlüsse bieten:

  • maximal zwei HDMI
  • maximal zwei DVI
  • maximal einen HDMI und einen DVI
  • bis zu drei Display Port
  • einen VGA
  • einen eDP

Durch die Verwendung des neuen Display-Port-1.2-Standards ist es auch möglich, DP-Monitore per Daisy-Chaining anzubinden. Intel bietet hier die doppelte Bandbreite (im Vergleich zu DP1.1). Durch die Möglichkeit, drei Displays anzuschließen, wird für viele User die Notwendigkeit entfallen, auf eine dedizierte Grafiklösung zu setzen, wenn die Leistung derselben nicht benötigt wird. Die Flexibilität von Intels Onboard-Grafik ist hier vollkommen ausreichend - selbst für 4K2K oder ähnliches.

Interessant ist auch, dass Intel es erlaubt, eine Onboard-Grafik gleichzeitig mit der dedizierten Grafik in einem PCIe-x16-Slot zu betreiben. Dann kann der Anwender zwei Monitore an der PCIe-Lösung anschließen und bis zu zwei weitere an der Onboard-Grafik. Nur ein Drag-und-Drop ist zwischen den Monitoren verschiedener Grafiklösungen dann nicht möglich.

Displays können zudem auch per WiDi 4.1 angeschlossen werden, wenn das Mainboard die Option mitbringt.