Seite 1: Intels stärkster NUC: Hades Canyon im Test

intel-hades-canyonMit den Core-Prozessoren mit Radeon-RX-Vega-M-Grafik wurde Anfang des Jahres die erste Zusammenarbeit zwischen den beiden Kontrahenten vorgestellt. AMD hielt sich etwas zurück, schließlich ist es ein Produkt auf dem Intel als Hersteller genannt wird. Wohl aufgrund fehlender eigener Alternative bestellte Intel ein sogenanntes Custom-Silicon bei AMD. Ob nun auf Basis der Polaris- oder Vega-Architektur klären wir später noch. Was der kleine NUC leistet, schauen wir uns nun aber genauer an.

Die Motivation hinter der Entwicklung der Core-Prozessoren mit einer Grafikeinheit in Form der Radeon RX Vega M dürfte klar sein: Intel benötigt für einige Produktkategorien deutlich mehr Grafikleistung, als es die eigenen integrierten Lösungen derzeit bieten können. Bereits vor 2-3 Jahren dürfte die Entwicklung unter dem Codenamen Kaby Lake-G begonnen worden sein. Ob Raja Koduri als Neuzugang dazu führen wird, dass Intel auf eine solche Zusammenarbeit zukünftig nicht mehr angewiesen ist, wird sich noch zeigen müssen.

Mit den Core-Prozessoren mit Radeon RX Vega M geht Intel in vielerlei Weise einen neuen Weg. Die vor wenigen Monaten vorgestellten vier Modelle sollen nur die ersten sein, weitere werden folgen. Die Kombination aus Core-Prozessor der 8. Generation auf Basis von Kaby Lake, 4 GB an HBM2 und der Radeon RX Vega M Graphics im Notebook-Segment ist ein Novum. Für den Desktop startete AMD in diesem Sommer mit der Radeon RX Vega 56 und 64. Zudem verwenden die Core-Prozessoren als erstes Endkundenprodukt eine Technik zur Anbindung von Chips in einem Package namens Embedded Multi-Die Interconnect Bridge (EMIB).

Das CPU-Package der Core-Prozessoren mit Radeon-RX-Vega-M-Grafik besteht aus drei Chips, die darin untergebracht sind. Vorhanden sind ein HBM2-Speicherstack mit einer Kapazität von 4 GB, die Radeon RX Vega M Graphics und der Intel-Core-Prozessor der 8. Generation. Mittels EMIB verbunden sind aber nur der HBM2-Speicherstack und die AMD-GPU. EMIB ist kein Interface oder ein Protokoll, sondern lediglich eine Technik für die elektrische Verbindung von Chips. AMD wird zusammen mit TSMC eine ähnliche Technik verwenden, um seine GPU mit den HBM-Speicherstacks auf dem Interposer für die Grafikkarte zu verbinden. Gleiches gilt natürlich auch für NVIDIA.

Aufgrund der Integration der GPU in das CPU-Package unter Verwendung von EMIB will Intel den Footprint der Chips um 50 % reduzieren können. Die Höhe des Chip-Packages soll bei 1,7 mm liegen, was extrem flache Notebooks möglich machen soll.

EMIB ist eine von Intel entwickelte Fertigungstechnologie, welche den Aufbau verschiedener Dies auf einem Trägersubstrat ermöglicht. Dieses sogenannte 2,5D-Design kann die verschiedensten Dies untereinander verbinden und stellt dank Through Silicon Vias (TSVs) einen schnellen Interconnect her. Nebenbei erhöht sich natürlich die Packdichte für die einzelnen Komponenten, was den Platzbedarf auf dem PCB verringert und hier für mehr Flexibilität sorgt.

Ähnliche Argumente gibt es bereits im Zusammenspiel mit High Bandwidth Memory, der ebenfalls direkt mit dem Prozessor auf einem Interposer untergebracht wird und mittels Through Silicon Vias (TSVs) verbunden wird. Der schnelle Speicher setzt einen ebenso schnellen Interconnect voraus – dies gilt auch bei den Intel-Core-H-Prozessoren. Mit der EMIB-Technologie lassen sich Dies mit unterschiedlichen Fertigungsgrößen gemeinsam unterbringen. So wäre es möglich, den CPU-Part in 10 nm zu fertigen, die GPU aber kommt weiterhin in 14 oder 12 nm von Globalfoundries. Zudem reduziert die Technik im Vergleich zum Silicon-Interposer deutlich die Kosten. Weitere Details zu EMIB hat Intel auf dem letzten Meeting der Technology and Manufacturing Group verraten.

Als Anbindung zwischen der GPU und der CPU verwendet Intel acht PCI-Express-Lanes. Diese bieten eine Bandbreite von 7,88 GB/s. Mit einer Einschränkung der Leistung ist aufgrund dieser Anbindung nicht zu rechnen. Allerdings werden bei den meisten Kombinationen aus Intel-Prozessor und diskreter GPU in Gaming-Notebooks die vollen 16 Lanes verwendet. Allerdings nutzt Intel für die Core-Prozessoren mit Radeon RX Vega M offenbar den Kaby-Lake-Refresh und diese bieten eben nur 12 Lanes für eine Anbindung weiterer Komponenten an. Acht werden hier also für die GPU verwendet, bleiben also nur noch vier für die SSD, Thunderbolt-Controller etc. übrig. Allerdings spricht Intel auch davon, dass die acht PCI-Express-Lanes ausreichend sind.

Radeon RX Vega M Graphics basiert auf Polaris

Bereits kurz nach dem Erscheinen der Hades Canyon NUCs begann die Diskussion darum, ob die verbaute GPU nun auf der Vega-Architektur, wie Intel und AMD dies auch vermarkten, oder auf der Polaris-Architektur basiert. Die ersten Zweifel kamen aufgrund der Tatsache auf, dass AIDA64 die GPU des Intel Core i7-8809G als Polaris 22 erkennt. Ein weiterer Test mit DXDIAG, ein Diagnoseprogramm, um die DirectX-Funktionalität zu testen, zeigt Ergebnisse, die obige These unterstützen. So unterstützt die Vega-Architektur das DirectX-Featureset 12_1, während die Polaris-Architektur nur 12_0 unterstützt. Für die Raven-Ridge-APUs mit Vega-Architektur zeigt DXDIAG die Unterstützung von 12_1 an, für den Intel Core i7-8809G wiederum nur 12_0.

Wir haben den verbauten Core i7-8809G mittels Direct3D 12 Feature Checker ausgelesen und zusammen mit den Commits zu AMD's Linux-Treiber ergibt sich klar, dass die hier verwendete GPU auf dem gfx8-Branch (Polaris, Tonga und Fiji) basiert, während Vega unter gfx9 läuft.

Hier die ausgelesenen Daten zum Core i7-8809G:

Windows 10 version 1803 (build 17101.1000) x64

ADAPTER 0
"AMD Radeon R9 200 Series"
VEN_1002, DEV_67B0, SUBSYS_30801462, REV_00
Dedicated video memory : 4072.4 MB (4270227456 bytes)
Total video memory : 12207.5 MB (12800466944 bytes)
Video driver version : 23.20.15017.4003
Maximum feature level : D3D_FEATURE_LEVEL_12_0 (0xc000)
DoublePrecisionFloatShaderOps : 1
OutputMergerLogicOp : 1
MinPrecisionSupport : D3D12_SHADER_MIN_PRECISION_SUPPORT_NONE (0) (0b0000'0000)
TiledResourcesTier : D3D12_TILED_RESOURCES_TIER_2 (2)
ResourceBindingTier : D3D12_RESOURCE_BINDING_TIER_3 (3)
PSSpecifiedStencilRefSupported : 1
TypedUAVLoadAdditionalFormats : 1
ROVsSupported : 0
ConservativeRasterizationTier : D3D12_CONSERVATIVE_RASTERIZATION_TIER_NOT_SUPPORTED (0)
StandardSwizzle64KBSupported : 0
CrossNodeSharingTier : D3D12_CROSS_NODE_SHARING_TIER_NOT_SUPPORTED (0)
CrossAdapterRowMajorTextureSupported : 0
VPAndRTArrayIndexFromAnyShaderFeedingRasterizerSupportedWithoutGSEmulation : 1
ResourceHeapTier : D3D12_RESOURCE_HEAP_TIER_2 (2)
MaxGPUVirtualAddressBitsPerResource : 40
MaxGPUVirtualAddressBitsPerProcess : 40
Adapter Node 0: TileBasedRenderer: 0, UMA: 0, CacheCoherentUMA: 0, IsolatedMMU: 1, HeapSerializationTier: 0
HighestShaderModel : D3D12_SHADER_MODEL_5_1 (0x0051)
WaveOps : 0
WaveLaneCountMin : 64
WaveLaneCountMax : 64
TotalLaneCount : 2816
ExpandedComputeResourceStates : 1
Int64ShaderOps : 0
RootSignature.HighestVersion : D3D_ROOT_SIGNATURE_VERSION_1_1 (2)
DepthBoundsTestSupported : 1
ProgrammableSamplePositionsTier : D3D12_PROGRAMMABLE_SAMPLE_POSITIONS_TIER_2 (2)
ShaderCache.SupportFlags : D3D12_SHADER_CACHE_SUPPORT_SINGLE_PSO | LIBRARY | AUTOMATIC_INPROC_CACHE | AUTOMATIC_DISK_CACHE (15) (0b0000'1111)
CopyQueueTimestampQueriesSupported : 1
CastingFullyTypedFormatSupported : 1
WriteBufferImmediateSupportFlags : D3D12_COMMAND_LIST_SUPPORT_FLAG_DIRECT | BUNDLE | COMPUTE | COPY (15) (0b0000'1111)
ViewInstancingTier : D3D12_VIEW_INSTANCING_TIER_NOT_SUPPORTED (0)
BarycentricsSupported : 0
ExistingHeaps.Supported : 1
ReservedBufferPlacementSupported : 0
SharedResourceCompatibilityTier :  D3D12_SHARED_RESOURCE_COMPATIBILITY_TIER_0 (0)
Native16BitShaderOpsSupported : 0
AtomicShaderInstructions : 0

Am Ende ist klar, dass es sich bei der Radeon RX Vega M Graphics um eine Art Hybrid-Lösung handelt, was bei solchem Custom Silicon nicht ganz unüblich ist. Am Ende spielt aber so oder so nur die Leistung die wichtige Rolle – egal auf Basis welcher Architektur dies erreicht wird.

Dynamic Power Sharing - 100 W lassen sich dynamisch zuweisen

Die nun vorgestellten fünf Modelle der Core-Prozessoren mit Radeon-RX-Vega-M-Grafik bieten eine Thermal Design Power von 65 und 100 W. Dies ist das komplette Power-Budget für CPU und GPU. Typischerweise optimieren die OEMs die Kombination aus CPU und diskreter GPU auf einen System Design Point (SDP) hin. Gaming-Notebooks legen das Gewicht auf die GPU-Leistung, andere Klassen eher auf den Prozessor. Innerhalb der jeweiligen Komponenten können diese mit eigenen Stromspar- und Boost-Mechanismen arbeiten. Dies tut Intel bereits bei den eigenen Prozessoren mit integrierter Grafik, denn auch hier wird die TDP im gewissen Rahmen zwischen der CPU und der HD Graphics zugeteilt. Priorität bekommt dabei meist die integrierte Grafik.

Die Core-Prozessoren mit Radeon RX Vega M bieten nun ein Dynamic Power Sharing, welches Intel Dynamic Tuning nennt. Je nach Anforderung an die CPU und die GPU wird das Power-Budget dynamisch angepasst. Über die jeweiligen Parameter soll der Nutzer auch eine gewisse Kontrolle bekommen. Ein Overclocking soll bis zu einem gewissen Rahmen möglich sein.

Das Dynamic Tuning soll Intel in die Lage versetzen, mit einem 45-W-Design eine höhere Leistung zu bieten als ein 62,5-W-Design mit ausgeschaltetem Dynamic Tuning. Benchmarks der neuen Core-Prozessoren mit Radeon RX Vega M werden aber wohl erst die Frage beantworten können, in welchem Bereich der Leistung wir uns hier bewegen.

8th Gen Intel Core mit Radeon RX Vega M Graphics

Kommen wir nun zu den vorgestellten fünf Modellen der neuen Serie:

Gegenüberstellung Core-Prozessoren mit Radeon RX Vega M Grafik
Modell Core i7-8809G Core i7-8709G Core i7-8706G Core i7-8705G Core i5-8305G
Kerne / Threads 4 / 8 4 / 8 4 / 8 4 / 8 4 / 8
Basis-Takt 3,1 GHz 3,1 GHz 3,1 GHz 3,1 GHz 2,8 GHz
Boost-Takt 4,2 GHz 4,1 GHz 4,1 GHz 4,1 GHz 3,8 GHz
L3-Cache 8 MB 8 MB 8 MB 8 MB 6 MB
Speicherunterstützung DDR4-2400 DDR4-2400 DDR4-2400 DDR4-2400 DDR4-2400
Speicherkanäle Dual-Channel Dual-Channel Dual-Channel Dual-Channel Dual-Channel
diskrete Grafikeinheit Radeon RX Vega M GH Radeon RX Vega M GH Radeon RX Vega M GL Radeon RX Vega M GL Radeon RX Vega M GL
GPU-Takt bis zu 1.100 MHz bis zu 1.100 MHz bis zu 1.100 MHz bis zu 1.100 MHz bis zu 1.100 MHz
integrierte Grafikeinheit 630 630 630 630 630
CPU- und Speicher-OC Ja Ja Ja Ja Nein
Vega-GPU- und HBM-OC Ja Nein Nein Nein Nein

Allesamt bieten diese vier Kerne und können bis zu acht Threads verarbeiten. Vier der fünf Modelle laufen in der Core-i7-Reihen, das kleinste Modell als Core i5. Der Basis-Takt liegt ja nach Modell bei 2,8  bis 3,1 GHz. Im Boost können einzelne Kerne bis zu 4,2 GHz erreichen. Ebenfalls für vier der fünf Modelle gleich ist der 8 MB große L3-Cache. Der Core i5-8305G bietet nur 6 MB.

Aufgrund der Kaby-Lake-Refresh-Basis bieten alle Prozessoren die Unterstützung für DDR4-2400 im Dual-Channel-Modus. Allesamt verfügen die Prozessoren natürlich auch über die Intel HD Graphics 630.

Unterschiede gibt es bei der Radeon RX Vega M. Der Core i7-8809G und Core i7-8709G verwenden die Variante Radeon RX Vega M GH, während beim Core i7-8706G, Core i7-8705G und Core i5-8305G die Radeon RX Vega M GL zum Einsatz kommt. Auf die Unterschiede geben wir in der nachfolgenden Tabelle genauer ein.

Nur der Core i7-8809G wird als Unlocked geführt. Hier ist eine Übertaktung der CPU, GPU und des HBM2 möglich. Bei den übrigen Modellen können nur CPU und Speicher übertaktet werden.

Gegenüberstellung der Radeon RX Vega M Grafikeinheiten
Modell Radeon RX Vega M GH Graphics Radeon RX Vega M GL Graphics
GPU Vega Vega
Fertigung 14 nm 14 nm
Compute Units 24 20
Shadereinheiten 1.536 1.280
Textureinheiten 96 80
Basis-Takt 1.063 MHz 931 MHz
Boost-Takt 1.190 MHz 1.011 MHz
Speicherausbau 4 GB HBM2 4 GB HBM2
Speicherinterface 1.024 Bit 1.024 Bit
Speichertakt 800 MHz 700 MHz
Speicherbandbreite 204,8 GB/s 179,2 GB/s
ROPs 64 Pixel/Takt 32 Pixel/Takt
SP-Leistung 3,7 TFLOPS 2,6 TFLOPS

Obige Tabelle zeigt die Unterschiede zwischen der Radeon RX Vega M GH und Radeon RX Vega M GL auf. Bei der GH-Variante kommt die Vega-GPU mit 24 Compute Units bzw. 1.536 Shadereinheiten daher. Der Basis-Takt beläuft sich auf 1.063 MHz und per Boost sollen 1.190 MHz möglich sein. Die GL-Variante verwendet nur 20 Compute Units bzw. 1.280 Shadereinheiten. Der Basis-Takt liegt bei 931 MHz und per Boost sollen 1.011 MHz erreicht werden können.

Beiden Varianten gemein sind die 4 GB HBM2, die über ein 1.024 Bit breites Speicherinterface angebunden sind. Intel verwendet einen HBM2-Speicherstack mit der Kapazität von 4 GB, während bei der Desktop-Variante der Radeon RX Vega zwei Speicherstacks mit jeweils 4 GB eingesetzt werden. Pro Chip ist das Speicherinterface 1.024 Bit breit – daher hier auch die erwähnten 1.024 Bit Speicherbandbreite. Der dazugehörige Speichertakt beläuft sich bei der GH-Variante auf 800 MHz, beim GL-Modell sind es 700 MHz. Die Speicherbandbreite liegt demnach bei 204,8 bzw. 179,2 GB/s – weniger als die Hälfte der Desktop-Vega-Karten. Die Rechenleistung liegt bei 3,7 bzw. 2,7 TFLOPS. Etwas erstaunlich ist, dass AMD bei der Radeon RX Vega M GL die ROPs auf die Hälfte einbremst.