Lakefield im Test: Core i5-L16G7 mit fünf Kernen muss zeigen was er kann

Veröffentlicht am: von

intel-lakefield-chipVor einigen Wochen stellte Intel seine beiden Lakefield-Prozessoren vor – heute können wir einen Blick auf die Leistung werfen, denn mit dem Galaxy Book S von Samsung stand uns das erste Notebook zur Verfügung, welches ein Hybrid-Design aus dem Hause Intel verwendet. Neue Leistungsrekorde sind hier natürlich nicht zu erwarten, was aber von einem passiv gekühlten Sandwitch-Packaging zu erwarten ist, schauen wir uns auf den folgenden Seiten an.

Erste Details zum Aufbau des Lakefield-Prozessors haben wir bereits veröffentlicht. Die Sunny-Cove- und Tremont-Architektur haben wir uns ebenfalls bereits ausführlich angeschaut. An dieser Stelle wollen wir die wichtigsten Aspekte aber noch einmal anführen, bevor wir dann zu den Benchmarks kommen. Bei Lakefield handelt es sich um einen Hybrid-Prozessor, der aus einem einem großen Sunny-Cove-Kern und den vier Tremont-Kernen besteht. Das Hyperthreading ist sowohl auf dem Sunny-Cove-Kern als auch in den vier Tremont-Kernen nicht aktiv. Dem Sunny-Cove-Kern wurde zudem seine AVX512-Funktionalität genommen, um eine gewisse ISA-Kompatibilität zwischen den unterschiedlichen Kernen gewährleisten zu können. Hinzu gesellt sich eine Gen11-Grafikeinheit.

Für das Packaging verwendet Intel die eigene Foveros-Technik. Diese sieht einen Base-Die vor, der das USB-3-Interface, das Audio-, SDIO-, das PCI-Express-3.0-Interface sowie weitere I/O-Komponenten vorhält. Auf dem Compute-Die befinden sich die fünf CPU-Kerne sowie die integrierte Grafikeinheit. Über dem Compute-Die befindet sich dann noch der Pop-Speicher (Package-on-Package). Der gesamte Chip hat eine Größe von nur 12 x 12 x 1 mm.

» zur Galerie

Der Base-Die hat eine Fläche von 92 mm², besteht aus zehn Metallschichten und muss neben einer geringen Leistungsaufnahme auch günstig zu fertigen sein. Dazu trägt auch das einfache Back End of Line (BEOL) bei, welches nur noch eine Belichtung pro Maske notwendig macht. Der Base-Die ist im Grunde genommen ein aktiver Interposer. Er kommt trotz der vergleichsweise großen Fläche (verglichen zum Compute-Die) auf nur 650 Millionen Transistoren.

Der Compute-Die mit den vier Tremont-Kernen, dem Sunny-Cove-Kern sowie der Gen11-Grafikeinheit (plus die Gen11.5 Display-Engine und die Imaging Processing Unit (IPU) 5.5) sitzt über dem Base-Die und kommt auf eine Fläche von 82 mm². Hier verrät Intel auch erstmals die Anzahl der Transistoren. Knapp über 5 Milliarden sollen es sein. Der Compute-Die wird in 10 nm+ gefertigt. Dabei handelt es sich um die zweite Generation des 10-nm-Fertigungsprozesses von Intel, der auch für die Tiger-Lake-Prozessoren zum Einsatz kommen soll.

Auf dem Compute-Die setzt Intel auf einen Ring-Interconnect. Dieser bindet den System Agent mit den fünf Kernen und der GPU an. Die einzelnen Ring-Stops, so der Namen der Anknüpfungspunkte in einem Ring-Interconnect, sind der Sunny-Cove-Kern, die vier Tremont-Kerne, die GPU und die Uncore-Komponenten.

Von den insgesamt 82 mm² Chipfläche des Compute-Die belegt das Tremont-Cluster etwa 5,14 mm² – inklusive 1,5 MB an L2-Cache. Ein einzelner Tremont-Kern kommt auf 0,88 mm². Der einzelne Sunny-Cove-Kern hingegen bringt es auf 4,49 mm² – inklusive 512 kB an L2-Cache. Für Intel bietet sich daher in diesem Bereich eine interessante Mischung aus Leistung, Verbrauch und belegter Chipfläche. Der Sunny-Cove-Kern hat allerdings auch den Nachteil, dass beispielsweise die AVX512-Funktionseinheiten weiterhin vorhanden sind, aber nicht genutzt werden.

Die Kommunikation zwischen dem Base- und dem Compute-Die erfolgt über das Foveros Die Interface (FDI). Die FDI-I/O-Zellen sitzen direkt unterhalb der Micro-Bumps, um ESD- und weitere negative Effekte zu minimieren. Die Transceiver- und Receiver-Elemente befinden sich auf dem Base-Die. Die Datenrate pro Pin ist mit 500 MT/s nicht besonders hoch, allerdings spricht das FDI gleich 200 Kanäle an und erreicht damit eine Übertragungseffizienz von 0,2 pJ/Bit. Projektiert war der FDI mit 0,15 pJ/Bit, allerdings will Intel für zukünftige Produkte noch an Verbesserungen arbeiten. Zum Vergleich: Der CoWoS von TSMC kommt auf 0,56 pJ/Bit und AMDs Infinity Fabric auf 2 pJ/Bit (weniger ist besser).

Über dem Base- und dem Compute-Die sitzten in zwei Schichten noch zwei oder vier Stacks an LPDDR4-Speicher, die ebenfalls über TSVs mit dem Compute-Die verbunden sind. Es handelt sich dabei um sogenannten PoP (Package over Package).

Vorerst nur zwei Modelle

Der Core i5-L16G7 und der Core i3-L13G4 sind die einzigen beiden Lakefield-Modelle. Beide verfügen über fünf Kerne (1x Sunny Cove und 4x Tremont). Der Cache ist jeweils 4 MB groß und die TDP liegt bei 7 W. Im Standby-Betrieb soll sie auf bis zu 2,5 mW abgesenkt werden können. Unterschiede gibt es also nur in der Taktung.

Gegenüberstellung der Lakefield-Prozessoren
  Core i5-L16G7 Core i3-L13G4
Kerne 5 5
Cache 4 MB 4 MB
Basis-Takt 1,4 GHz 0,8 GHz
Single-Core-Boost 3,0 GHz 2,8 GHz
All-Core-Boost 1,8 GHz 1,3 GHz
TDP7 W 7 W
GPU-Ausbau 64 EUs 48 EUs
GPU-Takt 500 MHz 500 MHz
Speicher 8 GB LPDDR4X-4267 8 GB LPDDR4X-4267

Der Basis-Takt des Core i5-L16G7 liegt bei 1,4 GHz, während der Core i3-L13G4 nur auf 0,8 GHz kommt. Diese Angaben dürften sich auf den großen Kern beziehen. Der Single-Core-Turbo wird mit 3,0 GHz für den Core i5-L16G7 angegeben und der Core i3-L13G4 kommt auf 2,8 GHz - auch hier bezogen auf den Sunny-Cove-Kern. Intel nennt außerdem einen All-Core-Turbo. Dieser liegt bei 1,8 GHz für den größeren Core i5-L16G7 und bei 1,3 GHz für den Core i3-L13G4.

Die beiden Lakefield-Modelle verfügen über ein PL1 bzw. eine TDP von 7 W. Das PL2 liegt bei 9,5 W – also um 33 % höher. Das PL2 darf für 28 s anliegen – ein Standard-Wert für Intel-Prozessoren. Intel zeigt sich beim PL2 und dem Tau-Wert also recht zurückhaltend, was aufgrund der kompakten Abmessung der Geräte und der damit verbundenen Kühlung auch nicht weiter verwunderlich ist. Für das Galaxy Book S ist ein PL1 von nur 5 W konfiguriert. Das Pl2 ist bei 9,5 W belassen worden. Samsung will ein Firmware-Update nachreichen, welches das PL1 auf die von Intel vorgesehenen 7 W erhöht.

Im Modellnamen vermerkt ist zudem die jeweilige Ausbaustufe der integrierten Grafikeinheit. Die Gen11-GPU des Core i5-L16G7 bietet 64 Execution Units (EUs) mit einem Takt von bis zu 500 MHz. Beim Core i3-L13G4 sind es 48 EUs bei ebenfalls bis zu 500 MHz. Als Arbeitsspeicher direkt im Package verbaut ist LPDDR4X-Speicher mit 4.267 MHz.

Der als PoP verbaute Arbeitsspeicher kann nicht getauscht werden. Beim Samsung Galaxy Book S sind 8 GB verbaut. Beide Standard-Konfiguration der Lakefield-Prozessoren verfügen über 8 GB an Arbeitsspeicher. Es können aber auch SKUs mit 4 GB produziert werden, wenn ein Kunde dies wünscht. Aktuell geht Intel aber davon aus, dass Samsung und Lenovo als die bisher einzigen Kunden auf 8 GB setzen.


Bevor wir uns die ersten Benchmarks anschauen, wollen wir einen Blick auf die Konfigurationen werfen, die für die Vergleiche zum Einsatz kommen. Zum einen sind dies einige wenige Desktop-Prozessoren, so wie wir sie aktuell in den CPU-Tests verwenden.

Zum anderen sind dies folgende Mobil-Prozessoren mit den dazugehörigen PL1-Limits:


3D-Rendering und Compute

Cinebench R20

Single-Threaded

Punkte
Mehr ist besser

Cinebench R20

Multi-Threaded

Punkte
Mehr ist besser

Blender

bmw27

Sekunden
Weniger ist besser

Blender

classroom

Sekunden
Weniger ist besser

V-Ray

Benchmark

Sekunden
Weniger ist besser

Corona

Benchmark

Sekunden
Weniger ist besser

Y-Cruncher

500M

Sekunden
Weniger ist besser

DigiCortex

Small 64 Bit

x real-time avg
Mehr ist besser

UL 3DMark

TimeSpy Extreme - CPU

Futuremark-Punkte
Mehr ist besser

Multimedia, Speicher und Verschlüsselung

Handbrake

UHD Demo Nature

Sekunden
Weniger ist besser

AIDA64

Speicherverzögerung

in ns
Weniger ist besser

7-Zip

32M - Dekomprimierung/Komprimierung

84976 XX


49857 XX
54179 XX


47824 XX
50744 XX


46586 XX
50525 XX


42719 XX
47636 XX


39007 XX
44788 XX


35940 XX
39146 XX


32204 XX
38546 XX


36441 XX
35604 XX


28227 XX
35112 XX


30406 XX
25178 XX


19664 XX
24846 XX


18705 XX
MIPS
Mehr ist besser

7-Zip

32M - Gesamtwertung

MIPS
Mehr ist besser

VeraCrypt

AES

GB/s
Mehr ist besser

Compiling

Für den Test der Compiling-Leistung haben wir den Mozilla Firefox in der aktuellen Version für den Desktop in 64 Bit compiled. Hier spielen die Single-Threaded- und die Multi-Threaded-Leistung eine Rolle, wobei ein Prozessor mit vielen Kernen deutliche Vorteile hat.

Compiling

Firefox-Browser

Sekunden
Weniger ist besser

Leistung/Watt

Auch wenn ein Core i5-L16G7 keine Leistungswunder vollbringt, so könnte er bei 5 W aber dennoch sehr effizient sein. Eben dies haben wir uns ebenfalls angeschaut. Dabei teilen wir die Punkte aus dem Cinebench-R20-nT-Test durch die Leistungsaufnahme des Prozessors.

Multi-Threaded-Leistung pro Watt

Cinebench nT

in Punkte/W
Mehr ist besser

Und tatsächlich. Die Multi-Threaded-Leistung pro Watt ist für einen Lakefield-Prozessor erstaunlich gut. Hier übertrumpft man alle anderen Notebook-Prozessoren um gleich mehrere Faktoren.


Die Benchmarks zeigen also gewisse Werte, die wir später noch beurteilen werden. Spannend ist aber sicherlich die Frage, wie ein Lakefield-Prozessor arbeitet und wir er mit der Last umgeht. Intel sieht vor, dass ein Programmstart und Single-Threaded-Anwendungen vom Sunny-Cove-Kern ausgeführt werden. Längere Berechnungen und eine gewisse Dauerlast werden von den vier Tremont-Kernen durchgeführt.

Ein Hyperthreading bietet Lakefield, wie auf der ersten Seite erläutert, nicht. Demzufolge sehen wir fünf echte Kerne bei der Arbeit. 

» zur Galerie

Für die meiste Software im Rahmen der Benchmarks, sehen wir immer alle fünf Kerne bei der Arbeit. Die Threads werden also auf alle fünf Kerne verteilt. Dies trifft nicht nur auf Benchmarks wie Cinebench R20 zu, sondern auch auf praxisrelevante Anwendungen wie Blender, ein Videoencoding und das Compiling von Software.

» zur Galerie

Teilweise fällt der Takt bei längerer Last auf den Basistakt von 1,4 GHz zurück. Im Galaxy Book S kommt der Lakefield-Prozessor ohne aktive Kühlung zum Einsatz. Je länger die Last anliegt, desto wärmer werden die gesamte Kühllösung bzw. das Gehäuse. Zwischen 80 und 85 °C haben wir unter Last gesehen, zu einer Drosselung aufgrund der hohen Temperaturen ist es aber nicht gekommen.

Wir hatten eigentlich nicht erwartet, dass alle fünf Kerne derart zusammenarbeiten. Wir hatten eigentlich damit gerechnet, dass zum Beispiel für ein Rendering ausschließlich die vier Tremont-Kerne verwendet werden. Aber in fast allen Multi-Threaded-Anwendungen arbeiten auch alle fünf Kerne.

Gegenüberstellung der Takraten

1T nT
4x Tremont 2,8 GHz 1,4 GHz
1x Sunny Cove 3,0 GHz 1,8 GHz

Unter Volllast arbeiten die vier Tremont-Kerne mit einem Takt von 1.400 MHz, der einzelne Sunny-Cove-Kern kommt auf 1.800 MHz. Im alltäglichen Einsatz sind die Taktraten teilweise deutlich höher. Hier sprechen wir von 2.800 MHz für einzelne Tremont-Kerne und 3.000 MHz für den Sunny-Cove-Kern.

Cinebench R20

Single- und Multi-Threaded

Punkte
Mehr ist besser

Die Leistung der unterschiedlichen Kerne können wir beispielsweise über eine Zuweisung der Kerne ermessen. So haben wir dem Cinebench R20 jeweils einen Tremont- und einen Sunny-Cove-Kern zugewiesen. Der einzelne Sunny-Cove-Kern ist in etwa 40 % schneller als ein Tremont-Kern. Arbeiten die fünf Kerne zusammen skaliert die Leistung natürlich nicht 1:1, da die Kerne den Takt, den sie im Single-Threaded-Betrieb erreichen, dann nicht mehr einhalten können.

Kernlatenzen

Werfen wir noch einen Blick auf die Latenzen, die bei Zugriffen zwischen den einzelnen Kernen und der Verschiebung von Threads wichtig sind.

» zur Galerie

Innerhalb des Trement-Clusters bewegen wir uns bei etwas über 50 ns. Geht es zum Sunny-Cove-Kern, sind es etwa 60 ns. Lakefield verwendet einen Ring-Interconnect mit Ring-Stops. Einer dieser Stops ist im Tremont-Cluster, ein weiterer beim Sunny-Cove-Kern – weitere Stops sind im Uncore-Segment und der integrierten GPU. Insofern sind höhere Latenzen hier zu erwarten. Zum Vergleich: Innerhalb eines monolithischen Dies der aktuellen Comet-Lake-Generation kommt Intel auf 40 bis 45 ns. Bei AMD sprechen wir von 30 ns im gleichen CCD und von 70 bis 75 ns, wenn mehrere CCDs über einen IOD miteinander verbunden sind.

I/O-Benchmarks

Da es sich bei den Lakefield-Prozessoren um eine stark integrierte Hardware handelt, haben wir auch die Anbindung der SSD untersucht.

» zur Galerie

Die verbaute und vermutlich direkt auf dem PCB verlöteten SSD ist über eine PCI-Express-Lane angebunden und kommt auf eine Lesedatenrate von bis zu 1.333 MB/s. Für das Schreiben von Daten konnten wir maximal etwas mehr als 400 MB/s messen.

In Lakefield integrierte ist auch ein Thunderbolt-3- und Wi-Fi-6-Controller. Das dazugehörige physikalische Interface (PHY) muss vom Notebookhersteller allerdings auch ausgeführt werden.


Für die Lakefield-Prozessoren verwendet Intel eine Gen11-Grafikeinheit – genau wie bei den Ice-Lake-Prozessoren. Allerdings muss sich die Grafikeinheit das Leistungs-Budget von 7 bzw. 5 W mit den CPU-Kernen teilen. Als Core i5-L16G7 kommt die gleiche Ausbaustufe der integrierten GPU wie beim Core i7-1065G7 zum Einsatz.

Aktuelle Spiele in den höchsten Auflösungen und mit maximalen Details wird man damit sicherlich nicht spielen können. Stattdessen geht es wohl mehr darum alle Media-Encoder-Funktionen nutzen zu können. Spiele sind nur sehr eingeschränkt überhaupt auszuführen.

Selbst Titel wie Valorant laufen in 1080p und mit den niedrigen Grafikeinstellungen nicht flüssig. Ein Ice-Lake-Prozessor mit 15 oder gar 25 W macht hier schon eine ganz andere Figur. In einem Lakefield-Prozessor reicht die Leistung aufgrund des beschränkten Leistungsbudget aber nicht aus.

Media De/Encoder

Für das Media Decoding haben wir auch ein paar kurze Tests gemacht und Videos von YouTube (VP9) und Netflix gestreamt.

» zur Galerie

Ein 4K-Video von YouTube lastet das Video-Processing eines Lakefield-Prozessors mit etwa 60 % aus. Die recht hohe Hintergrundlast auf dem Prozessor wird hingegen kaum erhöht. Ist die Netzwerkverbindung ausreichend, ist ein 4K-Streaming hier also problemlos möglich. Das verbaute Display stellt zwar nur 1080p dar, hier ging es aber darum die Leistung für das Decoding zu erfassen.

» zur Galerie

Aufgrund des Kopierschutzes wird das Streaming von Netflix mit einem schwarzen Bild im Screenshot dargestellt. Im Hintergrund lief aber ein Streaming in 1080p, mit nur geringer Last auf der Hardware. Auch dies ist für den Lakefield-Prozessor also kein Problem.


Für Intel sind die Lakefield-Prozessoren der ersten Generation sicherlich zunächst einmal nur ein Testvehikel. Während das Packaging mit EMIB bereits als etabliert gelten darf, kommt bei den Lakefield-Prozessoren auch erstmals die Foveros-Technologie zum Einsatz. Dies macht es Intel möglich, einen Base-Die mit 22 nm und einen Compute-Die mit 10 nm zu kombinieren.

Doch von den beiden Modellen wird Intel wohl kaum größere Stückzahlen verkaufen. Samsung bietet ihn im Galaxy Book S an, Lenovo gegen Ende des Jahres das ThinkPad X1 Fold und Microsoft will 2021 das Surface Book Neo anbieten. Weitere Ankündigungen gibt es nicht.

Die Benchmarks zeigen, dass die vier Tremont-Kerne und der einzelne Sunny-Cove-Kern kaum mit den sonst im mobilen Segment üblichen Designs mithalten können. Dies liegt nicht an den Mikroarchitekturen, sondern schlicht und ergreifend daran, dass dem Prozessor nur ein Leistungsbudget von nominell 7 W, in diesem Fall 5 W, zugestanden wird. Damit erreichen die Kerne natürlich nicht das Leitungsniveau, welches sie erreichen könnten, wenn man ihnen etwas mehr Luft zum Atmen gibt. Unser Test des Core i7-1065G7 hat gezeigt, dass vier Sunny-Cove-Kerne im mobilen Segment durchaus mehr leisten können.

Der Scheduler, also der Dienst, der den einzelnen CPU-Kernen die Threads zuweist, scheint aber gute Arbeit zu leisten, denn responsive Interaktionen werden auf dem schnellen Sunny-Cove-Kern durchgeführt, während Hintergrundanwendungen und solche mit langanhaltender Last auf den vier Tremont-Kernen durchgeführt werden. Insoweit scheint das System so zu funktionieren, wie es soll. Neben der Beschneidung hinsichtlich der TDP muss Intel für eine ISA-Kompatibilität der Kerne aber auch noch weitere Maßnahmen vornehmen, welche für die Leistung nicht gerade förderlich sind. So ist kein Hyperthreading aktiv.

» zur Galerie

Die Lakefield-Prozessoren sind eben nicht auf eine hohe Rechenleistung, sondern auf eine hohe Effizienz ausgelegt und hier kann der von uns getestete Core i5-L16G7 überzeugen. Das Browsen im Web, E-Mail und Office erledigt er problemlos. Auch Videos werden ohne jegliche Hindernisse und eine große Last abgespielt. Kompakt und leicht sind die Notebooks für dieses CPU-Modell und dennoch bieten sie eine Akkulaufzeit von etwa zehn Stunden. Diesen Wert erreicht das Galaxy Book S in unserem Test.

Einschränkungen muss man hingegen bei der 3D-Leistung hinnehmen. Auch hier kommt die Beschneidung der TDP ins Spiel, denn 5 W reichen einfach nicht aus, um fünf Kerne und eine Gen11-Graphics ausreichend zu versorgen. Spieler werden aber wohl auch kaum zu einem Notebook mit Lakefield-Prozessor greifen.

In jedem Fall konnten wir uns einen interessanten Einblick in die aktuelle Entwicklung verschaffen. Ob das Notebook mit der gebotenen Ausstattung für den jeweiligen Anwendungsfalls das Richtige ist, steht jedoch auf einem anderen Blatt.

Foveros und Chiplet sind die zukunft

Der Packaging-Technologie Foveros gehört die Zukunft. Intel hat bereits Pläne für eine zweite und dritte Generation der Lakefield-Prozessoren. Entscheidender aber ist, dass auch das Hybrid-Design offenbar in Zukunft bei anderen Prozessoren zum Einsatz kommen wird. Intel selbst bestätigte ein solches für Alder Lake-S – die Desktop-Prozessoren, die 2021 auf den Markt kommen sollen.

Gegenüberstellung der Lakefield-Generationen
  1. Gen Lakefield 2. Gen Lakefield 3. Gen Lakefield
Status in der Produktion in der Entwicklung in der Planungsphase
Compute-Die 1274 (10 nm) 1276 (7 nm) 1278 (5 nm)
Base-Die P1222 (22 nm) 1274.FV (10 nmn) 1276.FV (7 nm)

Ob und wo ein solches Design zum Einsatz kommen wird und sinnvoll ist, wird sich noch zeigen müssen. Bei den Notebooks steht dem bei guter Umsetzung eigentlich wenig entgegen, denn bereits die ARM-Designs mit LITTLE.big in den Smartphones haben ihre Vorteile aufgezeigt. Auch Apple wird mit dem Apple Silicon auf ein solches asynchrones Design setzen.