Seite 4: SenseMI und XFR

Die AMD SenseMI Technology setzt sich zusammen aus Pure Power, Precision Boost, Extended Frequency Range, Neural Net Prediction und Smart Prefetch.

Pure Power soll dafür sorgen, dass bei geringerer Leistungsaufnahme eine identische Leistung erreicht wird. Diese Technologie ist in dieser Form aber nicht wirklich neu, sondern wurde für die Zen-Architektur nur verfeinert. AMD verbaut hunderte Sensoren für Temperatur, Spannung und Takt auf dem CPU-Die. Genauer gesagt sollen dies 48 Sensoren sein, welche die Spannungsversorgung der verschiedenen Bereiche überwachen. Hinzu kommen 20 Temperatursensoren und neun sogenannte Droop-Sensoren. Diese Spannungs-Droops treten auf, wenn die Spannung unter Last stark abfällt – entsprechend muss dann gegengesteuert werden. Die Angabe von mehreren hundert Sensoren beruht sicherlich auch darauf, dass AMD nicht nur diese schnelle Sensoren einsetzt, sondern auch langsamere Modelle in eher unkritischen Bereichen einsetzt damit mehrere tausende critical path überwacht.

Hinzu kommt die dazugehörige Messelektronik. Aus den dort ermittelten Daten wird eine Spannungs/Taktkurve erstellt – für jeden Prozessor in mehreren Temperaturstufen. Diese Spannungs/Taktkurve wird fest auf dem Prozessor integriert und er arbeitet in der Folge auf Grundlage dieser Tabelle. die Frequenz ist dabei der fixe Wert, wohingegen die Spannung entsprechend variabel angepasst wird.

Precision Boost ermöglicht die genaue Kontrolle des Taktes und arbeitet mit Pure Power zusammen. Die Messelektronik ist dabei fast identisch bzw. es werden die gleichen Messsensoren verwendet, um bei gleicher Leistungsaufnahme einen höheren Takt zu erreichen. Auch hier kommt ein neues Infinity Control Fabric zum Einsatz. Precision Boost kann den CPU-Takt in Schritten von 25 MHz erhöhen. Die klassischen Boost-States ermöglichen nur acht Abstufungen und diese auch nur in 100-MHz-Schritten. Mit der Zen-Architektur wird dies anders, denn hier sind bis zu 100 Schritte möglich, die in Inkrementen von 25 MHz festgelegt werden können. Außerdem ist es dem Prozessor möglich in weniger als 1 ms in diesen States zu wechseln. Auch ein Wechsel während der Ausführung von Code ist möglich – früher ging dies nicht.

Auf dem RYZEN Tech Day sprach AMD viel über Effizienz und wie man diese erreicht hat. Dabei spielt natürlich auch die Spannungsversorgung und die Zuteilung derselbigen eine Rolle. AMD verwendet dabei das sogesannte lineare Low Drop Out (LDO), während Intel das Fully Integrated Voltage Regulator (FIVR) favorisiert. Der FIVR war eine der größten Neuerungen für die ersten "Haswell"-Prozessoren. Mit der Integration des Spannungswandler wollte Intel die Spannungsversorgung auf den Mainboards vereinfachen, die zuvor noch fünf unterschiedliche Spannungen an das CPU-Package liefern mussten: Vcore, Vgpu, VCCSA, VCCIO und PLL. Zudem sollte dieser Schritt Intel mehr Kontrolle über die Versorgung des Prozessors ermöglichen, was auch Einsparungen beim Verbrauch nach sich ziehen sollte.

Laut AMD ist der LDO deutlich simpler im Aufbau und bietet zudem über die Standard-Anwendungen hinweg eine Effizienz von 95 % und ermöglicht dabei die Ansteuerung der Spannung eines jeden Prozessor-Kerns unabhängig voneinander. Dies ist auch bei einem FIVR möglich, allerdings ist alleine das Schaltelement bzw. der Schaltkreis als solches bereits deutlich komplexer und größer und letztendlich auch weniger effizient. In den Leistungsmessungen und im Zusammenhang mit der gebotenen Leistung wird sich dann auch dieser Umstand in gewisser Weise zeigen.

Eigene Layer im Die sowie weitere Komponenten stellen sicher, dass die Spannungsversorgung über den LDO auch an der richtigen Stelle ankommen. Natürlich aber spielt auch die Versorgung über die VRMs der Mainboards eine wichtige Rolle, der LDO ist aber der entscheidende Bestandteil, der am nächsten an den zu versorgenden Komponenten sitzt und die Anforderungen am besten kennt – damit die ideale Ansteuerung vornehmen kann. Im RYZEN 7 1800X können alle acht physikalischen Kerne getrennt durch den LDO mit der entsprechenden Spannung angesteuert werden. Diese unabhängige Versorgung unterscheidet sich zu früheren Ansätzen, in denen das schwächste Mitglied, also der Kern, der die höchste Spannung benötigte, um bei einer bestimmten Frequenz zu arbeiten, die Basis für die Versorgung des kompletten Prozessors vorgab. AMD kann nun deutlich granularer ansteuern und damit die Effizienz erhöhen.

XFR als Tuning mit womöglich geringer Substanz

Um noch zusätzliches Übertaktungs-Potenzial bieten zu können, hat AMD die Extended Frequency Range (XFR) implementiert. Abhängig von der Kühlung sollen die Prozessoren mit dieser Methodik deutlich höhere Taktraten erreichen. XFR kann den Boost-Takt über oder unter dem Precision Boost betreiben. Besonders unter Verwendung einer Wasser- oder LN2-Kühlung soll die Leistung der Zen-Prozessoren profitieren.

XFR und die verschiedenen P- und Boost-States versuchen wir mal im Falle des RYZEN 7 1800X genauer zu erläutern. Von den acht P-States sind eigentlich nur die oberen drei interessant. P2/Pmin ist der Idle-Takt unter Windows und der liegt bei 2,2 GHz. Natürlich können die Prozessoren noch niedriger takten, P2/Pmin ist aber eine Ausgangslage, von der der Prozessor auch wieder schnell in die schnelleren States wechseln kann. Der P1 State liegt bei 3,2 GHz und wird dann erreicht, wenn leichte Last auf dem Prozessor vorhanden ist, aber noch nicht von einer Auslastung gesprochen werden kann. Der P0 State wiederum deckt sich mit dem Basis-Takt, in diesem Fall sind es 3,6 GHz. Ab dieser Stelle schaltet das Betriebssystem die Kontrolle der P-States ab und übergibt vollständig an den Prozessor. Nun kommen wir zu den verschiedenen Boost-Fällen.

Mehr als zwei CPU-Kerne können im Falle des RYZEN 7 1800X von 3,7 GHz auf bis zu 4,0 GHz übertakten. Darüber hinaus gibt es noch die Extended Frequency Range. Diese reicht im Falle des RYZEN 7 1800X auf bis zu 4,1 GHz – gilt aber nur für zwei Kerne. XFR wird auch nur dann erreicht, wenn bestimmte Bedingungen erfüllt sind. Im Falle des RYZEN 7 1800X und 1700X sind die das nicht erreichen der vorgeschriebenen Verbrauchsgrenze sowie die Einhaltung des Temperaturlimits von 59,9 °C für die Tcase-Temperatur, die im Heatsink selbst abgerufen wird. Für den RYZEN 7 1700 gilt eine Tcase-Temperatur von 71,3 °C, damit per XFR der Takt um weiter angehoben werden kann.

Wer XFR nutzen möchte, benötigt also eine gute Kühlung, damit die Tcase-Temperatur im Rahmen bleibt und außerdem wird das XFR auch noch auf zwei Kerne beschränkt. Es wird sich in der Praxis zeigen müssen, wie groß der Einfluss von XFR sein kann. Die Abhängigkeit von der Kühlung macht direkte Vergleiche sicherlich auch schwieriger. Abschalten lässt sich XFR übrigens, wenn ein Overclocking vorgenommen wird. Sobald der Nutzer Werte wie den Baseclock für das Mainboard oder den Mulitplikator ändert, fällt der Prozessor auf die dort gemachten Einstellungen zurück und alle Boost-Mechanismen sowie XFR sind nicht mehr aktiv.

Für die Effizienz und Geschwindigkeit einer Prozessor-Architektur sind Maßnahmen wie die Vorhersagen nächster Rechenaufgaben besonders wichtig. AMD will auch diesen Bereich deutlich verbessert haben und nennt dies Neural Net Prediction. AMD spricht sogar von einer AI innerhalb des Prozessors, wenngleich das sicherlich etwas übertrieben ist, denn die Prozessor-Architektur ist immer auch abhängig von der Software-Unterstützung. AMD hat den Branch History Table verdoppelt, um Vorhersagen zu verbessern. Smart Preftech kümmert sich um die dazugehörigen Daten und will diese effizient in den richtigen Cache oder die Register verteilen. Ein Shared-L3-Cache kommt im Falle von Summit Ridge auf 16 MB, zusätzlich stehen noch 4 MB L2-Cache zur Verfügung.