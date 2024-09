Werbung

Erst vor wenigen Tagen stellte Intel seine Prozessoren der Xeon-6900P-Serie offiziell vor. Wir hatten nun die Gelegenheit uns einen Server anzuschauen und Benchmarks durchzuführen. Das System war mit zwei Xeon 6972P und jeweils 96 Kernen bestückt. Wie sich die Prozessoren gegen die Konkurrenz aus eigenem Hause und hier die Xeon-6700E-Serie und auch die EPYC-Modelle von AMD schlagen und wo die Stärken liegen, klären wir im folgenden Artikel.

Die Xeon-6900P-Serie verwendet, anders als die 6700E-Serie, ausschließlich Performance-Kerne. Als Xeon-6900P-Serie setzt sie dabei auf den größeren LGA7529 der Birch-Stream-Plattform. Die von uns bereits getesteten Prozessoren der Xeon-6700E-Serie sind SP-Modelle für den Sockel LGA4710.

Mit der Xeon-6900P-Serie zündet Intel die zweite Stufe – nach der Xeon-6700E-Serie. Im ersten Quartal 2025 werden dann mit Sierra Forest-AP die großen Xeon 6900E mit bis zu 288 Kernen pro CPU sowie mit Granite Rapids-SP die kleineren Xeon 6700P folgen. Hinzukommen werden die darunter platzierten Xeon 6500P, 6300P und der Xeon 6 SoC.

Intel hat die Produktpalette deutlich ausgedünnt. Anstatt dutzender Varianten gibt es pro Serie nur noch eine Handvoll oder vielleicht etwas mehr. Dies war schon bei der Xeon-6700E-Serie so und setzt sich weiter fort.

Gegenüberstellung der Xeon-6900P-Serie Modell Kerne Basis-/Boost-Takt All-Core-Boost L3-Cache TDP DDR5 MRDIMM PCIe/CXL-Lanes Xeon 6980P 128 2,0 / 3,9 GHz 3,2 GHz 504 MB 500 W 12x 6.400 MT/s 12x 8.800 MT/s 96 Xeon 6979P 120 2,1 / 3,9 GHz 3,2 GHz 504 MB 500 W 12x 6.400 MT/s 12x 8.800 MT/s 96 Xeon 6972P 96 2,4 / 3,9 GHz 3,5 GHz 480 MB 500 W 12x 6.400 MT/s 12x 8.800 MT/s 96 Xeon 6952P 96 2,1 / 3,9 GHz 3,2 GHz 480 MB 400 W 12x 5.600 MT/s 12x 8.800 MT/s 96 Xeon 6960P 72 2,7 / 3,9 GHz 3,8 GHz 432 MB 500 W 12x 6.400 MT/s 12x 8.800 MT/s 96

Intel konzentriert sich ausschließlich auf eine Differenzierung über die Anzahl der Kerne und deren Takt. Alle weiteren Funktionen sind identisch. Bei der 4. und 5. Xeon-Generation gab es noch Unterscheidungen in der Anzahl der Beschleuniger, der Multi-Sockel-Fähigkeit und vieles mehr. Das alles ist mit der Xeon-6-Serie nun Geschichte. Eine Sonderstellung haben der Xeon 6972P und Xeon 6952P, die beide über 96 Kerne verfügen, erstgenanntes Modell aber bis zu 500 W verbrauchen darf, das zweite mit 400 W genau 20 % weniger.

Avenue City Referenzplattform

Die Prozessoren der Xeon-6900P-Serie unterstützen zwölf Speicherkanäle für DDR5-6400 oder MRDIMM mit 8.800 MT/s. Für den Einsatz von MRDIMMs aber muss man festhalten, dass pro Speicherkanal nur ein Modul verwendet werden kann, während es für DDR5 zwei Module sind und der Speicherausbau damit deutlich größer ausfallen kann. Ansonsten bietet die Plattformen viele Parallelen zur Xeon-6700E-Serie, was auch durchaus durch den Aufbau des Package gewollte ist. Die I/O-Funktionen, wie die Verfügbarkeit von bis zu 96 PCI-Express-Lanes oder 64 CXL-2.0-Lanes ist über die komplette Plattform gegeben. Auch hier macht Intel also weniger Unterscheidungen und vereinfacht das Angebot demnach in seiner Komplexität.

Um auf 128 Kerne und die I/O-Funktionen der Plattform zu kommen, setzt Intel bei den Prozessoren der Xeon-6900P-Serie auf drei Compute-Tiles mit den P-Kernen sowie auf zwei I/O-Tiles, welche die I/O-Blöcke für PCI-Express 5.0, CXL 2.0 und auch die Beschleuniger enthalten. Die Compute-Tiles werden in Intel 3 gefertigt, während die I/O-Tiles aus einer Fertigung in Intel 7 kommen. Die Verbindung der Tiles erfolgt per EMIB.

Einige dieser I/O-Blöcke im I/O-Tile können frei konfiguriert werden, sodass sie entweder für PCI-Express- oder CXL-Lanes verwendet werden können. Die UPI-Blöcke können zudem als UPI zur Anbindung eines oder mehrerer weiterer Sockel eingesetzt werden. Für 1S- und 2S-CPUs verzichtet Intel teilweise darauf und kann daher mehr PCI-Express- und CXL-Lanes anbieten.

Egal ob Granite Rapids-AP oder ab dem ersten Quartal 2025 mit Sierra Forest-AP – die Plattform besitzt die gleichen I/O-Funktionen und Beschleuniger, wohingegen die Entscheidung für die Xeon-6900P- und Xeon-6900E-Serie einzig eine Wahl für den Einsatz von P- und E-Kernen bedeutet. Konkret bedeutet dies für Granite Rapids-AP, dass hier 12 Speicherkanäle, sechs UPI-2.0-Links und bis zu 96 PCIe-5.0- bzw. CXL-2.0-Lanes auf Plattformebene unterstützt werden.

Die Compute-Tiles mit bis zu der Xeon-6900P-Serie bezeichnet Intel als UCC (Ultra Core Count). 44 Kerne sind für den UCC-Chip vorgesehen, aber bei keinem Prozessor sind alle diese 44 Kerne aktiv. Bei 128 Kernen für das größte Modelle ergeben sich bei drei Compute-Tiles 42,6 Kerne pro Tile, was in der Form natürlich nicht funktioniert, sodass Intel zum Beispiel 42 + 44 + 44 aktive Kerne einsetzen wird.

Der Einsatz von drei Compute-Tiles mit P-Kernen der Xeon-6900P-Serie und später dann zwei Compute-Tiles mit E-Kernen der Xeon-6900E-Serie ist notwendig, damit Intel die 12 Speichercontroller auf der Plattform anbieten kann, denn diese befinden sich nicht in den I/O-Tiles, sondern in den Compute-Tiles. Im Compute-Tile sind alle Kerne und Caches über ein Mesh-Interconnect angebunden. Der Last Level Cache (LLC) steht allen Kernen zur Verfügung, es kann aber auch eine NUMA-Clustering gewählt werden. Die Speichercontroller befinden sich wie gesagt mit in den Compute-Tiles. Intel wählt diesen Ansatz sicherlich, um die Latenzen und Bandbreite zu den Kernen möglichst gering bzw. hochzuhalten.

Intel stellte uns einen Server der Avenue City Referenzplattform zur Verfügung. Dieser war wie gesagt mit zwei Xeon 6972P mit jeweils 96 Kernen bestückt. Zudem waren pro Sockel zwölf Module DDR5-6400 mit jeweils 64 GB verbaut. Jeder Prozessor konnte also auf 768 GB an Arbeitsspeicher zurückgreifen.

Im Vergleich zum Server mit zwei Xeon 6700E fällt die Kühlung für die zwei Xeon 6972P deutlich größer aus. Kein Wunder, denn hier müssen anstatt zweimal 330 W nun zweimal 500 W abgeführt werden.

Auf der Avenue-City-Referenzplattform für die Xeon-6900P-Prozessoren entschied sich Intel einmal mehr für den Einsatz von OpenBMC. Über das BMC haben wir das System während der Benchmarks überwachen können. Der Schritt weg von proprietären BMCs ist hier aber das eigentliche Highlight und wird unsererseits begrüßt.

Leider war unser Server noch nicht mit MRDIMMs bestückt. Mit MDRIMMs bei 8.800 MT/s dürfte die Speicherbandbreite noch einmal um gut 33 % steigen, was in gewissen Benchmarks noch einmal zu einer deutlichen Leistungssteigerung beitragen wird. Unsere Benchmarks stellen demnach die Leistung mit der Mindestkonfiguration dar, es geht im Zweifel also auch noch schneller.

Dies gilt natürlich auch für die Anzahl der Kerne, denn die von uns getesteten Xeon 6972P haben eben 96 Kerne, wärend es auch noch den Xeon 6979P mit 120 und den Xeon 6980P mit 128 Kernen gibt.