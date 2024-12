Werbung

Mit der Arc B580 hat Intel die ersten dedizierten Grafikkarten der zweiten Arc-Generation vorgestellt, die als Battlemage-Design und mit Xe2-Architektur einen besseren Start vollführen soll, als dies damals Anfang Oktober 2022 mit der Arc A770 und Arc A750 gelang. Mit der verbesserten Xe2-Architektur und 12 GB Grafikspeicher adressiert Intel dieses Mal nicht mehr nur den Spieler, der sich mit 1080p begnügt. Aber natürlich ist auch Intel bewusst, dass der Preis und die Positionierung der Karte eine entscheidende Rolle spielen. Wir schauen uns heute die Limited Edition der Arc B580 genauer an.

Die Alchemist-Karten hatten es schwer: Die A380 war im Sommer 2022 nur für den chinesischen Markt vorgesehen und schaffte es dennoch zu uns – der erste Tests war verhehrend. Ein paar Monate später konnten die Arc A770 und A750 dann zumindest in Teilaspekten in der Preis-Leistung überzeugen, aber noch immer waren eine fehlende Treiberunterstützung für viele, vor allem ältere Spiele und zahlreiche Bugs ein zu großer Hemmschuh. Die 16 GB an Grafikspeicher waren eine nettes Ausstattungsdetail, der AV1-Encoder ein exklusives Feature und die Compute-Leistung ein Pro-Argument, aber das alles konnte nicht darüber hinwegtäuschen, dass auch die von Intel gesteckten Erwartungen nicht erfüllt werden konnten.

Einige der Unzulänglichkeiten der ersten Generation will Intel abgeschüttelt haben. So wurde die Emulation der Hardware deutlich ausgeprägter durchgeführt, sodass viel früher klar war, wo man mit der BMG-G21-GPU der Arc B580 hinsichtlich der Leistung landen wird. Die theoretische Compute-Leistung soll nun deutlich näher an der letztendlich erreichten Gaming-Leistung liegen. Das Software-Team wurde aufgestockt und als zweite Generation kann Battlemage auf einen deutlich ausgereifteren Treiber zurückgreifen.

Auch hat Intel aus Fehlern gelernt, die man in der Entwicklung der GPUs auf Basis der Xe-Architektur gemacht hat. So wird es hier deutlich weniger Varianten geben, denn neben der diskreten GPUs mit Xe-Architektur und XMX-Einheiten gab es auch eine integrierte Variante für Meteor Lake ohne XMX-Einheiten, genau wie für Arrow Lake-S. Auf der anderen Seite wird Arrow Lake-H ein GPU-Tile mit Xe-Architektur und XMX-Einheiten enthalten. Xe-HPG, Xe-LP, Xe-LPG – solche Varianten wird es für die Xe2-Architektur zwar wieder geben, allerdings ist der Funktionsumfang deutlich deckungsgleicher.

Weiterentwickelt hat sich auch die Software, denn mit XeSS 2, XeSS Frame Generation und Xe Low Latency gibt es nun auch Techniken, die wir bei der Konkurrenz schon haben, für Intels Hardware aber bisher vermisst haben.

Gegenüberstellung der Arc-Varianten Arc B570 Arc B580 Arc A580 GPU BMG-G21 BMG-G21 ACM-G10 Fertigung TSMC N5 TSMC N5 TSMC N6 Xe-Cores 18 20 24 Shadereinheiten 2.304 2.560 3.072 Raytracing-Einheiten 18 20 24 XMX-Einheiten 144 160 192 GPU-Takt 2.500 MHz 2.670 MHz 1.700 MHz GDDR6-Speicher 10 GB 12 GB 8 GB Speicherinterface 160 Bit 192 Bit 256 Bit Speicherbandbreite 380 GB/s 456 GB/s 512 GB/s Anbindung PCIe 4.0 x8 PCIe 4.0 x8 PCIe 4.0 x16 TBP 150 W 190 W 185 W

Die Intel Arc B580 kommt auf 20 der neuen Xe2-Kerne, was weniger als bei der Arc A580 sind, laut Intel sind die einzelnen Xe2-Kerne aber um 70 % schneller als ihre Vorgänger und haben ein um 50 % höheres Performance-pro-Watt-Verhältnis. Zudem takten die neuen GPUs höher als ihre Vorgänger. Konkret sprechen wir von 2.670 MHz für die Arc B580 in der Limited Edition und von 1.700 MHz für eine Standard-Variante der Arc A580.

Mit ihren 12 GB an Grafikspeicher stellt die Arc B580 in dieser Leistungsklasse wohl mehr als ausreichend Speicher zur Verfügung. Dies dürfte auch eines der Argumente für diese Karte sein. Angebunden ist der Speicher über ein 192 Bit breites Speicherinterface und darüber kommt die Arc B580 auf eine Speicherbandbreite von 456 GB/s. Das PCI-Express-Interface der GPU bietet acht Lanes und ist nach PCI-Express 4.0 spezifiziert. Dies ist selbst bei der Navi-33-GPU so der Fall und wird damit begründet, dass ein doppelt so breites Interface doppelt so viel Chipfläche benötigt. Die Leistungsaufnahme der Arc B580 soll 190 W betragen.

Die Arc B570 wird dann ab Januar 18 Xe2-Kerne zu bieten haben. Entsprechend geringer ist die Ausstattung an Raytracing- und XMX-Einheiten. Den GPU-Takt reduziert Intel auf 2.500 MHz, wenngleich die Custom-Modelle sich hier geringfügig unterscheiden können. An das nur noch 160 Bit breite Speicherinterface angebunden sind 10 GB an GDDR6, die auf eine Speicherbandbreite von 380 GB/s kommen. Das PCI-Express-Interface ist ebenfalls acht Lanes breit. Die Leistungsaufnahme der Arc B570 soll 150 W betragen.

Mit der Arc B580 adressiert Intel das Mittelklasse-Segment oder das, was früher einmal das Mittelklasse-Segment war. Zumindest in der letzten Grafikkarten-Generation wurde dieser Preisbereich kaum mehr bedacht. Eine NVIDIA GeForce RTX 4060 kostete bei Einführung 329 Euro, die AMD Radeon RX 7600 startete immerhin mit 299 Euro. In den USA wird für die Intel Arc B580 ein Preis von 249 US-Dollar vor Steuern angepeilt. Den dazugehörigen Euro-Preis kennen wir noch nicht.

XeSS 2 inklusive XeSS-SR, XeSS-FG und XeLL

Zusammen mit den neuen Karten gibt es neue Software-Funktionen. Dazu gehören XeSS 2 mit einem verbesserten Upsampling, aber auch XeSS Frame Generation (XeSS-FG) und eine Technik zur Reduzierung der Latenzen namens Xe Low Latency (XeLL).

XeSS 2, bzw. XeSS-FG wird aktuell nur mit Intels Arc-Grafikkarten funktionieren. Bei den integrierten GPUs kommt es darauf an, ob diese XMX-Einheiten besitzen oder nicht. Zwischen Frame Generation, Super Resolution und Low Latency wird allerdings unterschieden.

Unterstützung der XeSS-Technologien

XeSS Super Resolution XeSS Frame Generation Xe Low Latency Alchemist (dGPU) ✓ ✓ ✓ Battlemage (dGPU) ✓ ✓ ✓ Lunar Lake (iGPU) ✓ ✓ ✓ Meteor Lake (iGPU) ✓ ✕ ✓ Arrow Lake (iGPU) ✓ ✕

✓ Raptor Lake (iGPU) ✓ ✕ ✕ Alder Lake (iGPU) ✓ ✕ ✕ Tiger Lake (iGPU) ✓ ✕ ✕

Die Xe2-Architektur

Die Arc B580 basiert auf der Xe2-Architektur, wie sie gemeinsam mit den Core-Ultra-200V-Prozessoren alias Lunar Lake in integrierter Form vorgestellt wurde. Allerdings gibt es geringfügige Unterschiede in der Ausstattung der Caches und der Anbindung an das Speicher-Subsystem – nicht weiter verwunderlich, wenn man eine integrierte und eine dedizierte Lösung gegenüberstellt.

Jeder der Xe2-Kerne besitzt acht 512 Bit breite Vektoreinheiten, acht XMX-Einheiten für 2.048 Bit Matrix-Berechnungen und 256 kB an shared L1-Cache. Damit fällt der L1-Cache hier um 33 % größer als in der Umsetzung für die integrierte Grafikeinheit in Lunar Lake aus, denm hier stehen den Xe2-Kernen 192 kB an L1-Cache zur Verfügung. Die ALUs können in der Xe2-Architektur anstatt einer 8-Bit-Operation (SIMD8, Single Instruction, Multiple Data) gleich SIMD16 ausführen, was die Effizienz erhöht. Zudem können SIMD32-Operationen ausgeführt werden.

Die XMX-Einheiten unterstützen die Datenformate INT2, INT4, INT8, FP16 und BF16. FP64-Einheiten gibt es in der Xe2-GPU von Lunar Lake und anders als bei den diskreten GPUs der ersten Arc-Generation ebenfalls, wo man diese FP64-Einheiten weggelassen hatte, ist davon auszugehen, dass diese in den diskreten Varianten von Battlemage vorhanden sein werden. Die komplette Vektor-Einheit kann gleichzeitig Fließkomma-, Integer- und XMX-Operationen ausführen. Die XMX-Einheiten sind zudem in der Lage, 2.048 FP16-Operationen und 4.096 INT8-Operationen pro Takt auszuführen.

Organisiert sind die Xe2-GPUs wieder in Render Slices. In diesen sitzen dann wieder die weiteren Funktionsblöcke wie die Geometrie-, Rasterizer- und HiZ-Einheiten sowie das Pixel-Backend.

Neben den neuen Vektor- und XMX-Einheiten hat Intel die Raytracing-Beschleuniger verbessert. Jeder Xe2-Kern verfügt über einen dieser Beschleuniger. Diese verfügen nun über drei anstatt nur zwei Traversal Pipelines. Die Anzahl der "Box Intersection", also der Schnittpunkte, die berechnet werden können, erhöht sich von zwölf auf 18 – analog zur Erhöhung der Pipelines um 50 %. In den neuen Raytracing-Beschleunigern sind nun aber die Berechnung von zwei Triangle Intersections anstatt derer nur einer möglich. Die Leistung der Raytracing-Beschleuniger soll sich in etwa verdoppeln.

Große BMG-G21-GPU

Mit der Vorstellung der Arc B580 nannte Intel die groben technischen Daten der BMG-G21-GPU. Gefertigt wird die BMG-G21-GPU von TSMC in 5 nm (N5). Die Größe der GPU gibt Intel mit 272 mm² an. Die Anzahl der Transistoren soll 19,6 Milliarden betragen.

Gegenüberstellung der Ada-Lovelace-GPUs

NVIDIA AD107 Intel BMG-G21 Intel ACM-G10 AMD Navi 33 Fertigung TSMC N4 TSMC N5 TSMC N6 TSMC N6 Die-Größe 156 mm² 272 mm² 406 mm² 204 mm² Anzahl der Transistoren 18,9 Milliarden 19,6 Milliarden 21,7 Milliarden 13,3 Milliarden Transistordichte 121,2 MTr/mm² 72,1 MTr/mm² 53,4 MTr/mm² 65,2 MTr/mm²

Damit ist der Chip vergleichsweise groß, denn die AD107-GPU der GeForce RTX 4060 kommt auf 156 mm² bei 18,9 Milliarden Transistoren und Navi 33 der Radeon RX 7600 kommt auf 204 mm² bei 13,3 Milliarden Transistoren. Im Vergleich zur ACM-G10-GPU wird der neue Chip aber natürlich deutlich kleiner. An die in N4 gefertigten Ada-Lovelace-GPUs von NVIDIA reicht die von Intel bei TSMC in Auftrag gegebene Fertigung nicht heran.

Wir haben Intel natürlich gefragt, warum die GPU so groß ist. Bereits bei Alchemist war dies der Fall. Intel führt unter anderem redundante Chipbereiche und Dummy-Transistoren an, die man offenbar mitzählt, während dies bei AMD und NVIDIA nicht zwingend der Fall sein muss. Aber selbst, wenn man hier einen gewissen Prozentsatz abzieht, sind die bei TSMC gefertigten GPUs von Intel noch immer vergleichsweise groß.

Die Intel Arc B580 Limited Edition

Intel wird eine Limited Edition der Arc B580 anbieten, die ab morgen verfügbar sein wird – parallel zu den Custom-Designs. Vom Vorgänger Arc A580 gab es keine solche Limited Edition. Was zu einer Arc A770 Limited Edition gleich auffällt, ist das geringere Gewicht der Arc B580 Limited Edition. Dies dürfte auch einigen Maßnahmen zur Kosteneinsparung geschuldet sein, denn Intel wollte den Preispunkt von 250 US-Dollar halten. Dazu gehört auch, dass auf eine RGB-Leiste, wie bei der Arc A770 Limited Edition, verzichtet wird. Nur ein weiß beleuchtetes Arc-Logo gibt es. Die Oberfläche des Lüftergehäuses ist mit einen Softtouch-Lack versehen.

Die Arc B580 Limited Edition kommt auf eine Länge von etwa 275 mm und belegt zwei Slots. Zwei Axiallüfter kümmern sich um die für den Kühler notwendige Frischluft. Sie haben einen Durchmesser von 85 mm und stehen im Idle-Betrieb, unter einem gewissen Schwellwert für die Temperatur und die Leistungsaufnahme, still.

Auf der Rückseite ist eine Backplate verbaut, welche das PCB komplett abdeckt. Eine Öffnung im hinteren Drittel offenbart, dass das PCB längst nicht die Abmessungen der gesamten Karte hat. Somit kann der hintere Lüfter durch den Kühler hindurchblasen, was wir inzwischen bei fast allen Karten mit AMD- und NVIDIA-GPU so umgesetzt sehen.

Auf der Stirnseite der Karte ist einerseits das beleuchtete "Intel Arc"-Logo und andererseits der 8-Pin-Anschluss zur Stromversorgung zu finden. Auf den Einsatz von 12VHPWR verzichtet Intel weiterhin, wenngleich man diesen bei seinen Datacenter-Karten verwendet. Die Kühlfinnen sind in Querrichtung orientiert, sodass ein Großteil der warmen Luft auf der Stirnseite der Karte entweicht.

Die BMG-G21-GPU verfügt über ein PCI-Express-Interface mit acht Lanes. Dies ist auch klar zu erkennen, wenn man sich die PCIe-Steckleiste anschaut. Hier ist klar zu erkennen, dass bei den Pins an der langen Seite nur zur Hälfte der Pins auch Leiterbahnen im PCB führen. Für die Leistungsklasse einer Arc B580 reichen acht PCI-Express-Lanes aber aus – egal ob wir von PCI-Express 4.0 oder PCI-Express 3.0 sprechen. Ein großer Leistungsverlust ist nicht zu erwarten.

Auf der Slotblende sind die Display-Ausgänge. Intel sieht einmal HDMI 2.1a vor, der 8K bei 120 Hz ansteuern kann. Zudem gibt es gleich drei DisplayPort-Ausgänge. Hier sieht Intel einen primären DisplayPort vor, der UHBR 13.5 (54 GBit/s) unterstützt und damit 8K-Displays mit 60 Hz ansteuern kann. Rechts und links davon vorhanden sind zwei DisplayPort-1.2-Anschlüsse, die UHBR 10 (40 GBit/s) unterstützen.

Intel Arc Graphics Software

Zusammen mit der neuen Hardware, gibt es auch eine neue Intel Arc Graphics Software. Auch diese machte mit den ersten Alchemist-Karten bzw. in den ersten Wochen und Monaten keine wirklich gut Figur. Über die weiteren Monate hat Intel die Arc-Software aber weiterentwickelt. Dennoch wurde mit Battlemage ein Neustart gewagt, den wir in Form einer neuen Benutzeroberfläche und neuen Funktionen sehen.

So können einige der XeSS-Funktionen direkt im Treiber ausgewählt, bzw. aktiviert werden. Eine treiberbasierte Variante von XeLL kann auch ohne Integration in das Spiel die Latenzen reduzieren. Darüber hinaus gibt es im Arc-Treiber neue Overclocking-Funktionen. Diese ermöglichen die Erhöhung des Power-Limits, Speichertakts sowie von Spannung und Takt – dies in Kombination mit der kompletten V/F-Kurve. Wie dies im Treiber aussieht, zeigt Intel in Form einiger Screenshots.

Leider sind wir noch nicht dazu gekommen uns gerade das Overclocking oder auch Undervolting genauer anzuschauen. Wir hoffen dies noch nachholen zu können.