Erste unabhängige Benchmarks: Vera-CPU von NVIDIA schlägt sie alle

Thread Starter
Mitglied seit
06.03.2017
Beiträge
120.364
In der vergangenen Woche hat NVIDIA die ersten Racks und Module mit der eigenen Vera-CPU an seine engsten Partner ausgeliefert. Die aktuell anlaufende Agentic-AI-Phase lässt die CPU-Hersteller frohlocken, denn nach den KI-Beschleunigern feiern nun die Prozessoren ein Comeback.
... weiterlesen
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
88 kerne vs. 48 kerne und nur 10% schneller... :fresse:
News nicht gelesen oder nicht verstanden?
Oder die altbackende Denke "Anzahl Kerne == Leistung"? Was ja immerhin bedeuten würde, das du die seit 20 Jahren veraltete Denke Taktrate == Leistung zumindest schonmal abgelegt hast.

Oder hat die Aufmerksamkeitsspanne nicht ausgereicht, weil die relevante Info erst relativ am Ende der News steht:
Die Vera-CPU wird mit einer TDP von rund 450 W angegeben, ergänzt durch etwa 50 W für angebundenen LPDDR5X-Speicher, wodurch sich ein Gesamtpaket von etwa 500 W ergibt. Im Vergleich dazu erreichen konkurrierende x86-Systeme ähnliche Leistungsaufnahmen bereits allein für die CPU.
48 Kerne... 88 Kerne... drölfzig Kerne? Das spielt keine Rolle, es geht um die Leistung pro Watt.
Und da liegt die neue CPU eben vorne. Egal wieviel Kerne, Threads oder sonstwas sie hat.
Die liefert also bei gleichviel oder weniger Stromverbrauch mehr Ergebnisse.
Also eher 10% schneller trotz geringerem Stromverbrauch.

Oder hast du nur nicht verstanden, das Server andere Anforderungen haben als dein Heim-PC?
 
Die Benchmarks skalieren doch sehr merkwürdig...
Ein einzelner Xeon 6980P ist schneller als zwei? Und ein Epyc 9575F mit 64 Kernen ist schneller als zwei Epyc 9755 mit 2x 128 Kernen?
Außerdem wurden die Benchmarks allesamt von Nvidia ausgewählt und der Stromverbrauch durfte nicht aufgezeichnet werden :lol:
Link
"Due to that power management tuning still happening, unfortunately, NVIDIA asked that CPU power consumption monitoring not be engaged during this initial round of benchmarking. [...] NVIDIA also requested only specific workloads relevant to the intended workloads/domains that Vera is catering to in the data center be tested."

Da würde ich erstmal weiter abwarten und Tee trinken :coffee:

Insgesamt scheint es eine saubere ARM-Implementierung zu sein. Seit Apples M1 und Qualcomms Snapdragon X ist ja ziemlich offensichtlich, wie viel Potential die Architektur hergibt. Die Konkurrenz wird dieses Jahr allerdings auch noch erneuert und x86 ist sicherlich kein unwichtiges Argument gegen Nvidia.
 
Zuletzt bearbeitet:
@Liesel Weppen
Auch wenn Du Recht hast - ein etwas freundlicherer Ton wäre schön.
Wir sind hier schließlich nicht auf Computerbase. Danke.
 
Richtig beeindruckend die ganze Hauptplatine mit der dichten Bestückung. Leider ist das alles MCIO, damit nichts für den Heimserver, selbst wenn man es kaufen könnte. Lustig ist auch der 12HPWR, der dient bestimmt zur Prozessorstromversorgung.
 
Die Anzahl der Kerne und der Takt sind in diesem Segment wirklich kein allzu guter Leistungsindikator.
In diesem Segment zählt sicherlich Leistung pro Watt.
Geht ja auch im Privatbereich dahin das man bewusster mit der Energie umgeht, AMD ist hier sehr stark im Desktop Segment und Intel kommt nach den Raptoren mit Arrow-Lake-S auch wieder in konkurrenzfähige Sphären.
Diese VERA-Module sind halt nicht so flexibel konfigurierbar wie ein Xeon oder Epyc Server denke ich, sprich man bekommt was man bestellt und dann ist es so. Nachher irgendwas upgraden wird da nicht drin sein?
 
konkurrenz belebt das geschäft und das sieht schon mal vielversprechend aus. :)
und nvidia hat sowohl know how als auch resourcen, damit das keine eintagsfliege bleibt... man darf gespannt sein, was die prozessoren in weiteren tests und vor allem in der praxis zu leisten im stande sind.
 
News nicht gelesen oder nicht verstanden?
Oder die altbackende Denke "Anzahl Kerne == Leistung"? Was ja immerhin bedeuten würde, das du die seit 20 Jahren veraltete Denke Taktrate == Leistung zumindest schonmal abgelegt hast.

Oder hat die Aufmerksamkeitsspanne nicht ausgereicht, weil die relevante Info erst relativ am Ende der News steht:

48 Kerne... 88 Kerne... drölfzig Kerne? Das spielt keine Rolle, es geht um die Leistung pro Watt.
Und da liegt die neue CPU eben vorne. Egal wieviel Kerne, Threads oder sonstwas sie hat.
Die liefert also bei gleichviel oder weniger Stromverbrauch mehr Ergebnisse.
Also eher 10% schneller trotz geringerem Stromverbrauch.

Oder hast du nur nicht verstanden, das Server andere Anforderungen haben als dein Heim-PC?

nur das bei solchen geschichten der stromverbrauch vollkommen nebensächlich ist... hat gründe warum MS, google & co. (atom)kraftwerke gemietet oder gleich ganz gekauft haben. :fresse:

oder auch: der 9575F ist 13.5% langsamer, bei 27% weniger kernen, und einer TDP von 400W... 12x 128GB speicherriegel brauchen ca 75-90W, server boards selber verbauchen fast nix, da die kein chipsatz haben und alles direkt an der CPU hängt im normalfall, kommen wir also +/- auf die 500W raus....
 
also ich würden den kauf eines atomkraftwerks jetzt nicht gerade als nebensächlich bezeichnen. :unsure:

zudem muss das ganze ja auch noch als abwärme aus dem system abtransportiert werden, was in den ausmaßen nicht gerade banal ist...
 
nur das bei solchen geschichten der stromverbrauch vollkommen nebensächlich ist... hat gründe warum MS, google & co. (atom)kraftwerke gemietet oder gleich ganz gekauft haben. :fresse:
Nein, ist er nicht. Weil Stromverbrauch auch gleich Kühlungsaufwand bedeutet. Ob Google für die CPU einen Stromverbrauch von 500W oder von 600W bezahlen muss, ist denen wahrscheinlich wirklich egal. Aber nicht ob sie 500W oder 600W Abwärme abführen müssen. Weil wieviel Abwärme du aus einem Rack rauskriegst ist nunmal auch begrenzt.
Auf der anderen Seite haste in einem ganzen Rechenzentrum dann gern mal gleich hunderte solcher CPU und dann werden aus 100W mehr oder weniger pro CPU in Summe auch gleich mal 10, 20kW, die nicht nur bezahlt werden müssen, sondern die man da im wahrsten Sinne des Wortes verheizt.

oder auch: der 9575F ist 13.5% langsamer, bei 27% weniger kernen, und einer TDP von 400W... 12x 128GB speicherriegel brauchen ca 75-90W, [...] kommen wir also +/- auf die 500W raus
Jo, also exakt das was im Artikel auch steht: Gleicher Stromverbrauch, aber die NVidia CPU ist 10% schneller.
Und die Anzahl der Kerne ist immernoch komplett irrelevant.
 
Zuletzt bearbeitet:
Die Benchmarks skalieren doch sehr merkwürdig...
Allerdings, es scheint als würde da ggf. die RAM Anbindung limitieren. Die 1,2 TB/s Speicherbandbreite des NVidia Chips sprechen ja dafür, dass er ein sehr breites Speicherinterface hat und auch ein AMD RYZEN AI Max+ PRO 495 hat für 16 Kerne ein 256 Bit Speicherinterface und nutzt LPDDR5x bis 8533 MT/s. Das erfordert das die CPUs fest verlötet werden müssen, erlaubt aber mehr als die doppelte Speicherbandbreite z.B. eines RYZEN 9950X mit ebenfalls 16 Zen Kernen, welcher obendrein eine deutlich höhere TDP hat und damit mehr Multithradperformance der der 495, der bis maximal 120W spezifiziert ist.

Die gesockelten CPUs dürfte hier einen Nachteil haben, was aber nicht erklärt, wieso zwei CPUs praktisch nicht schneller als eine von ihnen sein sollen, denn normalerweise hat man dann bei jeder CPU ja auch eigene RAM Riegeln und damit hat auf einem Board für zwei CPUs jede CPU die volle Speicherbandbreite zur Verfügung die eine alleine hat und beide sollten zusammen die doppelte Speicherbandbreite erreichen. Aber es steht ja auch im Test:
Getestet wurde allerdings nur eine der beiden CPUs auf dem Compute-Module.
Dies dürfte auch für die Dual CPU Systeme mit x86 CPUs gelten, womit es allerdings recht unsinnig ist, überhaupt auf den Systemen mit zwei CPUs zu testen.

der Stromverbrauch durfte nicht aufgezeichnet werden
Wenn nur die TDP angegeben wurde und offenbar angenommen wird, dass die Leistungsaufnahme der TDP entsprechen würde, ist davon auszugehen, Wer aber jemals Benchmarks gesehen hat bei denen die dabei entstehende Leistungsaufnahme auch wirklich gemessen wurde, der weiß das dem längst nicht immer so ist.

Die Konkurrenz wird dieses Jahr allerdings auch noch erneuert und x86 ist sicherlich kein unwichtiges Argument gegen Nvidia.
Ja, Intel hat vor ein paar Tagen den Beginn der Massenproduktion von Clearwater Forest bekannt gegeben und AMD den der Epyc "Venice" CPUs wobei sich dies auf die Modelle mit den kompakten Zen 6c beziehen dürfte, die direkt mit Clearwater Forest konkurrieren werden.

Allerdings dürften beide bzgl. des RAM Durchsatzes gegenüber verlöteten Chips die speziell für solche KI Anwendungen gemacht werden, klar im Nachteil sein. Dafür habe ich nicht gelesen, wie viele PCIe Lanes dieser NVidia Chip hat, vermutlich kaum welche, da er eben für Anwendungen gemacht ist, die alleine auf ihm laufen und keine GPUs anbinden können muss. Für das Training der Modelle dürfte es dann wieder anderes aussehen, weil dafür die GPUs verwendet werden und die CPUs diese ansprechen können müssen. Ob diese Vera CPU dafür überhaupt taugt? Es scheint doch einer eine CPU für eine sehr spezielle Anwendung innerhalb des KI Bereiches zu sein.
Wir sind hier schließlich nicht auf Computerbase.
Eben!

In diesem Segment zählt sicherlich Leistung pro Watt.
Daran habe ich in Zeiten in denen die Größe von Rechenzentren in GW angeben wird, meine Zweifeln. Auch wenn ich sehe, was für TDP Angaben die CPUs und vor allem GPUs inzwischen erreicht haben und was für Angaben für die nächsten Generationen im Raum stehen, scheint mir deren Betriebspunkt doch weit über dem Sweet Spot für die maximale Effizienz zu liegen.

Geht ja auch im Privatbereich dahin das man bewusster mit der Energie umgeht,
Das sehe ich aber im Forum eher wenig, da wollen immer noch viele die CPUs maximal auf den höchsten Allcore Takt bringen, den sie schafft, am liebsten mindestens den maximalen Boosttakt auf allen Kernen.

AMD ist hier sehr stark im Desktop Segment und Intel kommt nach den Raptoren mit Arrow-Lake-S auch wieder in konkurrenzfähige Sphären.
Wenn es um Spiele geht, so sind die X3D von AMD da gut, aber bei Anwendungen ist Arrow Lake vorne, vor allem wenn man, wie ich, die Power Limits entsprechend limitiert:

Arrow Lake 285K Power Limit Skalierung.png


Bei 75W hat man beim 285W gut 80% der Performance wie bei 210W für ein wenig mehr als ein Drittel der Leistungsaufnahme und weit mehr Leistung als jede AMD CPUs bei der Leistungsaufnahme bietet. Keine Ahnung wieso dies scheinbar so wenig Leuten bewusst zu sein scheint. Aber selbst bei höheren Power Limits bleibt der 285K immer effizienter als der 9950X, der den 7950X erst bei mehr als 125W überholen kann.
 
off topic entfernt!
 
Hier wurde aber auch eine Menge gelöscht, was nicht Off Topic war, z.B. die Frage der RAM Bandbreite. Aber je mehr gelöscht wird, umso weniger lohnt es sich überhaupt im Forum zu schreiben, weil es könnte ja doch bald wieder gelöscht werden.
 
nein, das ist nicht korrekt!
ich sehe die verschobenen beiträge noch und da ist absolut nichts dabei was mit dem thema zu tun hatte.

jeder hat einfluss darauf wie gut und sinnvoll der austausch innerhalb der jeweiligen themen ist.
immer nur die moderation dafür verantwortlich zu machen ist mit verlaub einfach nur billig und nimmt einen selbst aus der verantwortung!
 
Das stimmt doch nicht, ich erinnere mich genau, dass wir auch über die Frage diskutiert haben, wieso die Systeme mit 2 CPUs nicht schneller als die mit einer CPU waren. Lügt euch in die eigene Tasche ihr würdet unfehlbar sein, wundert euch dann aber nicht wenn das Forum langsam stirbt.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh