• Hallo Gast!
    Noch bis zum 20.07. kannst Du an unserer Umfrage zum Hersteller des Jahres teilnehmen! Als Gewinn verlosen wir unter allen Teilnehmern dieses Mal eine Grafikkarte Eurer Wahl für bis zu 1.000 EUR - über eine Teilnahme würden wir uns sehr freuen!

System hängt sich total auf bei hoher Last auf Grafikkarte

roboem

Experte
Thread Starter
Mitglied seit
26.11.2015
Beiträge
5
Hallo,

als Upgrade meines über zehn Jahre alten Supermicro-Xeon-Server habe ich mir ein "neues" System zusammengekauft. Leider habe ich nun ein Problem und weiß nicht, wie ich es angehen soll und hoffe daher auf eure Unterstützung.

Kurz, lasse ich mit Forge WebUI oder ComfyUI mit einem Stablediffusion-XL-Modell ein Bild erstellen, verschwindet mindestens die ganze Grafikkarte aus dem System (wird mit lspci nicht mehr angezeigt), meistens schaltet sich jedoch der komplette Server aus und lässt sich selbst über BMC nicht mehr einschalten.

Board: Asrockrack X470D4U
Prozessor: AMD Ryzen 5 Pro 5650G
Grafikkarte: Nvidia 2080 Ti
Netzteil: BeQuiet Straight Power ATX BQT E9-400W
Betriebssystem: Debian Bookworm

  • Ich hatte schon das Netzteil in Verdacht, jedoch tritt das Problem auch bei Begrenzung der Kartenaufnahme auf 100 Watt auf.
  • Lasse ich LLM per Ollama arbeiten, tritt das Problem nicht auf. Mit Stable Diffusion 1.5 war das Problem bisher nicht reproduzierbar.
  • Ich habe RAM- und CPU-Stresstests über Stunden durchgeführt ohne Probleme.
  • Die gleiche Karte läuft in einem Supermicro X9DRi-LN4F+ mit 2x Xeon E5-2630L ohne Anstalten.
  • Ich habe die Karte bereits in bereits in beiden x16-Plätzen probiert.
Was kommt als Ursache in Betracht? Wie kann mich dem Problem annähern?

Grüße,
Rolf
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Netzteil zu 99,9 %
 
Danke für eure Meinungen.
Dann werde ich doch ein anderes Netzteil kaufen.
Wie gesagt die Karte bei Nutzung der LLM auch 260W und Stablediffusion mit SD1.5 auch. Ebenso habe ich die Aufnahme über nvidia-smi -pl auch schon auf 100W gedrosselt und das Problem trat weiterhin auf.
 
Schwer, die E9 sind gut, alt hin oder her. Hat bei mir in der 530W Version jahrelang ein HD 6970 Crossfire ertragen...
Läufts bare metal oder in einer VM?

Aber... ein modernes Niederlast-Effizientes NT ist sicher kein Fehler... Ist halt schwierig, Stalbe Diffusion ist jetzt auch nicht unbedingt besonders "stable"... lel...
 
Tja, ist tatsächlich das Netzteil. Ich habe mir jetzt die Mühe gemacht, das neue Board mit dem Netzteil des bisherigen Servers zu betreiben (ist kein ATX, daher ans Supermicro-Gehäuse gebunden).
Und ja, auch beim exessiven Generieren mittels Stable Diffusion läuft alles stabil.
Beitrag automatisch zusammengeführt:

Läufts bare metal oder in einer VM?

Aber... ein modernes Niederlast-Effizientes NT ist sicher kein Fehler... Ist halt schwierig, Stalbe Diffusion ist jetzt auch nicht unbedingt besonders "stable"... lel...

Eigentlich als LXC unter Proxmox, aber zum Test hatte ich es auch bare metal installiert.

Und Stable Diffusion - ja, hin und wieder kippt es aus den Latschen. Aber dabei nimmt es nicht mal den Container mit, geschweige denn den Hypervisor.
Beitrag automatisch zusammengeführt:

Okay, jetzt ist die Frage, welches Netzteil kommt nun rein?

Zugegeben, ich wollte bei der Auswahl sparen und habe das E9 gebraucht gekauft. Meint ihr wirklich es liegt am Alter des Exemplars, oder dass es auch wenn es 400 Watt liefern soll, die Verteilung auf die Schienen nicht passend ist?

Board+Prozessor+RAM+2xNVME liegen während Stresstest ohne GPU bei ~140Watt und mit GPU bei 380 Watt (jeweils Wall mit dem 900 Watt-Netzteil von Supermicro).

Zu 95% der Zeit wird das System um die 70Watt ziehen, daher mein Bestreben kein überdimensioniertes Netzteil zu verwenden.
 
Ist zwar knapp, hätte aber funktionieren müssen. Na ja, das Dingen ist ja eh uralt, von 2012 denke ich.
 
Zugegeben, ich wollte bei der Auswahl sparen und habe das E9 gebraucht gekauft. Meint ihr wirklich es liegt am Alter des Exemplars, oder dass es auch wenn es 400 Watt liefern soll, die Verteilung auf die Schienen nicht passend ist?
Schwer zu erraten, vor allem auch, da du es ja gebraucht gekauft hast, also keine Vorgeschichte kennst dazu.

Leistung ist knapp, müsste/sollte aber gehen... wobei... wer weiss.

BeQuiet wieder? Pure Power 13M vielleicht, sieht ganz interessant aus, alternativ Power-Zone, tät aber gleich etwas stärker kaufen, nimmt sich im idle-Verbrauch fast nix mehr und kostet auch nicht die Welt mehr.. also so 550W bis 850W, je nach dem, wie die Preise so sind.
Das Pure Power soll wohl etwas kürzere Kabel haben, musst dir ansehen, obs dir reicht (steht detailliert auf deren Homepage)... mir hats gereich.

Sonst gibts auch andere Hersteller, schau halt ins Netzteil-Forum. Wichtig ist, dass es bei wenig Leistung gut läuft.

Eigentlich als LXC unter Proxmox, aber zum Test hatte ich es auch bare metal installiert.
Haja, NV Treiber unter Linux sind ja auch so ne Sache, drum die Frage.
 
Zu 95% der Zeit wird das System um die 70Watt ziehen, daher mein Bestreben kein überdimensioniertes Netzteil zu verwenden.

Vereinfacht ausgedrückt:

Ein Netzteil nimmt immer nur das auf, was gerade in diesem Moment vom Computer benötigt wird. Plus bisschen "Verwaltungsoverhead".

Dieser Overhead bedeutet - ganz, ganz grob gesagt - dass das Netzteil intern ein bisschen mehr Spannung erzeugen musss, um exakte und saubere 12 Volt abgeben zu können. Und dieser "Überschuss" wird intern verheizt, damit er nicht deine Hauptplatine brät.

Ein 1000-Watt-Netzteil muss für diesen Overhead nicht mehr verbraten als eines mit 500 Watt. Deswegen tun sich große Netzteile mit Gold- und Platin-Energiestandards leichter als kleine: Sie haben zwar in der Menge die gleichen Verluste, aber prozentual sind es weniger.

Hatte übrigens seit ich mit IT angefangen habe (siehe Signatur) vor drei Wochen zum ersten Mal ein defektes Netzteil...
Beitrag automatisch zusammengeführt:

Board+Prozessor+RAM+2xNVME liegen während Stresstest ohne GPU bei ~140Watt und mit GPU bei 380 Watt (jeweils Wall mit dem 900 Watt-Netzteil von Supermicro).

Wenn du das mit einem 400-Watt-Netzteil fährst, wundert es niemanden, dass das nicht funktioniert.

Hebe das 400er auf, das ist sicher nicht defekt. Aber hier halt überlastet, weil zu den ermittelten 380 Watt sicher noch Peaks kommen.
 
Ich danke euch für eure Rückmeldungen.
Dann werde ich mich nochmal näher mit dem Netzteilforum befassen und auf 500-550 Watt schielen. Hersteller sind mir egal solange es nichts undbekanntes oder ominöses ist.
Ich benötige 1x24 polig fürs Board, 1x 8polig für die CPU und für die GPU zwei mal 8polige PCIe. SATA oder so ist nicht nötig.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh