Boot nur noch mit einem Arbeitsspeichermodul – Mainboarddefekt?

2Stoned

Enthusiast
Thread Starter
Mitglied seit
15.12.2006
Beiträge
300
Ort
Erde
Ich hatte schon in der Vergangenheit wiederholt das Problem, dass mein Computer nicht mehr starten wollte. Die Lüfter liefen alle auf Hochtouren, doch Tastatur, Maus und Bildschirme blieben aus. Auf dem Mainboard leuchtete die rote DRAM-Lampe. Beim ersten Mal vor 2~3 Jahren habe ich das Problem behoben, indem ich alle RAM-Module einzeln mit memtest getestet habe, keine Fehler feststellen konnte, alle wieder eingebaut habe, und dann lief die Kiste auf einmal wieder. Beim zweiten Mal, vor etwa einem halben Jahr, half es schon nicht mehr, die Module nur neu einzusetzen, sondern ich musste das RAM-OC deaktivieren. Nun stehe ich wieder vor dem gleichen Problem. Dieses Mal ging der Computer mitten im Betrieb aus. Als ich getestet habe, ob ich die Module einfach aus- und wieder einbauen kann, lief der PC mal kurz mit vier Modulen, dann wollten nur noch drei, und jetzt läuft gar nur eines.
Ich werde indessen sicher jeweils über Nacht mit je einem Modul Memtest laufen lassen und dann jeweils am Morgen das nächste Modul einbauen und den Tag hindurch damit arbeiten, um zu schauen, ob der RAM auch in Ordnung ist. Ich habe jedoch eher den Verdacht, dass es am Mainboard liegt. Einen Ersatz dafür habe ich aber keinen.
Wäre bei meinen verbauten Komponenten irgendetwas bekannt, dass diese momentan, nach ein paar Jahren, abserbeln?
Was könnte ich tun, um andere Fehlerquellen auszuschließen? Oder gibt es einen soliden Mainboard-Test à la memtest? Maintest? Mothertest?
Ich danke für euren Input zu dieser Miesere.

PS: System ist folgendes
CPUAMD Ryzen 3950X
MainboardGigabyte X570 Aorus Ultra
RAMSamsung M391A2K43BB1-CTD 4x 16GB, DDR4-2666, ECC
GPUEVGA RTX 3060 12GB
PCIeDELOCK 20 Gbps USB-C 3.2 2x2 PCIe-Karte mit ASM3242 Chip
Speicher3 NVMe SSDs (2x 1 Tb Samsung 970 Evo Plus (NVMe) und 1x ADAT XPG GAMMIX)
NTFractal Ion+ Plantinum 560 Watt
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Unterdessen konnte ich alle Arbeitsspeichermodule wieder einbauen und die Kiste lief für 2 Tage. Heute ist mir der PC aber schon dreimal abgeschmiert. Einmal nur die Benutzeroberfläche, zweimal kam es aber zum Neustart. Beim letzten Neustart hatte ich die folgende Meldung eines Hardwarefehlers:

Bash:
Uncorrected, software containable error.
CPU: 7 (17:71:0) MC0_STAUTS[-IUE|MiscV|AddrV|-|-
|-|UECC|-|Poison|-]: 0xbc002800000c0135
Error Addr: 0x0000000167a26580
IPID: 0x000000b000000000
Load Store Unit Ext. Error Code: 12
cache level: L1, tx: DATA, mem-tx: DRD

Was kann ich daraus ableiten?
 
Hast du auch den Curve Optimizer laufen? Mach den mal aus.
C-State und PBO auch mal versuchsweise aus machen.
 
Es könnte auch ne wackelige kalte Lötstelle unter dem CPU Sockel sein und wie entsteht sowas? Zum Beispiel bei der Kühlermontage
zu fest angezogen, muß nicht heute gewesen sein, kann auch in der Vergangenheit bei unachtsamen auf/ab montieren passiert sein dass
da mal die Montage-Schrauben nicht optimal angezogen wurden.
Was helfen kann! Einen besseren Metall-Bügel kaufen um den CPU-Sockel die Mainboard-Rückseite stabiler zu halten bei der CPU-Kühler Montage,
sodass kein Bauch entsteht und so alle Pins im Sockel einen gleichmäßigen Anpressdruck haben.
 
Hast du auch den Curve Optimizer laufen? Mach den mal aus.
C-State und PBO auch mal versuchsweise aus machen.
Danke für den Input! Den Curve Optimizer nutze ich nicht (ist, glaube ich, nur für Windows verfügbar). PBO und C-State werde ich mal ausschalten. Kann ich im Anschluss etwas konkretes testen, oder einfach schauen, ob keine weiteren zufälligen Abstürze mehr auftreten?
 
Der Noctua NH-D15 scheint mir eigentlich schon daraufhin designt zu sein, dass da ein gleichmäßiger Anpressdruck vorherrscht. Das ist aber ein Top-Hinweis von dir, und ich werde den Kühler vielleicht einfach mal 180º gedreht einbauen. Habe das System jetzt schon einige Jahre im Einsatz, Wärmeleitpaste habe ich aber letzten Sommer mal erneuert, vielleicht war ich da nicht sorgfältig mit den Schrauben. :/
Beitrag automatisch zusammengeführt:

Hervorragend, dann schaue ich, dass ich diesen mal deaktiviere. Der bedingt aber, glaube ich, eh PBO 2.0, wenn ich das also deaktiviere, sollte der auch aus sein.
 
Ich kann leider nicht testen, ob PBO zu deaktivieren etwas bringt: Sobald ich RAM im Dual-Channel-Betrieb einbaue, startet die Kiste nicht mehr. Ich weiss nicht ob es einfach Glückssache ist, ob die Kiste zum BIOS kommt oder nicht, sobald eine Dual-Channel-Konfiguration eingebaut ist, denn kürzlich konnte ich ja noch mit vier Modulen starten, wobei es dann zum oben-genannte Fehler kam.
Zwei Module im Single-Channel-Betrieb laufen auch mit PBO bisher ohne Probleme.
Die vier Module habe ich mit Memtest86 getestet, zweimal je nur ein einzelnes Modul, und einmal zwei Module in der Single-Channel-Konfiguration (die zwei der CPU am nächsten gelegenen RAM-Slots), wobei kein einziger Fehler aufgetreten ist.
Kann ich den Arbeitsspeicher als Fehlerquelle ausschließen, wenn Memtest86 nichts findet? Dann blieben wohl noch CPU und Mainboard übrig. Gibt es aussagekräftige CPU-Testprogramme, aus denen sich etwas definitives ableiten liesse?
 
Das Mainboard ist in diesem Sinn nur "dumm", es tut selber nix groß dazu.
Klingt für mich so als ob die CPU (auf der die IMC - memory controller sitzt) einen Schaden hat. Vier Riegel sind sowieso immer harte Arbeit für die IMC und auch bei AM4 war das immer ein wenig Glückspiel ob es läuft.
Wenn du kannst teste vorher eine andere CPU, ist auch weniger Aufwand als das Mainboard zu tauschen.
 
CPU wäre ja noch schlimmer (teurer) zu ersetzen. Eieiei (frohe Ostern). Eine Ersatz-CPU habe ich gerade nicht zur Hand, aber es gibt hier in der Nähe so Computer-Reparier-Geschäfte, zur Not würde ich den PC halt da hinschleppen … Gäbe es vorab noch Software, um ein CPU-Problem von einem Mainboarddefekt abzugrenzen?
Danke für deine fachlichen Einsichten! Top!
 
Zuletzt bearbeitet:
BIOS-Batterie habe ich bisher nicht ersetzt. Das wäre aber wohl leicht zu testen, würde allerdings Abstürze im laufenden Betrieb nicht erklären. Behalte das aber im Hinterkopf und werde auch dies nicht unversucht lassen. Danke für die Idee!
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh