Aktuelles

Ryzen 5000 Whea Fehler (inklusive Reboot) was tun....

ilovebytes

Urgestein
Thread Starter
Mitglied seit
26.09.2007
Beiträge
5.102
Ort
Kärnten/Österreich
gibt es eigentlich noch Betroffene mit dem Whea Fehler inklusive Neustart bei den neuen Cpus ?

vor allem tritt es scheinbar bei 5900X und 5950X auf ?

bei mir lief es die ersten 3-4 Tage eigentlich problemlos und seit gestern hab ich immer wieder mal nen Random Reboot - bis jetzt immer nur im Idle (gibt die Theorie das die Idle Spannung für manche Cpus zu niedrig ist und das System dann abstürzt) aber auch wenn ich die Spannung im Bios als fixen Wertz setze(sprich das ganze im Idle auch nicht abgesenkt wird) hab ich trotzdem die Whea Fehler mit Reboot.

es tritt einfach sporadisch - zwar bis jetzt - nur 2-3x am Tag auf und eben immer im Idle wenn ich zb mal 30 minuten weg bin com Pc - komme ich zurück hat er neu gestartet...

viele meinen es liegt am Agesa und/oder an zu hohem FCLK - gut das mit dem Agesa kann ich nicht ausschliessen, aber der FCLK liegt bei mir bei 1200Mhz und es ist egal ob der Rest Stock (Bios optimized defaults ) oder mit PBO läuft die Whea Fehler treten unabhängig davon auf...

am Agesa kann es eigentlich auch nicht liegen, da es ja die ersten paar Tage nicht aufgetretten ist egal ob Stock oder mit OC...

ich befürchte fast das läuft auf eine RMA hinaus - da man im Inet wohl schon einige mit demselben Problem findet

Nach der Qual endlich eine Cpu zu bekommen (von den Grafikkarten reden wir lieber erst gar nicht), nun wahrscheinlich ein Defekt bei der Cpu, ich muß sagen Amd macht es mir aktuell nicht gerade leicht meine Sympathien für sie aufrecht zu halten :(

habt ihr noch irgendwelche Vorschläge auf Lager was ich sonst noch testen könnte ? aber da der Schei** leider auch komplett Stock auftritt wüsste ich erstmal nicht was ich noch probieren könnte ? eventuell ein älteres Bios zu flashen, aber sonst fällt mir leider nix mehr ein...
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.

fdsonne

Moderator
Hardwareluxx Team
Mitglied seit
08.08.2006
Beiträge
36.136
Ort
SN
Kannst du mal ins Eventlog schauen? Da müssten normal die Fehler reportet werden -> und da müsste normal so ne kryptische Kombo an Hex Zahlen stehen. In der XML Ansicht, der lange RawData String. Diese kann man decodieren um daraus nähere Schlüsse zu ziehen...

Ich hatte sowas seinerzeit mal mit nem 2700U als das Ding gerade frisch raus war. Der ist zwar nicht hart abgenippelt (was vllt dann doch eher für einen Defekt oder so spricht), aber er warf alle Nase lang solche Fehler. Mir hat dann irgendwann nach mehr als einem halben Jahr HP mit nem Bios Update fürs Book geholfen...
 

ilovebytes

Urgestein
Thread Starter
Mitglied seit
26.09.2007
Beiträge
5.102
Ort
Kärnten/Österreich
also das spuckt mir die Ereignisanzeige für die Fehler aus
Protokollname: System
Quelle: Microsoft-Windows-WHEA-Logger
Datum: 11.12.2020 13:21:17
Ereignis-ID: 18
Aufgabenkategorie:Keine
Ebene: Fehler
Schlüsselwörter:
Benutzer: Lokaler Dienst
Computer:
Beschreibung:
Schwerwiegender Hardwarefehler.

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 4

Die Detailansicht dieses Eintrags beinhaltet weitere Informationen.
Ereignis-XML:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
<Provider Name="Microsoft-Windows-WHEA-Logger" Guid="{c26c4f3c-3f66-4e99-8f8a-39405cfed220}" />
<EventID>18</EventID>
<Version>0</Version>
<Level>2</Level>
<Task>0</Task>
<Opcode>0</Opcode>
<Keywords>0x8000000000000000</Keywords>
<TimeCreated SystemTime="2020-12-11T12:21:17.9527572Z" />
<EventRecordID>7927</EventRecordID>
<Correlation ActivityID="{9df21bdd-5db7-4bca-85b4-a69924ee5d4e}" />
<Execution ProcessID="4140" ThreadID="4800" />
<Channel>System</Channel>
<Computer>DESKTOP</Computer>
<Security UserID="S-1-5-19" />
</System>
<EventData>
<Data Name="ErrorSource">3</Data>
<Data Name="ApicId">4</Data>
<Data Name="MCABank">5</Data>
<Data Name="MciStat">0xbea0000001000108</Data>
<Data Name="MciAddr">0x1fff80143e77421</Data>
<Data Name="MciMisc">0xd01a0ffe00000000</Data>
<Data Name="ErrorType">9</Data>
<Data Name="TransactionType">2</Data>
<Data Name="Participation">256</Data>
<Data Name="RequestType">0</Data>
<Data Name="MemorIO">256</Data>
<Data Name="MemHierarchyLvl">0</Data>
<Data Name="Timeout">256</Data>
<Data Name="OperationType">256</Data>
<Data Name="Channel">256</Data>
<Data Name="Length">936</Data>
<Data Name="RawData">435045521002FFFFFFFF03000100000002000000A80300000C150C000B0C14140000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131FE6FF5E89C91C54CBA8865ABE14913BB22476E1CB8CFD60102000000000000000000000000000000000000000000000058010000C00000000003000001000000ADCC7698B447DB4BB65E16F193C4F3DB0000000000000000000000000000000001000000000000000000000000000000000000000000000018020000800000000003000000000000B0A03EDC44A19747B95B53FA242B6E1D0000000000000000000000000000000001000000000000000000000000000000000000000000000098020000100100000003000000000000011D1E8AF94257459C33565E5CC3F7E8000000000000000000000000000000000100000000000000000000000000000000000000000000007F010000000000000002010000000000100FA2000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000400000000000000000000000000000000000000000000000000000000000000000000000000000007000000000000000400000000000000100FA200000818040B32D87EFFFB8B170000000000000000000000000000000000000000000000000000000000000000F50157A5EFE3DE43AC72249B573FAD2C03000000000000009F000206000000002174E74301F8FF0100000000000000000000000000000000000000000000000002000000020000006370581DB8CFD601040000000000000000000000000000000000000005000000080100010000A0BE2174E74301F8FF0100000000FE0F1AD0000000000400000000000000B00005000000004D00000000F9010000230000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000003B00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000</Data>
</EventData>
</Event>

ich werde da leider nicht wirklich schlau draus ausser das es eben von der Cpu kommt und mit dem Cache zu tun hat und Tante Google sagt da gibt es doch einige mit dem Problem auch bei den neuen Cpus :(
 

fdsonne

Moderator
Hardwareluxx Team
Mitglied seit
08.08.2006
Beiträge
36.136
Ort
SN
Ich guck mal am WE, ich hatte seinerzeit für mein Problem mal relativ viel Zeit da in das Decodieren des Strings gesteckt. Da gibts es bei Microsoft im diversen Dev. Artikeln die Aufschlüsslung welcher Wert da für was steht. Hatte mir dafür damals ein Stück Programm gebastelt, was mir den Spaß nach Vorgaben auseinander nimmt - muss aber gucken wo das ist, vllt kann ich dir dann näheres sagen...
 

ilovebytes

Urgestein
Thread Starter
Mitglied seit
26.09.2007
Beiträge
5.102
Ort
Kärnten/Österreich
wäre toll danke - aber ich fürchte es läuft alles auf ne RMA raus da das Ding eben immer auftritt auch komplett Stock und immer mit Reboot :(

edit: ich hab jetzt nochmal pbo und core performance boost explizit auf disabled - mal schauen was er nun im idle treibt...
 
Zuletzt bearbeitet:

MrGingko

Profi
Mitglied seit
22.09.2020
Beiträge
49
Hier mal ne kurze Auswahl zu dem Thema aus anderen Foren:


RMA bringt wohl nix. Ich hoffe/denke ein BIOS Update wirds richten.

Ich habe das gleiche Problem mit einem 5800X, zum Glück nicht unter Last oder Ingame. Tritt bei mir meist während größeren Downloads auf, da bisher nur bei Downloads via GOG Client bzw. Mircosoft XBOX App ... Mit Stock RAM Settings (2133MhZ) hatte ich noch keine Crashs.
 

ilovebytes

Urgestein
Thread Starter
Mitglied seit
26.09.2007
Beiträge
5.102
Ort
Kärnten/Österreich
danke für die Threads muß ich mir mal in Ruhe anschauen, bis jetzt habe ich nur mal den Thread von Igor überflogen und da gibt es doch 2-3 die vermelden das nach der Rma sprich dem Austausch der Cpus das Problem nicht mehr auftritt ?

du meinst also es liegt nur an den aktuellen Biosen ?

schön wäre es - ich teste grad mal noch ob es mit deaktivierten C-State nicht mehr passiert, aber wenn das auch nicht hilft - hab ich wenig Hoffnung das das wirklich durch ein Bios/Agesa Update behoben werden kann...
 

MrGingko

Profi
Mitglied seit
22.09.2020
Beiträge
49
Ich weiß nicht ob's am BIOS liegt, vermute und hoffe nur, da das Fehlerbild so seltsam ist und diverse Leute nach der RMA die selben Probleme haben. Das bei Igor's Lab 2-3 Leute schreiben, das dieses Problem nach der RMA behoben ist, sagt meiner Meinung nach nicht viel aus, da dieses Fehler eben nicht immer bei Task XY auftreten bzw. unter Lasten, sonder häufig bei absolut trivialen Dingen wie Surfen, Downloads, Musikhören etc.
 

fdsonne

Moderator
Hardwareluxx Team
Mitglied seit
08.08.2006
Beiträge
36.136
Ort
SN
Das klingt halt in erster Linie nach einer Instabilität - das Ding ist, heutige Hardware ist halt einfach viel schwerer auf Stabilität zu testen wie das noch vor Jahren der Fall war. Dieser ganze Boostspaß und Co. machen das zudem ungleich schwerer, weil die Stabilität nicht mehr nur durch eine Dauerhaft hohe Last auszutesten ist sondern eben auch in den Phasen des Lastwechsels -> das zu simulieren ist schwer bis unmöglich. Diese Fehler sind in erster Linie erstmal eine Art Report über etwas was schief läuft. Ne RMA kann daran natürlich nur bedingt was richten, wenn die Hardware gar nicht defekt ist, sondern einfach die Settings zu "hart" sind für das, was man da macht... Das kann auch direkt OotB schon der Fall sein, weil man nie genau weis, was die Boardhersteller da noch an "Optimierungen" rein stopfen.

Leider will man das meist gar nicht hören, weil andere ja (angeblich) dieses und jenes Setting fahren und das dort stabil ist, oder zumindest sein soll. Zwischen den Zeilen merkt man dann häufig aber, dass hier und dort dennoch auf Sachen geschimpft wird, kein Plan wann ich das letzte mal echte Abstürze hatte, also wo Software gecrasht ist oder wo der PC sich mit nem Bluescreen verabschiedet hat. Oder wo Hardware Fehler reportet. Normal sollte das nicht der Fall sein... Viele schieben aber sowas dann auf die Software, obwohl der Grund einfach nur zu hohe Settings sind. Auch auffallend im GPU Bereich.



EDIT: hier für alle, die es selbst mal probieren wollen zu decodieren.
Der RawData String basiert laut Microsoft auf dem Common Platform Error Record (CPER) und ist beschrieben im Anhang N der UEFI Spezifikation 2.2 aus 2010

Ich guck mal was das jetzt bedeutet bzw. was die Zeichenfolge aussagen möchte...
 
Zuletzt bearbeitet:

ilovebytes

Urgestein
Thread Starter
Mitglied seit
26.09.2007
Beiträge
5.102
Ort
Kärnten/Österreich
super danke

ja ich würde es ja verstehen wenn es beim OC oder beim Wechsel von hoher Last auf Idle passiert - aber es passierte eben immer nur wenn der Pc schon min ne halbe Stunde im Idle ist. ICh habe jetzt mal wirklich alles deaktvitiert was den Takt irgendwie nach oben treibt - also PBO, Core Performance Boost, Dynamisches OC, Fmax Enhancer, dazu die global C-States - Ram läuft mit 2400 und if mit 1200 Mhz - also wirklich alles stock und dazu an "Optimierern" abgedreht was geht.

Cpu boostet damit maximal auf 3700 Mhz und idle voltage wird dabei nur auf 1V abgesenkt - aber es hilft alles nichts die Whea Fehler mit Reboot bleiben, so wie du eh schreibst ich weiß jetzt eigentlich nicht mehr was ich noch testen soll, ausser es anstatt mit windows 10 H2 2020 mal mit ner alten 1909 zu versuchen, aber das sind wirklich nur noch Griffe nach dem berühmten Stohhalm...
 

fdsonne

Moderator
Hardwareluxx Team
Mitglied seit
08.08.2006
Beiträge
36.136
Ort
SN
Was ich dir schonmal sagen kann -> laut dem notification type, der hinterlegt ist, handet es sich um einen MCE, also um eine Machine Check Exception. Im Spec-Paper steht dazu:
"A Machine Check Exception is a processor-generated exception class interrupt used to system software of the presence of a fatal or recoverable error condition."

Ich würde das mal noch nicht 100% abschreiben, ich guck mal noch weiter - ist bisschen Tricky das ganze zu verstehen.
 

ilovebytes

Urgestein
Thread Starter
Mitglied seit
26.09.2007
Beiträge
5.102
Ort
Kärnten/Österreich
danke für die ganze Mühe die du dir damit machst, ich bin leider vorerst mal mit dem Testen aller möglichen Einstellungen und Vorschläge auch hier aus dem Forum worüber ich sehr dankbar bin beschäftigt. Aber eben leider bis jetzt ohne Erfolg.

"A Machine Check Exception is a processor-generated exception class interrupt used to system software of the presence of a fatal or recoverable error condition."

Das fett gedruckte macht mir auch nicht gerade Mut...

Ich werde wohl am Montag zumindest mal beim Shop wo ich die Cpu ergattern konnte vorfühlen wie es um einen eventuellen Austausch im Zuge der Gewährleistung ausschaut und wie schnell das gegebenenfalls möglich wäre. Wobei ich mir da nicht allzuviele Hoffnungen mache, vor allem wohl wegen der schlechten Verfügbarkeit...

Aber bis dahin werde ich einfach mal alles was mir so einfällt und noch an Lösungsvorschlägen vielleicht hier ankommt ausprobieren :)
 
G

Gelöschtes Mitglied 314968

Guest
Oh boy - da hab ich scheinbar mehr Glück gehabt. o_O

Ich hoffe, du bekommst schnell Ersatz und AMD äußert sich dazu.

Welches Mainboard nutzt du?
 

fdsonne

Moderator
Hardwareluxx Team
Mitglied seit
08.08.2006
Beiträge
36.136
Ort
SN
Sooo ich hab das ganze jetzt mal auseinander genommen. Relevant an der ganzen Geschichte ist das folgende:

Section 1/3:
Section Offset: 58010000
Section Length: C0000000
Revision: 0003
Validation Bits: 00
Reserved: 00
Flags: 01000000
Section Type: ADCC7698B447DB4BB65E16F193C4F3DB
FRU Id: 00000000000000000000000000000000
Section Severity: 01000000
FRU Text: 0000000000000000000000000000000000000000

Section Data:
Validation Bits: 7F010000 / 0b101111111
Processor Type: 00
Processor ISA: 02
Processor Error Type: 01
Operation: 00

Flags: 00
Level: 00
Reserved: 0000
CPU Version Info: 100FA20000000000
CPUBrand String: 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
Processor ID: 0400000000000000
Target Address: 0000000000000000
Requestor Identifier: 0000000000000000
Responder Identifier: 0000000000000000
Instruction IP: 0000000000000000

Nach den Werten gibt es drei Sektionen in der Meldung. Die erste davon deutet auf einen Generic Processor Error hin. Was man anhand des Section Types feststellen kann. Im verlinkten PDF, Table 227 - Section Descriptor -> Section Type auf Seite 1948 (der gedruckten Seitenzahlen).
Wenn man dann den Section Data String weiter aus einander nimmt, kommt man im Feld Processor Error Type auf den Wert 01, was laut PDF, Table 228 - Processor Generic Error Section -> Processor Error Type einem Cache Error entspricht.
Weiter im Feld Operation wird 00 angegeben, gleiche Tabelle ein Feld weiter im PDF ergibt Unknown or generic. Es ist demnach kein Data Read oder Write und keine Ausführung einer Instruktion.

Heißt unterm Strich - der Prozessor hat offenbar einen Fehler im Cache mit einem Eintrag oder Wert. Jetzt kann man bisschen Spekulieren was das ist bzw. warum das so ist.
Mögliche Ursachen wären IF Clock zu hoch oder zu wenig Spannung, Speichertakt zu hoch/zu wenig Spannung oder allgemein natürlich ein Defekt. Generell sollte sowas natürlich nicht auftreten!
Ich würde allerdings in erster Instanz noch nicht vollends ausschließen, dass dir da die Firmware oder ähnliches in die Suppe spuckt bzw. das gar kein Hardware Defekt ist.

Testen kann man natürlich viel - schwer Empfehlungen auszusprechen. Die Daten deuten aber definitiv auf irgendwas in Richtung Cache bzw. IF hin. Ob das zwingend ein Hardware Defekt ist, kann ich von außen leider nicht beurteilen. Vorfühlen beim Händler ist sicher nicht verkehrt. Problembehebung durch Tausch des Prozessors würde ich bei einem Fehler, der verursacht durch eine ungünstige Kombination aus Setting, Board, Firmware/UEFI/Agesa/Bios und CPU und ggf. noch Taktraten allerdings nicht als 100% gesetzt ansehen.

In der ein oder anderen Meldung hast du ja gesagt, du betreibst das Teil auf dem Dark Hero im Modus mit dem Allcore OC + Boost? Tritt denn der Fehler auch auf wenn du komplett alles in Richtung Factory default drehst? Und ich mein damit auch alles, was Asus ggf. so schon drauf drückt was da nicht hin gehört. RAM auf 2133 oder 2400 und IF entsprechend auf sehr niedrig. Wäre ggf. nochmal nen Test wert?

EDIT: vllt noch kurz zur Nachvollziehbarkeit, die Rohdaten da sind in der Bytereihenfolge als Little Endian zu verstehen. Das heist, fürs lesen muss man die Bytes vertauschen. Bspw. wird so aus 0xADCC7698, den ersten vier Bytes aus dem Section Type demnach 0x9876CCAD -> was sich so dann im PDF auch finden lässt. Was wie zu verstehen ist, beschreibt das PDF eigentlich ganz gut.
 
Zuletzt bearbeitet:

ilovebytes

Urgestein
Thread Starter
Mitglied seit
26.09.2007
Beiträge
5.102
Ort
Kärnten/Österreich
@iLovePancakes
auf einem funkelnagelneuen crosshair 8 Dark Hero (auf dem der "alte" 3700X problemlos lief - den ich nun aber leider nicht mehr hier habe :heul: )

@fdsonne
ich hab schon soviele Einstellungsvarianten durchexerziert und ja bei dem Problem soll wohl irendeine Spannung in die Supper spucken und da scheint es eben so zu seine das manche cpus, das wahrscheinlich zu wenig Spannung im Idle locker wegstecken und andere nicht.

ich hab das ganze natürlich auch mit den Stock Settings (load optimized defaults) und zusätzlich Pbo, Fmax Enhancer, Core Precision Boost, Power Down auf disabled und Power supply Mode auf typical getestet - dabei senkt er die Spannung nie unter 1.1 Volt ab und taktet im Idle nicht runter und unter Last maximal auf 3,7 Ghz. Leider hilft auch das nicht - die Reboots im Idle bleiben bestehen....

aktuell teste ich gerade noch folgende Spannungen :

VDDSOC = 1.05
VDDG CCD = 0.950
VDDG IOD = 0.950
CLDO VDDP = 0.900

habe allerdings nur noch sehr wenig Hoffnung das das was bringt....
 

L!ME

Urgestein
Mitglied seit
26.06.2006
Beiträge
2.724
Ort
Bodensee
Mein 5950x läuft nur in Zeitlupe, egal welches BIOS und egal welche Einstellungen. Board ist ein Gigabyte B550i. Mit dem 4650pro läuft es. Denke die CPU hat eine Macke....
 

Scoty

Enthusiast
Mitglied seit
20.04.2005
Beiträge
3.399
Ort
Erde
Ich hatte bei einen 3100 auch ständig reboots. Jetzt mit meinen neuen 5600x auch einmal. Agesa ist Patch C. Als ich denn 3100 noch hatte hatte ich die Agesa vor Patch C. Ich denke es liegt an Agesa aber 100% sicher bin ich nicht. Beim 3100 waren die reboots meist im Idel oder wenn ich kaum was gemacht habe. Ich hoffe mit Patch D wird es besser. An denn CPUs kann es so also nicht liegen da es auch wie in meinen fall Zen2 auch betraff und jetzt Zen3 und ich nutze immer wenn möglich die neuesten Agesa und Treiber.
 

ilovebytes

Urgestein
Thread Starter
Mitglied seit
26.09.2007
Beiträge
5.102
Ort
Kärnten/Österreich
@haudi
was meinst du pll Voltage auf 1,8 fixieren ? hatte ich glaube ich auch schon probiert, aber kann ich ja auch nochmal machen

@iLovePancakes
hatte ich schon auf 1.32V fixiert - hat leider auch nicht geholfen Reboots kammen trotzdem


@Scoty dann müßte aber der 3700X im Dark Hero dasselbe Problem haben und der lief über ne Woche bevor ich den 5900X erhielt absolut problemlos, wie zuvor auch am Crosshair 7 komplett ohne Reboots oder sonstige Macken weder im Idle noch unter Last.

Ich glaube es ist eine Mischung aus beiden Agesa und Probleme bei den Cpus selbst und viele Cpus halten die Macken der Agesa Versionen aus und manche leider nicht und viele mit den Problemen dürften wohl leider so eine Cpu erwischt haben.

Das Problem tratt auch schon bei den 3000ern auf aber nicht so oft wie nun scheinbar vor allem bei den 5900X und 5950X. Fakt ist wirklich Spass macht das so alles nicht und ich überlege gerade was ich am besten weiter mache, Umtausch beim Händler über die Gewährleistung, Rma bei Amd oder Widerruf und kompletter Rücktritt vom Verkauf.

Das Problem ist halt wie macht man es am besten um schnellst möglich eine dann hoffentlich funktionierende Cpu zu haben, den einerseits gibt es die bescheidene Liefersituation und andererseits wohl keine Garantie das man (ausser vielleicht bei ner RMA über Amd selbst) eine Cpu erhält die auch wirklich mit den aktuellen Biosen und Agesas zurecht kommt.

Was mich an der ganzen Sache auch etwas wundert, das hier von Reviewer und Tester nicht mehr INput dazu kommt, entweder hatten die alle Glück mit den Cpus, oder welche aus nem speziellen Pool von Amd erhalten oder was weiß ich.

Igor hatte ja auch Probleme mit seinem 5900X, aber da hörte man dann auch nie wieder was hier wirklich das Problem war....
 

Scoty

Enthusiast
Mitglied seit
20.04.2005
Beiträge
3.399
Ort
Erde
Aktuell bekommt man kaum eine. Einfach warten auf die nächste Agesa. Mein 3100 lief auch Wochen ohne Probleme, dann Bios update gemacht und es fing an. Kann aber auch an Windows liegen oder Chipsatz Treiber usw.. Gibt viele Möglichkeiten. Nur an der CPU kann man das nicht festmachen.
 

ilovebytes

Urgestein
Thread Starter
Mitglied seit
26.09.2007
Beiträge
5.102
Ort
Kärnten/Österreich
Windows wurde schon in 3 verschiednenen Versionen getestet mit und ohne Amd Chipsatztreiber, ebenso alle fürs Board verfügbaren Biose, dazu Crucial und Gskill als Speicher, sowie eine GT710, eine 1080ti und eine 5700XT als Grafikkarte - all diese Komponenten funktionieren am DArk Hero mit einem 3700X problemlos und ohne irgendwelche Reboots oder Abstürze. Aber sobald ich statt des 3700X den 5900X ins System stecke habe ich die Whea Fehler und die Reboots egal ob Gskill oder Crucial egal welche Grafikkarte, egal welches Windows, egal ob mit oder ohne Chipsatztreiber und egal welches Bios und welche Einstellungen.

Im Gegenzug ist es auch beim 3700X egal welche der vorhandenen Komponenten ich verwende, egal welche Bios Einstellungen, egal welche Windows Version, egal ob mit oder ohne Chipsatztreiber, da gab es keine Reboots und Whea Fehler

es kann also nur der 5900X die Fehler auslösen...
 

Scoty

Enthusiast
Mitglied seit
20.04.2005
Beiträge
3.399
Ort
Erde
Dann Tausch in aus falls es einen gibt.
 

ilovebytes

Urgestein
Thread Starter
Mitglied seit
26.09.2007
Beiträge
5.102
Ort
Kärnten/Österreich
genau das ist ja das Problem... :(

ich bin auch schon irgendwie platt, habe im Ganzen glaube ich die letzten Tage min 80 Stunden rumgedoktort an dem System um wirklich sicherzugehen das die Probleme von der Cpu ausgehen, und bin mir da eigentlich mittlerweile recht sicher, vor allem da es wirklich keine Konstellation von restlicher Hardware und Software sowie derren Einstellungen gibt in welcher das Problem nicht auftritt...

naja mal schauen was der Händler morgen meint, aber wie gesagt ich erwarte mir nicht allzuviel.. am ehsten wird es wohl auf nen Widerruf rauslaufen wo ich dann halt wieder ohne Cpu dastehe, aber das ist mir langsam auch schon fast egal...
 

fdsonne

Moderator
Hardwareluxx Team
Mitglied seit
08.08.2006
Beiträge
36.136
Ort
SN
Frag ihn ob er dir ne Leihstellung in Form eines anderen, vllt älteren Modells in der RMA Zeit überlassen kann? Dann hast du wenigstens einen Prozessor, weil du ja oben sagtest, der 3700er ist schon weg?

Ansonsten riecht es halt wie gesagt wirklich nach CPU oder Firmware. Für den ganzen Rest, Speicher, PCIe und Co. gibts andere Fehler. Die da dann auch geworfen werden. Im Code steht aber explizit ein Cache Error. Insofern wird das wohl nur mit anderer CPU oder anderer Firmware, die das Ding entsprechend anders anspricht, anders sein.


Was mich noch interessieren würde -> hast du im Verzeichnis C:\Windows\Minidump irgendwelche Files? Reboot klingt halt nach Bluescreen. Möglicherweise kann man da noch mehr ablesen. Ich würde nämlich nicht nichtmal 100% ausschließen, dass ein Treiber für das Problem verantwortlich ist, der irgendwo an irgend einer Stelle mit dem Prozessor nicht klar kommt. Vergleichbar mit den ersten Microcode Updates von Intel 2018 nach dem Security Zeugs, was sie dann zurück gezogen haben, weil die Software abnippeln konnte in bestimmen Konstellationen. Sowas könnte man ggf. aus dem Minidump auslesen.
Ansonsten wäre noch interessant, ob in anderen WHEA Fehler Einträgen im Eventlog andere Sachen angemosert stehen. Er meldet bei dir ja CPU Core 4 (oder Thread 4 - bin ich mir nicht 100% sicher) -> ein Test ob es was bringt den einen CCD mal zu deaktivieren bzw. vllt die Cores mal zu deaktivieren wäre vllt noch eine Option. Nur fürs Ausschlussverfahren. Gerade L1/L2 Cache ist ja pro Core. Der L3 Cache ist shared pro CCD. Wandert der Fehler spricht es eher nach Firmware als nach Hardware. Wandert er nicht und ist weg beim ausknipsen der richtigen Einheit, dann spricht es eher für Hardware.
 

ilovebytes

Urgestein
Thread Starter
Mitglied seit
26.09.2007
Beiträge
5.102
Ort
Kärnten/Österreich
danke für den Tipp mit ner alternativen Übergangs Cpu - das werde ich dem Händler je nach Antwort auch mal vorschlagen. Ja der 3700x ist leider weg :( (aktuell wünschte ich mir ich hätte mir das verkniffen den wirklich Not für den Tausch hatte ich nicht )

Mindump muß ich schauen. Treiber kann ich mir nicht recht vorstellen ausser den neusten Amd Chipsatztreibern, hatte ich keinerlei weitere Treiber installiert - der Rest für onboard Sound und die Grakas war vorerst von Windows selber installiert. Und die Fehler sind auch ohne Amd Chipsatztreiber vorhanden.

du meinst wahrscheinlich die Prozessor-APIC-ID und da meldet er immer eine andere das geht von 0 bis über 20 ich glaub 26 war das höchste. Aber ich kann natürlich trotzdem mal versuchen die jeweils ein CCD zu deaktivieren - muß nur mal schauen wo und wie das überhaupot geht :d
 

Scoty

Enthusiast
Mitglied seit
20.04.2005
Beiträge
3.399
Ort
Erde
Bei mir wurden damals keine Dump Files erzeugt. Die kommen auch nur bei einen BSOD was ja nie der Fall war. Bei einen Bios Update mit neuer Agesa wird ja auch der Microcode in der CPU geupdatet was ich denke das Problem sein könnte. Darum meinte ich ja auf neue Agesa eventuell noch warten bevor man ohne PC da steht.
 

ilovebytes

Urgestein
Thread Starter
Mitglied seit
26.09.2007
Beiträge
5.102
Ort
Kärnten/Österreich
die habe ich in der Tat auch nicht und ich habe auch nie einen BSOD sondern die Kiste startet einfach von einem Moment auf den anderen neu. Aber wenn es wirklich die Firmware also das Bios/Agesa wäre, warum funktioniert dann bei manchen die Kombo Asus Crosshair Dark Hero und 5900X/5950X problemlos und bei mir und einigen anderen nicht ?

Wenn die Firmware schuld ist sollten die neuen Cpus ja bei keinem am Dark Hero funktionieren ? oder meint ihr mit der Firmware was anderes als das Bios ?
 

Holzmann

The Saint
Mitglied seit
02.05.2017
Beiträge
30.878
Ort
dieser thread
Ganz ehrlich, würde board und CPU tauschen und dann weiter sehen.
 

Scoty

Enthusiast
Mitglied seit
20.04.2005
Beiträge
3.399
Ort
Erde
Board tauschen wird kein Problem werden, CPU eher schon.
 
Oben Unten