Auffällige Häufung: Radeon-RX-6900/6800-Karten mit defekten GPUs

Ich auch nicht:
* Sind die Chips ja nicht bloß tot, sondern haben Kurschluss auf mehreren Rails oder sind gebrochen.
* Damit das passiert, muss doch eig. schon wirklich große Hitze entstehen?
* Und damit die entsteht, braucht es doch schon eine Verkettung mehrerer Fehler/Umstände:
- Spannung, welche unter normalen Umständen vom Treiber gedeckelt wird - aber per Software anpassbar,
- PL, welches auch unter normalen Umständen vom Treiber gedeckelt wird - aber per Software anpassbar,
- Last, dass die GPU überhaupt "überkocht" und
- Abschaltung vom Thermal Limit (110°) und Shutdown Temp (118°) - meines Wissens nach nicht per Software abschaltbar.

Was man so liest, sind zumindest einige Karten ja auch nicht unter Last gestorben, sondern der Rechner einfach nicht mehr gestartet.
@Darki24
@Grauzone
@DarknessAMD
Ihr seid ja potentielle Betroffene, wie war das denn bei euch?

Daher finde ich Igors Theorie mit den krummen Chips schon nachvollziehbar, sprich das die Chips nach einer gewissen Zeit unter thermal stress (also Wechsel heiß/kalt) kaputt gehen.

Kris, falls du hier mitlesen solltest:
Melde dich ggf. doch mal hier im RDNA2 OC Thread. Dort finden sich einige Leute, die ihre Karten schon richtig durchgepeitscht haben und experimentierfreudig sind, vielleicht kommt man so noch zur ein oder anderen Erkenntnis. Dort läuft die Diskussion (meistens :)) auch recht gesittet ab.


Ohne den weiteren Verlauf des threads komplett gelesen zu haben möchte ich auf deine Frage eingehen:

Hatte die Karte erfolgreich ans laufen bekommen, die neusten Treiber über die AMD Adrenaline Software installiert und die Karte mit Battlefield 1 auf max. settings für ca. 2 Stunden ohne Probleme laufen. Hab die Temperatur überwacht da sie (wie ich in meinem thread beschrieben hab) auf Wasserkühlung umgebaut war und ich testen wollte ob der Kühler richtig funktioniert.

Temperaturen waren bei ca 60 Grad nichts auffälliges.

Eine Woche darauf ist der Rechner dann nicht mehr richtig gestartet MoBo LED war an (VGA). Weitere Details gerne bei mir aus dem Thread entnehmen.


Ich bin atm mit Krisfix im Kontakt. Er will einige GPUs an AMD für eine detailierte Analyse senden. Meine Karte kommt Montag wieder zurück dann sende ich sie ihm nochmal damit er sie mit anderen an AMD sende kann.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Dann ist es bei dir aber nicht der Treiber, glaube das kann man festhalten oder? Zitat aus deinem anderen Thread

"Heute morgen dann den PC in die Wand gesteckt und aus der steckdose kamen funken. Fi und Sicherung des Raums wieder rein. Wieder die Sicherung geflogen. Dann eine andere steckdose verwendet im selben Raum und die Sicherung blieb drin"
 
Zusammenhang Treiber und erneute Stromzufuhr ebenfalls möglich.

Aber warten wir doch endlich mal auf Fakten und nicht auf Spekulatius.
 
Habe vorhin auch aus reiner Vorsicht den alten 22.5.1 Treiber installiert. Hatte zwar selber noch kein Spulenfiepen gehört gehabt, aber man weiß ja nie.

Positiver Nebeneffekt ist das der Verbrauch in Idle jetzt über die Hälfte weniger geworden ist, trotz 2 Monitore in der 1440er Auflösung mit 120 Hz.

22.5.1.jpg
 
Positiver Nebeneffekt ist das der Verbrauch in Idle jetzt über die Hälfte weniger geworden ist, trotz 2 Monitore in der 1440er Auflösung mit 120 Hz.
Ein Wunder was amd über Jahre nie gelang, machst du in Minuten :bigok:
 
Da ich eine 6800 Gaming OC hab interessiert mich das Thema natürlich auch.

Komisch ist nur.....ich hab auf Reddit mal gesucht und nichts gefunden darüber.....
 
Noch ein Positiver Effekt, RBAR funktioniert wieder ohne Ruckler.
 
Bin der Meinung, dass wenn es ein Treiberproblem wäre, man schon von viel mehr defekten Karten hätte lesen müssen, als nur von den paar.
 
Also, so wie ich das sehe ist die Aussage:

"Die Mehrzahl der User hatte den aktuellen Treiber drauf!"

gleichzusetzen mit:

"Die Mehrheit der Amokläufer hat in den letzten 24 Stunden vor der Tat Brot gegessen."

Koinzidenz != Kausalität
Lebt dein "Einhorn noch"? :devilish:
 
Seine Vermutung schlägt schon international Wellen:



Und nicht jeder 14 Jährige Schüler meldet seine kaputte GPU in einem Hardwareforum oder an einen YouTube Kanal. Da darf dann ein genervtes Elternteil direkt zum örtlichen Konsumtempel fahren und eine neue GPU erlegen.
 
Außerhalb von KrisRepair hört man NICHTS. Nicht auf Reddit, nicht auf anderen Formaten, nirgendwo.

Ich denke, es ist einfach ein dummer Zufall, nicht mehr. Ein Zufall, der eine gewaltige Welle gemacht hat.
 
Nichts stimmt auch nicht, gab durchaus paar Leute die sich gemeldet haben, bei PCGH, bei CB, hier im Thread, aber das wird dann teils sofort von paar "AMD Ultras" abgestempelt und sonst wie relativiert.

Vllt melden sich betroffene auch nicht in Foren weil sie eh Gararntie haben, oder wenn defekt dann ist die eben defekt bzw geht nicht mehr und sie wollten eh was anderes oder Geld juckt die nicht, an aber durch die Meldung haben Betriffebe einen Anhaltpunkt.

Die Sache ist nun mal für Leute interessant, die keine Garantie mehr haben, weshalb auch immer, zur Sicherheit einen Treiber zurück und abwarten was da raus kommt, bei NV hat die Sache auch ~2 Wochen gedauert bis es feststand das die Benutzer "zu dumm" waren.

Wenn an der Sache nichts dran ist, wird das im Sand verlaufen, aber ohne zu wissen was im Hintergrund nun wirklich abläuft, angeblich ist AMD ja bereits in Kontakt mit dem.
 
Das heute schon wieder eine Gaspipeline in Europa in die Luft geflogen ist, ist bestimmt auch reiner Zufall und hat mit nichts einen Zusammenhang :fresse:

…..

Wenn an der Sache nichts dran ist, wird das im Sand verlaufen, aber ohne zu wissen was im Hintergrund nun wirklich abläuft, angeblich ist AMD ja bereits in Kontakt mit dem.
Das denke ich auch und zumindest hat es dann wohl AMD nicht direkt abgestritten bzw. untersucht wohl dann die zugesendeten Karten.
 
Oh man, und ich hab meine mit dem 22.11.2 nochmal richtig getreten - nix passiert.

Den für die 7000er hatte ich nicht drauf..
 
Die meisten Leute haben auch noch Garantie und können sie einfach einschicken. AMD müsste es eigentlich merken, wenn sich vermehrt Leute melden.
 
AMD müsste es eigentlich merken, wenn sich vermehrt Leute melden.
Das ist dann aber vergleichbar einem Werk-Service beim PKW statt öffentliche Pannenhilfe: Je mehr Werksservice genutzt wird, desto besser die Pannenstatistik:sneaky: - AMD wird nen Teufel tun, und das an die große Glocke hängen. Wenn die ganzen VC-Problemkarten auch ausschließlich an Handel und Lieferkette zurückgegangen wäre, ohne dass einige öffentlich das Fass aufgemacht hätten, wäre das auch stillschweigend so weiter gelaufen oder maximal als Einzelschicksaal in Serienstreuung abgetan worden...
 
Also ohne zu wissen, dass Krisfix die skills hat eine GPU auf Board Ebene zu reparieren und das ganze auch noch zu filmen und auf YouTube zu laden hätte ich mir wohl oder übel eine neue Karte kaufen müssen.
Sprich eine Analyse der Karte hätte nie stattgefunden.

Die aktuelle Marktsituation der Karten treiben die Nutzer auf den Gebrauchtmarkt die bei einem Fehler/Defekt ihre Karten an jemanden geben der sie repariern kann.

Ich hätte nie gedacht das das überhaupt möglich ist. Was für viele andere sicher auch neu war und den Service von Krisfix nutzen.

Da wundert es mich nicht das er mit seiner Erfahrung und nun wachsenden Bekanntheit dieses Muster der Katzen aufdeckt.


Bin wirklich gespannt ob sich eine Fehlerursache herausbildet oder ob es wirklich nur ein Zufall ist.
 
Seit jahren/Jahrzehnten gibt's Leute die grafikkarten reparieren ;)
 
Seit jahren/Jahrzehnten gibt's Leute die grafikkarten reparieren ;)
Wobei die meisten sich auf die Reparaturen des Kühlungssystem und der Spannungsversorgung beschränken das Know-how und das equipment aktuelle GPU Chip oder RAM Chips zu tauschen haben nur wenige.
AMD müsste es eigentlich merken, wenn sich vermehrt Leute melden.
Auch wenn viele hier AMD als Roten Ritter sehen der die armen User aus der Nvidia Knechtschaft befreien will ansehen ist das in der Realität anders.

Solche Fehler zuzugeben ist halt richtig teuer und da ist es viel viel günstiger nur die Kunden abzuarbeiten die sich von sich aus melden.
Dabei spielt es keine Rolle ob das jetzt die Vaporchamber betrifft oder wenn es um einen defekt aufgrund eines falschen/fehlerhaften Treiber für 2 jahre alte GPU betrifft.

Nicht vergessen ich bin mir sicher das mehr als der Häfte der Kunden mit einer defekten Vaporchamber das Problem nie melden werden weil sie entweder die GPU in der passenden Lage betreiben oder einfach die erhöhte Temperatur + die 10-20% geringer Maximalleistung nicht bemerken.
Und wenn AMD 50% weniger Karten austauschen muß ist das eine richtige Einsparung für AMD.
(es wäre natürlich dann doof wenn später dann reihenweise die GPU's mit defekten Speicher ausfallen würden)

Und das macht so nicht nur AMD sondern hat Nvidia und fast alle anderen Firmen genauso.
 
naja wer VRM macht, kann auch mal eben nen RAM tauschen, GPU geht auch recht einfach mit entsprechendem Equipment, wenn man bei variante LowCost bleibt, ist es immer ne ganz schöne Prozedur die recht langwierig werden kann wenn die kack Lötkugeln nicht da bleiben wo sie hin sollen...
 
Naja, zumindest schreien auch jetzt die YT Kanäle auf die noch nie nennenswerte brauchbare Inhalte lieferten und nur auf clickbait ausgelegt sind. Ein Erfolg mehr 👍
 
Sry, das ist aber wirklich blödsinn wenn durch eine massive Überspannung die interne Struckturen verdampfen wird ein Die regelrecht von innen aufgesprengt.
Das mit erhitzen? Wenn du meinst... es gibt die guten alten Batch TEL Öfen, Laser Annealing Tools und Rapid Thermal Annealing Tools, die machen alles ordentlich Hitze. Natürlich spreng ich jeden Chip, wenn ich da ordentlich Schnaps dranlege, nur das soll durch einen Treiber passieren?, ich denke nein.
 
Das mit erhitzen? Wenn du meinst... es gibt die guten alten Batch TEL Öfen, Laser Annealing Tools und Rapid Thermal Annealing Tools, die machen alles ordentlich Hitze. Natürlich spreng ich jeden Chip, wenn ich da ordentlich Schnaps dranlege, nur das soll durch einen Treiber passieren?, ich denke nein.
Ohne darauf einzugehen ob es stimmt oder nicht drängt sich mir eine Frage auf:
Woher stammt dieses Wissen? Hast du irgend welche speziellen Fähigkeiten, Ausbildungen, Erfahrungen oder ähnliches, welche dir Wissen erschließen um diese Aussage zu tätigen?
 
Rückmeldung zu der Karte dich ich verkauft habe.

Angeblich Core defekt
Da die Karte allerdings, wenn eine zweite dazu gesteckt ist und nicht als Hauptkarte genutzt wird, im Gerätemanager erkannt wird (allerdings mit Fehler 43) kann ich das nicht so ganz glauben. Klar ist an der Karte etwas defekt, sonst würde sie ja anstandslos funktionieren, aber der core wird es wohl nicht sein (meine Vermutung, kann es selbst nicht testen).

Ein Wasserschaden oder ein mechanischer defekt sei auch nicht zu erkennen.

Also entweder ist der Chip einfach aufgrund des alters defekt oder irgendwas anderes ist das Problem.
Somit habe ich beim Umbau auf Wasser offenbar keinen Fehler gemacht, das ist Punkt 1.
Punkt zwei ist, sie lief noch 1 1/2 Tage beim Käufer, bevor die Karte dann nicht mehr funktionierte.

Zwei Möglichkeiten will ich nun nicht ausschließen..
OC hat die Karte einfach sterben lassen oder sie war einfach faulty.

Ärgert mich insofern, weil ich im Hinterkopf habe: " Wäre das bei mir ebenfalls in 3 Tagen passiert?" also alles sehr merkwürdig.

Der Käufer hat krisfix erneut angeschrieben und weitere Infos angegeben, er wartet auf Rückantwort.
Melde mich wieder falls es neue Erkenntnisse geben sollte.
 
Zuletzt bearbeitet:
Rückmeldung zu der Karte dich ich verkauft habe.

Angeblich Core defekt
Da die Karte allerdings, wenn eine zweite dazu gesteckt ist und nicht als Hauptkarte genutzt wird, im Gerätemanager erkannt wird (allerdings mit Fehler 43) kann ich das nicht so ganz glauben. Klar ist an der Karte etwas defekt, sonst würde sie ja anstandslos funktionieren, aber der core wird es wohl nicht sein (meine Vermutung, kann es selbst nicht testen).

Ein Wasserschaden oder ein mechanischer defekt sei auch nicht zu erkennen.

Also entweder ist der Chip einfach aufgrund des alters defekt oder irgendwas anderes ist das Problem.
Also ich habe beim Umbau auf Wasser offenbar keinen Fehler gemacht, das ist Punkt 1.
Punkt zwei ist, sie lief noch 1 1/2 Tage beim Käufer, bevor die Karte dann nicht mehr funktionierte.

Zwei Möglichkeiten will ich nun nicht ausschließen..
OC hat die Karte einfach sterben lassen oder sie war einfach faulty.

Ärgert mich insofern, weil ich im Hinterkopf habe: " Wäre das bei mir ebenfalls in 3 Tagen passiert?" also alles sehr merkwürdig.

Der Käufer hat krisfix erneut angeschrieben und weitere Infos angegeben, er wartet auf Rückantwort.
Melde mich wieder falls es neue Erkenntnisse geben sollte.
Mod BIOS?
 
Nein, kein Mod Bios.

Karte wurde mit MPT auf 200w Limit betrieben, Spannungen herabgesetzt.
Tags zuvor hat er die Karte mit dem Treiber auf +15% gestellt und Benchmarks gemacht, da lief die Karte auch noch.

Erst nach dem Benutzen vom MPT und das absenken des Powerlimits auf 200w hat sie (am nächsten Tag) nicht mehr gestartet.
1673723323810.png

Dies waren seine Settings die er eingestellt hatte auch das "Temp dependet Vmin/max" wurde nicht angehakt.

Da er von der 6700XT schon weiß wie man das MPT benutzt denke ich auch nicht, dass er da einen Fehler gemacht hat, wenn es mehr voltage gewesen wäre ok, aber weniger und gedrosseltes Powerlimit..
Alles sehr merkwürdig.

(Eventuell zuviel TDC auf dem SOC? - wären 5A ca. mehr als stock mit +15% oder nicht?)
 
(Eventuell zuviel TDC auf dem SOC? - wären 5A ca. mehr als stock mit +15% oder nicht?)
Was ist dies für eine Karte? Ich habe eine RX6800 und da steht bei SOC TDC = 30A.

Sein SOC zieht sportliche 71.4 Watt bei der Einstellung. Seine GPU ist auf 200 Watt begrenzt, obwohl sie Standard 253 Watt ziehen müsste bei der Spannung und dem TDC Limit. Mmn sollte das Powerlimit über die TDC Limits und Vmax (mV) gesteuert werden und nicht einfach einen harten Wert fürs Power Limit (W) Strich 200 zu setzen. Hinzukommt noch ein Powertarget, welches um +15% erhöht werden kann und hier gar nicht abgebildet wird.

Hier mein der Default der RX6800:

1673787011575.png
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh