HBA defekt oder PCIe Problem?

AliManali

cpt sunday flyer
Thread Starter
Mitglied seit
07.03.2012
Beiträge
5.128
Ort
Ostschweiz
Hi

Wir haben eine neue CPU in meinen C612 Server eingebaut. Habe einen Perc 310 an napp-it durchgereicht. Da hängt an einem Kabel meine Backplane mit 4 SATA SSD, am anderen Kabel eine einzelne SATA HDD. Als ich napp-it hochgefahren habe, wurde erst die Platte nicht erkannt. Jenes rum gebastelt, nicht zum laufen gebracht. Also den HBA in einen anderen PCIe Slot gesteckt. Nun wurde eine SSD im Hotswap Cage nicht erkannt. Also wieder jenes rum gebastelt, hat nichts gebracht.

Sind zwei Kabel am HBA, einmal SAS auf Mini SAS für die Backplane, einmal SAS auf 4x SATA für die Platte.

Zum Glück hatte ich letzthin einen nagelneuen Perc 310 bestellt. Also den Perc und die Kabel ausgetauscht, jetzt läuft alles. Ausserdem hatte ich bisschen den Anpressdruck vom Kühler weg genommen, mein Kumpel hat den angezogen wie ein Stier.

Ich frage mich, ob das Fehlerbild "eine einzelne SSD von einem Port läuft nicht" von den PCIe Lanes her kommen könnte. Eher nicht, oder? Dann würde der HBA nicht erkannt nach mir, oder er läuft halt mit halber Geschwindigkeit. Kann es sein, dass es den anderen HBA gehimmelt hat, warum auch immer?

Kann ich im ESXi irgendwie feststellen, ob HBA und NIC voll angebunden werden?

Gruss und danke
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Kabel untereinander getauscht und geschaut, ob der Fehler mitwandert? Hattest du das probiert mit "Jenes rum gebastelt"?
 
Nein, Kabeltausch ging nicht. Das SAS zu 4x SATA Kabel sitzt irgendwie bombenfest drin, das kriege ich nicht mehr raus. Halt an allen Stecker gewackelt, paarmal neu gestartet, bisschen Anpressdruck vom Kühler genommen. Witzig war, erst lief eine Platte nicht, dann eine SSD von 4 am anderen Port nicht, nachdem ich den PCIe Slot gewechselt habe. Denke der HBA hat einfach das zeitliche gesegnet. Warum auch immer, wir hatten ja nur die CPU getauscht.

Muss eh noch zwei NICs aus China holen, dann bestelle ich gleich noch einen Perc mit, damit ich wieder einen auf Ersatz habe. Kostet ja nicht alle Welt.
 
Nein, Kabeltausch ging nicht. Das SAS zu 4x SATA Kabel sitzt irgendwie bombenfest drin, das kriege ich nicht mehr raus. Halt an allen Stecker gewackelt, paarmal neu gestartet, bisschen Anpressdruck vom Kühler genommen. Witzig war, erst lief eine Platte nicht, dann eine SSD von 4 am anderen Port nicht, nachdem ich den PCIe Slot gewechselt habe. Denke der HBA hat einfach das zeitliche gesegnet. Warum auch immer, wir hatten ja nur die CPU getauscht.

Muss eh noch zwei NICs aus China holen, dann bestelle ich gleich noch einen Perc mit, damit ich wieder einen auf Ersatz habe. Kostet ja nicht alle Welt.
Ärgerlich. Das wäre mein erster Versuch gewesen, um zu prüfen, ob der Fehler mitwandert ; mit anschließendem Tausch des SAS -> SATA Kabels und weiteren Tests, ob das Problem immer noch besteht.

Aber da hätte ich auch kein Vertrauen mehr drin, auch wenn das bzgl. Datenkorruption beim Software RAID unproblematisch sein dürfte (ohne es mit Gewissheit sagen zu können). Aber die HBA, selbst bereits im IT Mode geflasht, kosten tatsächlich nicht mehr die Welt.
 
Bin auf jeden Fall gottenfroh, hatte ich letzthin noch einen auf Halde bestellt. Sonst hätte ich ein langes Gesicht gemacht. :)
 
Schwer zu sagen, ich halte es schon für denkbar, dass z.B. ein Pad eines Chips den Kontakt verliert mit der Zeit, speziell, wenn das PCB gebogen wird... muss ja nur die Lötstelle von Haus aus nicht so gut sein, und irgendwann, bei der mechanischen Beanspruchung gibt eine auf... reicht ja eine von tausenden auf der Karte.
Das ist ja auch das "gefährliche", wenn man an fremden alten Systemen rumfingert, da hast du dann schnell mal den schwarzen Peter, wenn irgendwas von dem Uralt-Kram nicht mehr will.

Wenn ich mir z.B. meinen Inspur 9207-8i ansehe, wie brennheiß der mit dem orig. Kühler wird... tät mich nicht wundern, wenn das Material da einfach massiv schneller altert als gewohnt.

Wobei Kabel schon immer der Tatverdächtige Nr. 1 sind... gut, wenn man da genug zum tauschen und probieren hat...
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh