Nur 16 Bit: Einige HPE SAS SSDs fallen nach 32.768 Stunden aus

Veröffentlicht am: von

hpeVia Support-Mitteilung veröffentlicht HPE ein kritisches Firmware-Update für einige seiner SAS-SSDs, da eine Betriebsdauer von mehr als 32.768 Stunden dazu führen kann, dass sämtliche auf dem Laufwerk befindliche Daten komplett verloren gehen. Grund dafür ist ein Zähler in der Firmware, der über eine Länge von 16 Bit verfügt. Gezählt werden hier die Betriebsstunden. 216 ergeben 65.536 Stellen, da auch in den negativen Zahlenbereich gezählt werden kann, bleiben 32.768 Stunden übrig, die als Betriebsstunden gezählt werden können. Dieses Maximum von 3 Jahren, 270 Tagen und 8 Stunden haben einige der Laufwerke nun offenbar erreicht.

"Neglecting to update to SSD Firmware Version HPD8 will result in drive failure and data loss at 32,768 hours of operation and require restoration of data from backup in non-fault tolerance, such as RAID 0 and in fault tolerance RAID mode if more drives fail than what is supported by the fault tolerance RAID mode logical drive."

Weiter heißt es:

"After the SSD failure occurs, neither the SSD nor the data can be recovered. In addition, SSDs which were put into service at the same time will likely fail nearly simultaneously."

Offenbar kommt es bei Erreichen von 32.768 Stunden zu einem vollständigen Datenverlust, wenn kein weiteres Backup vorhanden ist. HPE zieht sich im gleichen Atemzug jedoch aus der Verantwortung, da mit Veröffentlichung des Updates und dem Hinweis darauf der Nutzer der SSDs in der Pflicht steht.

"By disregarding this notification and not performing the recommended resolution, the customer accepts the risk of incurring future related errors."

» zur Galerie

Betroffen sind folgen Speicherlösungen von HPE: HPE ProLiant, Synergy, Apollo, JBOD D3xxx, D6xxx, D8xxx, MSA und StoreVirtual 3200. Per Smart Storage Administrator (SSA) lässt sich die bisherige Betriebsdauer der SSDs auslesen. Die Firmware HPD8 steht ab sofort für die verschiedenen SSDs und Storage-Systeme bereit. Im dazugehörigen Customer Bulletin gibt es dazu weitere Informationen. Unklar ist, warum die SSDs nach Erreichen von 32.768 Stunden komplett ausfallen. Dies wäre sicherlich nicht notwendig.

Warum HPE nur einen Zähler mit einer Länge von 16 Bit gewählt hat, ist nicht bekannt. Vermutlich gab es Beschränkungen in der Größe der Firmware bzw. das ROMs, auf dem sich die Firmware befindet. Allerdings darf dies schon als grober Fehler bezeichnet werden. Es erinnert an die zu kleinen BIOS-ROMs auf manchen Ryzen- und EPYC-Mainboards, die dazu führten, dass neue Prozessoren darauf nicht mehr unterstützt werden konnten. Entweder mussten die Hersteller dann eine nahezu identische Revision 2.0 auf den Markt bringen oder bieten zwei BIOS-Versionen an, um alle Prozessoren unterbringen zu können.