Toshiba MG10F im Test: Toshibas neue Enterprise-Festplatte mit 22 TB

An einem RAID-Controller ist es nicht unüblich auf Bit-Ebene wöchentlich ein Verify zu machen.
Das nennt sich Scrubbing und schon weil das komplette Lesen solcher HDDs recht lange dauert, würde ich empfehlen das eher monatlich statt wöchentlich zu machen.
daher bitte nicht falsch verstehen, aber bei einer "Enterprise"-Platte würde ich mir auch einen Benchmark wünschen, bei dem die Festplatte einmal vollständig (meinetwegen mit großen Daten) beschrieben und ausgelesen wird. Meine Erfahrung ist, dass relativ früh die Platte anfängt "Pausen" einzulegen und die Datenate auch mal auf 30MB/s runterbricht oder die Platte sich auch mal länger reorganisieren muss.
Wenn es nicht um HDDs mit SMR geht oder Vibrationen eine Rolle spielen, dann liegt dies vermutlich an der Art der Zugriffe, also Größe und ggf. Fragmentierung der Dateien die da gelesen werden. Dazu kann es auch am Filesystem oder Host liegen, z.B. auch an der SW die diese Dateien ausliest. Die einzige Situation, von Vibrationen abgesehen, in der HDDs für Unterbrechungen sorgen könnten, wäre wenn sie Probleme haben einen Sektor korrekt zu lesen und dies auch nicht mit Hilfe der ECC korrigieren können. Dann wiederholt die Platte den Versuch diesen Sektor zu lesen bis sie es schafft oder bis zum Timeout (dann meldet sie einen Lesefehler) und der ist Dank TLER einstellbar und dürfte bei denen meist auf 7s eingestellt sein.

Jede ordentliche RAID Lösung wird dann in einem echen RAID (also nicht RAID 0, welches eigentlich ein AID 0 ist) die Daten anhand der Redundanz rekonstruieren und den problematischen Sektor auf der Platte die den Lesefehler gemeldet hat, damit überschreiben. Dies kann man verhindern, indem man die SAS Versionen sind, da kann man die Sektoren mit einer anderen Größe Formatieren, also 520 oder 528 statt 512 Bytes und in diese zusätzlichen Bytes schreibt der HW RAID Controller dann eine eigene ECC. Er stellt dann die Platten so ein, dass sie einfach nur dumm die Daten lesen und so weitergeben wie sie gelesen wurden und macht die Fehlererkennung und -korrektur selbst und wenn er einen Fehler erkennt den er nicht korrigieren kann, dann liest er sofort die Daten aller anderen Platten um die Daten aus der Redundanz zu rekonstruieren und den Sektor mit dem Fehler zu überschreiben. Dies spart die Zeit für die Wiederholungen beim Lesen wie sie bei den SATA Platten eben anfallen, weil man da die Sektorgröße eben nicht ändern kann.

Das war aber vor allem für die Storages mit den 15krpm HDDs relevant, da diese für die anspruchsvollsten Anwendungen waren, aber die sind inzwischen von SSDs verdrängt worden, denn wenn es um Performance geht, sehen auch die schnellsten Enterprise HDDs gegen Enterprise SSDs einfach kein Land. Dies 3.5" HDDs mit hohen Kapazitäten sind für Storages wo die Performance nicht kritisch, aber der Preis pro TB gering sein soll und der Preis wird mit den SATA Varianten im Vergleich zu den SAS Versionen schon wegen der Host Controller eben noch ein wenig geringer ausfallen. Dafür muss man dann eben mit der Krücke TLER leben.
In meinen Augen verkaufen die Hersteller unter dem Marketing-Begriff "Enterprise" Festplatten, die einfach nur größer und im Zugriff lauter sind als die Pre-Helium-Generationen. Wirklich Enterprise ist da nicht viel.
Keine Ahnung wieso du dir anmaßt definieren zu dürfen was Enterprise ist und was nicht. Wenn deine Anforderung ist, das die eine konsistente Performance liefern, dann musst du da tiefer in die Tasche greifen und die SAS Varianten nehmen und dazu einen ordentlichen SAS RAID Controller oder eben gleich SSDs. Am Besten gleich die Intel Optane, denn wie schrieb Tweaktown so passend im Review der Optane 905P:
Performance kostet eben und wenn man auch unter anspruchsvollen Lasten und Bedingungen Performance will, kostet es mehr, ggf. auch viel mehr. Da muss man dann ggf. auch mal die Umgebung überarbeiten in der die HDDs arbeiten, damit es doch keine Vibrationen gibt, auch nicht plötzlich laute Geräusche, denn was dann passieren kann, zeigt das Video "Shouting in the Datacenter".

Da sieht man die Vibrationssensoren bei der Arbeit. Damit die Köpfe bei Schreiben nicht Daten auf einer Nachbarspur überschreiben, wenn sie durch Vibrationen aus der Spur zu kommen drohen, werden die Schreibzugriffen dann abgebrochen und auch beim Lesen können Vibrationen eben dafür sorgen, dass die Lesevorgänge wiederholt werden müssen, weil die Köpfe eben nicht mehr korrekt in der Spur positioniert sind. Wir reden da von Toleranzen im unteren nm Bereich!
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Keine Ahnung wieso du dir anmaßt definieren zu dürfen was Enterprise ist und was nicht.
Ich maße mir nur an den Begriff "Enterprise" zu kritisieren, da es ja eben keine richtige Definition dafür zu geben scheint, es aber etwas suggeriert, was nicht der Fall ist. Sind sie etwa nur für Rechenzentren, die dann aber bitte alle ihr Verify auf 1 Monat einstellen? Die Workload bei der SAS-Variante liegt übrigens auch bei 550TB pro Jahr.

"Enterprise" ist für mich derzeit nichts Halbes und nichts Ganzes. Für ein seriöses Rechenzentrum nicht professionell genug, für ein SW-RAID zu Hause unpassend (da wahrscheinlich mit TLER), also irgendwie eher etwas für jemanden zwischen SW-RAID und Datacenter -> kleine Zielgruppe.

Daher ja auch mein Wunsch nach mehr Transparenz, z.B. durch weiterführende Tests. Ich will mir nicht anmaßen, zu definieren was "Enterprise" zu bedeuten hat - ich will wissen, was der Hersteller damit meint.
 
Ich maße mir nur an den Begriff "Enterprise" zu kritisieren, da es ja eben keine richtige Definition dafür zu geben scheint, es aber etwas suggeriert, was nicht der Fall ist.
550TB/Jahr sind mit Zulassung für Dauerlast gleichzusetzen, die hören ja nicht auf zu arbeiten, wenn man mehr Datenvolumen pro Jahr überträgt.
"Enterprise" ist für mich derzeit nichts Halbes und nichts Ganzes. Für ein seriöses Rechenzentrum nicht professionell genug
Das ist deine Meinung, die allermeisten Rechenzentren sehen dies anderes, die kaufen die Dinger nämlich. Man muss eben immer die Hardware auswählen die zur Aufgabe passt und für performancekritische Anwendungen sind HDDs sowieso schon lange nicht mehr relevant, da haben SSDs übernommen und dafür waren solche HDDs auch vorher nicht gedacht, sondern eben die SAS Platten mit 10 oder 15krpm.
für ein SW-RAID zu Hause unpassend (da wahrscheinlich mit TLER)
Wo ist das Problem mit TLER? Es scheint dir nicht klar zu sein, was TLER ist und was eine Platte mit TLER von einer ohne unterscheidet. Wofür es da ist, hatte ich doch gerade im letzten Post geschrieben: Wenn eine HDD einen Sektor nicht mehr fehlerfrei lesen kann, was ja gemäß den Spezifikationen schlimmstenfalls bei 1:10^15 gelesenen Sektoren der Fall sein darf, so wiederholt die Platte den Lesevorgang in der Hoffnung die Daten doch noch lesen zu können. Wie lange sie das macht bis sie aufgibt (Timeout), ist bei HDDs mit TLER einstellbar und meist bei denen auch per Default auf einen geringeren Wert voreingestellt. Bei denen ohne TLER ist der Wert fix und meist länger, bei den WD Green waren es früher 14s, während es bei den Red eben 7s waren, die Red haben TLER und daher kann man da den Timeout auch einstellen. Wieso sie das für ein SW RAID, ob zu Hause oder sonstwo nun ungeeignet machen sollte, verstehe ich beim besten Willen nicht.

Für SW RAIDs braucht man eigentlich kein TLER, da diese meist viel länger auf eine Antwort warten, egal ob die Daten oder eben einen Lesefehler, als ein HW RAID Controller es macht. Die HW RAID Controller warten meist nur 8s auf eine Antwort bevor sie die Platte als defekt aus dem RAID werfen und deshalb sollte man da eben auch nur Platten mit TLER nehmen, die anderen fliegen früher oder später dann als defekt raus, wenn sie einmal ein Problem haben einen Sektor innerhalb dieser 8s zu lesen und dafür können z.B. auch Vibrationen verantwortlich sein.
also irgendwie eher etwas für jemanden zwischen SW-RAID und Datacenter -> kleine Zielgruppe.
Sage das nicht den Herstellern, die würden sich sonst fragen wer die ganzen Deppen sind die sie trotzdem kaufen :d

Sorry, aber kennst du den Witz mit dem Autofahrer der auf der Autobahn fährt, im Verkehrsfunk die Warnung vor einem Geisterfahrer auf seiner Strecke hört und denkt: Einer? Hunderte! Der Autofahrer bei diesem Thema bist du!
 
550TB/Jahr sind mit Zulassung für Dauerlast gleichzusetzen, die hören ja nicht auf zu arbeiten, wenn man mehr Datenvolumen pro Jahr überträgt.
Sagt derjenige, der jedem ungefragt sagt, dass Festplatten nicht länger als 5 Jahre betrieben werden sollte, da der Hersteller das nicht vorsieht? Aber planmäßig von Anfang an die Spezifikation mit 550TB/Jahr zu überschreiten ist nun okay?
Das ist deine Meinung, die allermeisten Rechenzentren sehen dies anderes, die kaufen die Dinger nämlich.
Natürlich kaufen die allermeisten Rechenzentren die. Davon war aber nicht die Rede. anyway...
und für performancekritische Anwendungen sind HDDs sowieso schon lange nicht mehr relevant,
Es geht nicht um Performance, sondern darum ein erfolgreiches Rebuilt in vertretbarer Zeit zu realisieren und bei nicht unüblichem wöchentlichem Verify die Spezifikation nicht zu brechen.
Es scheint dir nicht klar zu sein, was TLER ist und was eine Platte mit TLER von einer ohne unterscheidet.
Ich glaube du verstehst da etwas falsch, sonst hättest du verstanden weswegen TLER bei HW-RAID besser und bei SW-RAID schlechter ist, vielleicht schaust du mal hier: https://en.wikipedia.org/wiki/Error_recovery_control#Standalone_vs._RAID_considerations

Sorry, aber kennst du den Witz mit dem Autofahrer der auf der Autobahn fährt, im Verkehrsfunk die Warnung vor einem Geisterfahrer auf seiner Strecke hört und denkt: Einer? Hunderte! Der Autofahrer bei diesem Thema bist du!
Deine Antworten sind allein für dich hilfreich. Das führt hier zu nichts, ich bin raus.
 
Sagt derjenige, der jedem ungefragt sagt, dass Festplatten nicht länger als 5 Jahre betrieben werden sollte, da der Hersteller das nicht vorsieht?
Nein, ich weise nur gerne darauf hin, die vom Hersteller geplante Nutzungsdauer eben nur 5 Jahre beträgt, manche halten eine 10 Jahr alte HDD ja noch für jung und wundern sich, wenn die dann schlappt macht. Auch weiß ich darauf hin, dass die meisten HDDs auch länger halten werden, allerdings eben nicht ewig.

TLER bei HW-RAID besser und bei SW-RAID schlechter ist
So ein Blödsinn. Bei einem HW RAID ist TLER ein Muss, denn wie schon geschrieben warten die meisten HW RAID Controller 8s auf eine Antwort, bevor sich die HDD als defekt aus dem RAID werfen und die Platten ohne TLER versuchen eben länger als 8s problematische Sektoren doch noch zu lesen, fliegen dann also beim ersten mal wo sie ein Problem haben einen Sektor zu lesen und dies länger als 8s dauert, aus dem RAID. Aber SW RAIDs haben in aller Regel längere Timeouts und dann ist TLER im Prinzip egal, die Verzögerung wenn dann mal eine Platte einen Sektor nicht lesen kann, ist allerdings höher, wenn die Platten einen längeren Timeout haben und es nicht schafft,

Da geht es um RAID vs. Standalone, nicht um HW RAID oder SW RAID, was ein großer Unterschied ist. Zu SW RAIDs steht da nur: "In a software RAID configuration whether or not TLER is helpful is dependent on the operating system." Eben, nämlich davon abhängig, wie lange das SW RAID auf eine Antwort von einer Platte wartet, aber meines Wissens haben die meisten SW RAID und auch ZFS da recht lange Timeouts. Lange timeouts bedeuten dann im Zweifel aber eben auch eine lange Verzögerung in der nichts passiert.

Im übrigen ist der Eintrag dort ganz schlecht geschrieben, z.B.:
"It is best for TLER to be "enabled" when in a RAID array to prevent the recovery time from a disk read or write error from exceeding the RAID implementation's timeout threshold. If a drive times out, the hard disk will need to be manually re-added to the array, requiring a re-build and re-synchronization of the hard disk." "If a drive times out" bezieht sich auf den Timeout des RAID Controllers und da sind es bei HW RAID Controllern per Default eben meist 8s, dies hatte ich aber schon geschrieben.

"Enabling TLER seeks to prevent this by interrupting error correction before timeout, to report failures only for data segments." Erstens kann man TLER nicht enablen, dies ist eine Eigenschaft die die Platte hat ober eben nicht, man kann bei denen mit TLER eben nur die Timeout einstellen und bei denen ohne halt nicht. Was sie da konkret meinen ist also, einen kurzen Timeout einzustellen, der Rest funktioniert dann in beiden Fällen gleich, die Platte versucht halt bis zum Timeout oder bis sie es geschafft hat, je nachdem was zuerst eintritt, die Daten zu lesen. Auch HDDs ohne TLER geben es ja irgendwann auf.

"In a stand-alone configuration TLER should be disabled. As the drive is not redundant, reporting segments as failed will only increase manual intervention. Without a hardware RAID controller or a software RAID implementation to drop the disk, normal (no TLER) recovery ability is most stable." Manual intervention ist richtig, bei einem RAID bekommt man nur die Verzögerung mit, aber nichts vom Lesefehler, außer man hat bei TLER nicht aufgepasst und die Platte ist aus dem RAID geflogen, da ja das RAID die Daten aus der Redundanz rekonstruiert. Standalone, also ohne RAID, hat man keine Redundanz und der Fehler wird an das Programm gemeldet, welches den Lesevorgang angefordert hat. Was es daraus macht, hängt vom Programm ab, ist es ein Mediaplayer, wird er ihn meist ignorieren, dann hat man im Video vielleicht einen kurzen Freese des Bildes oder eine kurze Tonstörung, aber mehr auch nicht. Kopierprogramme sollten abbrechen, aber da gibt es ja auch solche die extra so ausgelegt sind, dass sie weitermachen, Unstoppable Kopiere, dann hat man eine Silent Data Corruption, aber nicht weil die Hardware falsch gearbeitet hätte, sondern die SW den Fehler ignoriert hat.

Richtig wäre es den Fehler gemeldet zu bekommen um die Datei auf dem Backup rekonstruieren zu können. Für Standalone HDDs ist es besser den Timeout höher einzustellen, dann versucht sie ja länger die Daten doch noch korrekt zu lesen und bei HDDs ohne TLER ist der Timeout eben in aller Regel höher eingestellt, meist so 14s, statt eben 7s bei denen mit TLER. Wenn die Datensicherheit allerdings davon abhängt das eine HDD die es nach 7s nicht geschafft hat problematische Daten zu lesen, dies dann nach weiteren 7s doch noch schafft, sollte man sich eher mal Gedanken über Backups machen oder eben ein RAID 1 nehmen. Oder man stellt dann eben den Timeout der Platte mit TLER höher, dies geht ja, der Timeout ist ja einstellbar, dies macht ja eben TLER aus, aber die Art der Fehlerkorrektur, nämlich mit wiederholten Versuchen die Daten doch noch erfolgreich zu lesen, bleibt in beiden Fällen gleich und damit ist der Teil "normal (no TLER) recovery ability is most stable" halt reichlich unsinnig. Die Methode ist gleich, nur wie lange es per Default versucht wird, unterscheidet sich.
Das führt hier zu nichts, ich bin raus.
Ja, denn leider kannst du offenbar nicht einmal lesen und verstehen was da bei Wikipedia geschrieben steht, was du mir selbst als Quellen für die Aussagen TLER wäre bei SW RAIDs schlecht, was dort aber nicht steht. Außerdem ist es falsch, man kann auch gerne nur 1s einstellen, dann wird es zwar öfter Lesefehler von den Platten geben, aber das RAID rekonstruiert die Daten dann aus der Redundanz und überschreibt den problematischen Sektor auf der Platte und schickt die Daten zur Anwendung, so dass man als Anwender davon nichts merkt, außer dass die Verzögerung kürzer ist, als wenn man der Platten mehr Zeit gibt zu versuchen einen Sektor zu lesen.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh