Ausfallwarscheinlichkeit von RAID-Systemen

Rimini

Semiprofi
Thread Starter
Mitglied seit
04.09.2005
Beiträge
3.165
Ausfallwarscheinlichkeit von RAID-Systemen
=================================

Um die Ausfallwarscheinlichkeit eines RAID-Systems bestimmen zu können, ist es einfacher die Warscheinlichkeit der Funktionsfähigkeit des RAID-Systems zu berechnen.

Angenommen 1,5% (der Wert ist nur beispielhaft und nicht begründet) eines Festplattentypes (Produktionscharge oder was auch immer) fällt innerhalb eines Zeitraumes aus, dann sind 98,5% der Festplatten in diesem Zeitraum funktionsfähig. Zur einfacheren Darstellung der mathematischen Formeln nimmt man nicht Prozentwerte, sondern normierte Werte, also im Beispiel 98,5%/100%=0,985.

Bildet man nun mit diesem Festplattentyp ein RAID 0 aus n Platten (wobei n die Anzahl der Platten ist), rechnet man mit den Warscheinlichkeitsgesetzen für unabhängige Ereignisse und bestimmt damit die Warscheinlichkeit der Funktionsfähigkeit. In einem RAID 0 aus n Festplatten gibt es insgesamt 2^n Funktionszustände, wobei nur der Zustand "Alle Festplatten funktionsfähig" auch den Zustand funktionsfähig des RAID 0 bedeutet, oder anders gesagt, wenn eine oder mehrere Festplatten ausfallen, ist das RAID 0 nicht funktionsfähig. Die Warscheinlichkeit das alle Festplatten funktionsfähig sind, ist nach den Regeln der Warscheinlichkeitsrechnung das Produkt der einzelnen Warscheinlichkeiten der Funktionsfähigkeit der einzelnen Festplatten (hier vereinfacht immer 98,5% oder normiert 0,985). Bei zwei Platten im RAID 0 sind das dann z.B.

0,985 * 0,985 = 0,970225

oder mit 100% multipliziert 97,0225% Funktionsfähigkeit

bei drei Platten im RAID 0

0,985 * 0,985 * 0,985 = 0,955671625

und bei n Platten dann

0,985 ^ n

Die Ausfallwarscheinlichkeit ist dann natürlich der "Rest" bis zu 100%.Mit den Beispielwerten also ca. 3% bei zwei Platten, ca. 4,5% bei drei Platten usw. Wie man sieht, ist in der Warscheinlichkeitsformel die Anzahl n der Festplatten im RAID 0 zwar der Exponent, aber aufgrund der kleinen Werte der Ausfallwarscheinlichkeit kann man in erster Näherung bei einer kleinen Anzahl von Platten auch näherungsweise einfach mit der Addition der Ausfallwarscheinlichkeit der einzelnen Platten rechnen.

Hat ein RAID 0 nur genau einen Zustand, in dem es funktionsfähig ist, gibt es beim RAID 1, das aus genau zwei Festplatten besteht, bereits drei von vier Zustände, in denen es funkrionsfähig ist. Hier werden einfach die einzelnen Warscheinlichkeiten der Funktionsfähigkeiten der einzelnen Zustände addiert.

Beide Platten funktionsfähig: 0,985*0,985
Nur Platte 1 funktionsfähig: 0,985*(1-0,985)
Nur Platte 2 funktionsfähig: (1-0,985)*0,985

Summiert und vereinfacht ergibt das dann:

0,985^2 + 2*(0,985*(1-0,985))=0,999775

oder wieder mit 100% multipliziert 99,9775% Funktionsfähigkeit des RAID 1. Dies entapricht damit einer Ausfallwarscheinlichkeit von 0,025% des RAID 1 gegenüber den 1,5% der einzelnen Platten.

Als nächstes betrachten wir das RAID 5, welches aus n Festplatten besteht und bei dem maximal eine Festplatte defekt sein darf, damit das RAID 5 funktionsfähig bleibt. Dies bedeutet es gibt den RAID 5 Zustand, wo alle Festplatten intakt sind und n Zustände bei denen genau eine Festplatte, eben immer eine andere, defekt ist, so dass das RAID 5 funktionsfähig ist mit den entsprechenden Warscheinlichkeiten.

Alle Platten funktionsfähig: 0,985 ^ n (ein möglicher Zustand)
Genau eine Festplatte defekt: (0,985 ^ (n-1)) * (1-0,985) (n mögliche Zustände)

Summiert man dies für alle Zustände erhält man eine Warscheinlichkeit der Funktionsfähigkeit des RAID 5 von:

0,985^n + n * ((0,985^(n-1))*(1-0,985))

In einer Tabelle zusammengestellt gibt das dann folgende Warscheinlichkeiten der Funktionsfähigkeit eines RAID 5 in Abhängigkeit von der Anzahl der Platten:

3 Platten im RAID 5, 99,93% Funktionsfähigkeit des RAID 5
4 Platten im RAID 5, 99,87% Funktionsfähigkeit des RAID 5
5 Platten im RAID 5, 99.78% Funktionsfähigkeit des RAID 5
6 Platten im RAID 5, 99,68% Funktionsfähigkeit des RAID 5
7 Platten im RAID 5, 99,55% Funktionsfähigkeit des RAID 5
8 Platten im RAID 5, 99,41% Funktionsfähigkeit des RAID 5
9 Platten im RAID 5, 99,24% Funktionsfähigkeit des RAID 5
10 Platten im RAID 5, 99,07% Funktionsfähigkeit des RAID 5
11 Platten im RAID 5, 98,87% Funktionsfähigkeit des RAID 5
12 Platten im RAID 5, 98,66% Funktionsfähigkeit des RAID 5
13 Platten im RAID 5, 98,43% Funktionsfähigkeit des RAID 5
14 Platten im RAID 5, 98,18% Funktionsfähigkeit des RAID 5
15 Platten im RAID 5, 97,92% Funktionsfähigkeit des RAID 5
16 Platten im RAID 5, 97,65% Funktionsfähigkeit des RAID 5
17 Platten im RAID 5, 97,36% Funktionsfähigkeit des RAID 5
18 Platten im RAID 5, 97,06% Funktionsfähigkeit des RAID 5
19 Platten im RAID 5, 96,75% Funktionsfähigkeit des RAID 5
20 Platten im RAID 5, 96,43% Funktionsfähigkeit des RAID 5
21 Platten im RAID 5, 96,09% Funktionsfähigkeit des RAID 5
22 Platten im RAID 5, 95,74% Funktionsfähigkeit des RAID 5
23 Platten im RAID 5, 95,38% Funktionsfähigkeit des RAID 5
24 Platten im RAID 5, 95,01% Funktionsfähigkeit des RAID 5
25 Platten im RAID 5, 94,63% Funktionsfähigkeit des RAID 5
26 Platten im RAID 5, 94,23% Funktionsfähigkeit des RAID 5
27 Platten im RAID 5, 93,83% Funktionsfähigkeit des RAID 5
28 Platten im RAID 5, 93,42% Funktionsfähigkeit des RAID 5
29 Platten im RAID 5, 93,00% Funktionsfähigkeit des RAID 5
30 Platten im RAID 5, 92,58% Funktionsfähigkeit des RAID 5
31 Platten im RAID 5, 92,14% Funktionsfähigkeit des RAID 5
32 Platten im RAID 5, 91,70% Funktionsfähigkeit des RAID 5

Bleibt noch das RAID 10, was aus einer geradzahligen Anzahl von vier oder mehr Festplatten bestehen kann. Hier sind die Verhältnisse etwas komplizierter, da sowohl eine als auch mehrere Festplatten ausfallen können, ohne die Funktionsfähigkeit des RAID 10 zu beeinträchtigen. Beim RAID 10 aus vier Festplatten gibt es folgende Zustände der Funktionsfähigkeit:

Alle Platten funktionsfähig: 0,985^4 (ein möglicher Zustand)
Genau eine Festplatte defekt: (0,985^3)*(1-0,985) (vier mögliche Zustände)
Zwei Festplatten defekt: (0,985^2)*(1-0,985)^2 (zwei mögliche Zustände)

Summiert ergibt das dann (0,985^4)+4*(0,985^3)*(1-0,985)+2*(0,985^2)*(1-0,985)^2=0,999113449 oder 99.9113449% Warscheinlichkeit der Funktionsfähigkeit.

Wie Am Anfang gesagt, sind die hier angegebenen Prozentwerte rein beispielhaft und es ist wohl sehr schwer, überhaupt eine Aussage der Hersteller von Festplatten zur Ausfallwarscheinlichkeit zu erhalten. Aber eine Ausfallwarscheinlichkeit von 1-2% ist ein angemessener, üblicher Praxiswert. Auch ist mit Ausfallwarscheinlichkeit nicht der Ausfall durch Verschleiß am "Lebensende" einer Festplatte gemeint, sondern Die Warscheinlichkeit des Ausfalls einer neuen Festplatte über einen Zeitraum, in dem üblicherweise eine Festplatte funktionsfähig sein sollte. Dies sind erfahrungsgemäß ca. 3-5 Jahre und ist auch nicht mit dem Garantiezeitraum der Hersteller zu verwechseln. Der Garantiezeitraum ist höchstens ein Anhaltspunkt, wie lange eine Festplatte funktionsfähig sein sollte.

Gruß

Rimini
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
@ Rimini

frag doch mal ob Chris [HWLUXX] seinen "Raid_Guide" um diesen Thread erweitern will, denke das wäre sinnvoll
 
Rimini schrieb:
Beim RAID 10 aus vier Festplatten gibt es folgende Zustände der Funktionsfähigkeit:
[...]
Zwei Festplatten defekt: (0,985^2)*(1-0,985)^2 (zwei mögliche Zustände)

Bei einem RAID10 aus 4 Platten werden ja zwei Mirrors zu einem Stripe zusammengefasst. Eine Festplatte kann immer ausfallen, ohne Datenverlust. Wenn zwei Festplatten ausfallen, müssen es aber Platten aus jeweils dem anderen Mirror sein, fallen beide Platten eines Mirrors aus sind die Daten ja auch weg.

Das wurde in der Rechnung nicht berücksichtigt, oder?
 
In einem RAID 10 gibt es insgesamt vier Zustände, bei denen zwei Platten gleichzeitig ausgefallen sein können. Zwei dieser Zustände führen nicht zum Datenverlust und das RAID 10 ist weiterhin funktionsfähig. Diese und nur diese zwei Zustände sind in der Berechnung der Warscheinlichkeit der Funktionsfähigkeit des RAID 10 enthalten. Die anderen zwei Zustände füren ja zum Funktionsversagen des RAID 10 und sind deshalb auch bei der Berechnung der Warscheinlichkeit der Funtionsfähigkeit des RAID 10 natürlich nicht zu berücksichtigen.

Rimini
 
Ach ja, das kann natürlich jeder so übernehmen. Ich erhebe da keinerlei Urheberansprüche, aber ein Verweis wäre natürlich fair.

Eigentlich ist das mit der Warscheinlichkeit der Funktionsfähigkeit von Systemen aus mehreren gleichen Einzelkomponenten und unabhängigen Ereignissen (Ausfall der einzelnen Komponenten sind unabhängig voneinander) relativ einfach zu beschreiben:

Man braucht nur alle Zustände des Gesamtsystems, in denen es funktionsfähig ist. Für jeden Zustand berechnet sich die Warscheinlichkeit aus dem Produkt der Warscheinlichkeit der einzelnen Komponenten, die sie sich in diesem Zustand befinden. Die Warscheinlichkeit für das Gesamtsystem ist dann die Summe der Warscheinlichkeiten der einzelnen Zustände des Gesamtsystems. Ein typisches Beispiel hierfür sind Fertigungssysteme, bei denen die Fertigung (oder ein Fertigungsschritt) auf mehrere gleichartige Maschinen verteilt wird, um eine höhere Produktionskapazität und/oder schnellere Fertigung zu erreichen. Durch den parallelen Einsatz gleichartiger Maschinen erreicht man dann auch noch eine höhere Verfügbarkeit der Fertigung, da ja eine oder auch mehrere Maschinen ausfallen können. Habe da so vor 20-25 Jahren immer mal was in dieser Richtung konzipiert/berechnet und wie man sieht, kann man so etwas aus dem Maschinenbau ohne weiteres auch auf die Computertechnik anwenden.

Einen schönen Sonntag allen.

Rimini
 
Zuletzt bearbeitet:
Danke. Übrigens habe ich das mit den 32 Disks im RAID 5 nicht aus Spaß gemacht, den "Spaß" hat vielmehr mal THG aufgebaut. Ach ja und ein RAID 10 mit 6, 8, 10, 12, 14 oder 16 Disks wollte ich nicht mehr selbst rechnen, kann ja jetzt jeder selber machen.

Rimini
 
Schon erstaunlich, an was man sich nach solanger Zeit erinnern kann. Jetzt ist mir auch die Bezeichnung der Regeln der Warscheinlichkeitsrechnung eingefallen, die hier angewendet werden:

UND-Regel für voneinander unabhängige Ereignisse

Will man die Warscheinlichkeit, dass Ereignis 1 UND Ereignis 2 gleichzeitig eintreten, bestimmen, muss man die Warscheinlichkeiten der einzelnen Ereignisse miteinander multiplizieren.

ODER-Regel für voneinander unabhängige Ereignisse

Will man die Warscheinlichkeit, dass Ereignis 1 ODER Ereignis 2 eintreten, bestimmen, muss man die Warscheinlichkeiten der einzelnen Ereignisse addieren.

Das wars jetzt aber, mehr Gedanken mach ich mir darüber nichtmehr.

Viele Grüße und einen guten Start in die neue Woche

Rimini
 
Hi,

ich bin es nochmal. DoubleJ hatte mit seinen Zweifeln, dass da bei der Berechnung der Ausfallwarscheinlichkeit beim RAID 10 (oder wie auch immer bezeichnet etwas nicht stimmig ist. Es sind natürlich vier mögliche Zustände beim RAID 10, wo zwei Disks gleichzeitig ausgefallen sein können und der RAID-Verbund funktionsfähig bleibt:

Angenommen das RAID 10 besteht aus vier Disk mit folgenden Datenteilen ("Stripes"):

Disk1 mit den Stripes A/C/F
Disk2 mit den Stripes B/D/G
Disk3 mit den Stripes A/C/F
Disk4 mit den Stripes B/D/G



sind Disk1(ACF) und Disk2(BDG)
oder Disk1(ACF) und Disk4(BDG)
oder Disk2(BDG) und Disk3(ACF)
oder Disk3(ACF) und Disk4(BDG)

funktioniert das RAID-System mit den verbleibenden Disks.

Damit gilt dann mit den abgenommenen Werten beim RAID 10 korrekt:

Alle Platten funktionsfähig: 0,985^4 (ein möglicher Zustand)
Genau eine Festplatte defekt: (0,985^3)*(1-0,985) (vier mögliche Zustände)
Zwei Festplatten defekt: (0,985^2)*(1-0,985)^2 (vier mögliche Zustände)

Summiert ergibt das dann (0,985^4)+4*(0,985^3)*(1-0,985)+4*(0,985^2)*(1-0,985)^2=0,999550050625 oder 99,9550050625% Warscheinlichkeit der Funktionsfähigkeit bzw. 100%-99,9550050625%=0,0449949375% Ausfallwarscheinlichkeit des RAID 10.

Gruß

Rimini
 
Danke.

Hat mir einfach keine Ruhe gelassen, das mit der Ausfallwarscheinlichkeit. Und so richtig dargestellt wurde das wohl auch noch nirgends. Hat echt Spaß gemacht, mal so weit hinten im Gehirn vergrabenes Wissen wieder zu aktivieren, auch wenn es etwas "bruchstückhaft" zusammen gekommen ist.

Gruß

Rimini
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh