Wenn es um die Sicherheit, Unversehrtheit und Wiederherstellbarkeit von Daten geht,
braucht man immer:
Redundanz:
Redundanz bedeutet, dass ein Plattenausfall keinen Datenverlust zu Folge hat. Man kann direkt weiterarbeiten und die neueste Version einer gerade bearbeiteten Datei bleibt verfügbar. Redundanz mit Softwareraid gibt es über ganzen Platten (normales Raid), Plattensegmenten (Synology SHR, ZFS AnyRaid demnächst) oder basierend auf Dateikopien (Windows Storage Spaces). Verfahren mit Segmentierung oder Storage Spaces erlauben die volle Nutzung von Platten unterschiedlicher Kapazität. Bei Storage Spaces gibt es darüberhinaus eine hot/cold auto Tiering Option zwischen HD und Flash Speicher. Für Redundanz unter Windows nimmt man entweder Hardware Raid, einfaches Software Raid (Windows Datenträgerverwaltung, Mainboard Raid) oder modernes Softwareraid (Storage Spaces oder ZFS). Storage Spaces bietet keine Plattenredundanz sodern optionale Redundanz auf Ebene der Spaces (virtuellen Platten)
Validierung:
Validierung bedeutet, dass alle Daten und Metadaten mit Prüfsummen gespeichert werden. Datenveränderungen werden dann beim Lesen erkannt und können bei Redundanz automatisch repariert werden (selbstheilende Dateisysteme). Unter Windows wird das mit ReFS oder ZFS unterstützt.
Versionierung:
Versionierung bedeutet, dass nicht nur der aktuellste Datenstand sondern Versionen zu bestimmten Zeiten direkt verfügbar sind. Moderne Versionierung arbeitet extrem effektiv mit den gespeicherten Datenblöcken vor einer Änderung mit Copy on Write Verfahren statt mit Kopien ganzer Dateien. Damit sind selbst tausende Versionen problemlos möglich, z.B. eine Version je Stunde/letzter Tag, eine Version je Tag/letzter Monat etc. Unter Windows gibts Versionierung mit Schattenkopien und ntfs/ReFS oder ZFS Snaps. Zugriff auf Versionen erfolgt mit "vorherige Version" oder im Dateisystem (readonly ZFS Snap Ordner)
Backup
Backup bedeutet, dass die Daten auch im Disasterfall (Amok Hardware, Feuer, Diebstahl) zumindest in einem älteren Stand verfügbar bleiben. Backup macht man anhand der 3.2.1 Regel. Das bedeutet dass man immer 3x Kopien der Daten hat die sich auf 2x Medien/Systemen befinden, 1x davon extern. Für Backups syncronisiert man den Speicher mit den Originaldaten mit einem Backupmedium, mit oder ohne weitere Versionierung auf dem Backup Medium. Als Backupmedium kommt ein weiteres NAS, externe Platten (auch USB) oder Cloud in Frage. Ein ganz modernes Sync Verfahren ist ZFS Replikation. Damit lassen sich selbst Petabyte Hochlastserver mit offenen Dateien mit dem Backup bis herunter zu 1min Verzögerung syncronisieren, auch zwischen ZFS Servern mit unterschiedlichem Betriebssystem übers Netz.
Dateisysteme unter Windows
Windows setzt seit vielen Jahren auf ntfs. Das ist sehr ausgereift, es fehlen allerdings die zwei wichtigsten Optionen moderner Dateisysteme Copy on Write (crashsicher, Snaps) und Prüfsummen auf Daten und Metadaten (Validierung, bitrot protection).
Microsoft bietet daher ReFS an das wie ZFS Copy on Write und Prüfsummen mitbringt. ReFS gibt es seit Windows 2012, demnächst auch als Bootsystem. ReFS fehlen noch viele Features von ntfs oder ZFS, es wird aber laufend weiterentwickelt. ReFS ist nicht abwärtskompatibel. Neuestes ReFS kann man nicht auf einem älteren Windows öffnen. Unangenehm ist dabei ein Auto-Update auf neueste Versionen.
Alternativ gibt es das OpenSource ZFS Dateisystem jetzt auch für Windows. Der zugehörige Dateisystemtreiber für Windows ist noch beta (release candidate), also nicht für unternehmenskritische Anwendungen geeignet. Praktisch alle bekannten Fehler unter Windows sind aber behoben, es spricht also nichts dagegen, sich das mal genauer anzusehen. Den Issuetracker sollte man aber im Blick behalten.
Storage Management
Storage Spaces kann man mit den Windows GUI Tools + Powershell managen. ZFS handhabt man mit den Kommandozeilenprogrammen zfs und zpool. Alternativ kann man Storage Spaces und ZFS per web-gui und napp-it cs im Browser managen. Napp-it cs ist ein portable Multi-OS und Multi-Server Tool (Copy and Run). Automatisieren kann man Aufgaben als Windows geplanter Task oder napp-it cs jobs.
braucht man immer:
Redundanz:
Redundanz bedeutet, dass ein Plattenausfall keinen Datenverlust zu Folge hat. Man kann direkt weiterarbeiten und die neueste Version einer gerade bearbeiteten Datei bleibt verfügbar. Redundanz mit Softwareraid gibt es über ganzen Platten (normales Raid), Plattensegmenten (Synology SHR, ZFS AnyRaid demnächst) oder basierend auf Dateikopien (Windows Storage Spaces). Verfahren mit Segmentierung oder Storage Spaces erlauben die volle Nutzung von Platten unterschiedlicher Kapazität. Bei Storage Spaces gibt es darüberhinaus eine hot/cold auto Tiering Option zwischen HD und Flash Speicher. Für Redundanz unter Windows nimmt man entweder Hardware Raid, einfaches Software Raid (Windows Datenträgerverwaltung, Mainboard Raid) oder modernes Softwareraid (Storage Spaces oder ZFS). Storage Spaces bietet keine Plattenredundanz sodern optionale Redundanz auf Ebene der Spaces (virtuellen Platten)
Validierung:
Validierung bedeutet, dass alle Daten und Metadaten mit Prüfsummen gespeichert werden. Datenveränderungen werden dann beim Lesen erkannt und können bei Redundanz automatisch repariert werden (selbstheilende Dateisysteme). Unter Windows wird das mit ReFS oder ZFS unterstützt.
Versionierung:
Versionierung bedeutet, dass nicht nur der aktuellste Datenstand sondern Versionen zu bestimmten Zeiten direkt verfügbar sind. Moderne Versionierung arbeitet extrem effektiv mit den gespeicherten Datenblöcken vor einer Änderung mit Copy on Write Verfahren statt mit Kopien ganzer Dateien. Damit sind selbst tausende Versionen problemlos möglich, z.B. eine Version je Stunde/letzter Tag, eine Version je Tag/letzter Monat etc. Unter Windows gibts Versionierung mit Schattenkopien und ntfs/ReFS oder ZFS Snaps. Zugriff auf Versionen erfolgt mit "vorherige Version" oder im Dateisystem (readonly ZFS Snap Ordner)
Backup
Backup bedeutet, dass die Daten auch im Disasterfall (Amok Hardware, Feuer, Diebstahl) zumindest in einem älteren Stand verfügbar bleiben. Backup macht man anhand der 3.2.1 Regel. Das bedeutet dass man immer 3x Kopien der Daten hat die sich auf 2x Medien/Systemen befinden, 1x davon extern. Für Backups syncronisiert man den Speicher mit den Originaldaten mit einem Backupmedium, mit oder ohne weitere Versionierung auf dem Backup Medium. Als Backupmedium kommt ein weiteres NAS, externe Platten (auch USB) oder Cloud in Frage. Ein ganz modernes Sync Verfahren ist ZFS Replikation. Damit lassen sich selbst Petabyte Hochlastserver mit offenen Dateien mit dem Backup bis herunter zu 1min Verzögerung syncronisieren, auch zwischen ZFS Servern mit unterschiedlichem Betriebssystem übers Netz.
Dateisysteme unter Windows
Windows setzt seit vielen Jahren auf ntfs. Das ist sehr ausgereift, es fehlen allerdings die zwei wichtigsten Optionen moderner Dateisysteme Copy on Write (crashsicher, Snaps) und Prüfsummen auf Daten und Metadaten (Validierung, bitrot protection).
Microsoft bietet daher ReFS an das wie ZFS Copy on Write und Prüfsummen mitbringt. ReFS gibt es seit Windows 2012, demnächst auch als Bootsystem. ReFS fehlen noch viele Features von ntfs oder ZFS, es wird aber laufend weiterentwickelt. ReFS ist nicht abwärtskompatibel. Neuestes ReFS kann man nicht auf einem älteren Windows öffnen. Unangenehm ist dabei ein Auto-Update auf neueste Versionen.
Alternativ gibt es das OpenSource ZFS Dateisystem jetzt auch für Windows. Der zugehörige Dateisystemtreiber für Windows ist noch beta (release candidate), also nicht für unternehmenskritische Anwendungen geeignet. Praktisch alle bekannten Fehler unter Windows sind aber behoben, es spricht also nichts dagegen, sich das mal genauer anzusehen. Den Issuetracker sollte man aber im Blick behalten.
Storage Management
Storage Spaces kann man mit den Windows GUI Tools + Powershell managen. ZFS handhabt man mit den Kommandozeilenprogrammen zfs und zpool. Alternativ kann man Storage Spaces und ZFS per web-gui und napp-it cs im Browser managen. Napp-it cs ist ein portable Multi-OS und Multi-Server Tool (Copy and Run). Automatisieren kann man Aufgaben als Windows geplanter Task oder napp-it cs jobs.