> > > > Neuer Anlauf mit OpenZFSonOSX: ZFS für OS X

Neuer Anlauf mit OpenZFSonOSX: ZFS für OS X

DruckenE-Mail
Erstellt am: von

openzfsonosxZFS wäre fast einmal das neue Dateisystem für OS X 10.7 geworden, doch aus unbekannten Gründen, vermutlich aber Lizenzfragen, zog Apple seine Pläne in letzter Sekunde zurück. Dabei wäre es an der Zeit für ein neues modernes Dateisystem, denn HFS+ ist mit seinen zahlreichen Erweiterungen und fehlenden Features zur Sicherung der Datenintegrität eigentlich nicht mehr auf der Höhe der Zeit. Dies geht zwar auch anderen Dateisystemen wie NTFS und FAT so, doch neben Linux scheint die Affinität bei OS-X-Nutzern besondern hoch zu sein. OpenZFS ist daher die Basis von OpenZFSonOSX und bereits für Illumos, FreeBSD und andere Linux-Distributionen verfügbar.

OpenZFSonOSX ist nun ein neues Projekt, dass ZFS auf OS X bringen möchte. Sicherlich gibt es dazu auch andere Wege, OpenZFSonOSX hat sich allerdings auf die Fahnen geschrieben, den aktuellen Entwicklungsstrang so einfach wie möglich zugänglich zu machen. Zunächst einmal wäre da der Download als Desktop- und Server-Version. Im Forum sind einige Anleitungen zu finden und hier wird man sicherlich auch die nötige Hilfe bekommen, falls bei der Installation, Einrichtung oder dem Betrieb Probleme auftreten. Einige wichtige Informationen finden sich ebenfalls im dazugehörigen Wiki.

Hintergrundinformationen zu ZFS

Aus einem älteren Artikel zu ZFS haben wir noch einmal ein paar Informationen hervorgeholt, um das Thema noch einmal etwas näher zu bringen. Der Name ZFS stammt ursprünglich von Zettabyte-File-System, inzwischen aber wird dieser Name nicht mehr benutzt. Um der Abkürzung ZFS, die sich inzwischen etabliert hat, aber treu zu bleiben, wird der letzte Buchstabe des Alphabets in diesem Sinne als letztes Wort in Sachen File-System interpretiert. ZFS wird unter einer Sun-Lizenz als Open-Source CDDL geführt und kann daher von jedem versierten Anwender auf ein beliebiges Betriebssystem portiert und verwendet werden. Ursprünglich entwickelt wurde es für Solaris, um es dort in Data-Centern einzusetzen.

Bevor wir jetzt auf die Details von ZFS näher eingehen, wollen wir uns die technischen Daten einmal genauer anschauen:

Maximale Wortlänge: 128 Bit - dies bieten auch einige andere Dateisysteme und ist in der Praxis zu vernachlässigen
Maximale Anzahl an Dateien in einem Dateisystem: 248 - Damit soll auch das zukünftige Datenvolumen noch verwaltet werden können. Zum Vergleich NTFS kann nur 232 Dateien verwalten.
Maximale Größe des Dateisystems: 16x 260 Byte - damit lassen sich mehr Byte in einem ZFS verwalten, als es Atome im bekannten Universum gibt. Zum Vergleich: NTFS kann maximal "nur" 260 Byte verarbeiten.
Maximale Größe einer Datei: 16x 260 Byte - auch hier wieder eine kaum vorstellbare Zahl, an die NTFS mit maximalen 16 TB nicht herankommt.
Maximale Anzahl an Dateien in einem Verzeichnis: 248 - NTFS kann insgesamt nur 232 Dateien verwalten.

Die Zahl 264 spielt an anderer Stelle eine entscheidende Rolle. So ist die maximale Anzahl an Geräten in einem Pool 264, ebenso wie die maximale Anzahl an Dateisystemen und maximale Anzahl an Pools in einem System.

Obige Angaben sollen nur unterstreichen, wozu ZFS entwickelt wurde: Es soll den Bedarf der Datenverwaltung in der Zukunft sichern. Jeff Bonwick, der Chefentwickler von ZFS, sprach davon, dass diese technischen Voraussetzungen für immer ausreichen sollten. In der Informatik sollte man mit diesen Begriffen aber vorsichtig umgehen. Auch wenn man sich oben genannte Dimensionen momentan noch nicht vorstellen kann, so könnte dies in 20 Jahren schon ganz anders aussehen. Man erinnere sich nur an den berühmten Satz von Bill Gates in dem er sagte, dass 640 kB Speicher für immer ausreichend seien.

RAID-Z

ZFS kann natürlich auf nur einem Datenträger als Dateisystem verwendet werden. Da ZFS aber maßgeblich für Server-Umgebungen entwickelt wurde, spielen hier mehrere Datenträger weitaus häufiger eine wichtige Rolle. Wem eine eindimensionale Dateispeicherung (Speicherung von Daten auf einem Datenträger) zu unsicher ist, dem stehen zudem RAID-Fähigkeiten zur Verfügung. Wie bei einem üblichen RAID auch, wird durch Festlegung der Anzahl der Festplatten über die Redundanz entschieden. Kommen zwei Festplatten zum Einsatz, stehen dem Anwender das übliche RAID0 und RAID1 zur Verfügung. Ab dem Einsatz von drei Festplatten kommen dann noch weitere Optionen hinzu. RAID-Z1 entspricht in etwa dem RAID5. Es vereint die Performance von RAID0 und die Sicherheit von RAID1 durch ein Parity-Bit. Wer vier Festplatten einsetzt, der kann seine Daten auch einem RAID-Z2 anvertrauen. Dies entspricht einem RAID6 mit zwei Parity-Bits. Ab einer weiteren Festplatte steht auch RAID-Z3 zur Verfügung, bei dem drei Parity-Bits vorhanden sind und die Sicherheit nochmals deutlich erhöht.

Vielen Soft- und Hardware-Controllern für den RAID-Betrieb ist es nicht möglich, unterschiedlich große Festplatten zu verwenden. Auch hier arbeitet ZFS deutlich flexibler. So können drei Festplatten mit Größen von 500 GB, 1 TB und 2 TB in einem RAID-Z verwendet werden. Im RAID-Z1 würde dies einer maximal verwendbaren Volume-Größe von 1 TB (2x 500 GB + 1 TB Parity) entsprechen. Wird die 500-GB-Festplatte durch ein Modell mit einer Kapazität von 1 TB ausgetauscht, erhöht sich das nutzbare Volume auf 2 TB (2x 1 TB + 2 TB Parity). Dies alles kann geschehen, ohne dass das RAID neu aufgebaut werden muss. Das ZFS baut die Dateistrukturen selbstständig neu um, ohne Zutun des Anwenders.

Checksum-Support

Magnetische Festplatten gehören inzwischen zu den anfälligsten Teilen eines Computer-Systems. Da hier die meisten Datenfehler auftreten, besitzt ZFS einen integrierten Checksum-Support. Dazu wird eine 32-Bit-Prüfsumme zusammen mit einem 256-Bit-Hash verwendet. Wird der entsprechende Datenblock gelesen, werden die Daten über diesen Mechanismus verifiziert. Datenfehler werden so schon auf Dateisystem-Ebene erkannt und können gegebenenfalls behoben werden. Zudem ergibt dieses System einen deutlich zuverlässigeren Überblick über den Zustand der Festplatte, als dies der S.M.A.R.T.-Status tut. Wer nun glaubt, eine solche Sicherung der Datenintegrität sei überflüssig, der sollte das Festplattendienstprogramm einmal über seine Festplatten laufen und diese prüfen lassen. Regelmäßig kommt es hier zu Fehlern und oftmals lassen sich die Daten nicht wiederherstellen.

Daten, die bereits vorhanden sind und verändert werden, werden nicht einfach überschrieben. Stattdessen wird ein neuer Block angelegt, die Veränderungen geschrieben und diese dann verifiziert. Metadaten des zu überschreibenden Blocks werden übernommen und zum neuen Block hinzugefügt. So steht noch immer eine alte Version des Datenblocks zur Verfügung, falls bei der Bearbeitung des aktuellen etwas nicht korrekt abläuft und die Daten nicht geschrieben werden können.

Snapshot

Wohl das wichtigste und revolutionärste Feature von ZFS sind die sogenannten Snapshots. Dabei wird vom "lebenden" Dateisystem ein Schnappschuss angefertigt - das Dateisystem wird im aktuellen Zustand eingefroren. Dieser Vorgang nimmt aber keinerlei Zeit in Anspruch, da die Dateien sich ja bereits auf der Festplatte befinden. Im Anschluss werden einfach nur noch die Veränderungen geschrieben. Snapshots lassen sich auch in andere zPools übertragen und erlauben so ein einfaches Backup des File-Systems bei möglichst geringer Datenmenge.

Gerade im Vergleich zu anderen Backup-Lösungen zeigen sich die Vorteile der Snapshots. Nehmen wir einmal Time-Machine von Mac OS X. Verändert sich hier eine 1 GB große Datei, so wird beim nächsten Backup die komplette 1 GB große Datei gesichert. Erfolgen diese Veränderungen in regelmäßigen Abständen, würde dies bei einer stündlichen Sicherung ein gewaltiges Datenaufkommen nach sich ziehen. Die Snapshots von ZFS arbeiten auf Dateiblock-Ebene und speichern eben nur die Veränderungen der Datei. Dies spart Datenplatz und erlaubt auch schnelle Sicherungen bzw. deren Übertragung.

Clones

Eine Art Erweiterung der Snapshots sind Clones. Hierbei wird ein beschreibbarer Snapshot angelegt, was in zwei separaten File-Systemen auf einem Datenblock resultiert. Werden nun Veränderungen an einem der Klone durchgeführt, werden neue Datenblöcke von beiden angelegt. Auf unveränderte Daten greifen aber weiterhin beide Klone zurück.

Quota und Reservation

In einem zPool angelegten File-Systems können Attribute wie Quota und Reservation zugeteilt werden. Dabei wird festgelegt, wie viel Speicherplatz das jeweilige File-System im zPool verbrauchen darf. Zudem lassen sich über Reservation bestimmte Größen für File-Systeme reservieren. Diese Pool-Eigenschaften können aber auch global vom zPool aus, auf alle File-Systeme, vererbt werden.

Kompression

Wie viele andere Dateisysteme auch, unterstützt ZFS ebenfalls die Kompression der Daten auf dem Dateisystem. Natürlich handelt es sich dabei um eine verlustfreie Kompression. Geplant war und ist weiterhin auch eine automatische Erkennung des Datei-Typs und darauf folgend die Anwendung einer bestimmten - oftmals verlustbehafteten - Kompression wie beispielsweise MP3 oder JPEG. 

Social Links

Ihre Bewertung

Ø Bewertungen: 1

Tags

Kommentare (4)

#1
customavatars/avatar163959_1.gif
Registriert seit: 27.10.2011

Bootsmann
Beiträge: 749
Zum letzten Abschnitt: Wenn mir mein Dateisystem anfangen würde, meine Daten verlustbehaftet zu komprimieren, würde ich es schneller vom System schmeißen als ich "ZFS" aussprechen könnte.

Alles in allem habe ich aber kein Problem damit, mal ein neues Dateisystem zu sehen. Ist nur die Frage, wie es mit der Geschwindigkeit aussieht. Alles erstmal mit Checksums zu sichern, ist nicht unbedingt einfach. Das müsste von der Festplatte selber erledigt werden.
#2
customavatars/avatar3377_1.gif
Registriert seit: 15.11.2002
www.twitter.com/aschilling
[printed]-Redakteur
Tweety
Beiträge: 29103
Man muss dennoch erst einmal erläutern, das es sich um eine verlustfreie Kompression handelt. Dennoch sollte das natürlich klar sein. Zur Geschwindigkeit kann ich nur sagen: Selbst ein Core 2 Duo kommt damit klar, so lange du nicht solche Features wie Deduplication etc. einschaltest.
#3
customavatars/avatar127265_1.gif
Registriert seit: 16.01.2010

Oberleutnant zur See
Beiträge: 1451
also für das falsche zitat von bill gates muss ein redakteur bluten!
dass dieser mythos immer wieder aufkommt, obwohl er ausreichend widerlegt ist, ist ein unding.
#4
customavatars/avatar163959_1.gif
Registriert seit: 27.10.2011

Bootsmann
Beiträge: 749
@Don: Weiß leider nicht, was du mit dem ersten Teil sagen willst. Im Artikel steht was von verlustbehaftet bei Musik oder Bildern. Klar, das ganze dürfte man abschalten können (bzw. ist standardmäßig aus), aber wieso sich da das Dateisystem und nicht ein normales Programm (welches das sicherlich besser kann) drum kümmern soll, ist mir ein Rätsel.


Zugriff auf Daten auf der Festplatte ist bereits jetzt (auch noch mit SSDs) ein Flaschenhals. Das ganze sollte man nicht noch mit mehr Aufwand verschlimmern. Klar, auch ein [hier langsame CPU einsetzen] kann das machen, aber das ganze gilt auch für Java - und dennoch halte ich jeden für verrückt, der Java für performance-wichtige Anwendungen nutzt, bei der es darauf ankommt, Code eben effizient auszuführen.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Kommentar: Pokémon Go bringt die Smombies auf den Vormarsch

Logo von IMAGES/STORIES/LOGOS-2016/POKEMON_GO_LOGO

Sicherlich lassen sich meine Erfahrungen von Sonntag nicht zwangsläufig auf ganz Deutschland übertragen, dennoch stelle ich folgende Behauptung auf: Am vergangenen Wochenende zog es vielerorts deutlich mehr Menschen auf die Straßen als noch in den Tagen zuvor. Schuld daran war nicht nur das... [mehr]

Microsoft Cortana wehrt sich gegen "sexuelle Belästigung"

Logo von IMAGES/STORIES/LOGOS-2015/MICROSOFT_CORTANA_BUTTON

Menschen sind neugierig, wenn künstliche Intelligenz ins Spiel kommt. Man probiert aus, stellt absurde Fragen, prüft, ob die K. I. Humor hat oder lotet die Grenzen aus, bis sie bei Ironie und Sarkasmus nicht mehr weiter weiß. Auch ist bekannt, dass Apples Sprachassistentin Siri etwa durchaus... [mehr]

WhatsApp wird dauerhaft kostenlos

Logo von IMAGES/STORIES/LOGOS-2013/WHATSAPP

Kaum eine Anwendung dürfte Mobilfunkanbieter derart viel Geld gekostet haben wie WhatsApp. Denn seit dem Start im Jahr 2009 steigt die Zahl der über den Dienst verschickten Nachrichten kontinuierlich, vor allem auf Kosten der ehemals so lukrativen SMS. Für die Gründer hat sich das längst... [mehr]

Harvester Messenger vereint fast alle Messenger in einer App

Logo von IMAGES/STORIES/LOGOS-2016/HARVESTER_LOGO

Früher hatte sicher jeder einige Multimessenger in Benutzung, die namensgebend viele verschiedene Messenger-Protokolle in einem Programm vereinten. So konnten Nutzer gleichzeitig via icq, AIM oder XMPP (Jabber) kommunizieren. Die aktuelle Messengerlandschaft hat sich zwar stark gewandelt, doch im... [mehr]

Steam erlaubt nun das Löschen einzelner Spiele aus der Bibliothek

Logo von IMAGES/STORIES/LOGOS-2013/STEAM

Wer immer mal wieder bei einem der zahlreichen Humble-Bundle-Aktionen zuschlägt oder die Pakete anderer Anbieter kauft, der füllt seine Steam-Bibliothek häufig auch mit Titeln auf, die man eigentlich nicht spielen würde oder die man nicht einzeln gekauft hätte. Solche Spiele lassen sich ab... [mehr]

Pokémon Go offiziell in Deutschland erhältlich – erstes Update für iOS

Logo von IMAGES/STORIES/LOGOS-2016/POKEMON_GO_LOGO

Bis vor wenigen Stunden war Pokémon Go nur über Umwege in Deutschland spielbar. Besitzer eines Android-Smartphones mussten sich über Umwege die APK-Datei beschaffen und diese durch Aushebelung der Drittanbieter-Sperre auf ihrem Gerät installieren. Etwas schwieriger war das unter iOS – hier... [mehr]