Update 01.01.2026
Es ging die Tage mit sehr langweiligen Dingen und Sachen weiter. So wurde unter anderem in den letzten Tagen:
- Immich mit Machine Learning auf dem "Worker"-Server fertig gemacht
- Das Offline-Backup wurden angegangen
- Der Backupserver in Betrieb genommen
- Kleinerer Storage-Umbau am ESXI und andere Kleinstarbeiten
Machine Learning, Linux und "Reihenfolge"
Tja, was soll ich sagen? Es war klar, das irgendwas erstmal nicht funktioniert. Nachdem ich TrueNAS installiert hatte, die Z1-Arrays erstellt und die Datasets angelegt hatte habe ich Immich installiert und gehofft, das es einfach "out of the Box" funktioniert. Beim Testen vor einigen Wochen mit der Nvidia P1000 gab es dabei auch schon reichlich Probleme, die sich jedoch durch ein bisschen Git-Gestöbere und Neustarts regel ließen. Dem war diesmal nicht so. Nachdem Immich installiert war konnte der Container für das Maschinelle Lernen nicht auf die Datasets zugreifen, was sich durch Rechteänderungen schnell erledigen ließ. Danach war leider wieder Stillstand: Der ML-Container startete im Sekundentakt neu und fand manchmal die Grafikkarte nicht. Gesagt, getan und das wissen aus Windows-Umgebungen umgesetzt: Alle Apps gelöscht, alle Datasets gelöscht und neu erstellt und siehe da: Lief immer noch nicht. Etwas genervt und nach einem Kaffee ging es dann weiter, da erinnerte ich mich an die "Install Nvidia Drivers"-Funktion in TrueNAS Scale. Option ausgewählt, Download durchlaufen lassen, Immich neu aufgesetzt, das KI-Modell eingetragen und Zack: Rennt. Es kann manchmal so einfach sein wenn man sich an die Reihenfolge der Installation hält. Jetzt werden die Tage die Bilder auf den Server gepackt damit die A2000 diese Indexieren darf. Am Ziel angekommen sind wir damit noch nicht, der erste große Schritt ist damit aber getan.
Was mich jetzt schon an Immich freut ist die Duplikaterkennung. Wir hatten soviel Wildwuchs bei uns in den Daten (und keiner wusste teilweise wo was gespeichert war) das es uns schon etwas merkwüdig vorkam was wir für eine Masse an Bildern hatten. Immich hat schon mehrere Hundert Duplikate gefunden.
Über die Shell wurde mit "watch -n1 nvidia-smi" geprüft, was die A2000 anstellt. Kurzum: Macht wirklich was.
Das war an dem Tag auch der einzige Shell-Befehl der auszuführen war. War gar nicht so schwer, man muss nur mal Logs lesen.
Probleme mit dem Backupserver
Hier ging es direkt los - Sonntag, 20:00 Uhr, beste Voraussetzungen für Probleme. Der Server wurde bei mir im Wohnzimmer getestet und wanderte von da aus in den Schrank. Beim Test verlief alles wie erwartet gut, keinerlei Vorkommnisse, keinerlei merkwürdige Logeinträge oder sonst etwas. Als der Server jedoch in den Keller verfrachtet wurde ging das erste Problem los: Kein Bild über IPMI, obwohl der Server eingeschaltet war. Die Reaktion des Servers war mit "Einschalten > 5 Sekunden warten > Knopf Drücken > Server aus" aber leider genau die, die ich erwartet hatte. Heißt: Er Postet, ich sehe aber nichts. Da es schon spät war bin ich erstmal wieder zurück ins Wohnzimmer gegangen und habe dort mit erschrecken eine GT730 liegen gesehen. Da war mir klar: Ich hatte beim Testen eine GPU verbaut. Als ich dann wieder am Server (incl. GPU) war, diese Verbaut war und der Server eingeschaltet war gab es auf dem an der GT730 verbundenen Monitor Bild. Im BIOS wurde dann die Default GPU auf "Internal" geändert, der Server heruntergefahren und die GPU ausgebaut. Beim Einschalten kam dann (welch ein wunder) ein Bild beim IPMI. Leider macht die Lüfterregelung noch nicht das, was ich möchte. Ich denke hier wird auf kurz oder lang auch noch ein Adapter verbaut damit die Lüfter dauerhaft einfach auf 7V laufen.
Das erste Array wurde auch erstellt, mehr ist auf der Kiste noch nicht passiert. Hier geht es die Tage aber in Ruhe weiter, erst einmal muss das Jahr gescheit starten.
Server Nummer 3: Das Offline-Backup
Es steht ja fest, das das 12HE-Laborgestell von Startech aus dem Keller gegen ein Intellinet 26HE-Modell getauscht wird. Die CPU war günstig zu haben (ca. 20€ mit Versand auf eBay), damit hätte er als Storage-Server mehr Leistung als der HP DL20 Gen9. Das ist in diesem Fall aber halb so Wild. Dadurch das der Server für das Offline-Backup so dadurch ggf. etwas schneller durch die Backups kommt haben wir ggf. sogar ein "Race to Sleep"-System (zumindest im Herzen

)
Das Laborgestell wird nochmal etwas spezielles. Es soll nämlich nicht einfach nur ein "Schrank" irgendwo im Raum sein sondern am Ende wie ein Beistelltisch neben dem Schreibtisch stehen sollen. Die Tischplatte soll von der Aufmachung her die gleiche sein wie die vom Schreibtisch in meinem Büro. Das gute ist das die vorderen Streben schon Schraublöcher an den Stirnseiten bereits Bohrungen bietet an denen die Platte befestigt werden kann. Das einzige was noch getan werden muss sind Abstandshalter für den mittleren Bereich der Streben die von vorne nach hinten gehen, da diese "Unterhlab" der Stirnseiten liegen, das wird in diesem Unterfangen aber das geringste Problem. Auch soll die Platte nach hinten etwas hinausragen damit zwei Kabeldurchführungen montiert werden können.
Als Case wird ein Supermicro 826 genutzt. Hier wurde zuerst einmal alles an Hardware herausgerissen die vorhanden war, ebenso sind die redundanten Netzteile geflogen. Die Netzteile die vorher verbaut waren, waren Brutal laut. Um das TFX-Netzteil zu montieren wurde eine Halterung gedruckt, die Vorlage dazu gab es auf Printabels. Vermutlich wird der Airflow in dem Case jetzt eine mittelschwere Katastrophe aber es sollte funktionieren.
Hardware:
- Intel Xeon E5 E3-1260 v6
- 2x 16GB DDR4 UDIMM ECC HMA82GU7MFR8N
- Asrock Rack C236 ITX oder Asus P10S-I ITX
- 4x Western Digital WS120EDBZ 12TB
- Lenovo AM520 128GB oder 128GB SATA-SSD für OS
- BeQuiet! TFX Power 3 300W
- Supermicro 826 mit 3x S8038-7K @ Arctic Fan Hub
- TrueNAS Scale
Aktuell ist das Asrock Rack C236 verbaut. Wenn alles klappt wird aber ein Asus P10S-I ITX mit iKVM-Modul kommen und in den Server wandern. So kann ich zumindest bequem von überall im Haus den Server starten.
Der leidliche Rest
Es standen noch zwei kleinere Arbeiten an, fangen wir hier beim DL20 Gen9 an. Es waren vorher nur 4 SATA-SSDs (500GB) verbaut, es sollten jedoch am Ende 6 werden. Ein weiterer cablecc NGFF B+M Dual SATA Adapter für zwei m.2 SATA-SSDs wurde besorgt, danach wurde ESXI auf einer von denen Installiert (128GB), die weitere m.2 SATA-SSD (256GB) ist für weiteren Storage vorgesehen. ESXI wurde in diesem Zuge nochmal neu installiert. Des weiteren sind alle Server aktuell aus bis in KW 2 weitere Noctua-Lüfter da sind damit ich den LWL-Karten nochmal was mehr Kühlung spendieren kann.