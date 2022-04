Im Zuge diverser Umbaumaßnahmen im Hardwareluxx Rack ist uns aufgefallen, dass die Temperatur etwas gestiegen ist - was soweit auch völlig normal ist, denn mehr Hardware = mehr Abwärme. Also haben wir einen kleinen Test gemacht: Was kostet die "Kompensation" des Temperaturunterschieds mittels höherer Lüfterdrehzahl? Das Ergebnis hat uns dann doch ein wenig überrascht, aber lest selbst.

Zunächst einmal ein Blick auf die Hintergründe:

Man kennt es: Auf Mainboards oder eben auch in Komplettsystemen sind Temperatursensoren verbaut, die man auch mit automatischen Benachrichtigungen versehen kann, sobald kritische Werte erreicht werden. Und so ist uns aufgefallen, dass die Temperatur im Rack von kaum merkbaren 30 °C auf ca. 35 - 40 °C angestiegen ist. Die CPU-Temperaturen sind ebenfalls um ca. 5 - 20 °C gestiegen, was natürlich kein Problem darstellt, da sie immer noch (meist deutlich) unter 60 °C liegen - und somit völlig unkritisch ist. Der Temperaturanstieg der CPU hängt aber auch mit einer höheren Auslastung des Systems zusammen.

Der kluge Admin denkt sich aber natürlich schnell: "Wäre es nicht langfristig schlau, die CPUs besser zu kühlen?"

Wir nehmen eines unserer Systeme, bestehend aus SYS-2029U-TR4T, 2x Xeon Platinum 8280, 384 GB DDR4-ECC-RAM und vier verbauten Gehäuselüftern für unsere Beispielrechnung. Steuerbar sind sie nur zusammen, daher können wir an dieser Stelle es nicht bis ins kleinste Detail runterbrechen, aber der Überblick ist ausreichend.

Das Mainboard gibt uns vier Lüftermodi zur Auswahl, die zu unterschiedlichen Lüfterdrehzahlen führen:

Full speed = ca 9.000 RPM

Optimal Speed = ca 6.200 RPM

Power Utilization Effectiveness (PUE) Speed (ist selektiert) = ca 4.900 RPM

HeavyIO Speed = ca 8.300 RPM

Der Einfachheit halber, beschränken wir den Blick zunächst auf den PUE-Mode, den wir bisher laufen haben, und den FullSpeed-Mode.

Im PUE-Mode liegt die CPU-Temperatur bei rund 55 °C, das System hat dabei eine mittlere Temperatur von ca. 40 °C und die mittlere Stromaufnahme liegt bei etwa 280 W/h.

Wenn wir nun in den FullSpeed Mode wechseln und etwas abwarten, sehen wir CPU Temperaturwerte von 45 - 50 °C, die Systemtemperatur liegt bei ca. 32 °C und die Stromaufnahme ist im Mittel auf rund 330 W/h gestiegen.

Für die Reduktion der CPU-Temperatur um 5-10 °C "zahlen" wir also grob 50 W/h. Rechnen wir also mal die jährlichen Kosten aus. Als Grundlage nehmen wir einen kWh Preis von 30 Cent, was angesichts der aktuellen Energiepreise (mittelfristig) eher tief gegriffen ist, aber dennoch einen guten Richtwert bietet.

Nehmen wir also:

Verbrauch * 24 (Stunden) * 365 (Tage) * kWh Preis

um die Kosten pro Jahr zu berechnen, diesem Fall also

0,05 kWh * 24 * 365 * 0,3 Euro = 131,4 Euro

Long Story short: Für eine Temperaturreduktion von 5-10° müssten wir ca. 130 Euro im Jahr zahlen.

Da wir natürlich nur Momentaufnahmen für die Zahlen nutzen können, sollte man eine gewisse Toleranz einrechnen. Liegt die Tolerenz bei rund 20 %, bewegen wir uns in einem Rahmen von 100 - 150 Euro. Sollte der Strompreis aber z.B. auf ca. 40 ct steigen (was ja nicht allzu unrealistisch ist), erhöht sich das Einsparpotential schon auf ca. 175 Euro.

Wenn man das nun auf mehrere Server im Rack hochrechnet, kann sich dieser Wert entsprechend auch multiplizieren, und bei 3-4 Servern ist man schnell bei jährlichen Mehrkosten von 400 - 600 Euro - und zwar nur, um die Systeme etwas besser zu kühlen.

Weitere Überlegungen:

Was also machen wir jetzt mit dieser Information? Natürlich muss jeder für sich selber und anhand der individuellen Situation und Konfiguration abwägen, was sinnvoller erscheint. Ist eine hohe Kühlleistung wirklich notwendig? Rechnen sich die Mehrkosten in Bezug auf Laufzeit und Ausfallsicherheit? Wie kritisch sind die Werte im System? Wie eng ist das Server Budget gestrickt? Wie lang sind die Serverlaufzeiten (Komponententausch) geplant?

In unserem Fall können wir das wie folgt abwägen:

Unsere Server haben eine gewisse "Lebenszeit" im Rack, und werden dann ohnehin ersetzt. Wir warten nicht, bis etwas kaputt geht, sondern ersetzen es schon vorher. Betriebswirtschaftlich gesehen lässt sich ein Server in einem Zeitraum zwischen 3-5 Jahren abschreiben, daher ist eine längere Laufzeit aus dem Gesichtspunkt keine Notwendigkeit. Da die Komponenten der Serversysteme auf 24/7-Langzeitbetrieb ausgelegt sind und die Serverloads bei uns im unteren Bereich angesiedelt sind befürchten wir auch keinen spontanen Hardwareausfall bei den geringfügig höheren Temperaturen auf rund 55 °C.

Daher "sparen" wir uns die Mehrausgaben an dieser Stelle, weisen aber darauf hin, dass diese Entscheidung immer individuell getroffen werden muss. Natürlich kann es Faktoren geben, die dazu führen, das System möglichst lange in einem funktionalen Status zu behalten, und deswegen z.B. die Belüftung deutlich zu erhöhen.

Wir hoffen, der kleine Einblick konnte etwas weiterhelfen - über konstruktives Feedback würden wir uns natürlich auch freuen.

Gruß aus dem Maschinenraum!