banner
Heim / Blog / Erfahren Sie mehr über die Senkung des Stromverbrauchs von Servern
Blog

Erfahren Sie mehr über die Senkung des Stromverbrauchs von Servern

Jun 17, 2023Jun 17, 2023

Heute werden wir über den Stromverbrauch von Servern sprechen. Insbesondere gibt es ein paar einfache Schritte, um den Stromverbrauch deutlich zu reduzieren. Mit der Umstellung auf Server der Ära 2022 und darüber hinaus steigen die TDP und der Stromverbrauch der Chips, da die Chips und Systeme immer dichter werden. Darüber hinaus haben viele Unternehmen Nachhaltigkeitsziele. Strom zu sparen bedeutet also, Geld zu sparen und diese Nachhaltigkeitsziele schneller zu erreichen. Vor diesem Hintergrund gibt es einige relativ einfache Möglichkeiten, den Stromverbrauch im Rechenzentrum zu senken, ohne ein Hyper-Scale-Architekt mit vollständiger Kontrolle über die Umgebung sein zu müssen. Wir werden heute einige davon behandeln.

Wir werden schnell darauf hinweisen, dass Intel dies sponsert und die Xeon Platinum-CPUs bereitstellt. Außerdem verwenden wir die Workloads, die wir für einen Teil davon in unserem Artikel „Stop Leaving Performance on the Table with AWS EC2 M6i Instances“ ausgeführt haben. Außerdem stellte Inspur den von uns getesteten Inspur NF5280M6 zusammen mit dem NF5180M6 zur Verfügung, den wir im März testen werden. Wir hatten die HPE-Netzteile bereits im Labor. Diese Art von Tests erfordert eine Menge Material, daher brauchten wir hier Hilfe. Wie immer erstellen wir diesen Artikel redaktionell unabhängig und kein Unternehmen überprüft ihn, bevor er veröffentlicht wird.

Wir haben auch eine Videoversion davon:

Wie immer empfehlen wir, dies für ein besseres Seherlebnis in einem neuen YouTube-Fenster, Tab oder einer neuen App zu öffnen.

Ein Bereich, den wir zuvor untersucht haben, ist die gängige Meinung zur Effizienz von 1U-Servern im Vergleich zu 2U-Servern. Als wir uns dies im Jahr 2018 beim Testen konventioneller Weisheit im 1U- vs. 2U-Stromverbrauch ansahen, verwendeten wir einen 1U Dell EMC PowerEdge R640 und einen 2U R740xd. Da die Testplattformen nicht identisch waren, stellten wir tatsächlich fest, dass der R640 einen geringeren Stromverbrauch hatte. Der Punkt war, dass Konfigurationen wichtig sind, daher würde es entscheidend sein, identische Plattformen zu bekommen.

Dieses Mal führen wir den Test erneut mit dem Inspur NF5280M6 zusammen mit dem NF5180M6 durch. Wir bestücken baugleiche Prozessoren, Intel Xeon Platinum 8362 CPUs. Hierbei handelt es sich um die skalierbaren Intel Xeon „Ice Lake“-Prozessoren der 3. Generation mit jeweils 32 Kernen. Wir haben Intel nach diesen SKUs gefragt, da sie gut in die aktuelle VMware- und Microsoft-Lizenzierung passen. Der Vorteil der beiden Inspur-Systeme besteht darin, dass die Motherboards nahezu identisch sind. Es sind jeweils ein paar unterschiedliche Überschriften ausgefüllt, wir haben sie jedoch ausgefüllt, um zuverlässigere Zahlen zu erhalten.

Anschließend haben wir unsere Beschleunigungs-Workloads ausgeführt, darunter AVX-512-HPC-Workloads, Tensorflow und unseren WordPress-Workload zur Krypto-Webbeschleunigung, und die Unterschiede zwischen den beiden Plattformen festgestellt. Wir fanden auch das Highlight, dass die Inspur-Plattformen über einen Sensor für den Stromverbrauch des Lüfters verfügen, sodass wir den Stromverbrauch an der PDU, den Netzteilen und auch am Lüfter verfolgen konnten (es gibt auch CPU- und Speichersensoren, aber diese waren bei beiden ähnlich). Plattformen.)

Die von uns ausgeführten Workloads ähneln denen, die wir ausgeführt haben, und zeigen die in Ice Lake integrierten Beschleuniger sowie Workload 1, bei dem Tensorflow installiert wird. Wir werden im nächsten Abschnitt näher auf die Arbeitslasten eingehen, aber so sahen sie beim NF5280M6 aus, den wir getestet haben:

Hier ist das gleiche Set im NF5180M6, das wir im März offiziell testen werden. Die Leistung war zwischen den Systemen erwartungsgemäß nahezu identisch, es gab keine nennenswerten Unterschiede zwischen unseren Laufreihen. Der Stromverbrauch war jedoch unterschiedlich.

Das Wichtigste und vielleicht Interessanteste hier sind die Messwerte zum Stromverbrauch der Lüfter zwischen den beiden Servern. Der 1U-Server ist in Blau, der 2U-Server in Schwarz.

Was wir dieses Mal herausgefunden haben, war, dass wir auf der 2U-Plattform im Vergleich zur 1U-Plattform allein aufgrund der Lüfter einen um 0,1–1,1 % geringeren Gesamtstromverbrauch erzielten. Wir haben Komponenten zwischen den Systemen ausgetauscht, sodass wir dieselben CPUs, RAM, SSDs, NICs und Netzteile verwenden konnten. Bei den Motherboards handelte es sich um die gleichen Modelle, bis auf einige unbestückte Anschlüsse. Aufgrund der Art und Weise, wie Inspur und viele andere Anbieter heutzutage Server bauen, konnten wir die Änderungen effektiv nur auf das Kühlungsdelta beschränken.

Die wichtigste Erkenntnis ist, dass wir tatsächlich ein deutliches Stromverbrauchsdelta festgestellt haben, insbesondere als der Stromverbrauch zunahm. Dies variiert je nach Servermodell und Konfiguration, ist aber sehr sinnvoll. Wenn Sie auf der Suche nach Effizienz sind, kann sich der Umstieg auf 2U-Systeme mit geringerer Dichte lohnen. Dies wird später im Jahr 2022 und darüber hinaus an Bedeutung gewinnen, da die Chip-TDPs steigen. Viele Unternehmen werden in der Lage sein, auf weniger dichte 2U-Gehäuse umzusteigen, um von diesen Effizienzvorteilen zu profitieren, da die Strombudgets auf Rackebene möglicherweise nicht für Top-Bin-1U-Konfigurationen geeignet sind. Dies ist auch einer der Gründe, warum wir bei STH einen viel größeren Fokus auf die Flüssigkeitskühlung gelegt haben. Auf den von uns getesteten 8x-GPU-Systemen steigt der Prozentsatz der für die Kühlung aufgewendeten Energie weiter an, bis zu dem Punkt, dass 20 % der Systemleistung für die Kühlung aufgewendet werden.

Als nächstes werfen wir einen Blick auf Netzteile und warum auch die Stromversorgungsseite wichtig ist.

Im Jahr 2019 führten wir einen Artikel durch, in dem wir einfach VMs hinzufügten und prüften, ob wir mit 80Plus Platinum- oder Titanium-Netzteilen eine bessere Energieeffizienz erzielen könnten. Wir haben HPE ProLiant 800W 80Plus Platinum- und Titanium-Netzteile getestet und im Grunde nur dieselben VMs zum Server hinzugefügt, um auf jeder eine kleine inkrementelle Last zu erzeugen.

Im Leerlauf gab es keinen nennenswerten Unterschied zwischen den beiden. Als wir uns der Hälfte der Nennnetzteile näherten, sahen wir eine Abweichung von etwa 1,5–2 % im Gesamtstromverbrauch der PDU.

Das ist nicht riesig, aber es ist einfach. Eine weitere Implikation ist, dass man Netzteile auswählen muss, deren Größe auf die erwartete Arbeitslast abgestimmt ist. Der Erwerb von 2-kW-Netzteilen für einen Server, der 100–500 W verbraucht, liegt nicht im Wirkungsgradbereich vieler moderner Netzteile. Bei unseren beiden Testservern, die wir dafür verwenden, konnten wir bei Verwendung der 1,3-kW-Netzteile im Vergleich zu den 1,6-kW-Inspur-Netzteilen einen um etwa 0,3 % besseren Stromverbrauch feststellen. Da es sich hierbei um Netzteile mit Platin-Effizienz handelt, liegt der Unterschied in der Energieeffizienz bei Nennstufen.

Als kurze Anmerkung hier: Man kann auch von 120 V auf 208 V oder höher umsteigen und so auch eine Steigerung der Energieeffizienz erzielen. Wir haben dies im Jahr 2015 getestet und festgestellt, dass sich durch die Umstellung auf höhere 208 V ein Leistungseffizienzvorteil von etwa 2 % ergibt, und bei höheren 220–240 V sind es normalerweise noch etwa 0,25 %.

Der Schlüssel hierzu liegt darin, dass der Wechsel zu Racks mit höherer Spannung und Netzteilen mit höherem Wirkungsgrad zu Einsparungen beim Stromverbrauch von bis zu 3–4 % führen kann.

Lassen wir uns dennoch von den kleinen Dingen befreien und in die Zukunft blicken, um herauszufinden, wie Beschleuniger das Spiel verändern und warum einige aktuelle Vergleiche tatsächlich nicht optimal sind.