Skip Navigation

Barkhausen Institut

Whole System Persistence – Stromausfall ohne Datenverlust

Unsere Forscher Till Miemietz und Michael Roitzsch aus der Gruppe Composable Operating System haben im Rahmen des DIMES-Workshops 2023 ein Paper mit dem Titel „An NVM Performance Study Towards Whole System Persistence on Server Platforms“ veröffentlicht, das in Kollaboration mit Prof. Hermann Härtig und Viktor Reusch entstanden ist.

Worum geht es in diesem Paper?                 

Whole System Persistence (WSP) ist ein Konzept, das es ermöglicht, die Stromversorgung eines Computers zu unterbrechen, ohne den aktuellen Rechenzustand zu verlieren. Dabei verfügt die Systemhardware über ausreichend Kapazitätsreserven, um sämtliche flüchtige Daten auf dauerhafte Speichermedien zu schreiben, sobald die Stromzufuhr unterbrochen wird. Dies ermöglicht eine Verkürzung der herkömmlichen Prozesse des Hoch- und Herunterfahrens eines Computers zugunsten schnellerer Suspend- und Resume-Vorgänge (Anhalten und Fortsetzen).

Was genau wurde entdeckt?

Im Kontext von Serversystemen könnte WSP ein schnelles Ein- und Ausschalten von Maschinen ermöglichen, die nur gelegentlich benutzt werden. Im Paper werden mehrere Ansätze zur Implementierung von WSP auf solchen Maschinen untersucht. Dabei wird festgestellt, dass Hauptspeichertechnologien wie NVM (non-volatile memory) ein Schlüsselfaktor für eine effiziente Umsetzung von WSP sind. Das Besondere an NVM-Speichern ist, dass sie ihre Daten bei einer Unterbrechung der Stromzufuhr nicht verlieren. Die Forschungsdaten zeigen, dass mit einer NVM-basierten Version von WSP eine Verbesserung der Systemantwortzeit von bis zu 93% im Vergleich zum Booten und Laden der Anwendungsdaten von einer SSD erreicht werden kann. Das heißt, dass die Zeit vom Starten des Betriebssystems bis zum Zeitpunkt, an dem der Rechner genutzt werden kann, um bis zu 93% verkürzt werden kann. Dabei liegen die Suspend- und Resume-Zeiten von WSP in der Größenordnung von zehn Millisekunden. Im Vergleich dazu dauerte das herkömmliche Hoch- und Herunterfahren des Betriebssystems 50 bis 70 Sekunden.

Was bedeutet das für uns?

Im Idealfall könnte unser Computer mühelos wie eine Glühbirne ein- und ausgeschaltet werden. Dann hätte selbst ein Stromausfall keine nachteiligen Auswirkungen auf das System als solches, da dank WSP dennoch ein kontrolliertes Herunterfahren möglich ist. Bei Maschinen, die nur gelegentlich genutzt werden, könnte durch schnelles Ein- und Ausschalten Energie gespart werden.

Wo können wir mehr darüber erfahren?

T. Miemietz, V. Reusch, M. Roitzsch und H. Härtig: An NVM Performance Study Towards Whole System Persistence on Server Platforms. DIMES ’23: Proceedings of the 1st Workshop in Disruptive Memory System, Koblenz. https://dl.acm.org/doi/10.1145/3609308.3625269