Einige oder alle Informationen auf dieser Seite gelten möglicherweise nicht für Cloud de Confiance von S3NS. Weitere Informationen finden Sie unter Unterschiede zu Google Cloud.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Über Hostereignisse

Während der Lebensdauer einer VM-Instanz oder einer Bare-Metal-Instanz können auf dem Hostcomputer, auf dem Ihre Instanz ausgeführt wird, mehrere Hostereignisse auftreten. Ein Hostereignis kann die reguläre Wartung der Compute Engine-Infrastruktur oder in seltenen Fällen einen Hostfehler umfassen. Sie können auswählen, wie Ihre Compute-Instanzen während oder nach einem Hostereignis reagieren, indem Sie die Hostwartungsrichtliniekonfigurieren.

Standardmäßig ist für die meisten Instanzen die Live-Migration während Hostereignissen festgelegt. Für alle Maschinenserien außer Z3 können Sie dieses Verhalten überschreiben und die Instanzen explizit so einstellen, dass sie beendet und optional neu gestartet werden.

Einige Compute-Instanzen unterstützen die Live-Migration nicht, z. B.:

H4D-Instanzen
Bare-Metal-Instanzen
Instanzen mit angehängten GPUs
Z3-Instanzen mit mehr als 18 TiB angehängter Titanium-SSD.

Diese Instanzen werden beendet während Host ereignissen. Weitere Informationen finden Sie unter Wartungs- und Neustartverhalten.

Arten von Hostereignissen

Es gibt zwei Arten von Hostereignissen, die in den folgenden Abschnitten näher beschrieben werden:

Wartungsereignisse
Hostfehler

Wenn Ihre Instanz nicht mehr reagiert, kann dies auch einen Neustart oder die Beendigung der Instanz auslösen.

Wartungsereignisse

Ein Wartungsereignis ist ein Zeitpunkt, zu dem Compute Engine eine Wartungs- oder Reparaturaktivität ausführen muss, für die VMs vom Hostserver entfernt werden müssen. Wenn Sie die Live-Migration Hostwartungsrichtlinie für einen unterstützten Instanztyp aktivieren, verschiebt Compute Engine die Instanz auf einen neuen Host und es kommt zu minimalen Unterbrechungen Ihrer Anwendung.

Compute Engine wendet auch einfache Hypervisor- und Netzwerkupgrades im Hintergrund unterbrechungsfrei an, indem die Instanz auf demselben Host beibehalten wird.

Das Verhalten von Instanzen während eines Wartungsereignisses kann je nach der Mandantenfähigkeit der Instanz und dem Maschinentyp variieren.

Bei VMs für einzelne Mandanten liegt die ungefähre Häufigkeit geplanter Hostwartungsereignisse bei alle 4 bis 6 Wochen. Ob die Live-Migration unterstützt wird, hängt von der Hostwartungsrichtlinie für die VM für einzelne Mandanten ab.

Informationen zum Wartungsverhalten für jeden Maschinentyp finden Sie auf der entsprechenden Maschinenfamilienseite:

C-Serie:
- C2 und C2D: Computing-optimierte Maschinenfamilie
- C4N: Netzwerkoptimierte Maschinenfamilie
- Alle anderen C-Serien: Maschinenfamilie für allgemeine Zwecke
E-, N- und T-Serie: Maschinenfamilie für allgemeine Zwecke
H-Serie: Computing-optimierte Maschinenfamilie
M- und X-Serie: Speicheroptimierte Maschinenfamilie
Z-Serie: Speicheroptimierte Maschinenfamilie

Informationen zu beschleunigungsoptimierten Maschinenfamilien finden Sie auf den folgenden Seiten:

GPUs: GPU-Hostwartungsereignisse verarbeiten.
TPUs: Wartungsereignisse in der Cloud TPU-Dokumentation vorbereiten

Hostfehler

Ein Hostfehler (compute.instances.hostError) bedeutet, dass auf der physischen Maschine oder in der Rechenzentrumsinfrastruktur, die Ihre Compute-Instanz hostet, ein Problem mit der Hardware oder Software aufgetreten ist, das zum Absturz der Instanz geführt hat. Ein Hostfehler, der einen völligen Hardwareausfall oder andere Hardwareprobleme nach sich zieht, kann eine Live-Migration Ihrer Instanz verhindern. Wenn Ihre Instanz so eingestellt ist, dass sie automatisch neu startet (dies ist die Standardeinstellung), startet Compute Engine Ihre Instanz in der Regel innerhalb von drei Minuten ab dem Fehler war erkannt. Je nach Problem kann der Neustart bis zu 5, 5 Minuten dauern.

Manchmal reagiert eine Compute-Instanz möglicherweise nicht mehr, bevor ein Hostfehler gemeldet wird. Sie können die Zeit verkürzen, die Compute Engine auf den Neustart oder die Beendigung der Instanz wartet. Legen Sie dazu das Zeitlimit für die Fehlerbehebung des Hosts fest. Weitere Informationen finden Sie unter Verfügbarkeitsrichtlinien festlegen.

Physische Hardware- und Softwarefehler können von Zeit zu Zeit auftreten, sind jedoch eher selten. Um Ihre Anwendungen und Dienste solchen potenziell störenden Systemereignissen zu schützen, sollten Sie folgende Ressourcen prüfen:

Übersicht über die Hostwartungsrichtlinie

Die Hostwartungsrichtlinie einer Instanz bestimmt, wie sie sich bei den folgenden Hostereignissen verhält:

Wartungsereignis
Hostfehlerereignis oder Instanz reagiert nicht

Sie können Instanzen so konfigurieren, dass sie während der Hostwartung weiterhin ausgeführt werden, während sie von Compute Engine live zu einem anderen Host migriert werden, oder Sie können stattdessen Ihre Instanz beenden.

Für die Hostwartungsrichtlinie einer Instanz lassen sich die folgenden Einstellungen ändern:

Wartungsverhalten:Gibt an, ob die Instanz live migriert oder beendet wird, wenn ein Wartungsereignis auftritt.
Neustartverhalten:Gibt an, ob Compute Engine die Instanz neu startet oder beendet, wenn die Instanz abstürzt, ein Hostfehler auftritt oder sie nicht mehr reagiert.
Erkennungszeit für Hostfehler:Die maximale Zeit, die Compute Engine auf den Neustart oder die Beendigung einer Instanz wartet, nachdem erkannt wurde, dass die Instanz nicht mehr reagiert.

Die Hostwartungsrichtlinie einer Instanz kann jederzeit aktualisiert werden, um zu steuern, wie sich Ihre Instanzen verhalten sollen.

Wartungs- und Neustartverhalten

Wenn ein Hostereignis auftritt, kann die Compute-Instanz entweder die Live-Migration verwenden oder die Instanz kann beendet werden. Wenn eine Instanz beendet wird, können Sie sie selbst neu starten oder Compute Engine sie automatisch neu starten lassen.

Die folgenden Maschinenserien unterstützen möglicherweise keine Live-Migration und müssen stattdessen während Hostereignissen beendet werden:

Bare-Metal Instanzen werden beendet und neu gestartet. Das bedeutet, dass sie möglicherweise auf einem anderen Host neu gestartet werden. Weitere Informationen finden Sie in der Dokumentation zur Wartung für die jeweilige Maschinenserie. Informationen zu C3-Bare-Metal-Maschinentypen finden Sie beispielsweise unter Wartung für C3-Instanzen.
Vertrauliche VM-Instanzen mit Ausnahme von N2D-Maschinentypen mit AMD EPYC Milan-CPU-Plattformen , auf denen AMD SEV ausgeführt wird.
Instanzen mit GPUs
Instanzen mit TPUs

Live-Migration

Standardmäßig ist für die meisten Instanztypen die Live-Migrationfestgelegt, mit Ausnahme der im vorherigen Abschnitt genannten Instanztypen.

Während der Live-Migration migriert Compute Engine Ihre Instanz automatisch an eine andere Stelle, um ein Infrastrukturwartungsereignis zu vermeiden. Die Instanz kann so während der Migration weiterhin ausgeführt werden. Ihre Instanz könnte für eine kurze Zeit mit verminderter Leistung arbeiten, aber im Allgemeinen sollten die meisten Instanzen keine nennenswerten Unterschiede aufweisen. Dies ist ideal für Instanzen, die eine konstante Betriebszeit erfordern und eine kurzfristig verminderte Leistung tolerieren.

Mit der Migration Ihrer Instanz von Compute Engine wird ein Systemereignis gemeldet und in der Liste der Zonenvorgänge sowie in den Systemereignisprotokollen angezeigt. Sie können dieses Ereignis durch Aufruf der Compute Engine-Vorgänge für eine bestimmte Zone überprüfen. Für Live-Migrationsereignisse gilt folgender Vorgangstyp:

compute.instances.migrateOnHostMaintenance

Beenden und neu starten

Wenn für Ihre Instanz keine Live-Migration ausgeführt werden soll oder Ihr Instanztyp die Live-Migration nicht unterstützt, können Sie stattdessen zulassen,Cloud de Confiance by S3NS dass die Instanz bei einem Hostereignis beendet wird. Bei dieser Konfiguration sendet Compute Engine bei einem Hostereignis ein Soft-Power-Off-Signal, um die Instanz herunterzufahren. Anschließend wird 60 Sekunden gewartet, bis die Instanz ordnungsgemäß heruntergefahren ist, und der Instanzstatus wird auf TERMINATED gesetzt. Wenn die Instanz nicht innerhalb von 60 Sekunden ordnungsgemäß heruntergefahren wird, wird sie zwangsweise beendet.

Diese Option ist ideal, wenn Ihre Instanzen eine konstante, maximale Leistung benötigen und die gesamte Anwendung auf die Bewältigung von Instanzausfällen oder Neustarts ausgelegt ist.

Wenn Compute Engine eine Instanz aufgrund eines Hostereignisses beendet, wird ein Systemereignis gemeldet und in der Liste der Zonenvorgänge sowie in den Systemereignisprotokollen angezeigt. Sie können dieses Ereignis durch Aufruf der Compute Engine-Vorgänge für eine bestimmte Zone überprüfen. Für Instanzbeendigungsereignisse gilt folgender Vorgangstyp:

compute.instances.terminateOnHostMaintenance

Automatischer Neustart

Wenn Ihre Instanz so konfiguriert ist, dass sie bei einem Wartungsereignis beendet wird, oder wenn Ihre Instanz aufgrund eines zugrunde liegenden Hardwareproblems abstürzt, kann Compute Engine die Instanz automatisch neu starten. Die Instanz wird entweder auf demselben Hostserver neu gestartet oder auf einen anderen Server in derselben Zone verschoben, der nicht am Wartungsereignis teilnimmt.

Standardmäßig versucht Compute Engine, Instanzen mit angehängten lokalen SSD-Laufwerken eine Stunde lang wiederherzustellen. Wenn das Zeitlimit erreicht ist, versucht Compute Engine, die Instanz auf einem anderen Hostserver in derselben Zone neu zu starten.

Wenn Sie den automatischen Neustart konfigurieren möchten, setzen Sie das Feld automaticRestart der Hostwartungsrichtlinie auf true. Diese Einstellung gilt nicht, wenn die Instanz aufgrund eines Zonenausfalls oder durch manuelle Vorgänge offline genommen wurde, z. B. durch den Aufruf von sudo shutdown im Gastbetriebssystem.

Beim automatischen Neustart der Instanz von Compute Engine wird ein Systemereignis gemeldet, das in der Liste der Zonenvorgänge angezeigt wird. Sie können dieses Ereignis durch Aufruf der Compute Engine-Vorgänge für eine bestimmte Zone überprüfen. Für automatische Neustartereignisse gilt folgender Vorgangstyp:

compute.instances.automaticRestart

Laufwerkpersistenz nach der Beendigung der Instanz

Da Hyperdisk netzwerkgebundener Speicher sind, hängt Compute Engine beim Neustart der Instanz das Bootlaufwerk und alle sekundären Laufwerke wieder an die Instanz an. Die Daten auf diesen Laufwerken bleiben über die Live-Migration und die Neustarts der Instanz hinweg erhalten.

Wartungsplanung

Cloud de Confiance by S3NS bietet Funktionen, die eine bessere Kontrolle über die Wartung ermöglichen. Durch die Verwendung bestimmter Maschinenfamilien, können Sie Wartungseinstellungen angeben und Benachrichtigungen über bevorstehende Wartungsereignisse über Cloud Logging, den Metadatenserver der Instanz, den gcloud CLI compute instances describe Befehl oder die REST instances.describe Methode erhalten. Nach Erhalt einer Benachrichtigung, haben Sie einen bestimmten Zeitraum Zeit, um die geplante Wartung zu einem von Ihnen gewählten Zeitpunkt zu starten. Wenn Sie die geplante Wartung nicht auslösen, findet das Wartungsereignis am Ende des Benachrichtigungszeitraums statt. Das ist der in der Benachrichtigung angegebene geplante Zeitpunkt.

Sie können diese Funktionen in Kombination mit Ihrer Hostwartungsrichtlinie verwenden, um einen Wartungszeitplan anzupassen, der zu Ihrer Arbeitslast passt.

Nächste Schritte

Mehr über Live-Migration erfahren.
Weitere Informationen zum Festlegen der Hostwartungsrichtlinie für Instanzen.
Weitere Informationen zum Abrufen von Live-Migrationshinweisen
Weitere Informationen zum Simulieren der Hostwartung

Weitere Informationen zum manuellen Ausführen der Live-Migration von VMs für einzelne Mandanten