Einige oder alle Informationen auf dieser Seite gelten möglicherweise nicht für Cloud de Confiance von S3NS. Weitere Informationen finden Sie unter Unterschiede zu Google Cloud.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Autopilot-Modus-Arbeitslasten in GKE Standard

Autopilot Standard

Sie können ComputeClasses verwenden, um Google Kubernetes Engine- Arbeitslasten (GKE) im Autopilot-Modus in Ihren GKE Standard auszuführen. In diesem Dokument werden die Methoden beschrieben, mit denen Sie Ihre Arbeitslasten im Autopilot-Modus ausführen können, und Sie erhalten Hilfe bei der Entscheidung, wann eine Arbeitslast in einem bestimmten Modus ausgeführt werden soll.

Diese Informationen richten sich an folgende Personen:

Cloud-Architekten, die Betriebskosten in Unternehmen optimieren möchten.
Plattformadministratoren, die den Aufwand für die manuelle Infrastrukturverwaltung reduzieren möchten.
Site Reliability Engineers (SREs), die die Infrastruktur wartung, ‑upgrades und ‑skalierung nach Möglichkeit an Google auslagern möchten. Cloud de Confiance by S3NS

Sie sollten mit den folgenden Konzepten vertraut sein:

GKE Autopilot

Autopilot ist ein Betriebsmodus in GKE, in dem Google Ihre Knoteninfrastruktur, Skalierung, Sicherheit und vorkonfigurierten Funktionen verwaltet. Der Autopilot-Modus ist für die Ausführung der meisten Produktionsarbeitslasten in einer Umgebung optimiert, in der empfohlene Einstellungen für Sicherheit, Zuverlässigkeit, Leistung und Skalierbarkeit angewendet werden. Informationen zur Entscheidung zwischen dem Autopilot Modus und dem Standardmodus basierend auf Ihren Anforderungen finden Sie unter GKE-Betriebsmodi.

Sie können den Autopilot-Modus auf folgende Arten verwenden:

Cluster erstellen, der den Autopilot Modus verwendet: Google verwaltet den gesamten Cluster und wendet Best Practices für Automatisierung, Zuverlässigkeit, Sicherheit und Kosten an.
Arbeitslasten im Autopilot-Modus in Standardclustern ausführen: Sie stellen Autopilot-ComputeClasses bereit und wählen sie in Arbeitslasten aus. Google verwaltet die Knoten, die GKE für diese spezifischen Arbeitslasten in einem von Autopilot verwalteten Knoten pool erstellt. Sie steuern den Cluster und können Ihre eigenen Standardknotenpools neben den von GKE verwalteten Knoten ausführen.

Autopilot-Modus für ComputeClasses

Eine ComputeClass ist eine benutzerdefinierte Kubernetes-Ressource, die eine Liste von Knotenkonfigurationen wie Maschinentypen oder Funktionseinstellungen definiert. Sie können bestimmte ComputeClasses in Kubernetes-Arbeitslastspezifikationen auswählen. Wenn für eine Arbeitslast, die eine ComputeClass auswählt, ein neuer Knoten erforderlich ist, versucht GKE, den Knoten mit einer der Konfigurationen bereitzustellen, die von der ComputeClass deklariert werden. GKE versucht jede Konfiguration in der ComputeClass der Reihe nach und greift auf die nächste Konfiguration zurück, wenn die Knotenerstellung fehlschlägt. Weitere Informationen finden Sie unter Benutzerdefinierte ComputeClasses.

Wenn Sie Autopilot-Arbeitslasten in Ihren GKE-Standardclustern ausführen möchten, aktivieren Sie den Autopilot-Modus in einer ComputeClass und wählen Sie diese ComputeClass in bestimmten Arbeitslasten aus. Google verwaltet alle neuen Knoten, die GKE für diese Arbeitslasten bereitstellt, ähnlich wie die Knoten in Autopilot-Clustern. Die meisten Vorteile und Sicherheitsfunktionen des Autopilot-Modus gelten für diese Arbeitslasten und die Hostknoten.

Autopilot-Modus-ComputeClasses bieten Clusteradministratoren zusätzliche Flexibilität bei der Auswahl des Kontrollgrads, den sie über bestimmte Arbeitslasten und die Infrastruktur in ihrem Cluster haben möchten, z. B. auf folgende Weise:

Sie können bestimmte Arbeitslasten vollständig von GKE verwalten lassen, indem Sie sie im Autopilot-Modus ausführen.
Sie behalten die volle Kontrolle über Arbeitslasten und Infrastruktur, die den Autopilot-Modus nicht verwenden, z. B. manuell erstellte Knotenpools.
Sie können eine Autopilot-ComputeClass als den Standard für Ihren Cluster oder Namespace, festlegen, sodass Arbeitslasten im Autopilot-Modus ausgeführt werden, es sei denn, sie fordern explizit eine andere Option an.

Mit diesen Optionen können Clusteradministratoren den Grad und den Umfang der Nutzung von Autopilot festlegen.

Vorteile von Autopilot-ComputeClasses in Standardclustern

Wenn Sie einige Ihrer Arbeitslasten im Autopilot-Modus ausführen, ergeben sich folgende Vorteile:

Kosten für die Infrastrukturverwaltung senken: Google führt Upgrades durch, wartet, konfiguriert und optimiert bestimmte Knoten für Sie.
Autopilot-Preismodell verwenden: Arbeitslasten, die eine Autopilot-ComputeClass verwenden, werden nach dem Autopilot Preismodell abgerechnet. Dieses Preismodell umfasst die Abrechnung pro Pod für Arbeitslasten, die keine bestimmte Hardware anfordern. Weitere Informationen finden Sie im Abschnitt Preise.
Skalierung und Sicherheit verbessern: Autopilot-Arbeitslasten profitieren von Vorteilen wie dem Zugriff auf die containeroptimierte Compute-Plattform, verbesserten Standardsicherheitsbeschränkungen und Knoten-Autoscaling basierend auf Ressourcen anfragen. Die Knoten für diese Arbeitslasten verwenden Funktionen wie automatische Knotenupgrades und automatische Reparaturen.
Zuverlässigkeit verbessern: Das GKE Service Level Agreement (SLA) umfasst ein Service Level Objective (SLO) für die Pod-Betriebszeit für Autopilot.

Viele dieser Vorteile bieten auch Autopilot-Cluster, die auch eine besser verwaltete Umgebung als Standardcluster bieten und mehrere Vorteile in Bezug auf Sicherheit, Netzwerke und Ressourcenverwaltung umfassen. Weitere Informationen finden Sie unter Autopilot-Übersicht.

Hardwareauswahl in Autopilot-ComputeClasses

In Autopilot-ComputeClasses können Sie bestimmte Hardware für Ihre Knoten auswählen (z. B. GPUs oder Maschinentypen) oder GKE Pods auf einer containeroptimierten Compute-Plattform für allgemeine Zwecke platzieren lassen. Die Option für allgemeine Zwecke wird für die meisten Produktionsarbeitslasten empfohlen, für die keine bestimmte Hardware erforderlich ist, um gut zu funktionieren. Sie unterstützt sowohl x86- als auch Arm-Architekturen.

In der folgenden Tabelle werden diese Konfigurationsoptionen beschrieben, wie Sie eine in einer ComputeClass auswählen und wie sich diese Auswahl auf Ihr Abrechnungsmodell auswirkt:

**Tabelle 1.** Hardwareauswahl in Autopilot-ComputeClasses
Arbeitslastanforderung	Empfohlene ComputeClass-Konfiguration	Abrechnungsmodell
Arbeitslasten für allgemeine Zwecke	Verwenden Sie eine Autopilot-ComputeClass mit der `podFamily` Prioritätsregel, um Arbeitslasten, für die keine bestimmte Hardware erforderlich ist, auf der containeroptimierten Compute- Plattform von Autopilot auszuführen. Diese Plattform eignet sich gut für Arbeitslasten für allgemeine Zwecke wie die folgenden: Webserver Ereignisgesteuerte Jobs Batchverarbeitung CI/CD-Pipelines Die integrierten Autopilot-ComputeClasses verwenden nur `podFamily` Prioritätsregeln. Sie können auch `podFamily` Prioritätsregeln zu benutzerdefinierten Autopilot ComputeClasses hinzufügen.	Pod-basiertes Abrechnungsmodell
Arbeitslasten, die bestimmte Hardware benötigen	Verwenden Sie eine ComputeClass, die eine beliebige verfügbare Hardwarekonfiguration regel verwendet, z. B. die Regel `machineFamily` oder die Regel `gpus` .	Knotenbasiertes Abrechnungsmodell

Autopilot in ComputeClasses konfigurieren

Sie können den Autopilot-Modus in einem Standardcluster verwenden, indem Sie eine integrierte Autopilot-ComputeClass verwenden, die von GKE bereitgestellt wird, oder indem Sie Autopilot in einer benutzerdefinierten ComputeClass aktivieren, die Sie erstellen. In den folgenden Abschnitten werden die einzelnen Optionen beschrieben.

Integrierte Autopilot-ComputeClasses

GKE konfiguriert bestimmte Autopilot-ComputeClasses für Sie. Sie können diese integrierten Autopilot-Klassen in jedem geeigneten Cluster auswählen. Die integrierten Autopilot-ComputeClasses in Standardclustern verwenden die Prioritätsregel podFamily, um Pods auf der containeroptimierten Compute-Plattform auszuführen. Weitere Informationen finden Sie unter Integrierte ComputeClasses in GKE.

Benutzerdefinierte Autopilot-ComputeClasses

Sie können Autopilot in jeder benutzerdefinierten ComputeClass aktivieren, die Sie verwalten, indem Sie das Feld autopilot in der ComputeClass-Spezifikation verwenden. Benutzerdefinierte Autopilot-ComputeClasses sind in folgenden Situationen nützlich:

Ihre Arbeitslasten haben bestimmte Hardwareanforderungen, z. B. Beschleuniger.
Sie möchten bestimmte Knotenoptionen ändern, z. B. Zonen festlegen oder Taints anwenden, während Sie weiterhin die containeroptimierte Compute-Plattform von Autopilot verwenden.

Wenn Sie Autopilot in einer vorhandenen ComputeClass aktivieren möchten, müssen Sie sie löschen, die Konfiguration aktualisieren und die ComputeClass dann in Ihrem Cluster neu erstellen. Ihre Änderungen gelten für alle neuen Knoten, die GKE für Arbeitslasten erstellt, die Sie nach der Aktualisierung der Autopilot-ComputeClass bereitstellen.

Weitere Informationen zum Aktivieren von Autopilot in Ihren benutzerdefinierten ComputeClasses finden Sie unter Bestimmte Hardware für Ihre Autopilot-Pods auswählen.

Preise

Die GKE Autopilot-Preise gelten für die Knoten und Arbeitslasten, die GKE für eine Autopilot-ComputeClass erstellt. Das Autopilot-Abrechnungsmodell, das für eine bestimmte Arbeitslast gilt, hängt von der Prioritätsregel der ComputeClass ab, die GKE zum Erstellen von Knoten für diese Arbeitslast verwendet.

In der folgenden Tabelle wird das Abrechnungsmodell beschrieben, das für verschiedene Autopilot-ComputeClass-Konfigurationen in Ihren Standardclustern gilt:

**Tabelle 2.** Preise für Autopilot-ComputeClasses
Abrechnungsmodelle für verschiedene ComputeClass-Konfigurationen
Pod-basiertes Abrechnungsmodell	Das Pod-basierte Abrechnungsmodell gilt, wenn GKE eine `podFamily` Prioritätsregel verwendet, um Knoten für eine Arbeitslast zu erstellen. Die integrierten Autopilot-ComputeClasses, verwenden immer das Pod-basierte Abrechnungsmodell.
Knotenbasiertes Abrechnungsmodell	Das knotenbasierte Abrechnungsmodell gilt, wenn GKE eine Prioritätsregel der ComputeClass verwendet, die explizit bestimmte Hardware anfordert, z. B. eine bestimmte Maschinenfamilie oder GPUs.

Die Autopilot-Preise gelten nur für die Arbeitslasten und Knoten, die eine Autopilot -ComputeClass verwenden. Für Ihren Standardcluster und alle anderen Knotenpools, die Sie ausführen, gelten weiterhin die GKE-Standardpreise.

Vorkonfigurierte Einstellungen für von Autopilot verwaltete Knoten

Bevor Sie den Autopilot-Modus in Ihren ComputeClasses aktivieren, sollten Sie wissen, was Sie von den Knoten erwarten können, die GKE zum Ausführen der Autopilot-Arbeitslasten erstellt. Google konfiguriert bestimmte Funktionen und Sicherheitsbeschränkungen in Autopilot-Knoten. Daher werden Arbeitslasten, die in Ihren Standardknoten korrekt bereitgestellt und ausgeführt werden, möglicherweise vom Autopilot-Modus abgelehnt, wenn sie die Sicherheitsanforderungen von Autopilot nicht erfüllen.

In der folgenden Tabelle werden die Featurekonfigurationen beschrieben, die die entsprechenden Einstellungen in Ihrem Standardcluster überschreiben. Wenn eine Konfiguration nicht in dieser Tabelle enthalten ist, verwenden die Autopilot-Knoten die Einstellung des Standardclusters. Die Workload Identity-Föderation für GKE ist beispielsweise nicht in dieser Tabelle enthalten. Das bedeutet, dass die Einstellung für die Workload Identity-Föderation für GKE des Standardclusters für die Autopilot-Knoten gilt, die GKE erstellt.

**Tabelle 3.** Vorkonfigurierte Einstellungen für Autopilot-Knoten
Funktion	Einstellung auf Standardclusterebene	Einstellung für von Autopilot verwaltete Knoten
Knotenupgrades und ‑wartung	Konfigurierbar: Automatische Knotenreparatur Automatische Knotenupgrades Strategie für Knotenupgrades	Vorkonfiguriert: Automatische Knotenreparatur: aktiviert Automatische Knotenupgrades: aktiviert Strategie für Knotenupgrades: Surge-Upgrades mit vorkonfigurierten Parametern
Autoscaling	Konfigurierbar: Autoscaling-Profil	Vorkonfiguriert: Autoscaling-Profil `optimize-utilization`
Netzwerk	VPC-nativ oder routenbasiert	Erfordert einen VPC-nativer Cluster
Sicherheit	Konfigurierbar: IAM-Dienstkonto für Knoten Zugriffsbereiche Secure Boot	Vorkonfiguriert: IAM-Dienstkonto für Knoten: verwendet das Dienstkonto für die automatische Knotenbereitstellung. Zugriffsbereiche: verwendet die Zugriffsbereiche für die automatische Knotenbereitstellung. Secure Boot: aktiviert Sicherheitsbeschränkungen für Knoten: integrierte Autopilot-Sicherheitskonfigurationen, die nach bestem Bemühen erzwungen werden.
Betriebssystem des Knotens	Konfigurierbar: Knoten-Image Knotensystemkonfiguration Linux-Cgroup-Modus	Vorkonfiguriert: Knoten-Image: Container-Optimized OS mit containerd Knotensystemkonfiguration: nur mit dem Feld `nodeSystemConfig` der ComputeClass konfigurierbar. Cgroup-Modus: v2
Bootlaufwerk des Knotens	Konfigurierbar: Bootlaufwerktyp Größe des Bootlaufwerks	Konfigurierbar: Bootlaufwerktyp: verwendet den Wert im Feld der ComputeClass `storage.bootDiskType`. Wenn dieses Feld nicht festgelegt ist, legt GKE den Bootlaufwerktyp so fest: Wenn die ComputeClass `podFamily` Regeln verwendet, verwendet GKE ein `pd-balanced` Laufwerk. Wenn die ComputeClass keine `podFamily`-Regeln verwendet, GKE verwendet den Standard-Bootlaufwerktyp für den Cluster. Größe des Bootlaufwerks: GKE verwendet den Wert im Compute Class `storage.bootDiskSize` Feld. Wenn dieses Feld nicht festgelegt ist, legt GKE die Größe des Bootlaufwerks so fest: Wenn Sie eine Standardgröße für das Bootlaufwerk für die automatische Knotenbereitstellung festlegen, verwendet GKE diesen Wert. Wenn Sie keine Standardgröße für das Bootlaufwerk für die automatische Knotenbereitstellung festlegen, verwendet GKE die Standardgröße des Clusters.
Knotenmetadaten	Resource Manager-Tags für Firewallrichtlinien: Aktualisierungen von Tags auf Clusterebene wirken sich nicht auf vorhandene Knoten aus.	Resource Manager-Tags für Firewallrichtlinien: Aktualisierungen von Tags auf Clusterebene wirken sich auf vorhandene Knoten aus.

Ressourcenanfragen für Autopilot-Arbeitslasten

Damit Autopilot-Arbeitslasten effizient ausgeführt werden können, erzwingt GKE bestimmte Mindest- und Höchstwerte für CPU-, Arbeitsspeicher- und sitzungsspezifische Speicheranfragen in Ihren Pods. GKE wendet auch Standardanfragen auf Pods an, die keine dieser Ressourcen explizit anfordern. Die spezifischen Werte für die Mindest-, Höchst- und Standardanforderungen für Ressourcen in GKE Autopilot-Arbeitslasten variieren je nach Hardwaretyp, den Ihre Pods verwenden.

Für sitzungsspezifischen Speicher ist der Standardwert, wenn Sie keinen sitzungsspezifischen Speicher anfordern, für alle ComputeClasses und Hardwareauswahlen immer gleich. Weitere Informationen finden Sie unter Standardanforderungen für Ressourcen.

In der folgenden Tabelle finden Sie Links zu den CPU- und Arbeitsspeicheranforderungen für Ihre Pod-Anfragen, je nach Hardwaretyp:

**Tabelle 4.** CPU- und Arbeitsspeicheranforderungen für Autopilot
Ressourcentyp	Mindest- und Höchstanforderungen	Standardanforderungen
Pods für allgemeine Zwecke	Informationen zu integrierten Autopilot-ComputeClasses finden Sie in der Zeile „für allgemeine Zwecke“ in der Tabelle Mindest- und Höchstwerte für ComputeClasses. Informationen zu `podFamily` Prioritätsregeln in benutzerdefinierten Autopilot ComputeClasses finden Sie unter Ressourcenanfragen für die Trennung von Arbeitslasten und längere Ausführungszeiten.	Informationen zu integrierten Autopilot-ComputeClasses finden Sie in der Zeile „Allgemeine Zwecke“ in der Tabelle Standardanforderungen für ComputeClasses. Informationen zu `podFamily` Prioritätsregeln in benutzerdefinierten Autopilot ComputeClasses finden Sie unter den Ressourcenanfragen für die Trennung von Arbeitslasten und längere Ausführungszeiten.
GPUs und TPUs	Hängt vom Typ und der Menge des Hardwarebeschleunigers ab. Weitere Informationen finden Sie unter Mindest- und Höchstwerte für die ComputeClass „Beschleuniger“.	Hängt vom Typ und der Menge des Hardwarebeschleunigers ab. Weitere Informationen finden Sie unter Standardanforderungen für Beschleuniger.
Bestimmte Compute Engine-Maschinentypen und ‑maschinenfamilien	Mindestwert: Keine Mindestwerte für CPU oder Arbeitsspeicher. Höchstwert: Der Höchstwert ist die Ressourcenkapazität der Compute Engine-Instanz.	Für jeden Compute Engine-Maschinentyp oder jede Maschinenfamilie sind die Standardanforderungen in der Zeile „Allgemeine Zwecke“ in der Tabelle „Standardanforderungen für ComputeClasses“ enthalten.