Autopilot-Modus-Arbeitslasten in GKE Standard

Sie können ComputeClasses verwenden, um Google Kubernetes Engine- Arbeitslasten (GKE) im Autopilot-Modus in Ihren GKE Standard auszuführen. In diesem Dokument werden die Methoden beschrieben, mit denen Sie Ihre Arbeitslasten im Autopilot-Modus ausführen können, und Sie erfahren, wann Sie eine Arbeitslast in einem bestimmten Modus ausführen sollten.

Diese Informationen richten sich an folgende Personen:

  • Cloud-Architekten, die Betriebskosten in Unternehmen optimieren möchten.
  • Plattformadministratoren, die den Aufwand für die manuelle Infrastrukturverwaltung reduzieren möchten.
  • Site Reliability Engineers (SREs), die die Infrastruktur wartung, ‑upgrades und ‑skalierung nach Möglichkeit an Google auslagern möchten. Cloud de Confiance by S3NS

Sie sollten mit den folgenden Konzepten vertraut sein:

GKE Autopilot

Autopilot ist ein Betriebsmodus in GKE, in dem Google Ihre Knoteninfrastruktur, Skalierung, Sicherheit und vorkonfigurierten Funktionen verwaltet. Der Autopilot-Modus ist für die Ausführung der meisten Produktionsarbeitslasten in einer Umgebung optimiert, in der empfohlene Einstellungen für Sicherheit, Zuverlässigkeit, Leistung und Skalierbarkeit angewendet werden. Informationen zur Entscheidung zwischen dem Autopilot Modus und dem Standardmodus basierend auf Ihren Anforderungen finden Sie unter GKE-Betriebsmodi.

Sie können den Autopilot-Modus auf folgende Arten verwenden:

  • Cluster im Autopilot Modus erstellen: Google verwaltet den gesamten Cluster und wendet Best Practices für Automatisierung, Zuverlässigkeit, Sicherheit und Kosten an.
  • Arbeitslasten im Autopilot-Modus in Standardclustern ausführen: Sie stellen Autopilot-ComputeClasses bereit und wählen sie in Arbeitslasten aus. Google verwaltet die Knoten, die GKE für diese spezifischen Arbeitslasten in einem von Autopilot verwalteten Knoten pool erstellt. Sie steuern den Cluster und können Ihre eigenen Standardknotenpools neben den von GKE verwalteten Knoten ausführen.

Autopilot-Modus für ComputeClasses

Eine ComputeClass ist eine benutzerdefinierte Kubernetes-Ressource, die eine Liste von Knotenkonfigurationen wie Maschinentypen oder Funktionseinstellungen definiert. Sie können bestimmte ComputeClasses in Kubernetes-Arbeitslastspezifikationen auswählen. Wenn für eine Arbeitslast, die eine ComputeClass auswählt, ein neuer Knoten erforderlich ist, versucht GKE, den Knoten mit einer der Konfigurationen bereitzustellen, die von der ComputeClass deklariert werden. GKE versucht jede Konfiguration in der ComputeClass der Reihe nach und greift auf die nächste Konfiguration zurück, wenn die Knotenerstellung fehlschlägt. Weitere Informationen finden Sie unter Benutzerdefinierte ComputeClasses.

Wenn Sie Autopilot-Arbeitslasten in Ihren GKE-Standardclustern ausführen möchten, aktivieren Sie den Autopilot-Modus in einer ComputeClass und wählen Sie diese ComputeClass in bestimmten Arbeitslasten aus. Google verwaltet alle neuen Knoten, die GKE für diese Arbeitslasten bereitstellt, ähnlich wie die Knoten in Autopilot-Clustern. Die meisten Vorteile und Sicherheitsfunktionen des Autopilot-Modus gelten für diese Arbeitslasten und die Hostknoten.

Autopilot-Modus-ComputeClasses bieten Clusteradministratoren zusätzliche Flexibilität bei der Auswahl des Kontrollgrads, den sie über bestimmte Arbeitslasten und die Infrastruktur in ihrem Cluster haben möchten, z. B. auf folgende Weise:

  • Sie können bestimmte Arbeitslasten vollständig von GKE verwalten lassen, indem Sie sie im Autopilot-Modus ausführen.
  • Sie behalten die volle Kontrolle über Arbeitslasten und die Infrastruktur, die den Autopilot-Modus nicht verwenden, z. B. manuell erstellte Knotenpools.
  • Sie können eine Autopilot-ComputeClass als den Standard für Ihren Cluster oder Namespace, festlegen, sodass Arbeitslasten im Autopilot-Modus ausgeführt werden, es sei denn, sie fordern explizit eine andere Option an.

Mit diesen Optionen können Clusteradministratoren den Grad und den Umfang der Nutzung von Autopilot festlegen.

Vorteile von Autopilot-ComputeClasses in Standardclustern

Wenn Sie einige Ihrer Arbeitslasten im Autopilot-Modus ausführen, bietet das folgende Vorteile:

  • Kosten für die Infrastrukturverwaltung senken: Google führt Upgrades durch, wartet, konfiguriert und optimiert bestimmte Knoten für Sie.
  • Autopilot-Preismodell verwenden: Arbeitslasten, die eine Autopilot-ComputeClass verwenden, werden nach dem Autopilot Preismodell abgerechnet. Dieses Preismodell umfasst die Abrechnung pro Pod für Arbeitslasten, die keine bestimmte Hardware anfordern. Weitere Informationen finden Sie im Abschnitt Preise.
  • Skalierung und Sicherheit verbessern: Autopilot-Arbeitslasten profitieren von Vorteilen wie dem Zugriff auf die containeroptimierte Compute-Plattform, verbesserten Standardsicherheitsbeschränkungen und dem Autoscaling von Knoten basierend auf Ressourcen anfragen. Die Knoten für diese Arbeitslasten verwenden Funktionen wie automatische Knotenupgrades und automatische Reparaturen.
  • Zuverlässigkeit verbessern: Das GKE Service Level Agreement (SLA) umfasst ein Service Level Objective (SLO) für die Pod-Betriebszeit für Autopilot.

Viele dieser Vorteile bieten auch Autopilot-Cluster, die auch eine besser verwaltete Umgebung als Standardcluster bieten und mehrere Vorteile in Bezug auf Sicherheit, Netzwerk und Ressourcenverwaltung umfassen. Weitere Informationen finden Sie unter Autopilot-Übersicht.

Hardwareauswahl in Autopilot-ComputeClasses

In Autopilot-ComputeClasses können Sie bestimmte Hardware für Ihre Knoten auswählen (z. B. GPUs oder Maschinentypen) oder GKE Pods auf einer containeroptimierten Compute-Plattform für allgemeine Zwecke platzieren lassen. Die Option für allgemeine Zwecke wird für die meisten Produktionsarbeitslasten empfohlen, für die keine bestimmte Hardware erforderlich ist, um gut zu funktionieren. Sie unterstützt sowohl x86- als auch Arm-Architekturen.

In der folgenden Tabelle werden diese Konfigurationsoptionen beschrieben, wie Sie eine in einer ComputeClass auswählen und wie sich diese Auswahl auf Ihr Abrechnungsmodell auswirkt:

Tabelle 1. Hardwareauswahl in Autopilot-ComputeClasses
Arbeitslastanforderung Empfohlene ComputeClass-Konfiguration Abrechnungsmodell
Arbeitslasten für allgemeine Zwecke

Verwenden Sie eine Autopilot-ComputeClass mit der podFamily Prioritätsregel, um Arbeitslasten, für die keine bestimmte Hardware erforderlich ist, auf der containeroptimierten Compute- Plattform von Autopilot auszuführen. Diese Plattform eignet sich gut für Arbeitslasten für allgemeine Zwecke wie die folgenden:

  • Webserver
  • Ereignisgesteuerte Jobs
  • Batchverarbeitung
  • CI/CD-Pipelines

Die integrierten Autopilot-ComputeClasses verwenden nur podFamily Prioritätsregeln. Sie können auch podFamily Prioritätsregeln zu benutzerdefinierten Autopilot ComputeClasses hinzufügen.

Pod-basiertes Abrechnungsmodell
Arbeitslasten, die bestimmte Hardware benötigen

Verwenden Sie eine ComputeClass, die eine beliebige verfügbare Hardwarekonfiguration regel verwendet, z. B. die Regel machineFamily oder die Regel gpus .

Knotenbasiertes Abrechnungsmodell

Konfiguration von Autopilot in ComputeClasses

Sie können den Autopilot-Modus in einem Standardcluster verwenden, indem Sie eine von GKE bereitgestellte integrierte Autopilot-ComputeClass verwenden oder Autopilot in einer von Ihnen erstellten benutzerdefinierten ComputeClass aktivieren. In den folgenden Abschnitten werden die einzelnen Optionen beschrieben.

Integrierte Autopilot-ComputeClasses

GKE konfiguriert bestimmte Autopilot-ComputeClasses für Sie. Sie können diese integrierten Autopilot-Klassen in jedem geeigneten Cluster auswählen. Die integrierten Autopilot-ComputeClasses in Standardclustern verwenden die Prioritätsregel podFamily, um Pods auf der containeroptimierten Compute-Plattform auszuführen. Weitere Informationen finden Sie unter Integrierte ComputeClasses in GKE.

Benutzerdefinierte Autopilot-ComputeClasses

Sie können Autopilot in jeder benutzerdefinierten ComputeClass aktivieren, die Sie verwalten, indem Sie das Feld autopilot in der ComputeClass-Spezifikation verwenden. Benutzerdefinierte Autopilot-ComputeClasses sind in folgenden Situationen nützlich:

  • Ihre Arbeitslasten haben bestimmte Hardwareanforderungen, z. B. Beschleuniger.
  • Sie möchten bestimmte Knotenoptionen ändern, z. B. Zonen festlegen oder Taints anwenden, während Sie weiterhin die containeroptimierte Compute-Plattform von Autopilot verwenden.

Wenn Sie Autopilot in einer vorhandenen ComputeClass aktivieren möchten, müssen Sie sie löschen, die Konfiguration aktualisieren und die ComputeClass dann in Ihrem Cluster neu erstellen. Ihre Änderungen gelten für alle neuen Knoten, die GKE für Arbeitslasten erstellt, die Sie nach der Aktualisierung der Autopilot-ComputeClass bereitstellen.

Weitere Informationen zum Aktivieren von Autopilot in Ihren benutzerdefinierten ComputeClasses finden Sie unter Bestimmte Hardware für Ihre Autopilot-Pods auswählen.

Preise

Die GKE Autopilot-Preise gelten für die Knoten und Arbeitslasten, die GKE für eine Autopilot-ComputeClass erstellt. Das Autopilot-Abrechnungsmodell, das für eine bestimmte Arbeitslast gilt, hängt von der ComputeClass-Prioritätsregel ab, die GKE zum Erstellen von Knoten für diese Arbeitslast verwendet.

In der folgenden Tabelle wird das Abrechnungsmodell beschrieben, das für verschiedene Autopilot-ComputeClass-Konfigurationen in Ihren Standardclustern gilt:

Tabelle 2. Preise für Autopilot-ComputeClasses
Abrechnungsmodelle für verschiedene ComputeClass-Konfigurationen
Pod-basiertes Abrechnungsmodell Das Pod-basierte Abrechnungsmodell wird angewendet, wenn GKE eine podFamily Prioritätsregel verwendet, um Knoten für eine Arbeitslast zu erstellen. Die integrierten Autopilot-ComputeClasses, verwenden immer das Pod-basierte Abrechnungsmodell.
Knotenbasiertes Abrechnungsmodell Das knotenbasierte Abrechnungsmodell wird angewendet, wenn GKE eine ComputeClass-Prioritätsregel verwendet, die explizit bestimmte Hardware anfordert, z. B. eine bestimmte Maschinenfamilie oder GPUs.

Die Autopilot-Preise gelten nur für die Arbeitslasten und Knoten, die eine Autopilot -ComputeClass verwenden. Für Ihren Standardcluster und alle anderen Knotenpools, die Sie ausführen, gelten weiterhin die GKE-Standardpreise.

Vorkonfigurierte Einstellungen für von Autopilot verwaltete Knoten

Bevor Sie den Autopilot-Modus in Ihren ComputeClasses aktivieren, sollten Sie wissen, was Sie von den Knoten erwarten können, die GKE zum Ausführen der Autopilot-Arbeitslasten erstellt. Google konfiguriert bestimmte Funktionen und Sicherheitsbeschränkungen in Autopilot-Knoten. Daher werden Arbeitslasten, die in Ihren Standardknoten korrekt bereitgestellt und ausgeführt werden, möglicherweise vom Autopilot-Modus abgelehnt, wenn sie die Sicherheitsanforderungen von Autopilot nicht erfüllen.

In der folgenden Tabelle werden die Funktionskonfigurationen beschrieben, die die entsprechenden Einstellungen in Ihrem Standardcluster überschreiben. Wenn eine Konfiguration nicht in dieser Tabelle enthalten ist, verwenden die Autopilot-Knoten die Einstellung des Standardclusters. Die Workload Identity-Föderation für GKE ist beispielsweise nicht in dieser Tabelle enthalten. Das bedeutet, dass die Einstellung für die Workload Identity-Föderation für GKE des Standardclusters für die Autopilot-Knoten gilt, die GKE erstellt.

Tabelle 3. Vorkonfigurierte Einstellungen für Autopilot-Knoten
Funktion Einstellung auf Standardclusterebene Einstellung für von Autopilot verwaltete Knoten
Knotenupgrades und ‑wartung

Konfigurierbar:

Vorkonfiguriert:

  • Automatische Knotenreparatur: aktiviert
  • Automatische Knotenupgrades: aktiviert
  • Strategie für Knotenupgrades: Surge-Upgrades mit vorkonfigurierten Parametern
Autoscaling Konfigurierbar: Autoscaling-Profil Vorkonfiguriert: Autoscaling-Profil optimize-utilization
Netzwerk VPC-nativ oder routenbasiert Erfordert einen VPC-nativer Cluster
Sicherheit

Konfigurierbar:

  • IAM-Dienstkonto für Knoten
  • Zugriffsbereiche
  • Secure Boot

Vorkonfiguriert:

Betriebssystem des Knotens

Konfigurierbar:

Vorkonfiguriert:

Bootlaufwerk des Knotens

Konfigurierbar:

Konfigurierbar:

  • Bootlaufwerktyp: Verwendet den Wert im Feld der ComputeClass storage.bootDiskType. Wenn dieses Feld nicht festgelegt ist, legt GKE den Bootlaufwerktyp so fest:
    • Wenn die ComputeClass podFamily Regeln verwendet, verwendet GKE ein pd-balanced Laufwerk.
    • Wenn die ComputeClass keine podFamily-Regeln verwendet, GKE verwendet den Standard-Bootlaufwerktyp für den Cluster.
  • Größe des Bootlaufwerks: GKE verwendet den Wert im Compute Class storage.bootDiskSize Feld. Wenn dieses Feld nicht festgelegt ist, legt GKE die Größe des Bootlaufwerks so fest:
Knotenmetadaten

Ressourcenanfragen für Autopilot-Arbeitslasten

Damit Autopilot-Arbeitslasten effizient ausgeführt werden können, erzwingt GKE bestimmte Mindest- und Höchstwerte für CPU-, Arbeitsspeicher- und sitzungsspezifische Speicheranfragen in Ihren Pods. GKE wendet auch Standardanfragen auf Pods an, die keine dieser Ressourcen explizit anfordern. Die spezifischen Werte für die Mindest-, Höchst- und Standardanforderungen für Ressourcen in GKE Autopilot-Arbeitslasten variieren je nach Hardwaretyp, den Ihre Pods verwenden.

Für sitzungsspezifischen Speicher ist der Standardwert, wenn Sie keinen sitzungsspezifischen Speicher anfordern, für alle ComputeClasses und Hardwareauswahlen immer gleich. Weitere Informationen finden Sie unter Standardanforderungen für Ressourcen.

In der folgenden Tabelle finden Sie Links zu den CPU- und Arbeitsspeicheranforderungen für Ihre Pod-Anfragen, je nach Hardwaretyp:

Tabelle 4. CPU- und Arbeitsspeicheranforderungen für Autopilot
Ressourcentyp Mindest- und Höchstanforderungen Standardanforderungen
Pods für allgemeine Zwecke
GPUs und TPUs Hängt vom Typ und der Anzahl der Hardwarebeschleuniger ab. Weitere Informationen finden Sie unter Mindest- und Höchstwerte für die ComputeClass „Beschleuniger“. Hängt vom Typ und der Anzahl der Hardwarebeschleuniger ab. Weitere Informationen finden Sie unter Standardanforderungen für Beschleuniger.
Bestimmte Compute Engine-Maschinentypen und ‑maschinenfamilien
  • Minimum: Keine Mindestwerte für CPU oder Arbeitsspeicher.
  • Maximum: Der Höchstwert ist die Ressourcenkapazität der Compute Engine-Instanz.
Für jeden Compute Engine-Maschinentyp oder jede Maschinenfamilie gelten die Standardanforderungen in der Zeile „für allgemeine Zwecke“ in der Tabelle Standardanforderungen für ComputeClasses.

Nächste Schritte