Sie können ComputeClasses verwenden, um Google Kubernetes Engine- Arbeitslasten (GKE) im Autopilot-Modus in Ihren GKE Standard auszuführen. In diesem Dokument werden die Methoden beschrieben, mit denen Sie Ihre Arbeitslasten im Autopilot-Modus ausführen können, und Sie erfahren, wann Sie eine Arbeitslast in einem bestimmten Modus ausführen sollten.
Diese Informationen richten sich an folgende Personen:
- Cloud-Architekten, die Betriebskosten in Unternehmen optimieren möchten.
- Plattformadministratoren, die den Aufwand für die manuelle Infrastrukturverwaltung reduzieren möchten.
- Site Reliability Engineers (SREs), die die Infrastruktur wartung, ‑upgrades und ‑skalierung nach Möglichkeit an Google auslagern möchten. Cloud de Confiance by S3NS
Sie sollten mit den folgenden Konzepten vertraut sein:
GKE Autopilot
Autopilot ist ein Betriebsmodus in GKE, in dem Google Ihre Knoteninfrastruktur, Skalierung, Sicherheit und vorkonfigurierten Funktionen verwaltet. Der Autopilot-Modus ist für die Ausführung der meisten Produktionsarbeitslasten in einer Umgebung optimiert, in der empfohlene Einstellungen für Sicherheit, Zuverlässigkeit, Leistung und Skalierbarkeit angewendet werden. Informationen zur Entscheidung zwischen dem Autopilot Modus und dem Standardmodus basierend auf Ihren Anforderungen finden Sie unter GKE-Betriebsmodi.
Sie können den Autopilot-Modus auf folgende Arten verwenden:
- Cluster im Autopilot Modus erstellen: Google verwaltet den gesamten Cluster und wendet Best Practices für Automatisierung, Zuverlässigkeit, Sicherheit und Kosten an.
- Arbeitslasten im Autopilot-Modus in Standardclustern ausführen: Sie stellen Autopilot-ComputeClasses bereit und wählen sie in Arbeitslasten aus. Google verwaltet die Knoten, die GKE für diese spezifischen Arbeitslasten in einem von Autopilot verwalteten Knoten pool erstellt. Sie steuern den Cluster und können Ihre eigenen Standardknotenpools neben den von GKE verwalteten Knoten ausführen.
Autopilot-Modus für ComputeClasses
Eine ComputeClass ist eine benutzerdefinierte Kubernetes-Ressource, die eine Liste von Knotenkonfigurationen wie Maschinentypen oder Funktionseinstellungen definiert. Sie können bestimmte ComputeClasses in Kubernetes-Arbeitslastspezifikationen auswählen. Wenn für eine Arbeitslast, die eine ComputeClass auswählt, ein neuer Knoten erforderlich ist, versucht GKE, den Knoten mit einer der Konfigurationen bereitzustellen, die von der ComputeClass deklariert werden. GKE versucht jede Konfiguration in der ComputeClass der Reihe nach und greift auf die nächste Konfiguration zurück, wenn die Knotenerstellung fehlschlägt. Weitere Informationen finden Sie unter Benutzerdefinierte ComputeClasses.
Wenn Sie Autopilot-Arbeitslasten in Ihren GKE-Standardclustern ausführen möchten, aktivieren Sie den Autopilot-Modus in einer ComputeClass und wählen Sie diese ComputeClass in bestimmten Arbeitslasten aus. Google verwaltet alle neuen Knoten, die GKE für diese Arbeitslasten bereitstellt, ähnlich wie die Knoten in Autopilot-Clustern. Die meisten Vorteile und Sicherheitsfunktionen des Autopilot-Modus gelten für diese Arbeitslasten und die Hostknoten.
Autopilot-Modus-ComputeClasses bieten Clusteradministratoren zusätzliche Flexibilität bei der Auswahl des Kontrollgrads, den sie über bestimmte Arbeitslasten und die Infrastruktur in ihrem Cluster haben möchten, z. B. auf folgende Weise:
- Sie können bestimmte Arbeitslasten vollständig von GKE verwalten lassen, indem Sie sie im Autopilot-Modus ausführen.
- Sie behalten die volle Kontrolle über Arbeitslasten und die Infrastruktur, die den Autopilot-Modus nicht verwenden, z. B. manuell erstellte Knotenpools.
- Sie können eine Autopilot-ComputeClass als den Standard für Ihren Cluster oder Namespace, festlegen, sodass Arbeitslasten im Autopilot-Modus ausgeführt werden, es sei denn, sie fordern explizit eine andere Option an.
Mit diesen Optionen können Clusteradministratoren den Grad und den Umfang der Nutzung von Autopilot festlegen.
Vorteile von Autopilot-ComputeClasses in Standardclustern
Wenn Sie einige Ihrer Arbeitslasten im Autopilot-Modus ausführen, bietet das folgende Vorteile:
- Kosten für die Infrastrukturverwaltung senken: Google führt Upgrades durch, wartet, konfiguriert und optimiert bestimmte Knoten für Sie.
- Autopilot-Preismodell verwenden: Arbeitslasten, die eine Autopilot-ComputeClass verwenden, werden nach dem Autopilot Preismodell abgerechnet. Dieses Preismodell umfasst die Abrechnung pro Pod für Arbeitslasten, die keine bestimmte Hardware anfordern. Weitere Informationen finden Sie im Abschnitt Preise.
- Skalierung und Sicherheit verbessern: Autopilot-Arbeitslasten profitieren von Vorteilen wie dem Zugriff auf die containeroptimierte Compute-Plattform, verbesserten Standardsicherheitsbeschränkungen und dem Autoscaling von Knoten basierend auf Ressourcen anfragen. Die Knoten für diese Arbeitslasten verwenden Funktionen wie automatische Knotenupgrades und automatische Reparaturen.
- Zuverlässigkeit verbessern: Das GKE Service Level Agreement (SLA) umfasst ein Service Level Objective (SLO) für die Pod-Betriebszeit für Autopilot.
Viele dieser Vorteile bieten auch Autopilot-Cluster, die auch eine besser verwaltete Umgebung als Standardcluster bieten und mehrere Vorteile in Bezug auf Sicherheit, Netzwerk und Ressourcenverwaltung umfassen. Weitere Informationen finden Sie unter Autopilot-Übersicht.
Hardwareauswahl in Autopilot-ComputeClasses
In Autopilot-ComputeClasses können Sie bestimmte Hardware für Ihre Knoten auswählen (z. B. GPUs oder Maschinentypen) oder GKE Pods auf einer containeroptimierten Compute-Plattform für allgemeine Zwecke platzieren lassen. Die Option für allgemeine Zwecke wird für die meisten Produktionsarbeitslasten empfohlen, für die keine bestimmte Hardware erforderlich ist, um gut zu funktionieren. Sie unterstützt sowohl x86- als auch Arm-Architekturen.
In der folgenden Tabelle werden diese Konfigurationsoptionen beschrieben, wie Sie eine in einer ComputeClass auswählen und wie sich diese Auswahl auf Ihr Abrechnungsmodell auswirkt:
| Arbeitslastanforderung | Empfohlene ComputeClass-Konfiguration | Abrechnungsmodell |
|---|---|---|
| Arbeitslasten für allgemeine Zwecke | Verwenden Sie eine Autopilot-ComputeClass mit der
Die
integrierten Autopilot-ComputeClasses
verwenden nur |
Pod-basiertes Abrechnungsmodell |
| Arbeitslasten, die bestimmte Hardware benötigen | Verwenden Sie eine ComputeClass, die eine beliebige verfügbare Hardwarekonfiguration
regel verwendet, z. B. die Regel |
Knotenbasiertes Abrechnungsmodell |
Konfiguration von Autopilot in ComputeClasses
Sie können den Autopilot-Modus in einem Standardcluster verwenden, indem Sie eine von GKE bereitgestellte integrierte Autopilot-ComputeClass verwenden oder Autopilot in einer von Ihnen erstellten benutzerdefinierten ComputeClass aktivieren. In den folgenden Abschnitten werden die einzelnen Optionen beschrieben.
Integrierte Autopilot-ComputeClasses
GKE konfiguriert bestimmte Autopilot-ComputeClasses für Sie. Sie können
diese integrierten Autopilot-Klassen
in jedem geeigneten Cluster auswählen. Die integrierten Autopilot-ComputeClasses in Standardclustern verwenden die Prioritätsregel podFamily, um Pods auf der containeroptimierten Compute-Plattform auszuführen. Weitere Informationen finden Sie unter
Integrierte ComputeClasses in GKE.
Benutzerdefinierte Autopilot-ComputeClasses
Sie können Autopilot in jeder benutzerdefinierten ComputeClass aktivieren, die Sie verwalten, indem Sie das Feld autopilot in der ComputeClass-Spezifikation verwenden. Benutzerdefinierte Autopilot-ComputeClasses sind in folgenden Situationen nützlich:
- Ihre Arbeitslasten haben bestimmte Hardwareanforderungen, z. B. Beschleuniger.
- Sie möchten bestimmte Knotenoptionen ändern, z. B. Zonen festlegen oder Taints anwenden, während Sie weiterhin die containeroptimierte Compute-Plattform von Autopilot verwenden.
Wenn Sie Autopilot in einer vorhandenen ComputeClass aktivieren möchten, müssen Sie sie löschen, die Konfiguration aktualisieren und die ComputeClass dann in Ihrem Cluster neu erstellen. Ihre Änderungen gelten für alle neuen Knoten, die GKE für Arbeitslasten erstellt, die Sie nach der Aktualisierung der Autopilot-ComputeClass bereitstellen.
Weitere Informationen zum Aktivieren von Autopilot in Ihren benutzerdefinierten ComputeClasses finden Sie unter Bestimmte Hardware für Ihre Autopilot-Pods auswählen.
Preise
Die GKE Autopilot-Preise gelten für die Knoten und Arbeitslasten, die GKE für eine Autopilot-ComputeClass erstellt. Das Autopilot-Abrechnungsmodell, das für eine bestimmte Arbeitslast gilt, hängt von der ComputeClass-Prioritätsregel ab, die GKE zum Erstellen von Knoten für diese Arbeitslast verwendet.
In der folgenden Tabelle wird das Abrechnungsmodell beschrieben, das für verschiedene Autopilot-ComputeClass-Konfigurationen in Ihren Standardclustern gilt:
| Abrechnungsmodelle für verschiedene ComputeClass-Konfigurationen | |
|---|---|
| Pod-basiertes Abrechnungsmodell | Das Pod-basierte Abrechnungsmodell wird angewendet, wenn GKE eine
podFamily Prioritätsregel verwendet, um Knoten für eine Arbeitslast zu erstellen. Die
integrierten Autopilot-ComputeClasses,
verwenden immer das Pod-basierte Abrechnungsmodell. |
| Knotenbasiertes Abrechnungsmodell | Das knotenbasierte Abrechnungsmodell wird angewendet, wenn GKE eine ComputeClass-Prioritätsregel verwendet, die explizit bestimmte Hardware anfordert, z. B. eine bestimmte Maschinenfamilie oder GPUs. |
Die Autopilot-Preise gelten nur für die Arbeitslasten und Knoten, die eine Autopilot -ComputeClass verwenden. Für Ihren Standardcluster und alle anderen Knotenpools, die Sie ausführen, gelten weiterhin die GKE-Standardpreise.
Vorkonfigurierte Einstellungen für von Autopilot verwaltete Knoten
Bevor Sie den Autopilot-Modus in Ihren ComputeClasses aktivieren, sollten Sie wissen, was Sie von den Knoten erwarten können, die GKE zum Ausführen der Autopilot-Arbeitslasten erstellt. Google konfiguriert bestimmte Funktionen und Sicherheitsbeschränkungen in Autopilot-Knoten. Daher werden Arbeitslasten, die in Ihren Standardknoten korrekt bereitgestellt und ausgeführt werden, möglicherweise vom Autopilot-Modus abgelehnt, wenn sie die Sicherheitsanforderungen von Autopilot nicht erfüllen.
In der folgenden Tabelle werden die Funktionskonfigurationen beschrieben, die die entsprechenden Einstellungen in Ihrem Standardcluster überschreiben. Wenn eine Konfiguration nicht in dieser Tabelle enthalten ist, verwenden die Autopilot-Knoten die Einstellung des Standardclusters. Die Workload Identity-Föderation für GKE ist beispielsweise nicht in dieser Tabelle enthalten. Das bedeutet, dass die Einstellung für die Workload Identity-Föderation für GKE des Standardclusters für die Autopilot-Knoten gilt, die GKE erstellt.
| Funktion | Einstellung auf Standardclusterebene | Einstellung für von Autopilot verwaltete Knoten |
|---|---|---|
| Knotenupgrades und ‑wartung |
Konfigurierbar: |
Vorkonfiguriert:
|
| Autoscaling | Konfigurierbar: Autoscaling-Profil | Vorkonfiguriert: Autoscaling-Profil optimize-utilization |
| Netzwerk | VPC-nativ oder routenbasiert | Erfordert einen VPC-nativer Cluster |
| Sicherheit |
Konfigurierbar:
|
Vorkonfiguriert:
|
| Betriebssystem des Knotens |
Konfigurierbar: |
Vorkonfiguriert:
|
| Bootlaufwerk des Knotens |
Konfigurierbar: |
Konfigurierbar:
|
| Knotenmetadaten |
|
|
Ressourcenanfragen für Autopilot-Arbeitslasten
Damit Autopilot-Arbeitslasten effizient ausgeführt werden können, erzwingt GKE bestimmte Mindest- und Höchstwerte für CPU-, Arbeitsspeicher- und sitzungsspezifische Speicheranfragen in Ihren Pods. GKE wendet auch Standardanfragen auf Pods an, die keine dieser Ressourcen explizit anfordern. Die spezifischen Werte für die Mindest-, Höchst- und Standardanforderungen für Ressourcen in GKE Autopilot-Arbeitslasten variieren je nach Hardwaretyp, den Ihre Pods verwenden.
Für sitzungsspezifischen Speicher ist der Standardwert, wenn Sie keinen sitzungsspezifischen Speicher anfordern, für alle ComputeClasses und Hardwareauswahlen immer gleich. Weitere Informationen finden Sie unter Standardanforderungen für Ressourcen.
In der folgenden Tabelle finden Sie Links zu den CPU- und Arbeitsspeicheranforderungen für Ihre Pod-Anfragen, je nach Hardwaretyp:
| Ressourcentyp | Mindest- und Höchstanforderungen | Standardanforderungen |
|---|---|---|
| Pods für allgemeine Zwecke |
|
|
| GPUs und TPUs | Hängt vom Typ und der Anzahl der Hardwarebeschleuniger ab. Weitere Informationen finden Sie unter Mindest- und Höchstwerte für die ComputeClass „Beschleuniger“. | Hängt vom Typ und der Anzahl der Hardwarebeschleuniger ab. Weitere Informationen finden Sie unter Standardanforderungen für Beschleuniger. |
| Bestimmte Compute Engine-Maschinentypen und ‑maschinenfamilien |
|
Für jeden Compute Engine-Maschinentyp oder jede Maschinenfamilie gelten die Standardanforderungen in der Zeile „für allgemeine Zwecke“ in der Tabelle Standardanforderungen für ComputeClasses. |
Nächste Schritte
- Arbeitslasten im Autopilot-Modus in Standardclustern bereitstellen
- Benutzerdefinierte ComputeClasses