Instanz mit dem reservierungsgebundenen Modell erstellen

In diesem Dokument wird beschrieben, wie Sie eine eigenständige Compute Engine-Instanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen. Mit diesem Bereitstellungsmodell können Sie A4X Max-, A4X-, A4-, A3 Ultra-, A3 Mega-, A3 High-Instanzen mit 8 GPUs, A3 Edge- oder H4D Instanzen erstellen, indem Sie vorreservierte Kapazität nutzen.

Weitere Methoden zum Erstellen von Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell finden Sie in der Dokumentation zu AI Hypercomputer unter Bereitstellungsoptionen – Übersicht.

Hinweis

  • Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben. Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Cloud de Confiance by S3NS Dienste und APIs überprüft. Zur Ausführung von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich bei Compute Engine authentifizieren, indem Sie eine der folgenden Optionen auswählen:

    Wählen Sie den Tab für die Verwendung der Beispiele auf dieser Seite aus:

    Console

    Wenn Sie über die Cloud de Confiance Console auf Cloud de Confiance by S3NS Dienste und APIs zugreifen, müssen Sie die Authentifizierung nicht einrichten.

    gcloud

    1. Installieren Sie die Google Cloud CLI und melden Sie sich dann mit Ihrer föderierten Identität in der gcloud CLI an. Nach der Anmeldung, initialisieren Sie die Google Cloud CLI mit dem folgenden Befehl:

      gcloud init
  • Legen Sie eine Standardregion und -zone fest.
  • REST

    Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.

      Installieren Sie die Google Cloud CLI und melden Sie sich dann mit Ihrer föderierten Identität in der gcloud CLI an.

    Weitere Informationen finden Sie in der Cloud de Confiance Authentifizierungsdokumentation unter Für die Verwendung von REST authentifizieren.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) IAM-Rolle für das Projekt zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Erstellen von Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell benötigen, Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen , um die notwendigen Berechtigungen anzuzeigen, die erforderlich sind:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind zum Erstellen von Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell erforderlich:

  • compute.instances.create für das Projekt
  • Zum Erstellen der VM mit einem benutzerdefinierten Image: compute.images.useReadOnly für das Image
  • Um die VM mit einem Snapshot zu erstellen: compute.snapshots.useReadOnly für den Snapshot
  • Zum Erstellen der VM mit einer Instanzvorlage: compute.instanceTemplates.useReadOnly für die Instanzvorlage
  • Zum Angeben eines Subnetzes für Ihre VM: compute.subnetworks.use für das Projekt oder für das ausgewählte Subnetz
  • Zum Festlegen einer statischen IP-Adresse für die VM: compute.addresses.use für das Projekt
  • Zum Zuweisen einer externen IP-Adresse zur VM, wenn Sie ein VPC-Netzwerk verwenden: compute.subnetworks.useExternalIp für das Projekt oder für das ausgewählte Subnetz
  • Zum Zuweisen eines Legacy-Netzwerks zur VM: compute.networks.use für das Projekt
  • Zum Zuweisen einer externen IP-Adresse zur VM, wenn Sie ein Legacy-Netzwerk verwenden: compute.networks.useExternalIp für das Projekt
  • Zum Festlegen von Metadaten der VM-Instanz für die VM: compute.instances.setMetadata für das Projekt
  • Zum Festlegen von Tags für die VM: compute.instances.setTags für die VM
  • Zum Festlegen von Labels für die VM: compute.instances.setLabels für die VM
  • Zum Festlegen eines Dienstkontos für die VM: compute.instances.setServiceAccount für die VM
  • Um ein neues Laufwerk für die VM zu erstellen: compute.disks.create für das Projekt
  • Zum Anhängen eines vorhandenen Laufwerks im Lese- oder Lese-/Schreibmodus: compute.disks.use für das Laufwerk
  • So hängen Sie ein vorhandenes Laufwerk im Lesemodus an: compute.disks.useReadOnly für das Laufwerk

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Instanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen

Wenn Sie eine A4X Max-, A4X-, A4-, A3 Ultra-, A3 Mega-, A3 High-Instanz mit 8 GPUs oder eine H4D-Instanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen möchten, müssen Sie warten, bis die automatisch erstellte Reservierung, die Sie verwenden möchten, die Startzeit erreicht hat. Außerdem muss die Compute-Instanz, die Sie erstellen möchten, alle folgenden Anforderungen erfüllen:

Im folgenden Beispiel wird eine Anfrage für eine zukünftige Reservierung im Kalendermodus für fünf A3 Ultra-Instanzen erstellt und dann eine A3 Ultra-Instanz erstellt, indem die automatisch erstellte Reservierung für die Anfrage genutzt wird.

Wenn Sie eine Beispiel-Compute-Instanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen möchten, wählen Sie eine der folgenden Optionen aus:

Console

  1. Erstellen Sie eine Beispielanfrage für fünf A3 Ultra-Instanzen und senden Sie sie zur Überprüfung ein:

    1. Rufen Sie in der Cloud de Confiance Console die Seite Reservierungen auf.

      Zu „Reservierungen“

    2. Klicken Sie auf den Tab Zukünftige Reservierungen.

    3. Klicken Sie auf Vorausschauende Reservierung erstellen. Die Seite Vorausschauende Reservierung erstellen wird angezeigt.

    4. Klicken Sie auf den Tab GPUs und wählen Sie dann in der Liste GPU-Typ die Option NVIDIA H200 141 GB aus. Mit dieser Aktion wird eine A3 Ultra-Instanz angegeben.

    5. Geben Sie im Feld Erforderliche Gesamtkapazität den Wert 5 ein.

    6. Geben Sie im Abschnitt Reservierungszeitraum die Startzeit und die Dauer für den Reservierungszeitraum an.

    7. Klicken Sie auf Nach Kapazität suchen und wählen Sie dann im Abschnitt Verfügbare Kapazität eine der verfügbaren Maschinen aus.

    8. Klicken Sie auf Erstellen.

  2. So erstellen Sie zur Startzeit der Anfrage eine A3 Ultra-Instanz, um die automatisch erstellte Beispielreservierung zu nutzen:

    1. Rufen Sie in der Cloud de Confiance Console die Seite Instanz erstellen auf.

      Zur Seite „Instanz erstellen“

    2. Geben Sie im Feld Name einen Namen für die Compute-Instanz ein. Geben Sie für dieses Beispiel example-instance ein.

    3. Geben Sie die Region und Zone an, in der sich die automatisch erstellte Reservierung befindet. Wählen Sie für dieses Beispiel us-central1 und us-central1-b aus.

    4. Klicken Sie auf den Tab GPUs und wählen Sie dann in der Liste GPU-Typ die Option NVIDIA H200 141 GB aus. Mit dieser Aktion wird eine A3 Ultra-Instanz angegeben und das Bereitstellungsmodell auf Reservierungsgebunden festgelegt.

    5. Klicken Sie im Navigationsmenü auf Erweitert.

    6. Wählen Sie im Abschnitt Reservierungen die Option Reservierung auswählen aus und klicken Sie dann auf Reservierung auswählen.

    7. Gehen Sie im Bereich Reservierung auswählen so vor:

      1. Wählen Sie die automatisch erstellte Beispielreservierung aus.

      2. Klicken Sie auf Auswählen.

    8. Maximieren Sie im Abschnitt Bereitstellungsmodell den Abschnitt Erweiterte Einstellungen des VM-Bereitstellungsmodells.

    9. Wählen Sie in der Liste Bei VM-Beendigung die Option Beenden (Standardeinstellung) oder Löschen aus.

    10. Klicken Sie auf Erstellen.

gcloud

  1. Verwenden Sie den Befehl gcloud beta compute future-reservations create, um eine Beispielanfrage für fünf A3 Ultra-Instanzen zu erstellen und zur Überprüfung einzusenden:

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-setting=local \
        --start-time=2026-03-05T00:00:00Z \
        --end-time=2026-03-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-b
    

    Angenommen, Cloud de Confiance genehmigt die Anfrage und Compute Engine erstellt automatisch eine leere Reservierung. Zur Startzeit der Anfrage, am 5. März 2026, erhöht Compute Engine die Anzahl der reservierten GPU-Instanzen in der Reservierung. Sie können die Reservierung dann nutzen.

  2. Verwenden Sie zur Startzeit der Anfrage den gcloud compute instances create Befehl mit den folgenden Flags, um eine A3 Ultra-Instanz zu erstellen, die die automatisch erstellte Beispielreservierung nutzt:

    • Das Flag --instance-termination-action.

    • Das Flag --provisioning-model, das auf RESERVATION_BOUND gesetzt ist.

    • Das Flag --reservation.

    • Das Flag --reservation-affinity, das auf specific gesetzt ist.

    Der Befehl ähnelt dem folgenden. Die vollständigen Anforderungen zum Erstellen einer A3 Ultra-Instanz finden Sie unter A3 Ultra- oder A4-Instanz erstellen.

    gcloud compute instance create example-a3ultra-instance  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-b \
        ...
    

    Der Befehl enthält die folgenden Werte:

    • TERMINATION_ACTION: Gibt an, ob Compute Engine die Compute-Instanz am Ende des Reservierungszeitraums beendet (STOP) oder löscht (DELETE).

    • RESERVATION_URL: Die URL der Reservierung, die so formatiert ist:

      • Wenn sich die automatisch erstellte Reservierung in Ihrem Projekt befindet: example-reservation.

      • Wenn sich die automatisch erstellte Reservierung in einem anderen Projekt befindet: projects/PROJECT_ID/reservations/example-reservation.

REST

  1. Senden Sie eine POST Anfrage an die Beta futureReservations.insert Methode, um eine Beispielanfrage für fünf A3 Ultra-Instanzen zu erstellen und zur Überprüfung einzusenden:

    POST https://compute.s3nsapis.fr/compute/beta/projects/example-project/zones/us-central1-b/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2026-03-05T00:00:00Z",
        "endTime": "2026-03-19T00:00:00Z"
      }
    }
    

    Angenommen, Cloud de Confiance genehmigt die Anfrage und Compute Engine erstellt automatisch eine leere Reservierung. Zur Startzeit der Anfrage, am 5. März 2026, erhöht Compute Engine die Anzahl der reservierten GPU-Instanzen in der Reservierung. Sie können die Reservierung dann nutzen.

  2. Senden Sie zur Startzeit der Anfrage eine POST Anfrage an die instances.insert Methode, um eine A3 Ultra-Instanz zu erstellen, die die automatisch erstellte Beispielreservierung nutzt. Geben Sie im Anfragetext die folgenden Felder an:

    • Das Feld reservationAffinity.consumeReservationType, das auf SPECIFIC_RESERVATION gesetzt ist.

    • Das Feld reservationAffinity.key, das auf compute.googleapis.com/reservation-name gesetzt ist.

    • Das Feld reservationAffinity.values, das auf die URL der Reservierung gesetzt ist.

    • Das Feld scheduling.instanceTerminationAction.

    • Das Feld scheduling.provisioningModel, das auf RESERVATION_BOUND gesetzt ist.

    Die Anfrage ähnelt der folgenden. Die vollständigen Anforderungen zum Erstellen einer A3 Ultra-Instanz finden Sie unter A3 Ultra- oder A4-Instanz erstellen.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g",
        "name": "example-a3ultra-instance",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    Der Anfragetext enthält die folgenden Werte:

    • RESERVATION_URL: Die URL der Reservierung, die so formatiert ist:

      • Wenn sich die automatisch erstellte Reservierung in Ihrem Projekt befindet: example-reservation.

      • Wenn sich die automatisch erstellte Reservierung in einem anderen Projekt befindet: projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION: Gibt an, ob Compute Engine die Compute-Instanz am Ende des Reservierungszeitraums beendet (STOP) oder löscht (DELETE).

Nächste Schritte