Instanz mit dem reservierungsgebundenen Modell erstellen

In diesem Dokument wird beschrieben, wie Sie eine eigenständige Compute Engine-Instanz mit dem an Reservierungen gebundenen Bereitstellungsmodell erstellen. Mit diesem Bereitstellungsmodell können Sie A4X Max-, A4X-, A4- oder A3-Ultra-Instanzen erstellen, indem Sie vorreservierte Kapazität nutzen.

Weitere Methoden zum Erstellen von Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell finden Sie in der AI Hypercomputer-Dokumentation unter Übersicht über Bereitstellungsoptionen.

Hinweise

  • Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben. Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Cloud de Confiance by S3NS Dienste und APIs überprüft. Zum Ausführen von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei der Compute Engine authentifizieren:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Cloud de Confiance console to access Cloud de Confiance by S3NS services and APIs, you don't need to set up authentication.

    gcloud

    1. Installieren Sie die Google Cloud CLI und melden Sie sich dann mit Ihrer föderierten Identität in der gcloud CLI an. Nach der Anmeldung initialisieren Sie die Google Cloud CLI mit dem folgenden Befehl:

      gcloud init
    2. Set a default region and zone.

    REST

    Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.

      Installieren Sie die Google Cloud CLI und melden Sie sich dann mit Ihrer föderierten Identität in der gcloud CLI an. Nach der Anmeldung initialisieren Sie die Google Cloud CLI mit dem folgenden Befehl:

      gcloud init

    Weitere Informationen finden Sie in der Dokumentation zur Cloud de Confiance -Authentifizierung unter Für die Verwendung von REST authentifizieren.

Erforderliche Rollen

Um die Berechtigungen zu erhalten, die Sie zum Erstellen von Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell benötigen, bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) für das Projekt zu gewähren. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell zu erstellen:

  • compute.instances.create für das Projekt
  • Zum Erstellen der VM mit einem benutzerdefinierten Image: compute.images.useReadOnly für das Image
  • Zum Erstellen der VM mit einem Snapshot: compute.snapshots.useReadOnly für den Snapshot
  • Zum Erstellen der VM mit einer Instanzvorlage: compute.instanceTemplates.useReadOnly für die Instanzvorlage
  • Zum Angeben eines Subnetzes für Ihre VM: compute.subnetworks.use für das Projekt oder für das ausgewählte Subnetz
  • Zum Festlegen einer statischen IP-Adresse für die VM: compute.addresses.use für das Projekt
  • Zum Zuweisen einer externen IP-Adresse zur VM, wenn Sie ein VPC-Netzwerk verwenden: compute.subnetworks.useExternalIp für das Projekt oder für das ausgewählte Subnetz
  • Zum Zuweisen eines Legacy-Netzwerks zur VM: compute.networks.use für das Projekt
  • Zum Zuweisen einer externen IP-Adresse zur VM, wenn Sie ein Legacy-Netzwerk verwenden: compute.networks.useExternalIp für das Projekt
  • Zum Festlegen von Metadaten der VM-Instanz für die VM: compute.instances.setMetadata für das Projekt
  • Zum Festlegen von Tags für die VM: compute.instances.setTags für die VM
  • Zum Festlegen von Labels für die VM: compute.instances.setLabels für die VM
  • Zum Festlegen eines Dienstkontos für die VM: compute.instances.setServiceAccount für die VM
  • Zum Erstellen eines neuen Laufwerks für die VM: compute.disks.create für das Projekt
  • Zum Anhängen eines vorhandenen Laufwerks im Lese- oder Lese-/Schreibmodus: compute.disks.use für das Laufwerk
  • Zum Anhängen eines vorhandenen Laufwerks im Lesemodus: compute.disks.useReadOnly für das Laufwerk

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Instanz erstellen, die das reservierungsgebundene Bereitstellungsmodell verwendet

Wenn Sie eine A4X Max-, A4X-, A4- oder A3 Ultra-Compute-Instanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen möchten, müssen Sie warten, bis die automatisch erstellte Reservierung, die Sie verwenden möchten, den Startzeitpunkt erreicht hat. Außerdem muss die Instanz, die Sie erstellen möchten, alle folgenden Anforderungen erfüllen:

Im folgenden Beispiel wird eine Anfrage für eine vorausschauende Reservierung im Kalendermodus für fünf A3 Ultra-Instanzen erstellt. Anschließend wird eine A3 Ultra-Instanz erstellt, indem die automatisch erstellte Reservierung für die Anfrage genutzt wird.

Wenn Sie eine Beispielinstanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen möchten, wählen Sie eine der folgenden Optionen aus:

Console

  1. Erstellen Sie eine Beispielanfrage für fünf A3 Ultra-Instanzen und senden Sie sie zur Überprüfung:

    1. Rufen Sie in der Cloud de Confiance Console die Seite Reservierungen auf.

      Zu „Reservierungen“

    2. Klicken Sie auf den Tab Vorausschauende Reservierungen.

    3. Klicken Sie auf Vorausschauende Reservierung erstellen. Die Seite Vorausschauende Reservierung erstellen wird angezeigt.

    4. Klicken Sie auf den Tab GPUs und wählen Sie dann in der Liste GPU-Typ die Option NVIDIA H200 141 GB aus. Mit dieser Aktion wird eine A3 Ultra-Instanz angegeben.

    5. Geben Sie im Feld Benötigte Gesamtkapazität den Wert 5 ein.

    6. Geben Sie im Abschnitt Reservierungszeitraum die Startzeit und die Dauer für Ihren Reservierungszeitraum an.

    7. Klicken Sie auf Nach Kapazität suchen und wählen Sie dann im Abschnitt Verfügbare Kapazität einen der verfügbaren Computer aus.

    8. Klicken Sie auf Erstellen.

  2. So erstellen Sie zum Startzeitpunkt der Anfrage eine A3 Ultra-Instanz, um die automatisch erstellte Beispielreservierung zu nutzen:

    1. Rufen Sie in der Cloud de Confiance Console die Seite Instanz erstellen auf.

      Zur Seite „Instanz erstellen“

    2. Geben Sie im Feld Name einen Namen für die Instanz ein. Geben Sie für dieses Beispiel example-instance ein.

    3. Geben Sie die Region und die Zone an, in der die automatisch erstellte Reservierung vorhanden ist. Wählen Sie für dieses Beispiel us-central1 bzw. us-central1-b aus.

    4. Klicken Sie auf den Tab GPUs und wählen Sie dann in der Liste GPU-Typ die Option NVIDIA H200 141 GB aus. Mit dieser Aktion wird eine A3 Ultra-Instanz angegeben und das Bereitstellungsmodell auf Reservation-bound (An Reservierung gebunden) festgelegt.

    5. Klicken Sie im Navigationsmenü auf Erweitert.

    6. Wählen Sie im Bereich Reservierungen die Option Reservierung auswählen und dann Reservierung auswählen aus.

    7. Führen Sie im Bereich Reservierung auswählen die folgenden Schritte aus:

      1. Wählen Sie die automatisch erstellte Beispielreservierung aus.

      2. Klicken Sie auf Auswählen.

    8. Maximieren Sie im Abschnitt Bereitstellungsmodell den Abschnitt Erweiterte Einstellungen für das VM-Bereitstellungsmodell.

    9. Wählen Sie in der Liste Bei VM-Beendigung die Option Beenden (Standardeinstellung) oder Löschen aus.

    10. Klicken Sie auf Erstellen.

gcloud

  1. Verwenden Sie den Befehl gcloud beta compute future-reservations create, um eine Beispielanfrage für fünf A3 Ultra-Instanzen zu erstellen und zur Überprüfung einzureichen:

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-setting=local \
        --start-time=2026-03-05T00:00:00Z \
        --end-time=2026-03-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-b
    

    Angenommen, Cloud de Confiance genehmigt die Anfrage und Compute Engine erstellt automatisch eine leere Reservierung. Zur Startzeit der Anfrage am 5. März 2026 erhöht Compute Engine die Anzahl der reservierten GPU-Instanzen in der Reservierung. Anschließend können Sie die Reservierung nutzen.

  2. Verwenden Sie zum Erstellen einer A3 Ultra-Instanz zur Nutzung der automatisch erstellten Beispielreservierung zur Startzeit der Anfrage den Befehl gcloud compute instances create mit den folgenden Flags:

    • Das Flag --instance-termination-action.

    • Das Flag --provisioning-model, das auf RESERVATION_BOUND gesetzt ist.

    • Das Flag --reservation.

    • Das Flag --reservation-affinity, das auf specific gesetzt ist.

    Der Befehl sieht in etwa so aus: Die vollständigen Anforderungen zum Erstellen einer A3 Ultra-Instanz finden Sie unter A3 Ultra- oder A4-Instanz erstellen.

    gcloud compute instance create example-a3ultra-instance  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-b \
        ...
    

    Der Befehl enthält die folgenden Werte:

    • TERMINATION_ACTION: Gibt an, ob Compute Engine die Instanz am Ende des Reservierungszeitraums beendet (STOP) oder löscht (DELETE).

    • RESERVATION_URL: Die URL der Reservierung, die so formatiert ist:

      • Wenn die automatisch erstellte Reservierung in Ihrem Projekt vorhanden ist: example-reservation.

      • Wenn sich die automatisch erstellte Reservierung in einem anderen Projekt befindet: projects/PROJECT_ID/reservations/example-reservation.

REST

  1. Wenn Sie eine Beispielanfrage für fünf A3 Ultra-Instanzen erstellen und zur Überprüfung einreichen möchten, stellen Sie eine POST-Anfrage an die Betamethode futureReservations.insert:

    POST https://compute.s3nsapis.fr/compute/beta/projects/example-project/zones/us-central1-b/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2026-03-05T00:00:00Z",
        "endTime": "2026-03-19T00:00:00Z"
      }
    }
    

    Angenommen, Cloud de Confiance genehmigt die Anfrage und Compute Engine erstellt automatisch eine leere Reservierung. Zur Startzeit der Anfrage am 5. März 2026 erhöht Compute Engine die Anzahl der reservierten GPU-Instanzen in der Reservierung. Anschließend können Sie die Reservierung nutzen.

  2. Wenn Sie zum Startzeitpunkt der Anfrage eine A3 Ultra-Instanz erstellen möchten, um die automatisch erstellte Beispielreservierung zu nutzen, senden Sie eine POST-Anfrage an die Methode instances.insert. Geben Sie im Anfragetext die folgenden Felder an:

    • Das Feld reservationAffinity.consumeReservationType ist auf SPECIFIC_RESERVATION gesetzt.

    • Das Feld reservationAffinity.key ist auf compute.googleapis.com/reservation-name gesetzt.

    • Das Feld reservationAffinity.values ist auf die URL der Reservierung festgelegt.

    • Das Feld scheduling.instanceTerminationAction.

    • Das Feld scheduling.provisioningModel ist auf RESERVATION_BOUND gesetzt.

    Die Anfrage sieht etwa so aus: Die vollständigen Anforderungen zum Erstellen einer A3 Ultra-Instanz finden Sie unter A3 Ultra- oder A4-Instanz erstellen.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g",
        "name": "example-a3ultra-instance",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    Der Anfragetext enthält die folgenden Werte:

    • RESERVATION_URL: Die URL der Reservierung, die so formatiert ist:

      • Wenn die automatisch erstellte Reservierung in Ihrem Projekt vorhanden ist: example-reservation.

      • Wenn sich die automatisch erstellte Reservierung in einem anderen Projekt befindet: projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION: Gibt an, ob Compute Engine die Instanz am Ende des Reservierungszeitraums beendet (STOP) oder löscht (DELETE).

Nächste Schritte