In diesem Dokument wird beschrieben, wie Sie eine eigenständige Compute Engine-Instanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen. Mit diesem Bereitstellungsmodell können Sie A4X Max-, A4X-, A4-, A3 Ultra-, A3 Mega-, A3 High-Instanzen mit 8 GPUs, A3 Edge- oder H4D Instanzen erstellen, indem Sie vorreservierte Kapazität nutzen.
Weitere Methoden zum Erstellen von Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell finden Sie in der Dokumentation zu AI Hypercomputer unter Bereitstellungsoptionen – Übersicht.
Hinweis
-
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben.
Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Cloud de Confiance by S3NS Dienste und APIs überprüft. Zur Ausführung
von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich bei
Compute Engine authentifizieren, indem Sie eine der folgenden Optionen auswählen:
Wählen Sie den Tab für die Verwendung der Beispiele auf dieser Seite aus:
Console
Wenn Sie über die Cloud de Confiance Console auf Cloud de Confiance by S3NS Dienste und APIs zugreifen, müssen Sie die Authentifizierung nicht einrichten.
gcloud
-
Installieren Sie die Google Cloud CLI und melden Sie sich dann mit Ihrer föderierten Identität in der gcloud CLI an. Nach der Anmeldung, initialisieren Sie die Google Cloud CLI mit dem folgenden Befehl:
gcloud init
-
- Legen Sie eine Standardregion und -zone fest.
REST
Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.
Installieren Sie die Google Cloud CLI und melden Sie sich dann mit Ihrer föderierten Identität in der gcloud CLI an.
Weitere Informationen finden Sie in der Cloud de Confiance Authentifizierungsdokumentation unter Für die Verwendung von REST authentifizieren.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die
Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1)
IAM-Rolle für das Projekt zu gewähren, um die Berechtigungen zu erhalten, die
Sie zum Erstellen von Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell benötigen,
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen , um die notwendigen Berechtigungen anzuzeigen, die erforderlich sind:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind zum Erstellen von Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell erforderlich:
-
compute.instances.createfür das Projekt -
Zum Erstellen der VM mit einem benutzerdefinierten Image:
compute.images.useReadOnlyfür das Image -
Um die VM mit einem Snapshot zu erstellen:
compute.snapshots.useReadOnlyfür den Snapshot -
Zum Erstellen der VM mit einer Instanzvorlage:
compute.instanceTemplates.useReadOnlyfür die Instanzvorlage -
Zum Angeben eines Subnetzes für Ihre VM:
compute.subnetworks.usefür das Projekt oder für das ausgewählte Subnetz -
Zum Festlegen einer statischen IP-Adresse für die VM:
compute.addresses.usefür das Projekt -
Zum Zuweisen einer externen IP-Adresse zur VM, wenn Sie ein VPC-Netzwerk verwenden:
compute.subnetworks.useExternalIpfür das Projekt oder für das ausgewählte Subnetz -
Zum Zuweisen eines Legacy-Netzwerks zur VM:
compute.networks.usefür das Projekt -
Zum Zuweisen einer externen IP-Adresse zur VM, wenn Sie ein Legacy-Netzwerk verwenden:
compute.networks.useExternalIpfür das Projekt -
Zum Festlegen von Metadaten der VM-Instanz für die VM:
compute.instances.setMetadatafür das Projekt -
Zum Festlegen von Tags für die VM:
compute.instances.setTagsfür die VM -
Zum Festlegen von Labels für die VM:
compute.instances.setLabelsfür die VM -
Zum Festlegen eines Dienstkontos für die VM:
compute.instances.setServiceAccountfür die VM -
Um ein neues Laufwerk für die VM zu erstellen:
compute.disks.createfür das Projekt -
Zum Anhängen eines vorhandenen Laufwerks im Lese- oder Lese-/Schreibmodus:
compute.disks.usefür das Laufwerk -
So hängen Sie ein vorhandenes Laufwerk im Lesemodus an:
compute.disks.useReadOnlyfür das Laufwerk
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Instanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen
Wenn Sie eine A4X Max-, A4X-, A4-, A3 Ultra-, A3 Mega-, A3 High-Instanz mit 8 GPUs oder eine H4D-Instanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen möchten, müssen Sie warten, bis die automatisch erstellte Reservierung, die Sie verwenden möchten, die Startzeit erreicht hat. Außerdem muss die Compute-Instanz, die Sie erstellen möchten, alle folgenden Anforderungen erfüllen:
Die Compute-Instanz und die Reservierung müssen übereinstimmende Attribute haben.
Die Compute-Instanz muss speziell auf die Reservierung abzielen, um sie nutzen zu können.
Die Compute-Instanz muss zum Ende der Reservierung beendet oder gelöscht werden.
Im folgenden Beispiel wird eine Anfrage für eine zukünftige Reservierung im Kalendermodus für fünf A3 Ultra-Instanzen erstellt und dann eine A3 Ultra-Instanz erstellt, indem die automatisch erstellte Reservierung für die Anfrage genutzt wird.
Wenn Sie eine Beispiel-Compute-Instanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen möchten, wählen Sie eine der folgenden Optionen aus:
Console
Erstellen Sie eine Beispielanfrage für fünf A3 Ultra-Instanzen und senden Sie sie zur Überprüfung ein:
Rufen Sie in der Cloud de Confiance Console die Seite Reservierungen auf.
Klicken Sie auf den Tab Zukünftige Reservierungen.
Klicken Sie auf Vorausschauende Reservierung erstellen. Die Seite Vorausschauende Reservierung erstellen wird angezeigt.
Klicken Sie auf den Tab GPUs und wählen Sie dann in der Liste GPU-Typ die Option NVIDIA H200 141 GB aus. Mit dieser Aktion wird eine A3 Ultra-Instanz angegeben.
Geben Sie im Feld Erforderliche Gesamtkapazität den Wert
5ein.Geben Sie im Abschnitt Reservierungszeitraum die Startzeit und die Dauer für den Reservierungszeitraum an.
Klicken Sie auf Nach Kapazität suchen und wählen Sie dann im Abschnitt Verfügbare Kapazität eine der verfügbaren Maschinen aus.
Klicken Sie auf Erstellen.
So erstellen Sie zur Startzeit der Anfrage eine A3 Ultra-Instanz, um die automatisch erstellte Beispielreservierung zu nutzen:
Rufen Sie in der Cloud de Confiance Console die Seite Instanz erstellen auf.
Geben Sie im Feld Name einen Namen für die Compute-Instanz ein. Geben Sie für dieses Beispiel
example-instanceein.Geben Sie die Region und Zone an, in der sich die automatisch erstellte Reservierung befindet. Wählen Sie für dieses Beispiel us-central1 und us-central1-b aus.
Klicken Sie auf den Tab GPUs und wählen Sie dann in der Liste GPU-Typ die Option NVIDIA H200 141 GB aus. Mit dieser Aktion wird eine A3 Ultra-Instanz angegeben und das Bereitstellungsmodell auf Reservierungsgebunden festgelegt.
Klicken Sie im Navigationsmenü auf Erweitert.
Wählen Sie im Abschnitt Reservierungen die Option Reservierung auswählen aus und klicken Sie dann auf Reservierung auswählen.
Gehen Sie im Bereich Reservierung auswählen so vor:
Wählen Sie die automatisch erstellte Beispielreservierung aus.
Klicken Sie auf Auswählen.
Maximieren Sie im Abschnitt Bereitstellungsmodell den Abschnitt Erweiterte Einstellungen des VM-Bereitstellungsmodells.
Wählen Sie in der Liste Bei VM-Beendigung die Option Beenden (Standardeinstellung) oder Löschen aus.
Klicken Sie auf Erstellen.
gcloud
Verwenden Sie den Befehl
gcloud beta compute future-reservations create, um eine Beispielanfrage für fünf A3 Ultra-Instanzen zu erstellen und zur Überprüfung einzusenden:gcloud beta compute future-reservations create example-fr \ --auto-delete-auto-created-reservations \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=example-reservation \ --share-setting=local \ --start-time=2026-03-05T00:00:00Z \ --end-time=2026-03-19T00:00:00Z \ --machine-type=a3-ultragpu-8g \ --total-count=5 \ --zone=us-central1-bAngenommen, Cloud de Confiance genehmigt die Anfrage und Compute Engine erstellt automatisch eine leere Reservierung. Zur Startzeit der Anfrage, am 5. März 2026, erhöht Compute Engine die Anzahl der reservierten GPU-Instanzen in der Reservierung. Sie können die Reservierung dann nutzen.
Verwenden Sie zur Startzeit der Anfrage den
gcloud compute instances createBefehl mit den folgenden Flags, um eine A3 Ultra-Instanz zu erstellen, die die automatisch erstellte Beispielreservierung nutzt:Das Flag
--instance-termination-action.Das Flag
--provisioning-model, das aufRESERVATION_BOUNDgesetzt ist.Das Flag
--reservation.Das Flag
--reservation-affinity, das aufspecificgesetzt ist.
Der Befehl ähnelt dem folgenden. Die vollständigen Anforderungen zum Erstellen einer A3 Ultra-Instanz finden Sie unter A3 Ultra- oder A4-Instanz erstellen.
gcloud compute instance create example-a3ultra-instance \ --machine-type=a3-ultragpu-8g \ --instance-termination-action=TERMINATION_ACTION \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL \ --zone=us-central1-b \ ...Der Befehl enthält die folgenden Werte:
TERMINATION_ACTION: Gibt an, ob Compute Engine die Compute-Instanz am Ende des Reservierungszeitraums beendet (STOP) oder löscht (DELETE).RESERVATION_URL: Die URL der Reservierung, die so formatiert ist:Wenn sich die automatisch erstellte Reservierung in Ihrem Projekt befindet:
example-reservation.Wenn sich die automatisch erstellte Reservierung in einem anderen Projekt befindet:
projects/PROJECT_ID/reservations/example-reservation.
REST
Senden Sie eine
POSTAnfrage an die BetafutureReservations.insertMethode, um eine Beispielanfrage für fünf A3 Ultra-Instanzen zu erstellen und zur Überprüfung einzusenden:POST https://compute.s3nsapis.fr/compute/beta/projects/example-project/zones/us-central1-b/futureReservations { "name": "example-request-calendar-mode", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "example-reservation", "shareSettings": { "shareType": "LOCAL" }, "specificReservationRequired": true, "specificSkuProperties": { "machineType": "a3-ultragpu-8g", "totalCount": 5 }, "timeWindow": { "startTime": "2026-03-05T00:00:00Z", "endTime": "2026-03-19T00:00:00Z" } }Angenommen, Cloud de Confiance genehmigt die Anfrage und Compute Engine erstellt automatisch eine leere Reservierung. Zur Startzeit der Anfrage, am 5. März 2026, erhöht Compute Engine die Anzahl der reservierten GPU-Instanzen in der Reservierung. Sie können die Reservierung dann nutzen.
Senden Sie zur Startzeit der Anfrage eine
POSTAnfrage an dieinstances.insertMethode, um eine A3 Ultra-Instanz zu erstellen, die die automatisch erstellte Beispielreservierung nutzt. Geben Sie im Anfragetext die folgenden Felder an:Das Feld
reservationAffinity.consumeReservationType, das aufSPECIFIC_RESERVATIONgesetzt ist.Das Feld
reservationAffinity.key, das aufcompute.googleapis.com/reservation-namegesetzt ist.Das Feld
reservationAffinity.values, das auf die URL der Reservierung gesetzt ist.Das Feld
scheduling.instanceTerminationAction.Das Feld
scheduling.provisioningModel, das aufRESERVATION_BOUNDgesetzt ist.
Die Anfrage ähnelt der folgenden. Die vollständigen Anforderungen zum Erstellen einer A3 Ultra-Instanz finden Sie unter A3 Ultra- oder A4-Instanz erstellen.
POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances { { "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g", "name": "example-a3ultra-instance", "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION_URL" ], }, "scheduling": { "instanceTerminationAction": "TERMINATION_ACTION", "provisioningModel": "RESERVATION_BOUND" }, ... } }Der Anfragetext enthält die folgenden Werte:
RESERVATION_URL: Die URL der Reservierung, die so formatiert ist:Wenn sich die automatisch erstellte Reservierung in Ihrem Projekt befindet:
example-reservation.Wenn sich die automatisch erstellte Reservierung in einem anderen Projekt befindet:
projects/PROJECT_ID/reservations/example-reservation.
TERMINATION_ACTION: Gibt an, ob Compute Engine die Compute-Instanz am Ende des Reservierungszeitraums beendet (STOP) oder löscht (DELETE).