In diesem Dokument wird beschrieben, wie Sie eine eigenständige Compute Engine-Instanz mit dem an Reservierungen gebundenen Bereitstellungsmodell erstellen. Mit diesem Bereitstellungsmodell können Sie A4X Max-, A4X-, A4- oder A3-Ultra-Instanzen erstellen, indem Sie vorreservierte Kapazität nutzen.
Weitere Methoden zum Erstellen von Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell finden Sie in der AI Hypercomputer-Dokumentation unter Übersicht über Bereitstellungsoptionen.
Hinweise
-
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben.
Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Cloud de Confiance by S3NS Dienste und APIs überprüft. Zum Ausführen von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei der Compute Engine authentifizieren:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Cloud de Confiance console to access Cloud de Confiance by S3NS services and APIs, you don't need to set up authentication.
gcloud
-
Installieren Sie die Google Cloud CLI und melden Sie sich dann mit Ihrer föderierten Identität in der gcloud CLI an. Nach der Anmeldung initialisieren Sie die Google Cloud CLI mit dem folgenden Befehl:
gcloud init - Set a default region and zone.
REST
Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.
Installieren Sie die Google Cloud CLI und melden Sie sich dann mit Ihrer föderierten Identität in der gcloud CLI an. Nach der Anmeldung initialisieren Sie die Google Cloud CLI mit dem folgenden Befehl:
gcloud initWeitere Informationen finden Sie in der Dokumentation zur Cloud de Confiance -Authentifizierung unter Für die Verwendung von REST authentifizieren.
Erforderliche Rollen
Um die Berechtigungen zu erhalten, die Sie zum Erstellen von Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell benötigen, bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1) für das Projekt zu gewähren. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um Compute-Instanzen mit dem reservierungsgebundenen Bereitstellungsmodell zu erstellen:
compute.instances.createfür das Projekt-
Zum Erstellen der VM mit einem benutzerdefinierten Image:
compute.images.useReadOnlyfür das Image -
Zum Erstellen der VM mit einem Snapshot:
compute.snapshots.useReadOnlyfür den Snapshot -
Zum Erstellen der VM mit einer Instanzvorlage:
compute.instanceTemplates.useReadOnlyfür die Instanzvorlage -
Zum Angeben eines Subnetzes für Ihre VM:
compute.subnetworks.usefür das Projekt oder für das ausgewählte Subnetz -
Zum Festlegen einer statischen IP-Adresse für die VM:
compute.addresses.usefür das Projekt -
Zum Zuweisen einer externen IP-Adresse zur VM, wenn Sie ein VPC-Netzwerk verwenden:
compute.subnetworks.useExternalIpfür das Projekt oder für das ausgewählte Subnetz -
Zum Zuweisen eines Legacy-Netzwerks zur VM:
compute.networks.usefür das Projekt -
Zum Zuweisen einer externen IP-Adresse zur VM, wenn Sie ein Legacy-Netzwerk verwenden:
compute.networks.useExternalIpfür das Projekt -
Zum Festlegen von Metadaten der VM-Instanz für die VM:
compute.instances.setMetadatafür das Projekt -
Zum Festlegen von Tags für die VM:
compute.instances.setTagsfür die VM -
Zum Festlegen von Labels für die VM:
compute.instances.setLabelsfür die VM -
Zum Festlegen eines Dienstkontos für die VM:
compute.instances.setServiceAccountfür die VM -
Zum Erstellen eines neuen Laufwerks für die VM:
compute.disks.createfür das Projekt -
Zum Anhängen eines vorhandenen Laufwerks im Lese- oder Lese-/Schreibmodus:
compute.disks.usefür das Laufwerk -
Zum Anhängen eines vorhandenen Laufwerks im Lesemodus:
compute.disks.useReadOnlyfür das Laufwerk
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Instanz erstellen, die das reservierungsgebundene Bereitstellungsmodell verwendet
Wenn Sie eine A4X Max-, A4X-, A4- oder A3 Ultra-Compute-Instanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen möchten, müssen Sie warten, bis die automatisch erstellte Reservierung, die Sie verwenden möchten, den Startzeitpunkt erreicht hat. Außerdem muss die Instanz, die Sie erstellen möchten, alle folgenden Anforderungen erfüllen:
Die Instanz und die Reservierung müssen übereinstimmende Attribute haben.
Die Instanz muss speziell auf die Reservierung abzielen, um sie nutzen zu können.
Die Instanz muss bis zum Ende der Reservierung beendet oder gelöscht werden.
Im folgenden Beispiel wird eine Anfrage für eine vorausschauende Reservierung im Kalendermodus für fünf A3 Ultra-Instanzen erstellt. Anschließend wird eine A3 Ultra-Instanz erstellt, indem die automatisch erstellte Reservierung für die Anfrage genutzt wird.
Wenn Sie eine Beispielinstanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen möchten, wählen Sie eine der folgenden Optionen aus:
Console
Erstellen Sie eine Beispielanfrage für fünf A3 Ultra-Instanzen und senden Sie sie zur Überprüfung:
Rufen Sie in der Cloud de Confiance Console die Seite Reservierungen auf.
Klicken Sie auf den Tab Vorausschauende Reservierungen.
Klicken Sie auf Vorausschauende Reservierung erstellen. Die Seite Vorausschauende Reservierung erstellen wird angezeigt.
Klicken Sie auf den Tab GPUs und wählen Sie dann in der Liste GPU-Typ die Option NVIDIA H200 141 GB aus. Mit dieser Aktion wird eine A3 Ultra-Instanz angegeben.
Geben Sie im Feld Benötigte Gesamtkapazität den Wert
5ein.Geben Sie im Abschnitt Reservierungszeitraum die Startzeit und die Dauer für Ihren Reservierungszeitraum an.
Klicken Sie auf Nach Kapazität suchen und wählen Sie dann im Abschnitt Verfügbare Kapazität einen der verfügbaren Computer aus.
Klicken Sie auf Erstellen.
So erstellen Sie zum Startzeitpunkt der Anfrage eine A3 Ultra-Instanz, um die automatisch erstellte Beispielreservierung zu nutzen:
Rufen Sie in der Cloud de Confiance Console die Seite Instanz erstellen auf.
Geben Sie im Feld Name einen Namen für die Instanz ein. Geben Sie für dieses Beispiel
example-instanceein.Geben Sie die Region und die Zone an, in der die automatisch erstellte Reservierung vorhanden ist. Wählen Sie für dieses Beispiel us-central1 bzw. us-central1-b aus.
Klicken Sie auf den Tab GPUs und wählen Sie dann in der Liste GPU-Typ die Option NVIDIA H200 141 GB aus. Mit dieser Aktion wird eine A3 Ultra-Instanz angegeben und das Bereitstellungsmodell auf Reservation-bound (An Reservierung gebunden) festgelegt.
Klicken Sie im Navigationsmenü auf Erweitert.
Wählen Sie im Bereich Reservierungen die Option Reservierung auswählen und dann Reservierung auswählen aus.
Führen Sie im Bereich Reservierung auswählen die folgenden Schritte aus:
Wählen Sie die automatisch erstellte Beispielreservierung aus.
Klicken Sie auf Auswählen.
Maximieren Sie im Abschnitt Bereitstellungsmodell den Abschnitt Erweiterte Einstellungen für das VM-Bereitstellungsmodell.
Wählen Sie in der Liste Bei VM-Beendigung die Option Beenden (Standardeinstellung) oder Löschen aus.
Klicken Sie auf Erstellen.
gcloud
Verwenden Sie den Befehl
gcloud beta compute future-reservations create, um eine Beispielanfrage für fünf A3 Ultra-Instanzen zu erstellen und zur Überprüfung einzureichen:gcloud beta compute future-reservations create example-fr \ --auto-delete-auto-created-reservations \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=example-reservation \ --share-setting=local \ --start-time=2026-03-05T00:00:00Z \ --end-time=2026-03-19T00:00:00Z \ --machine-type=a3-ultragpu-8g \ --total-count=5 \ --zone=us-central1-bAngenommen, Cloud de Confiance genehmigt die Anfrage und Compute Engine erstellt automatisch eine leere Reservierung. Zur Startzeit der Anfrage am 5. März 2026 erhöht Compute Engine die Anzahl der reservierten GPU-Instanzen in der Reservierung. Anschließend können Sie die Reservierung nutzen.
Verwenden Sie zum Erstellen einer A3 Ultra-Instanz zur Nutzung der automatisch erstellten Beispielreservierung zur Startzeit der Anfrage den Befehl
gcloud compute instances createmit den folgenden Flags:Das Flag
--instance-termination-action.Das Flag
--provisioning-model, das aufRESERVATION_BOUNDgesetzt ist.Das Flag
--reservation.Das Flag
--reservation-affinity, das aufspecificgesetzt ist.
Der Befehl sieht in etwa so aus: Die vollständigen Anforderungen zum Erstellen einer A3 Ultra-Instanz finden Sie unter A3 Ultra- oder A4-Instanz erstellen.
gcloud compute instance create example-a3ultra-instance \ --machine-type=a3-ultragpu-8g \ --instance-termination-action=TERMINATION_ACTION \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL \ --zone=us-central1-b \ ...Der Befehl enthält die folgenden Werte:
TERMINATION_ACTION: Gibt an, ob Compute Engine die Instanz am Ende des Reservierungszeitraums beendet (STOP) oder löscht (DELETE).RESERVATION_URL: Die URL der Reservierung, die so formatiert ist:Wenn die automatisch erstellte Reservierung in Ihrem Projekt vorhanden ist:
example-reservation.Wenn sich die automatisch erstellte Reservierung in einem anderen Projekt befindet:
projects/PROJECT_ID/reservations/example-reservation.
REST
Wenn Sie eine Beispielanfrage für fünf A3 Ultra-Instanzen erstellen und zur Überprüfung einreichen möchten, stellen Sie eine
POST-Anfrage an die BetamethodefutureReservations.insert:POST https://compute.s3nsapis.fr/compute/beta/projects/example-project/zones/us-central1-b/futureReservations { "name": "example-request-calendar-mode", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "example-reservation", "shareSettings": { "shareType": "LOCAL" }, "specificReservationRequired": true, "specificSkuProperties": { "machineType": "a3-ultragpu-8g", "totalCount": 5 }, "timeWindow": { "startTime": "2026-03-05T00:00:00Z", "endTime": "2026-03-19T00:00:00Z" } }Angenommen, Cloud de Confiance genehmigt die Anfrage und Compute Engine erstellt automatisch eine leere Reservierung. Zur Startzeit der Anfrage am 5. März 2026 erhöht Compute Engine die Anzahl der reservierten GPU-Instanzen in der Reservierung. Anschließend können Sie die Reservierung nutzen.
Wenn Sie zum Startzeitpunkt der Anfrage eine A3 Ultra-Instanz erstellen möchten, um die automatisch erstellte Beispielreservierung zu nutzen, senden Sie eine
POST-Anfrage an die Methodeinstances.insert. Geben Sie im Anfragetext die folgenden Felder an:Das Feld
reservationAffinity.consumeReservationTypeist aufSPECIFIC_RESERVATIONgesetzt.Das Feld
reservationAffinity.keyist aufcompute.googleapis.com/reservation-namegesetzt.Das Feld
reservationAffinity.valuesist auf die URL der Reservierung festgelegt.Das Feld
scheduling.instanceTerminationAction.Das Feld
scheduling.provisioningModelist aufRESERVATION_BOUNDgesetzt.
Die Anfrage sieht etwa so aus: Die vollständigen Anforderungen zum Erstellen einer A3 Ultra-Instanz finden Sie unter A3 Ultra- oder A4-Instanz erstellen.
POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances { { "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g", "name": "example-a3ultra-instance", "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION_URL" ], }, "scheduling": { "instanceTerminationAction": "TERMINATION_ACTION", "provisioningModel": "RESERVATION_BOUND" }, ... } }Der Anfragetext enthält die folgenden Werte:
RESERVATION_URL: Die URL der Reservierung, die so formatiert ist:Wenn die automatisch erstellte Reservierung in Ihrem Projekt vorhanden ist:
example-reservation.Wenn sich die automatisch erstellte Reservierung in einem anderen Projekt befindet:
projects/PROJECT_ID/reservations/example-reservation.
TERMINATION_ACTION: Gibt an, ob Compute Engine die Instanz am Ende des Reservierungszeitraums beendet (STOP) oder löscht (DELETE).
Nächste Schritte
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2026-01-31 (UTC).
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Benötigte Informationen nicht gefunden","missingTheInformationINeed","thumb-down"],["Zu umständlich/zu viele Schritte","tooComplicatedTooManySteps","thumb-down"],["Nicht mehr aktuell","outOfDate","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Problem mit Beispielen/Code","samplesCodeIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2026-01-31 (UTC)."],[],[]] -