Einige oder alle Informationen auf dieser Seite gelten möglicherweise nicht für Cloud de Confiance von S3NS. Weitere Informationen finden Sie unter Unterschiede zu Google Cloud.

Beschleunigungsoptimierte Maschinenfamilie

In diesem Dokument wird die beschleunigeroptimierte Maschinenfamilie beschrieben, die Compute Engine-Instanzen mit vorab angehängten NVIDIA-GPUs bietet. Diese Instanzen sind speziell für künstliche Intelligenz (KI), maschinelles Lernen (ML), Hochleistungs-Computing (HPC) und grafikintensive Anwendungen konzipiert.

Die beschleunigungsoptimierte Maschinenfamilie ist in den folgenden Maschinenreihen verfügbar: A4X Max, A4X, A4, A3, A2, G4 und G2. Jeder Maschinentyp innerhalb einer Reihe hat ein bestimmtes Modell und eine bestimmte Anzahl von NVIDIA-GPUs angehängt. Sie können auch einige GPU-Modelle an N1-Maschinentypen für allgemeine Zwecke anhängen.

Empfohlene Maschinenserie nach Arbeitslasttyp

Im folgenden Abschnitt finden Sie die empfohlene Maschinenreihe basierend auf Ihren GPU-Arbeitslasten:

Arbeitslasttyp	Empfohlener Maschinentyp
Modelle vortrainieren	A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High und A2 Informationen dazu, wie Sie die beste Lösung ermitteln, finden Sie in der AI Hypercomputer-Dokumentation unter Empfehlungen für das Vortrainieren von Modellen.
Modelle abstimmen	A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High, A2 und G4 Informationen dazu, wie Sie die beste Lösung finden, finden Sie in der AI Hypercomputer-Dokumentation unter Empfehlungen zum Feinabstimmen von Modellen.
Inferenz bereitstellen	A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2 und G4 Informationen dazu, wie Sie die beste Lösung finden, finden Sie in der AI Hypercomputer-Dokumentation unter Empfehlungen für die Bereitstellung von Inferenz.
Grafikintensive Arbeitslasten	G4, G2 und N1+T4
Hochleistungs-Computing	Für Hochleistungs-Computing-Arbeitslasten eignet sich jede beschleunigungsoptimierte Maschinenreihe. Die beste Lösung hängt davon ab, wie viel Rechenaufwand an die GPU ausgelagert werden muss. Weitere Informationen finden Sie in der AI Hypercomputer-Dokumentation unter Empfehlungen für HPC.

Preise und Nutzungsoptionen

Verbrauchsoptionen beziehen sich auf die Möglichkeiten, Rechenressourcen zu erhalten und zu nutzen. BeiCloud de Confiance by S3NS werden beschleunigeroptimierte Maschinentypen für die angeschlossenen GPUs, die vordefinierte vCPU, den Arbeitsspeicher und den lokalen SSD-Speicher (sofern vorhanden) in Rechnung gestellt. Die Rabatte für beschleunigeroptimierte Instanzen variieren je nach verwendeter Verbrauchsoption. Weitere Informationen zu den Preisen für beschleunigungsoptimierte Instanzen finden Sie auf der Seite „Preise für VM-Instanzen“ im Abschnitt Beschleunigungsoptimierte Maschinentypfamilie.

Die Rabatte für beschleunigeroptimierte Instanzen variieren je nach der von Ihnen gewählten Verbrauchsoption:

On-Demand:Sie können Rabatte für zugesicherte Nutzung (Committed Use Discounts, CUDs) für einige Ressourcen erhalten, indem Sie ressourcenbasierte Zusicherungen erwerben. GPUs und lokale SSDs, die Sie mit der On-Demand-Option verwenden, sind jedoch nicht für Rabatte für zugesicherte Nutzung geeignet. Wenn Sie CUDs für GPUs und lokale SSD-Laufwerke erhalten möchten, verwenden Sie stattdessen eine der Reservierungsoptionen.
Spot:Spot-VMs erhalten automatisch Rabatte über die Preise für Spot-VMs.
Flex-Start:Instanzen, die mit der Verbrauchsoption „Flex-Start“ bereitgestellt werden, erhalten automatisch Rabatte über die Dynamic Workload Scheduler-Preise.
Reservierungen:Sie können CUDs für Ihre Ressourcen vom Typ „Accelerator-optimierter Maschinentyp“ erhalten, indem Sie ressourcenbasierte Zusicherungen erwerben. Für Zusicherungen für GPUs und lokale SSD-Laufwerke sind angehängte Reservierungen für diese Ressourcen erforderlich.

Verfügbarkeit von Verbrauchsoptionen nach Maschinentyp

In der folgenden Tabelle ist die Verfügbarkeit der einzelnen Verbrauchsoptionen nach Maschinentypen zusammengefasst. Weitere Informationen zur Auswahl einer Verbrauchsoption finden Sie in der AI Hypercomputer-Dokumentation unter Verbrauchsmodell auswählen.

Maschinentyp	On demand	Spot	Flex-Start	On-Demand-Reservierungen	Vorausschauende Reservierungen	Vorausschauende Reservierungen im Kalendermodus	Vorausschauende Reservierungen in AI Hypercomputer
A4X Max und A4X
A4
A3 Ultra
A3 Mega
A3-High mit 8 GPUs
A3-High mit weniger als 8 GPUs
A3 Edge
A2
G4
G2
N1 mit GPUs

Wartung von beschleunigeroptimierten Maschinentypen

Während des Lebenszyklus einer Compute Engine-Instanz treten auf dem Host, auf dem Ihre Instanz ausgeführt wird, mehrere Hostereignisse auf. Ein Hostereignis kann die reguläre Wartung der Compute Engine-Infrastruktur oder in seltenen Fällen einen Hostfehler umfassen. Compute Engine wendet auch einfache, nicht unterbrechende Upgrades für den Hypervisor und das Netzwerk im Hintergrund an.

In der folgenden Tabelle werden die Hostwartungsfunktionen für beschleunigungsoptimierte Maschinentypen beschrieben:

Maschinentyp	Anzahl der GPUs	Typische Häufigkeit geplanter Wartungsereignisse	Wartungsverhalten	Erweiterte Benachrichtigung bei geplanter Wartung	On‑Demand-Wartung	Wartung simulieren
A4X Max² und A4X²	4	Mindestens 90 Tage	Wird mit Datenpersistenz auf lokalen SSDs beendet.	90 Tage	Ja	Nein
A4²	8	Mindestens 90 Tage	Wird mit Datenpersistenz auf lokalen SSDs beendet	90 Tage	Ja	Nein
A3 Ultra²	8	Mindestens 90 Tage	Wird mit Datenpersistenz auf lokalen SSDs beendet	90 Tage	Ja	Nein
A3 Mega² und A3 High²	8	Mindestens 30 Tage¹	Beenden und neu starten	7 Tage	Ja	Ja
A3 High	1, 2, 4	Mindestens 30 Tage¹	Beenden und neu starten	7 Tage¹	Nein	Ja
A3 Edge	8	Mindestens 30 Tage	Beenden und neu starten	7 Tage	Ja	Ja
A2-Ultra	1, 2, 4, 8	Mindestens 30 Tage	Beenden und neu starten	7 Tage	Ja (nur 8 GPUs)	Ja
A2-Standard	1, 2, 4, 8 oder 16	Mindestens 30 Tage	Beenden und neu starten	7 Tage	Ja (nur 8 und 16 GPUs)	Ja
G4	1, 2 oder 4	Mindestens 30 Tage	Beenden und neu starten. Wenn lokale SSD-Laufwerke angehängt sind, wird die Instanz mit Datenpersistenz auf lokalen SSDs beendet.	7 Tage	Nein	Ja
G4	8	Mindestens 90 Tage	Beenden und neu starten. Wenn lokale SSD-Laufwerke angehängt sind, wird die Instanz mit Datenpersistenz auf lokalen SSDs beendet.	30 Tage	Ja	Ja
G2	1, 2, 4 oder 8	Mindestens 30 Tage	Beenden und neu starten	7 Tage	Ja (nur 8 GPUs)	Ja
N1+T4	1 oder 2	Mindestens 15 Tage	Beenden und neu starten	7 Tage	Nein	Ja
N1+T4	4	Mindestens 30 Tage	Beenden und neu starten	7 Tage	Ja	Ja
N1+P4	1 oder 2	Mindestens 15 Tage	Beenden und neu starten	7 Tage	Nein	Ja
N1+P4	4	Mindestens 30 Tage	Beenden und neu starten	7 Tage	Ja	Ja
N1+P100	1 oder 2	Mindestens 15 Tage	Beenden und neu starten	7 Tage	Nein	Ja
N1+P100	4	Mindestens 30 Tage	Beenden und neu starten	7 Tage	Ja	Ja
N1+V100	1, 2 oder 4	Mindestens 15 Tage	Beenden und neu starten	7 Tage	Nein	Ja
N1+V100	8	Mindestens 30 Tage	Beenden und neu starten	7 Tage	Ja	Ja

¹ Ausgenommen sind Instanzen, die durch bestimmte Wartungsvereinbarungen mit Kunden abgedeckt sind.
² Weitere Informationen finden Sie unter Hostwartung in der AI Hypercomputer-Dokumentation.

Die in der vorherigen Tabelle angegebenen Wartungshäufigkeiten sind Schätzungen und keine Garantien. Für Compute Engine wird zeitweise eine Wartung häufiger durchgeführt.

Die A4X Max- und A4X-Maschinenserie

Die Maschinenreihen A4X Max und A4X werden auf einer Exascale-Plattform ausgeführt, die auf der Rack-Scale-Architektur von NVIDIA basiert und für rechen- und speicherintensive, netzwerkgebundene ML-Trainings und HPC-Arbeitslasten optimiert ist. A4X Max und A4X unterscheiden sich hauptsächlich in ihren GPU- und Netzwerkkomponenten. A4X Max bietet auch Bare-Metal-Instanzen, die direkten Zugriff auf die CPU und den Arbeitsspeicher des Hostservers ermöglichen, ohne dass der Hypervisor von Compute Engine dazwischengeschaltet ist.

Alle Maschinentypen der A4X Max- und A4X-Serie haben zwei Sockel mit NVIDIA Grace™-CPUs mit Arm® Neoverse™ V2-Kernen. Diese CPUs sind mit vier GPUs verbunden, die über eine schnelle Chip-zu-Chip-Kommunikation über NVLink-C2 verfügen.

NVLink-Domain

Sowohl die A4X Max- als auch die A4X-Maschinenreihe basieren auf der NVL72-Rack-Architektur von NVIDIA, die NVLink-Domains verwendet, um GPU-Computing im großen Maßstab und mit hoher Leistung zu ermöglichen. Eine NVLink-Domäne ist eine Gruppe von miteinander verbundenen NVIDIA NVSwitch-Chips und den GPUs, die mit ihnen verbunden sind. Sie bildet ein Hochgeschwindigkeitsnetzwerk, das eine direkte und schnelle Kommunikation zwischen GPUs ermöglicht. Bei A4X und A4X Max besteht eine einzelne NVL72-Domain (NVLink) aus 18 Instanzen und 72 GPUs.

A4X Max und A4X im Vergleich

In der folgenden Tabelle finden Sie einen detaillierten Vergleich der Maschinentypen A4X Max und A4X:

Funktion	A4X Max	A4X
GPU-Beschleunigung	An A4X Max-Instanzen werden automatisch NVIDIA GB300 Ultra-Superchips angehängt. Diese Superchips enthalten NVIDIA B300-GPUs und bieten bis zu 20 TB GPU-Arbeitsspeicher pro NVL72-Domain, was etwa 279 GB pro GPU entspricht.	An A4X-Instanzen werden automatisch NVIDIA GB200-Superchips angehängt. Diese Superchips haben NVIDIA B200-GPUs und bieten 186 GB Arbeitsspeicher pro GPU.
Erweiterte Netzwerkfunktionen mit RoCE	Bei A4X Max-Instanzen wird die Netzwerkleistung durch RoCE gesteigert, indem NVIDIA ConnectX-8 (CX-8) SuperNICs und das Rechenzentrum-weite Netzwerk von Google mit Achtfach-Rail-Ausrichtung kombiniert werden. Diese Konfiguration bietet eine noch höhere Leistung mit bis zu 3.200 Gbit/s Bandbreite, optimiert für anspruchsvolle groß angelegte Trainings- und HPC-Aufgaben. Für das allgemeine Netzwerk hat jede Instanz außerdem eine Bandbreite von bis zu 400 Gbit/s.	Bei A4X-Instanzen wird die Netzwerkleistung durch RDMA over Converged Ethernet (RoCE) gesteigert. Dazu werden NVIDIA ConnectX-7 (CX-7)-NICs mit dem Rechenzentrumsnetzwerk von Google kombiniert, das viergleisige Ausrichtung bietet. Diese Architektur bietet eine Bandbreite von bis zu 1.600 Gbit/s und ermöglicht so eine Kommunikation mit hohem Durchsatz und niedriger Latenz für große verteilte Arbeitslasten. Für das allgemeine Netzwerk hat jede Instanz außerdem eine Bandbreite von bis zu 400 Gbit/s.
Leistung	Die NVIDIA GB300-Ultra-Superchips bieten eine dichte FP4-Leistung von 15 PetaFLOPS. Für die FP4-Inferenz im großen Maßstab wird erwartet, dass die GB300-Ultra-Superchips eine um 20–40% höhere Leistung als die GB200-Superchips bieten.	Die NVIDIA GB200-Superchips bieten 10 PetaFLOPS an FP4-Leistung.
Bare Metal- und VM-Unterstützung	Nur Bare-Metal-Instanzen	Nur VM-Instanzen
Unterstützung für Betriebssysteme	A4X Max-Instanzen unterstützen eine Reihe von Linux-Betriebssystem-Images. Da Bare-Metal-Instanzen jedoch den IDPF-Netzwerktreiber verwenden, muss Ihr Betriebssystem-Image IDPF unterstützen. Wenn Sie ein Betriebssystem-Image verwenden möchten, das in Compute Engine verfügbar ist, Betriebssystem-Images, die IDPF unterstützen.	A4X-Instanzen unterstützen eine Reihe von Linux-Betriebssystem-Images. Eine vollständige Liste der unterstützten Betriebssysteme in Compute Engine finden Sie unter Betriebssystemunterstützung für GPUs.
CPU-Plattform	Sowohl der Maschinentyp „A4X Max“ als auch „A4X“ verwenden die NVIDIA Grace-CPU-Plattform mit Arm® Neoverse™ V2-Kernen. Weitere Informationen zur Plattform finden Sie unter CPU-Plattformen.
NVLink-Skalierbarkeit	Sowohl für A4X Max- als auch für A4X-Maschinentypen lässt sich Multi-Node-NVLink auf bis zu 72 GPUs in einer einzelnen Domain skalieren. Es bietet eine GPU-NVLink-Bandbreite von 1.800 GBps bidirektional pro GPU.
Unterstützung für Laufwerke	A4X Max- und A4X-Instanzen unterstützen lokale SSDs für schnelle Scratch Disks, was nützlich ist, um Daten in GPUs einzuspeisen und gleichzeitig E/A-Engpässe zu vermeiden. Für nichtflüchtigen Speicher können Sie Hyperdisk-Volumes anhängen. A4X Max- und A4X-Instanzen erhalten automatisch 12.000 GiB lokalen SSD-Speicher. Für langlebigen Speicher können Sie auch bis zu 512 TiB Hyperdisk-Speicher anhängen. Weitere Informationen zu Laufwerkstypen finden Sie unter Laufwerkstyp auswählen.
Unterstützung für dichte Zuweisung und topologiebewusste Planung	Sowohl A4X Max- als auch A4X-Maschinentypen unterstützen das Anfordern von Blöcken mit dicht zugewiesener Kapazität. Ihre Hostcomputer werden physisch nahe beieinander zugewiesen, als Ressourcenblöcke bereitgestellt und über ein dynamisches ML-Netzwerk verbunden, um Netzwerk-Hops zu minimieren und die Latenz zu optimieren. Außerdem können Sie für A4X Max- und A4X-Instanzen Topologieinformationen auf Knoten- und Clusterebene abrufen, die für die Jobplatzierung verwendet werden können.

A4X Max-Maschinentyp (Bare Metal)

Beschleunigungsoptimierte A4X Max-Maschinentypen verwenden NVIDIA GB300 Grace Blackwell Ultra-Superchips (nvidia-gb300) und sind ideal für das Trainieren und Bereitstellen von Foundation Models. A4X Max-Maschinentypen sind als Bare-Metal-Instanzen verfügbar.

A4X Max ist eine Exascale-Plattform, die auf NVIDIA GB300 NVL72 basiert. Jede Maschine hat zwei Sockel mit NVIDIA Grace-CPUs mit Arm Neoverse V2-Kernen. Diese CPUs sind über eine schnelle Chip-zu-Chip-Kommunikation (NVLink-C2C) mit vier NVIDIA B300 Blackwell-GPUs verbunden.

						Angehängte NVIDIA GB300 Grace Blackwell Ultra-Superchips
Maschinentyp	vCPU-Anzahl¹	Instanzarbeitsspeicher (GB)	Verbundene lokale SSD (GiB)	Anzahl der physischen Netzwerkkarten	Maximale Netzwerkbandbreite (Gbit/s)²	GPU-Anzahl	GPU-Arbeitsspeicher³ (GB HBM3e)
`a4x-maxgpu-4g-metal`	144	960	12.000	6	3.600	4	1.116

¹ Eine vCPU ist als einzelner Hardware-Hyper-Thread auf einer der verfügbaren CPU-Plattformen implementiert.
² Die maximale Bandbreite für ausgehenden Traffic darf die angegebene Zahl nicht überschreiten. Die tatsächliche Bandbreite für ausgehenden Traffic hängt von der Ziel-IP-Adresse und anderen Faktoren ab. Weitere Informationen zur Netzwerkbandbreite finden Sie unter Netzwerkbandbreite.
³ GPU-Arbeitsspeicher ist der Speicher auf einem GPU-Gerät, der zum temporären Speichern von Daten verwendet werden kann. Es ist vom Arbeitsspeicher der Instanz getrennt und wurde speziell für die höheren Bandbreitenanforderungen grafikintensiver Arbeitslasten entwickelt.

A4X-Maschinentyp

Beschleunigungsoptimierte A4X-Maschinentypen verwenden NVIDIA GB200 Grace Blackwell-Superchips (nvidia-gb200) und sind ideal für das Trainieren und Bereitstellen von Foundation Models.

A4X ist eine Exascale-Plattform, die auf NVIDIA GB200 NVL72 basiert. Jede Maschine hat zwei Sockel mit NVIDIA Grace-CPUs mit Arm Neoverse V2-Kernen. Diese CPUs sind über eine schnelle Chip-zu-Chip-Kommunikation (NVLink-C2C) mit vier NVIDIA B200 Blackwell-GPUs verbunden.

						Angehängte NVIDIA GB200 Grace Blackwell-Superchips
Maschinentyp	vCPU-Anzahl¹	Instanzarbeitsspeicher (GB)	Verbundene lokale SSD (GiB)	Anzahl der physischen Netzwerkkarten	Maximale Netzwerkbandbreite (Gbit/s)²	GPU-Anzahl	GPU-Arbeitsspeicher³ (GB HBM3e)
`a4x-highgpu-4g`	140	884	12.000	6	2.000	4	744

Einschränkungen von A4X Max und A4X

Für A4X Max- und A4X-Instanzen gelten die folgenden Einschränkungen:

Sie können nur Kapazität anfordern, für die die unterstützten Verbrauchsoptionen verwendet werden.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die diese Maschinentypen verwenden. Außerdem unterstützen A4X Max-Maschinentypen keine ressourcenbasierten Rabatte für zugesicherte Nutzung.
Sie können Instanzen nur in bestimmten Regionen und Zonen erstellen.
Sie können keinen nichtflüchtigen Speicher (regional oder zonenbasiert) verwenden. Sie können nur Google Cloud Hyperdisk verwenden.
Diese Maschinentypen sind nur auf der NVIDIA Grace-Plattform verfügbar.
Änderungen des Maschinentyps werden für A4X Max oder A4X nicht unterstützt. Wenn Sie zu einem dieser Maschinentypen wechseln oder von einem dieser Maschinentypen wechseln möchten, müssen Sie eine neue A4X-Max- oder A4X-Instanz erstellen.
Sie können Windows-Betriebssysteme nicht auf diesen Maschinentypen ausführen.
Bei A4X-Instanzen werden die Zähler für physische Ports, die mit _phy enden, nicht aktualisiert, wenn Sie ethtool -S verwenden, um das GPU-Netzwerk zu überwachen. Das ist das erwartete Verhalten für Instanzen, die die MRDMA-Architektur mit virtuellen Funktionen (VF) verwenden. Weitere Informationen finden Sie unter MRDMA-Funktionen und Tools zur Netzwerküberwachung.
A4X Max- und A4X-Instanzen unterstützen Folgendes nicht:
Sie können Hyperdisk ML-Laufwerke, die vor dem 4. Februar 2026 erstellt wurden, nicht an A4X-Maschinentypen anhängen.

Unterstützte Laufwerkstypen für A4X Max- und A4X-Instanzen

A4X Max

A4X Max-Instanzen können folgende Blockspeichertypen verwenden:

Hyperdisk Balanced (hyperdisk-balanced): Dies ist der einzige Laufwerkstyp, der für das Bootlaufwerk unterstützt wird.
Hyperdisk Balanced High Availability (hyperdisk-balanced-high-availability)
Lokale SSD: Wird Instanzen, die mit einem der A4X Max-Maschinentypen erstellt werden, automatisch hinzugefügt.

Maximale Anzahl von Laufwerken pro Instanz¹
Maschinentypen	Alle Hyperdisks	Hyperdisk Balanced	Hyperdisk mit ausgeglichener Hochverfügbarkeit	Hyperdisk Durchsatz	Hyperdisk ML	Hyperdisk Extrem	Verbundene lokale SSD
`a4x-maxgpu-4g-metal`	32	32	32	0	0	0	4

A4X

A4X-Instanzen können folgende Blockspeichertypen verwenden:

Hyperdisk Balanced (hyperdisk-balanced): Dies ist der einzige Laufwerkstyp, der für das Bootlaufwerk unterstützt wird.
Hyperdisk Extrem (hyperdisk-extreme)
Hyperdisk ML (hyperdisk-ml)
Lokale SSD: Wird Instanzen, die mit einem der A4X-Maschinentypen erstellt werden, automatisch hinzugefügt.

Maximale Anzahl von Laufwerken pro Instanz¹
Maschinentypen	Alle Hyperdisks	Hyperdisk Balanced	Hyperdisk mit ausgeglichener Hochverfügbarkeit	Hyperdisk Durchsatz	Hyperdisk ML	Hyperdisk Extrem	Verbundene lokale SSD
`a4x-highgpu-4g`	128	128	0	0	128	8	4

¹ Die Nutzung von Hyperdisk wird zusätzlich zu den Preisen der Maschinentypen berechnet. Informationen zu den Laufwerkpreisen finden Sie unter Preise für Hyperdisks.

Laufwerks- und Kapazitätslimits

Sie können einer Instanz eine Mischung aus verschiedenen Hyperdisk-Typen zuordnen. Die maximale Gesamt-Laufwerkskapazität (in TiB) für alle Laufwerkstypen darf jedoch 512 TiB für alle Hyperdisks nicht überschreiten.

Weitere Informationen zu den Kapazitätslimits finden Sie unter Hyperdisk-Größen- und ‑Anhangslimits.

Die A4-Maschinenserie

Die A4-Maschinenserie bietet Maschinentypen mit bis zu 224 vCPUs und 3.968 GB Arbeitsspeicher. A4-Instanzen bieten für die meisten GPU-beschleunigten Arbeitslasten eine bis zu dreimal höhere Leistung als frühere GPU-Instanztypen. A4 wird für ML-Trainingsarbeitslasten empfohlen, insbesondere bei großen Skalierungen, z. B. Hunderte oder Tausende von GPUs. Die A4-Maschinenserie ist in einem einzigen Maschinentyp verfügbar.

VM-Instanzen, die mit dem Maschinentyp A4 erstellt werden, bieten die folgenden Funktionen:

GPU-Beschleunigung mit NVIDIA B200-GPUs: NVIDIA B200-GPUs werden automatisch an A4-Instanzen angehängt, die 180 GB GPU-Arbeitsspeicher pro GPU bieten.
Skalierbarer Intel Xeon-Prozessor der 5.Generation (Emerald Rapids): bietet eine kontinuierliche Turbofrequenz für einen einzelnen Kern von bis zu 4,0 GHz. Weitere Informationen zu diesem Prozessor finden Sie unter CPU-Plattform.
Branchenführende NVLink-Skalierbarkeit: NVIDIA B200-GPUs bieten eine GPU-NVLink-Bandbreite von 1.800 GB/s bidirektional pro GPU.

Bei einer All-to-All-NVLink-Topologie zwischen 8 GPUs in einem System beträgt die NVLink-Gesamtbandbreite bis zu 14, 4 Terabyte pro Sekunde.
Verbesserte Netzwerkfunktionen mit RoCE: RDMA over Converged Ethernet (RoCE) steigert die Netzwerkleistung durch die Kombination von NVIDIA ConnectX-7-Netzwerkinterfacekarten (NICs) mit dem vierfach ausgerichteten Netzwerk von Google, das sich über das gesamte Rechenzentrum erstreckt. Durch die Nutzung von RDMA over Converged Ethernet (RoCE) erreichen A4-Instanzen einen viel höheren Durchsatz zwischen Instanzen in einem Cluster als die meisten A3-Instanzen, mit Ausnahme der Instanzen, die auf dem A3-Ultra-Maschinentyp ausgeführt werden.

Hinweis :Aufgrund der unterschiedlichen Netzwerktopologie können Sie keine Arbeitslasten zwischen A4-Instanzen und Instanzen verschieben, die mit einer der vorherigen Generationen von beschleunigeroptimierten Maschinenserien erstellt wurden. Sie können Arbeitslasten nur zwischen Instanzen verschieben, die auf A4- und A3-Ultra-Maschinentypen ausgeführt werden.
Höhere Netzwerkgeschwindigkeiten: Bietet im Vergleich zu A2-Instanzen der vorherigen Generation bis zu viermal höhere Netzwerkgeschwindigkeiten.

Weitere Informationen zu Netzwerken finden Sie unter Netzwerkbandbreiten und GPUs.
Optimierungen bei der Virtualisierung für Datenübertragung und ‑wiederherstellung: Die PCIe-Topologie (Peripheral Component Interconnect Express) von A4-Instanzen liefert genauere Informationen zur Lokalität, mit denen Arbeitslasten die Datenübertragungen optimieren können.

Die GPUs bieten außerdem einen Funktionsebenen-Reset (FLR) für eine reibungslose Fehlerwiederherstellung und Unterstützung für atomare Vorgänge zur Verbesserung der Nebenläufigkeit in bestimmten Szenarien.
Unterstützung für Laufwerke: A4-Instanzen unterstützen lokale SSDs für schnelle Scratch Disks. Dies ist nützlich, um Daten in GPUs einzuspeisen und gleichzeitig E/A-Engpässe zu vermeiden. Für langlebigen Speicher können Sie Hyperdisk-Volumes anhängen.

A4-Instanzen erhalten automatisch 12.000 GiB lokalen SSD-Speicher. Für Arbeitslasten, die langlebigen Blockspeicher erfordern, können Sie A4-Instanzen auch bis zu 512 TiB Hyperdisk zuordnen. Weitere Informationen zu Laufwerkstypen finden Sie unter Laufwerkstyp auswählen.
Unterstützung für dichte Zuweisung und topologiebewusste Planung: Wenn Sie A4-Instanzen bereitstellen, können Sie Blöcke mit dicht zugewiesener Kapazität anfordern. Ihre Hostcomputer werden räumlich nahe beieinander zugewiesen, als Ressourcenblöcke bereitgestellt und über ein dynamisches ML-Netzwerk verbunden, um Netzwerk-Hops zu minimieren und die niedrigste Latenz zu erzielen. Außerdem können Sie Topologieinformationen auf Knoten- und Clusterebene abrufen, die für die Jobzuweisung verwendet werden können.

A4-Maschinentyp

Beschleunigungsoptimierte A4-Maschinentypen haben NVIDIA B200 Blackwell-GPUs (nvidia-b200) angehängt und eignen sich ideal für das Trainieren und Bereitstellen von Foundation Models.

						Angehängte NVIDIA B200 Blackwell-GPUs
Maschinentyp	vCPU-Anzahl¹	Instanzarbeitsspeicher (GB)	Verbundene lokale SSD (GiB)	Anzahl der physischen Netzwerkkarten	Maximale Netzwerkbandbreite (Gbit/s)²	GPU-Anzahl	GPU-Arbeitsspeicher³ (GB HBM3e)
`a4-highgpu-8g`	224	3.968	12.000	10	3.600	8	1.440

Einschränkungen von A4

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A4-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A4-Maschinentyp verwenden.
Sie können einen A4-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Sie können keinen nichtflüchtigen Speicher (regional oder zonenbasiert) verwenden. Sie können nur Google Cloud Hyperdisk verwenden.
Der A4-Maschinentyp ist nur auf der Emerald Rapids-CPU-Plattform verfügbar.
Sie können den Maschinentyp einer Instanz nicht in einen A4-Maschinentyp ändern oder von einem A4-Maschinentyp weg ändern. Sie müssen eine neue Instanz mit diesem Maschinentyp erstellen.
A4-Maschinentypen unterstützen keine einzelnen Mandanten.
Sie können Windows-Betriebssysteme nicht auf einem A4-Maschinentyp ausführen.
Bei A4-Instanzen werden die Zähler für physische Ports, die mit _phy enden, nicht aktualisiert, wenn Sie ethtool -S verwenden, um das GPU-Netzwerk zu überwachen. Dies ist das erwartete Verhalten für Instanzen, die die MRDMA-Architektur für virtuelle Funktionen (VF) verwenden. Weitere Informationen finden Sie unter MRDMA-Funktionen und Tools zur Netzwerküberwachung.
Sie können Hyperdisk ML-Laufwerke, die vor dem 4. Februar 2026 erstellt wurden, nicht an A4-Maschinentypen anhängen.

Unterstützte Laufwerkstypen für A4-Instanzen

A4-Instanzen können folgende Blockspeichertypen verwenden:

Hyperdisk Balanced (hyperdisk-balanced): Dies ist der einzige Laufwerkstyp, der für das Bootlaufwerk unterstützt wird.
Hyperdisk Extrem (hyperdisk-extreme)
Hyperdisk ML (hyperdisk-ml)
Lokale SSD: Wird Instanzen, die mit einem der A4-Maschinentypen erstellt werden, automatisch hinzugefügt.

Maximale Anzahl von Laufwerken pro Instanz¹
Maschinentypen	Alle Hyperdisks	Hyperdisk Balanced	Hyperdisk Durchsatz	Hyperdisk ML	Hyperdisk Extrem	Verbundene lokale SSD
`a4-highgpu-8g`	128	128	–	128	8	32

¹ Die Nutzung von Hyperdisk wird zusätzlich zu den Preisen der Maschinentypen berechnet. Informationen zu den Laufwerkpreisen finden Sie unter Preise für Hyperdisks.

Laufwerks- und Kapazitätslimits

Weitere Informationen zu den Kapazitätslimits finden Sie unter Hyperdisk-Größen- und ‑Anhangslimits.

Die A3-Maschinenreihe

Die A3-Maschinenserie hat bis zu 224 vCPUs und 2.944 GB Arbeitsspeicher. Diese Maschinenreihe ist für rechen- und speicherintensive, netzwerkgebundene ML-Trainings und HPC-Arbeitslasten optimiert. Die A3-Maschinenserie ist in den Maschinentypen A3 Ultra, A3 Mega, A3 High und A3 Edge verfügbar.

VM-Instanzen, die mit den A3-Maschinentypen erstellt werden, bieten die folgenden Funktionen:

Funktion	A3 Ultra	A3 Mega, High, Edge
GPU-Beschleunigung	NVIDIA H200 SXM-GPUs, die 141 GB GPU-Speicher pro GPU bieten und einen größeren und schnelleren Speicher zur Unterstützung großer Sprachmodelle und HPC-Arbeitslasten bereitstellen.	NVIDIA H100 SXM-GPUs angeschlossen. Diese bieten 80 GB GPU-Arbeitsspeicher pro GPU und sind ideal für große Transformer-basierte Sprachmodelle, Datenbanken und HPC geeignet.
Skalierbare Intel Xeon-Prozessoren	5.Generation des skalierbaren Intel Xeon-Prozessors (Emerald Rapids) und bietet eine kontinuierliche maximale Turbofrequenz für einen einzelnen Kern von bis zu 4,0 GHz. Weitere Informationen zu diesem Prozessor finden Sie unter CPU-Plattform.	4.Generation des skalierbaren Intel Xeon-Prozessors (Sapphire Rapids) und bietet eine dauerhafte maximale Turbofrequenz pro Kern von bis zu 3,3 GHz. Weitere Informationen zu diesem Prozessor finden Sie unter CPU-Plattform.
Branchenführende NVLink-Skalierbarkeit	NVIDIA H200-GPUs bieten eine maximale GPU-NVLink-Bandbreite von 900 GB/s in einer Richtung. Bei einer All-to-All-NVLink-Topologie zwischen 8 GPUs in einem System beträgt die NVLink-Gesamtbandbreite bis zu 7, 2 Terabyte pro Sekunde.	NVIDIA H100-GPUs bieten eine maximale GPU-NVLink-Bandbreite von 450 GB/s in einer Richtung. Bei einer All-to-All-NVLink-Topologie zwischen 8 GPUs in einem System beträgt die NVLink-Gesamtbandbreite bis zu 7, 2 Terabyte pro Sekunde.
Erweiterte Netzwerkeinstellungen	Bei diesem Maschinentyp wird die Netzwerkleistung durch RDMA over Converged Ethernet (RoCE) gesteigert, indem NVIDIA ConnectX-7-Netzwerkadapter (NICs) mit unserem Rechenzentrum-weiten, vierfach schienengebundenen Netzwerk kombiniert werden. Durch die Nutzung von RDMA over Converged Ethernet (RoCE) erreicht der `a3-ultragpu-8g`-Maschinentyp einen viel höheren Durchsatz zwischen Instanzen in einem Cluster als andere A3-Maschinentypen. Hinweis:Aufgrund der Unterschiede in der Netzwerktopologie zwischen A3 Ultra und der vorherigen A3-Serie (A3 Mega, High und Edge) können Sie Arbeitslasten nicht zwischen Instanzen verschieben, die auf A3 Ultra und der vorherigen A3-Serie ausgeführt werden.	Bei den A3 Mega-Maschinentypen verbessert GPUDirect-TCPXO GPUDirect-TCPX weiter, indem das TCP-Protokoll ausgelagert wird. Durch die Nutzung von GPUDirect-TCPXO erreicht der Maschinentyp `a3-megagpu-8g` die doppelte Netzwerkbandbreite der Maschinentypen A3 High und A3 Edge. Bei den Maschinentypen A3 Edge (`a3-edgegpu-8g`) und A3 High (`a3-highgpu-8g`) erhöht GPUDirect-TCPX die Netzwerkleistung, indem Datennutzlasten direkt vom GPU-Speicher an die Netzwerkschnittstelle übertragen werden. Durch die Nutzung von GPUDirect-TCPX erreichen diese Maschinentypen einen viel höheren Durchsatz zwischen Instanzen in einem Cluster als die beschleunigungsoptimierten A2- oder G2-Maschinentypen.
Höhere Netzwerkgeschwindigkeiten	Bietet im Vergleich zur vorherigen Generation der A2-Maschinenserie eine bis zu viermal höhere Netzwerkgeschwindigkeit. Weitere Informationen zu Netzwerken finden Sie unter Netzwerkbandbreiten und GPUs.	Bietet im Vergleich zur A2-Maschinenserie der vorherigen Generation eine bis zu 2,5-mal höhere Netzwerkgeschwindigkeit. Weitere Informationen zu Netzwerken finden Sie unter Netzwerkbandbreiten und GPUs.
Virtualisierungsoptimierungen	Die PCIe-Topologie (Peripheral Component Interconnect Express) von A3-Instanzen liefert genauere Informationen zur Lokalität, mit denen Arbeitslasten die Datenübertragungen optimieren können. Die GPUs bieten außerdem einen Funktionsebenen-Reset (FLR) für eine reibungslose Fehlerwiederherstellung und Unterstützung für atomare Vorgänge zur Verbesserung der Nebenläufigkeit in bestimmten Szenarien.
Unterstützung für Laufwerke	A3-Instanzen unterstützen lokale SSDs für schnelle Scratch Disks. Dies ist nützlich, um Daten in GPUs einzuspeisen und gleichzeitig E/A-Engpässe zu vermeiden. Für nichtflüchtigen Speicher können Sie Persistent Disk- und Hyperdisk-Volumes anhängen. Die lokale SSD wird so angehängt: A3 Ultra-Instanzen erhalten automatisch 12.000 GiB lokalen SSD-Speicher. A3-Mega-, High- und Edge-Instanzen erhalten automatisch 6.000 GiB lokalen SSD-Speicher. Für Arbeitslasten, die langlebigen Blockspeicher erfordern, können Sie den Maschinentypen in diesen Serien auch bis zu 512 TiB Persistent Disk- und Hyperdisk-Speicher zuweisen. Bei ausgewählten Maschinentypen werden auch bis zu 257 TiB Persistent Disk unterstützt. Weitere Informationen zu Laufwerkstypen finden Sie unter Laufwerkstyp auswählen.
Unterstützung für Richtlinien für kompakte Platzierung	Sie haben mehr Kontrolle über die physische Platzierung Ihrer Instanzen in Rechenzentren. Dies ermöglicht eine geringere Latenz und eine höhere Bandbreite für Instanzen, die sich in einer einzelnen Verfügbarkeitszone befinden. Weitere Informationen finden Sie unter Richtlinien für kompakte Platzierung. Achtung:Standardmäßig können Sie keine Richtlinien für kompakte Platzierung mit einem Wert für „max-distance“ auf A3-VMs in Compute Engine anwenden. Wenn Sie Zugriff auf diese Funktion anfordern möchten, wenden Sie sich an Ihren Technical Account Manager (TAM) oder das Vertriebsteam.

A3 Ultra-Maschinentyp

An A3 Ultra-Maschinentypen sind NVIDIA H200 SXM-GPUs (nvidia-h200-141gb) angehängt. Sie bieten die höchste Netzwerkleistung in der A3-Serie. A3 Ultra-Maschinentypen eignen sich ideal für das Training und die Bereitstellung von Foundation Models.

						Angehängte NVIDIA H200-GPUs
Maschinentyp	vCPU-Anzahl¹	Instanzarbeitsspeicher (GB)	Verbundene lokale SSD (GiB)	Anzahl der physischen Netzwerkkarten	Maximale Netzwerkbandbreite (Gbit/s)²	GPU-Anzahl	GPU-Arbeitsspeicher³ (GB HBM3e)
`a3-ultragpu-8g`	224	2.952	12.000	10	3.600	8	1128

Einschränkungen von A3 Ultra

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A3-Ultra-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A3-Ultra-Maschinentyp verwenden.
Sie können einen A3-Ultra-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Sie können keinen nichtflüchtigen Speicher (regional oder zonenbasiert) verwenden. Sie können nur Google Cloud Hyperdisk verwenden.
Der A3-Ultra-Maschinentyp ist nur auf der Emerald Rapids-CPU-Plattform verfügbar.
Änderungen des Maschinentyps werden für den A3-Ultra-Maschinentyp nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
Sie können Windows-Betriebssysteme nicht auf einem A3-Ultra-Maschinentyp ausführen.
A3-Ultra-Maschinentypen unterstützen keine einzelnen Mandanten.
Bei A3 Ultra-Instanzen werden die Zähler für physische Ports, die mit _phy enden, nicht aktualisiert, wenn Sie ethtool -S verwenden, um das GPU-Netzwerk zu überwachen. Das ist das erwartete Verhalten für Instanzen, die die MRDMA-Architektur mit virtuellen Funktionen (VF) verwenden. Weitere Informationen finden Sie unter MRDMA-Funktionen und Tools zur Netzwerküberwachung.

A3 Mega-Maschinentyp

A3 Mega-Maschinentypen haben NVIDIA H100 SXM-GPUs und sind ideal für das Training von großen Modellen und Inferenz mit mehreren Hosts.

Hinweis:Beim Bereitstellen von a3-megagpu-8g-Maschinentypen empfehlen wir, einen Cluster dieser Instanzen zu verwenden und mit einem Planer wie Google Kubernetes Engine (GKE) oder Slurm bereitzustellen. Eine detaillierte Anleitung für beide Optionen finden Sie hier:

Informationen zum Erstellen eines Google Kubernetes Engine-Clusters finden Sie unter A3 Mega-Cluster mit GKE bereitstellen.
Informationen zum Erstellen eines Slurm-Clusters finden Sie unter A3 Mega-Slurm-Cluster bereitstellen.

						Angehängte NVIDIA H100-GPUs
Maschinentyp	vCPU-Anzahl¹	Instanzarbeitsspeicher (GB)	Verbundene lokale SSD (GiB)	Anzahl der physischen Netzwerkkarten	Maximale Netzwerkbandbreite (Gbit/s)²	GPU-Anzahl	GPU-Arbeitsspeicher³ (GB HBM3)
`a3-megagpu-8g`	208	1.872	6.000	9	1.800	8	640

Einschränkungen von A3 Mega

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A3-Mega-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A3-Mega-Maschinentyp verwenden.
Sie können einen A3-Mega-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Sie können keinen regionalen nichtflüchtigen Speicher auf einer Instanz verwenden, die einen A3-Mega-Maschinentyp verwendet.
Der Maschinentyp „A3 Mega“ ist nur auf der Sapphire Rapids-CPU-Plattform verfügbar.
Änderungen des Maschinentyps werden für den A3 Mega-Maschinentyp nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
Sie können Windows-Betriebssysteme nicht auf einem A3 Mega-Maschinentyp ausführen.

A3 High-Maschinentyp

A3 High-Maschinentypen haben NVIDIA H100 SXM-GPUs und eignen sich sowohl für die Inferenz großer Modelle als auch für die Feinabstimmung von Modellen.

Hinweis:Wenn Sie die Maschinentypen a3-highgpu-1g, a3-highgpu-2g oder a3-highgpu-4g bereitstellen, müssen Sie Instanzen mit Spot-VMs oder Flex-Start-VMs erstellen. Eine ausführliche Anleitung zu diesen Optionen finden Sie hier:

Wenn Sie Spot-VMs erstellen möchten, legen Sie das Bereitstellungsmodell auf SPOT fest, wenn Sie eine beschleunigungsoptimierte VM erstellen.
Sie haben folgende Möglichkeiten, Flex-Start-VMs zu erstellen:
- Erstellen Sie eine eigenständige VM und legen Sie das Bereitstellungsmodell auf FLEX_START fest, wenn Sie eine beschleunigungsoptimierte VM erstellen.
- Erstellen Sie eine Anfrage zur Größenänderung in einer verwalteten Instanzgruppe (MIG). Eine Anleitung finden Sie unter MIG mit GPU-VMs erstellen.

						Angehängte NVIDIA H100-GPUs
Maschinentyp	vCPU-Anzahl¹	Instanzarbeitsspeicher (GB)	Verbundene lokale SSD (GiB)	Anzahl der physischen Netzwerkkarten	Maximale Netzwerkbandbreite (Gbit/s)²	GPU-Anzahl	GPU-Arbeitsspeicher³ (GB HBM3)
`a3-highgpu-1g`	26	234	750	1	25	1	80
`a3-highgpu-2g`	52	468	1.500	1	50	2	160
`a3-highgpu-4g`	104	936	3.000	1	100	4	320
`a3-highgpu-8g`	208	1.872	6.000	5	1.000	8	640

Einschränkungen von A3 High

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A3-High-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A3-High-Maschinentyp verwenden.
Sie können einen A3 High-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Sie können keinen regionalen nichtflüchtigen Speicher auf einer Instanz verwenden, die einen A3-High-Maschinentyp verwendet.
Der Maschinentyp „A3 High“ ist nur auf der Sapphire Rapids-CPU-Plattform verfügbar.
Änderungen des Maschinentyps werden für den A3-High-Maschinentyp nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
Sie können Windows-Betriebssysteme nicht auf einem A3 High-Maschinentyp ausführen.
Für die Maschinentypen a3-highgpu-1g, a3-highgpu-2g und a3-highgpu-4g müssen Sie Instanzen mit Spot-VMs oder Flex-Start-VMs erstellen. Eine ausführliche Anleitung zu diesen Optionen finden Sie hier:
- Wenn Sie Spot-VMs erstellen möchten, legen Sie das Bereitstellungsmodell auf SPOT fest, wenn Sie eine beschleunigungsoptimierte VM erstellen.
- Sie haben folgende Möglichkeiten, Flex-Start-VMs zu erstellen:
  - Erstellen Sie eine eigenständige VM und legen Sie das Bereitstellungsmodell auf FLEX_START fest, wenn Sie eine beschleunigungsoptimierte VM erstellen.
  - Erstellen Sie eine Anfrage zur Größenänderung in einer verwalteten Instanzgruppe (MIG). Eine Anleitung finden Sie unter MIG mit GPU-VMs erstellen.
Sie können eine Confidential VM mit einem a3-highgpu-1g-Maschinentyp nur in begrenzten Regionen und Zonen verwenden. Außerdem gelten alle Einschränkungen für Confidential VMs, die auf dem A3 High-Maschinentyp ausgeführt werden.

A3 Edge-Maschinentyp

A3 Edge-Maschinentypen haben NVIDIA H100 SXM-GPUs und sind speziell für die Bereitstellung konzipiert. Sie sind in einer begrenzten Anzahl von Regionen verfügbar.

						Angehängte NVIDIA H100-GPUs
Maschinentyp	vCPU-Anzahl¹	Instanzarbeitsspeicher (GB)	Verbundene lokale SSD (GiB)	Anzahl der physischen Netzwerkkarten	Maximale Netzwerkbandbreite (Gbit/s)²	GPU-Anzahl	GPU-Arbeitsspeicher³ (GB HBM3)
`a3-edgegpu-8g`	208	1.872	6.000	5	600: für asia-south1 und northamerica-northeast2 400: für alle anderen A3 Edge-Regionen	8	640

Einschränkungen von A3 Edge

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A3-Edge-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A3-Edge-Maschinentyp verwenden.
Sie können einen A3-Edge-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Sie können keinen regionalen nichtflüchtigen Speicher auf einer Instanz verwenden, die einen A3-Edge-Maschinentyp verwendet.
Der A3-Edge-Maschinentyp ist nur auf der Sapphire Rapids-CPU-Plattform verfügbar.
Änderungen des Maschinentyps werden für den A3-Edge-Maschinentyp nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
Sie können Windows-Betriebssysteme nicht auf einem A3-Edge-Maschinentyp ausführen.
A3-Edge-Maschinentypen unterstützen einzelne Mandanten nicht.

Unterstützte Laufwerkstypen für A3-Instanzen

A3 Ultra

A3 Ultra-Instanzen können folgende Blockspeichertypen verwenden:

Hyperdisk Balanced (hyperdisk-balanced): Dies ist der einzige Laufwerkstyp, der für das Bootlaufwerk unterstützt wird.
Hyperdisk Balanced High Availability (hyperdisk-balanced-high-availability)
Hyperdisk Extrem (hyperdisk-extreme)
Lokale SSD: Wird Instanzen, die mit einem der A3-Maschinentypen erstellt werden, automatisch hinzugefügt.

Maximale Anzahl von Laufwerken pro Instanz¹
Maschinentypen	Alle Hyperdisks	Hyperdisk Balanced	Hyperdisk mit ausgeglichener Hochverfügbarkeit	Hyperdisk Durchsatz	Hyperdisk ML	Hyperdisk Extrem	Angehängte lokale SSDs
`a3-ultragpu-8g`	128	128	128	–	–	8	32

¹ Die Nutzung von Hyperdisk wird zusätzlich zu den Preisen der Maschinentypen berechnet. Informationen zu den Laufwerkpreisen finden Sie unter Hyperdisk-Preise.

A3 Mega

A3 Mega-Instanzen können folgende Blockspeichertypen verwenden:

Abgestimmter nichtflüchtiger Speicher (pd-balanced)
Nichtflüchtiger SSD-Speicher (Leistung) (pd-ssd)
Hyperdisk Balanced (hyperdisk-balanced)
Hyperdisk Balanced High Availability (hyperdisk-balanced-high-availability)
Hyperdisk ML (hyperdisk-ml)
Hyperdisk Extrem (hyperdisk-extreme)
Hyperdisk Durchsatz (hyperdisk-throughput)
Lokale SSD: Wird Instanzen, die mit einem der A3-Maschinentypen erstellt werden, automatisch hinzugefügt.

Maximale Anzahl von Laufwerken pro Instanz¹
Maschinentypen	Alle Hyperdisks	Hyperdisk Balanced	Hyperdisk mit ausgeglichener Hochverfügbarkeit	Hyperdisk Durchsatz	Hyperdisk ML	Hyperdisk Extrem	Angehängte lokale SSDs
`a3-megagpu-8g`	128	32	32	64	64	8	16

A3 High

A3 High-Instanzen können folgende Blockspeichertypen verwenden:

Abgestimmter nichtflüchtiger Speicher (pd-balanced)
Nichtflüchtiger SSD-Speicher (Leistung) (pd-ssd)
Hyperdisk Balanced (hyperdisk-balanced)
Hyperdisk Balanced High Availability (hyperdisk-balanced-high-availability)
Hyperdisk ML (hyperdisk-ml)
Hyperdisk Extrem (hyperdisk-extreme)
Hyperdisk Durchsatz (hyperdisk-throughput)
Lokale SSD: Wird Instanzen, die mit einem der A3-Maschinentypen erstellt werden, automatisch hinzugefügt.

Maximale Anzahl von Laufwerken pro Instanz¹
Maschinentypen	Alle Hyperdisks	Hyperdisk Balanced	Hyperdisk mit ausgeglichener Hochverfügbarkeit	Hyperdisk Durchsatz	Hyperdisk ML	Hyperdisk Extrem	Angehängte lokale SSDs
`a3-highgpu-1g`	128	32	32	64	64	–	2
`a3-highgpu-2g`	128	32	32	64	64	–	4
`a3-highgpu-4g`	128	32	32	64	64	8	8
`a3-highgpu-8g`	128	32	32	64	64	8	16

A3 Edge

A3 Edge-Instanzen können folgende Blockspeichertypen verwenden:

Abgestimmter nichtflüchtiger Speicher (pd-balanced)
Nichtflüchtiger SSD-Speicher (Leistung) (pd-ssd)
Hyperdisk Balanced (hyperdisk-balanced)
Hyperdisk Balanced High Availability (hyperdisk-balanced-high-availability)
Hyperdisk ML (hyperdisk-ml)
Hyperdisk Extrem (hyperdisk-extreme)
Hyperdisk Durchsatz (hyperdisk-throughput)
Lokale SSD: Wird Instanzen, die mit einem der A3-Maschinentypen erstellt werden, automatisch hinzugefügt.

Maximale Anzahl von Laufwerken pro Instanz¹
Maschinentypen	Alle Hyperdisks	Hyperdisk Balanced	Hyperdisk mit ausgeglichener Hochverfügbarkeit	Hyperdisk Durchsatz	Hyperdisk ML	Hyperdisk Extrem	Verbundene lokale SSD
`a3-edgegpu-8g`	128	32	32	64	64	8	16

Laufwerks- und Kapazitätslimits

Wenn der Maschinentyp dies unterstützt, können Sie einer Instanz eine Mischung aus Hyperdisk- und Persistent Disk-Volumes anhängen. Es gelten jedoch die folgenden Einschränkungen:

Die Gesamtzahl der Hyperdisk- und Persistent Disk-Volumes darf 128 pro Instanz nicht überschreiten.
Die maximale Gesamt-Laufwerkskapazität (in TiB) für alle Laufwerkstypen darf Folgendes nicht überschreiten:
- Für Maschinentypen mit weniger als 32 vCPUs:
  - 257 TiB für alle Hyperdisk- oder Persistent Disk-Volumes
  - 257 TiB für eine Mischung aus Hyperdisk und Persistent Disk
- Für Maschinentypen mit 32 vCPUs oder mehr:
  - 512 TiB für alle Hyperdisk-Volume
  - 512 TiB für eine Mischung aus Hyperdisk und Persistent Disk
  - 257 TiB für alle Persistent Disk-Volumes

Weitere Informationen zu den Kapazitätslimits finden Sie unter Hyperdisk-Größen- und Anhängelimits und Maximale Kapazität von Persistent Disk.

Die A2-Maschinenserie

Die A2-Maschinenreihe ist in den Maschinentypen A2-Standard und A2-Ultra verfügbar. Diese Maschinentypen haben 12 bis 96 vCPUs und bis zu 1.360 GB Arbeitsspeicher.

VM-Instanzen, die mit den A2-Maschinentypen erstellt werden, bieten die folgenden Funktionen:

GPU-Beschleunigung: Jede A2-Instanz hat NVIDIA A100-GPUs. Diese sind in den Optionen A100 mit 40 GB sowie A100 mit 80 GB verfügbar.
Branchenführende NVLink-Skalierung, die eine maximale GPU-zu-GPU-NVLink-Bandbreite von 600 Gbit/s bietet. Beispielsweise haben Systeme mit 16 GPUs eine NVLink-Bandbreite von bis zu 9,6 Terabyte pro Sekunde. Diese 16 GPUs können als einzelner Hochleistungs-Beschleuniger mit einheitlichem Arbeitsspeicher verwendet werden, um bis zu 10 petaFLOPS Rechenleistung zu liefern, und bis zu 20 PetaFLOPS Inferenz-Computing, die für künstliche Intelligenz, Deep Learning und ML-Arbeitslasten verwendet werden kann..
Höhere Rechengeschwindigkeit: Die angehängten NVIDIA A100-GPUs bieten im Vergleich zu NVIDIA V100-GPUs der vorherigen Generation eine bis zu zehnmal höhere Rechengeschwindigkeit.

Mit der A2-Maschinenserie erhalten Sie bis zu 100 Gbit/s-Netzwerkbandbreite.
Unterstützung für Festplatten: A2-Instanzen unterstützen lokale SSDs für schnelle Scratch Disks. Dies ist nützlich, um Daten in GPUs einzuspeisen und gleichzeitig E/A-Engpässe zu vermeiden. Für nichtflüchtigen Speicher können Sie Persistent Disk- und Hyperdisk-Volumes anhängen.

Lokale SSDs werden folgendermaßen unterstützt:
- Für A2-Standard-Maschinentypen können Sie beim Erstellen einer Instanz bis zu 3.000 GiB an lokalen SSD-Speicher hinzufügen.
- Bei A2-Ultra-Maschinentypen wird der lokale SSD-Speicher beim Erstellen einer Instanz automatisch angehängt.
Für Arbeitslasten, die nichtflüchtigen Blockspeicher erfordern, können Sie bis zu 257 TiB Persistent Disk- und 512 TiB Hyperdisk-Volumes an A2-Instanzen anhängen. Weitere Informationen zu Laufwerkstypen finden Sie unter Laufwerkstyp auswählen.
Unterstützung der Richtlinie für kompakte Platzierung: Bietet mehr Kontrolle über die physische Platzierung Ihrer Instanzen in Rechenzentren. Sie ermöglicht eine geringere Latenz und eine höhere Bandbreite für Instanzen, die sich in einer einzelnen Verfügbarkeitszone befinden. Weitere Informationen finden Sie unter Latenz mithilfe von Richtlinien für kompakte Platzierung reduzieren.

Für die A2-Maschinenreihe sind die folgenden Maschinentypen verfügbar.

A2 Ultra-Maschinentypen

Diese Maschinentypen haben eine feste Anzahl von A100-GPUs mit 80GB. Lokale SSDs werden automatisch an Instanzen angehängt, die mit den A2 Ultra-Maschinentypen erstellt wurden.

					Angehängte NVIDIA A100-GPUs mit 80 GB
Maschinentyp	vCPU-Anzahl¹	Instanzarbeitsspeicher (GB)	Verbundene lokale SSD (GiB)	Maximale Netzwerkbandbreite (Gbit/s)²	GPU-Anzahl	GPU-Arbeitsspeicher³ (GB HBM2e)
`a2-ultragpu-1g`	12	170	375	24	1	80
`a2-ultragpu-2g`	24	340	750	32	2	160
`a2-ultragpu-4g`	48	680	1.500	50	4	320
`a2-ultragpu-8g`	96	1.360	3.000	100	8	640

Einschränkungen von A2 Ultra

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A2-Ultra-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A2-Ultra-Maschinentyp verwenden.
Sie können einen A2-Ultra-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Die A2-Ultra-Maschinentypen sind nur auf der Cascade Lake-Plattform verfügbar.
Wenn Ihre Instanz einen A2-Ultra-Maschinentyp verwendet, können Sie den Maschinentyp nicht ändern. Wenn Sie einen anderen A2-Ultra-Maschinentyp oder einen anderen Maschinentyp verwenden müssen, müssen Sie eine neue Instanz erstellen.
Sie können keinen anderen Maschinentyp in einen A2-Ultra-Maschinentyp ändern. Wenn Sie eine Instanz benötigen, die einen A2-Ultra-Maschinentyp verwendet, müssen Sie eine neue Instanz erstellen.
Sie können die schnelle Formatierung der angehängten lokalen SSDs nicht auf Windows-Instanzen verwenden, die A2-Ultra-Maschinentypen verwenden. Um diese lokalen SSDs zu formatieren, müssen Sie eine vollständige Formatierung mit dem diskpart-Dienstprogramm durchführen und format fs=ntfs label=tmpfs angeben.

A2-Standardmaschinentypen

Diese Maschinentypen haben eine feste Anzahl von A100-GPUs mit 40GB. Sie können auch beim Erstellen einer A2-Standard-Instanz lokale SSD-Laufwerke hinzufügen. Informationen zur Anzahl der Laufwerke, die Sie anhängen können, finden Sie unter Maschinentypen, bei denen Sie eine bestimmte Anzahl von lokalen SSD-Laufwerken auswählen müssen.

					Angehängte NVIDIA A100-GPUs mit 40 GB
Maschinentyp	vCPU-Anzahl¹	Instanzarbeitsspeicher (GB)	Unterstützung lokaler SSDs	Maximale Netzwerkbandbreite (Gbit/s)²	GPU-Anzahl	GPU-Arbeitsspeicher³ (GB HBM2)
`a2-highgpu-1g`	12	85	Ja	24	1	40
`a2-highgpu-2g`	24	170	Ja	32	2	80
`a2-highgpu-4g`	48	340	Ja	50	4	160
`a2-highgpu-8g`	96	680	Ja	100	8	320
`a2-megagpu-16g`	96	1.360	Ja	100	16	640

Einschränkungen von A2 Standard

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A2-Standardmaschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A2-Standardmaschinentyp verwenden.
Sie können einen A2-Standard-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Die A2-Standardmaschinentypen sind nur auf der Cascade Lake-Plattform verfügbar.
Wenn Ihre Instanz einen A2-Standardmaschinentyp verwendet, können Sie nur von einem A2-Standardmaschinentyp zu einem anderen A2-Standardmaschinentyp wechseln. Sie können keinen anderen Maschinentyp ändern. Weitere Informationen finden Sie unter Beschleunigeroptimierte Instanzen ändern.
Sie können das Windows-Betriebssystem nicht mit dem Maschinentyp a2-megagpu-16g verwenden. Wählen Sie einen anderen A2-Standard-Maschinentyp aus, wenn Sie ein Windows-Betriebssystem verwenden.
Sie können die schnelle Formatierung der angehängten lokalen SSDs nicht auf Windows-Instanzen verwenden, die A2-Standard-Maschinentypen verwenden. Um diese lokalen SSDs zu formatieren, müssen Sie eine vollständige Formatierung mit dem diskpart-Dienstprogramm durchführen und format fs=ntfs label=tmpfs angeben.

Unterstützte Laufwerkstypen für A2-Instanzen

A2-Instanzen können folgende Blockspeichertypen verwenden:

Hyperdisk ML (hyperdisk-ml)
Abgestimmter nichtflüchtiger Speicher (pd-balanced)
Nichtflüchtiger SSD-Speicher (Leistung) (pd-ssd)
Nichtflüchtiger Standardspeicher (pd-standard)
Lokale SSD: Wird automatisch an Instanzen angehängt, die mit den A2 Ultra-Maschinentypen erstellt wurden.

A2-Ultra

Maximale Anzahl von Laufwerken pro Instanz¹
Maschinentypen	Alle Laufwerke ²	Hyperdisk ML	Verbundene lokale SSD
`a2-ultragpu-1g`	128	32	1
`a2-ultragpu-2g`	128	48	2
`a2-ultragpu-4g`	128	64	4
`a2-ultragpu-8g`	128	64	8

¹ Die Nutzung von Hyperdisk und Persistent Disk wird zusätzlich zu den Maschinentyppreisen berechnet. Informationen zu den Laufwerkpreisen finden Sie unter Preise für Persistent Disk und Hyperdisk.
² Dieses Limit gilt für Persistent Disk und Hyperdisk, nicht jedoch für lokale SSDs.

A2-Standard

Maximale Anzahl von Laufwerken pro Instanz¹
Maschinentypen	Alle Laufwerke ²	Hyperdisk ML	Lokale SSD
`a2-highgpu-1g`	128	32	8
`a2-highgpu-2g`	128	48	8
`a2-highgpu-4g`	128	64	8
`a2-highgpu-8g`	128	64	8
`a2-megagpu-16g`	128	64	8

Wenn der Maschinentyp dies unterstützt, können Sie einer Instanz eine Mischung aus Hyperdisk- und Persistent Disk-Volumes anhängen. Es gelten jedoch die folgenden Einschränkungen:

Die Gesamtzahl der Hyperdisk- und Persistent Disk-Volumes darf 128 pro Instanz nicht überschreiten.
Die maximale Gesamt-Laufwerkskapazität (in TiB) für alle Laufwerkstypen darf Folgendes nicht überschreiten:
- Für Maschinentypen mit weniger als 32 vCPUs:
  - 257 TiB für alle Hyperdisk- oder Persistent Disk-Volumes
  - 257 TiB für eine Mischung aus Hyperdisk und Persistent Disk
- Für Maschinentypen mit 32 vCPUs oder mehr:
  - 512 TiB für alle Hyperdisk-Volume
  - 512 TiB für eine Mischung aus Hyperdisk und Persistent Disk
  - 257 TiB für alle Persistent Disk-Volumes

Weitere Informationen zu den Kapazitätslimits finden Sie unter Hyperdisk-Größen- und Anhängelimits und Maximale Kapazität von Persistent Disk.

Die G4-Maschinenserie

Die G4-Maschinenserie verwendet die AMD EPYC Turin-CPU-Plattform und bietet NVIDIA RTX PRO 6000 Blackwell Server Edition-GPUs. Diese Maschinenreihe bietet erhebliche Verbesserungen gegenüber der G2-Maschinenreihe der vorherigen Generation, mit deutlich mehr GPU-Arbeitsspeicher, erhöhter GPU-Arbeitsspeicherbandbreite und höherer Netzwerkbandbreite.

G4-Instanzen haben bis zu 384 vCPUs, 1.440 GB Arbeitsspeicher und 12 TiB Titanium-SSD-Festplatten. G4-Instanzen bieten außerdem eine Standardnetzwerkleistung von bis zu 400 Gbit/s.

Diese Maschinenserie ist besonders für Arbeitslasten wie NVIDIA Omniverse-Simulationsarbeitslasten, grafikintensive Anwendungen, Videotranscodierung und virtuelle Desktops vorgesehen. Die G4-Maschinenserie bietet im Vergleich zu Maschinentypen der A-Serie auch eine kostengünstige Lösung für die Durchführung von Inferenz auf einem einzelnen Host und Modellabstimmung.

Instanzen, die den Maschinentyp „G4“ verwenden, bieten die folgenden Funktionen:

GPU-Beschleunigung mit NVIDIA RTX PRO 6000 Blackwell Server Edition-GPUs: An G4-Instanzen werden automatisch NVIDIA RTX PRO 6000 Blackwell Server Edition-GPUs angehängt, die 96 GB GPU-Arbeitsspeicher pro GPU bieten.
AMD EPYC Turin-CPU-Plattform der 5.Generation: Diese Plattform bietet eine kontinuierliche maximale Boost-Frequenz von bis zu 4,1 GHz. Weitere Informationen zu diesem Prozessor finden Sie unter CPU-Plattform.
Grafikleistung der nächsten Generation: Die NVIDIA RTX PRO 6000-GPUs bieten im Vergleich zu den NVIDIA L4-GPUs, die an die G2-Maschinenserie angehängt sind, erhebliche Leistungs- und Funktionsupgrades. Die Upgrades sind:
- Tensor Cores der 5. Generation: Diese Kerne unterstützen FP4-Präzision und DLSS 4 Multi Frame Generation. Durch die Verwendung dieser Tensor-Kerne der 5. Generation bieten NVIDIA RTX PRO 6000-GPUs im Vergleich zu NVIDIA L4-GPUs eine verbesserte Leistung, um Aufgaben wie die lokale LLM-Entwicklung und die Erstellung von Inhalten zu beschleunigen.
- RT-Kerne der 4. Generation: Diese Kerne bieten die doppelte Raytracing-Leistung der NVIDIA L4-GPUs der vorherigen Generation und beschleunigen das Rendern für Design- und Fertigungsarbeitslasten.
- Anzahl der Kerne: Die NVIDIA RTX PRO 6000-GPU umfasst 24.064 CUDA-Kerne, 752 Tensor-Kerne der 5. Generation und 188 RT-Kerne der 4. Generation. Diese Aktualisierung stellt eine erhebliche Steigerung gegenüber früheren Generationen wie der L4-GPU dar, die 7.680 CUDA-Cores und 240 Tensor-Cores hat.
Multi-Instanz-GPU (MIG): Mit dieser Funktion kann eine einzelne GPU in bis zu vier vollständig isolierte GPU-Instanzen auf einer einzelnen VM-Instanz partitioniert werden. Weitere Informationen zu NVIDIA MIG finden Sie in der NVIDIA-Dokumentation unter NVIDIA Multi-Instance GPU.
Unterstützung von Peripheral Component Interconnect Express (PCIe) Gen 5: G4-Instanzen unterstützen PCI Express Gen 5, wodurch die Datenübertragungsgeschwindigkeit vom CPU-Arbeitsspeicher zur GPU im Vergleich zu PCIe Gen 3, das von G2-Instanzen verwendet wird, verbessert wird.
Unterstützung für Festplatten: G4-Instanzen unterstützen Titanium-SSDs für schnelle Scratch Disks. Dies ist nützlich, um Daten in GPUs einzuspeisen und gleichzeitig E/A-Engpässe zu vermeiden. Für nichtflüchtigen Speicher können Sie Hyperdisk-Volumes anhängen.

An G4-Instanzen können bis zu 12.000 GiB Titanium-SSD angehängt werden. Für Arbeitslasten, die dauerhaften Blockspeicher erfordern, unterstützen G4-Instanzen auch das Anhängen von bis zu 512 TiB Hyperdisk. Weitere Informationen zu Laufwerkstypen finden Sie unter Laufwerkstyp auswählen.
GPU-Peer-to-Peer-Kommunikation (P2P): G4-Instanzen unterstützen die GPU-P2P-Kommunikation und ermöglichen so die direkte Datenübertragung zwischen GPUs innerhalb derselben Instanz. Dies kann die Leistung von Multi-GPU-Arbeitslasten erheblich verbessern, da die Latenz bei der Datenübertragung reduziert und CPU-Ressourcen freigegeben werden. Weitere Informationen finden Sie unter G4 GPU-Peer-to-Peer-Kommunikation (P2P).

G4-Maschinentypen

Beschleunigungsoptimierte G4-Maschinentypen verwenden NVIDIA RTX PRO 6000 Blackwell Server Edition-GPUs (nvidia-rtx-pro-6000) und eignen sich für NVIDIA Omniverse-Simulationsarbeitslasten, grafikintensive Anwendungen, Videotranscodierung und virtuelle Desktops. G4-Maschinentypen bieten im Vergleich zu Maschinentypen der A-Serie auch eine kostengünstige Lösung für die Durchführung von Single-Host-Inferenz und Modelloptimierung.

						Angehängte NVIDIA RTX PRO 6000-GPUs
Maschinentyp	vCPU-Anzahl¹	Instanzarbeitsspeicher (GB)	Maximal unterstützte Titanium-SSD (GiB)²	Anzahl der physischen Netzwerkkarten	Maximale Netzwerkbandbreite (Gbit/s)³	GPU-Anzahl	GPU-Arbeitsspeicher⁴ (GB GDDR7)
`g4-standard-48`	48	180	1.500	1	50	1	96
`g4-standard-96`	96	360	3.000	1	100	2	192
`g4-standard-192`	192	720	6.000	1	200	4	384
`g4-standard-384`	384	1.440	12.000	2	400	8	768

¹ Eine vCPU ist als einzelner Hardware-Hyper-Thread auf einer der verfügbaren CPU-Plattformen implementiert.
² Sie können beim Erstellen einer G4-Instanz Titanium-SSD-Laufwerke hinzufügen. Informationen zur Anzahl der Laufwerke, die Sie anhängen können, finden Sie unter Maschinentypen, bei denen Sie eine bestimmte Anzahl von lokalen SSD-Laufwerken auswählen müssen.
³ Die maximale Bandbreite für ausgehenden Traffic darf die angegebene Zahl nicht überschreiten. Die tatsächliche Bandbreite für ausgehenden Traffic hängt von der Ziel-IP-Adresse und anderen Faktoren ab. Siehe Netzwerkbandbreite.
⁴ GPU-Arbeitsspeicher ist der Speicher auf einem GPU-Gerät, der zum temporären Speichern von Daten verwendet werden kann. Es ist vom Arbeitsspeicher der Instanz getrennt und wurde speziell für die höheren Bandbreitenanforderungen grafikintensiver Arbeitslasten entwickelt.

Einschränkungen von G4

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen G4-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen G4-Maschinentyp verwenden.
Sie können einen G4-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Sie können keinen nichtflüchtigen Speicher (regional oder zonenbasiert) auf einer Instanz verwenden, die einen G4-Maschinentyp verwendet.
Der G4-Maschinentyp ist nur auf der AMD EPYC Turin-Plattform der 5. Generation verfügbar.
Sie können keine Confidential VM-Instanzen erstellen, die einen G4-Maschinentyp verwenden.
Sie können keine G4-Instanzen auf Knoten für einzelne Mandanten erstellen.
Sie können Windows-Betriebssysteme nicht auf g4-standard-384-Instanzen verwenden.
Sie können Hyperdisk ML-Laufwerke, die vor dem 4. Februar 2026 erstellt wurden, nicht an G4-Maschinentypen anhängen.

Unterstützte Laufwerkstypen für G4-Instanzen

G4-Instanzen können folgende Blockspeichertypen verwenden:

Hyperdisk Balanced (hyperdisk-balanced): Dies ist der einzige Laufwerkstyp, der für das Bootlaufwerk unterstützt wird.
Hyperdisk Balanced High Availability (hyperdisk-balanced-high-availability)
Hyperdisk Extrem (hyperdisk-extreme)
Hyperdisk ML (hyperdisk-ml)
Hyperdisk Durchsatz (hyperdisk-throughput)
Titanium-SSD: Sie können Instanzen, die mit den G4-Maschinentypen erstellt wurden, eine Titanium-SSD hinzufügen.

Maximale Anzahl von Laufwerken pro Instanz¹
Maschinentypen	Alle Hyperdisks	Hyperdisk Balanced	Hyperdisk mit ausgeglichener Hochverfügbarkeit	Hyperdisk Extrem	Hyperdisk ML	Hyperdisk Durchsatz	Titanium SSD
`g4-standard-48`	32	32	32	0	32	32	4
`g4-standard-96`	32	32	32	8	32	32	8
`g4-standard-192`	64	64	64	8	64	64	16
`g4-standard-384`	128	128	128	8	128	128	32

¹ Die Nutzung von Hyperdisk wird zusätzlich zu den Preisen der Maschinentypen berechnet. Informationen zu den Laufwerkpreisen finden Sie unter Preise für Hyperdisks.

Weitere Informationen zu den Kapazitätslimits finden Sie unter Hyperdisk-Größen- und ‑Anhangslimits.

G4-Peer-to-Peer-Kommunikation (P2P)

G4-Instanzen verbessern die Leistung von Multi-GPU-Arbeitslasten durch die Verwendung direkter GPU-Peer-to-Peer-Kommunikation (P2P). Diese Funktion ermöglicht es GPUs, die an dieselbe G4-Instanz angeschlossen sind, Daten direkt über den PCIe-Bus auszutauschen. Dadurch ist es nicht erforderlich, Daten über den Hauptspeicher der CPU zu übertragen. Dieser direkte Pfad reduziert die Latenz, senkt die CPU-Auslastung und erhöht die effektive Bandbreite zwischen GPUs. Die P2P-Kommunikation beschleunigt Multi-GPU-Anwendungen wie ML-Training (Machine Learning) und HPC (High Performance Computing) erheblich.

Für diese Funktion sind in der Regel keine Änderungen an Ihrem Anwendungscode erforderlich. Sie müssen NCCL nur für die Verwendung von P2P konfigurieren. Bevor Sie Ihre Arbeitslasten ausführen, müssen Sie die NCCL_P2P_LEVEL-Umgebungsvariable auf Ihrer G4-Instanz entsprechend dem Maschinentyp festlegen, um NCCL zu konfigurieren:

Für G4-Instanzen mit 2 oder 4 GPUs (g4-standard-96, g4-standard-192): Setzen Sie NCCL_P2P_LEVEL=PHB.
Für G4-Instanzen mit 8 GPUs (g4-standard-384): NCCL_P2P_LEVEL=SYS festlegen

Legen Sie die Umgebungsvariable mit einer der folgenden Optionen fest:

Führen Sie in der Shell-Sitzung, in der Sie die Anwendung ausführen möchten, den entsprechenden Exportbefehl (z. B. export NCCL_P2P_LEVEL=SYS) in der Befehlszeile aus. Damit diese Einstellung beibehalten wird, fügen Sie diesen Befehl dem Startskript Ihrer Shell hinzu (z. B. ~/.bashrc).
Fügen Sie der NCCL-Konfigurationsdatei unter /etc/nccl.conf die entsprechende Einstellung hinzu, z. B. NCCL_P2P_LEVEL=SYS.

Wichtige Vorteile und Leistung

Beschleunigt Multi-GPU-Arbeitslasten auf G4-Instanzen mit mindestens zwei GPUs: Bietet schnellere Laufzeiten für Anwendungen, die auf g4-standard-96-, g4-standard-192- und g4-standard-384-Maschinentypen ausgeführt werden.
Kommunikation mit hoher Bandbreite: Ermöglicht hohe Datenübertragungsgeschwindigkeiten zwischen GPUs.
Verbessert die NCCL-Leistung: Bietet im Vergleich zur Kommunikation ohne P2P erhebliche Leistungssteigerungen für Anwendungen, die die NVIDIA Collective Communication Library (NCCL) verwenden. Der Hypervisor von Google isoliert diese P2P-Kommunikation sicher innerhalb Ihrer Instanzen.
- Bei vier GPU-Instanzen (g4-standard-192) befinden sich alle GPUs auf einem einzelnen NUMA-Knoten, was die effizienteste P2P-Kommunikation ermöglicht. Dies kann zu Leistungssteigerungen von bis zu 2,04-mal für Kollektive wie Allgather, Allreduce und ReduceScatter führen.
- Bei acht GPU-Instanzen (g4-standard-384) werden die GPUs auf zwei NUMA-Knoten verteilt. Die P2P-Kommunikation wird sowohl für Traffic innerhalb als auch zwischen diesen Knoten beschleunigt.Die Leistungssteigerung für dieselben Kollektive beträgt bis zu 2, 19x.

Die G2-Maschinenserie

Die G2-Maschinenserie ist in Standardmaschinentypen verfügbar, die haben 4 bis 96 vCPUs und bis zu 432 GB Arbeitsspeicher. Diese Maschinenserie ist für Inferenz- und Grafikarbeitslasten optimiert. Die G2-Maschinenserie ist in einem einzigen Standardmaschinentyp mit mehreren Konfigurationen verfügbar.

Instanzen, die mit den G2-Maschinentypen erstellt wurden, bieten die folgenden Funktionen:

GPU-Beschleunigung: Jeder G2-Maschinentyp hat NVIDIA L4-GPUs.
Verbesserte Inferenzraten: Der G2-Maschinentyp unterstützt den Datentyp FP8 (8-Bit-Gleitkomma), was ML-Inferenzraten beschleunigt und Arbeitsspeicherbedarf reduziert.
Grafikleistung der nächsten Generation: NVIDIA L4-GPUs bieten mit RT-Kernen der dritten Generation und NVIDIA DLSS 3-Technologie (Deep Learning Super Sampling) eine bis zu dreimal höhere Grafikleistung.
Hohe Netzwerkbandbreite: Mit den G2-Maschinentypen erhalten Sie bis zu 100 Gbit/s-Netzwerkbandbreite.
Unterstützung für Festplatten: G2-Instanzen unterstützen lokale SSDs für schnelle Scratch Disks, was nützlich ist, um Daten in GPUs einzuspeisen und gleichzeitig E/A-Engpässe zu vermeiden. Für nichtflüchtigen Speicher können Sie Persistent Disk- und Hyperdisk-Volumes anhängen.

Sie können G2-Instanzen bis zu 3.000 GiB an lokalen SSD-Speicher hinzufügen. Für Arbeitslasten, die langlebigen Blockspeicher erfordern, können Sie G2-Instanzen Hyperdisk- und Persistent Disk-Volumes zuordnen. Die maximale Speicherkapazität hängt von der Anzahl der vCPUs der Instanz ab. Weitere Informationen zu Laufwerkstypen finden Sie unter Laufwerkstyp auswählen.
Unterstützung der Richtlinie für kompakte Platzierung: Bietet mehr Kontrolle über die physische Platzierung Ihrer Instanzen in Rechenzentren. Sie ermöglicht eine geringere Latenz und eine höhere Bandbreite für Instanzen, die sich in einer einzelnen Verfügbarkeitszone befinden. Weitere Informationen finden Sie unter Latenz mithilfe von Richtlinien für kompakte Platzierung reduzieren.

G2-Maschinentypen

Beschleunigungsoptimierte G2-Maschinentypen haben NVIDIA L4-GPUs angehängt und eignen sich ideal für kostenoptimierte Inferenz-, grafikintensive und Hochleistungs-Computing-Arbeitslasten.

Jeder G2-Maschinentyp hat auch einen Standardarbeitsspeicher und einen benutzerdefinierten Arbeitsspeicherbereich. Der benutzerdefinierte Arbeitsspeicherbereich definiert die Größe des Arbeitsspeichers, den Sie Ihrer Instanz für jeden Maschinentyp zuweisen können. Sie können auch beim Erstellen einer G2-Instanz lokale SSD-Laufwerke hinzufügen. Informationen zur Anzahl der Laufwerke, die Sie anhängen können, finden Sie unter Maschinentypen, bei denen Sie eine bestimmte Anzahl von lokalen SSD-Laufwerken auswählen müssen.

						Angehängte NVIDIA L4-GPUs
Maschinentyp	vCPU-Anzahl¹	Standard-Instanzarbeitsspeicher (GB)	Benutzerdefinierter Instanzarbeitsspeicherbereich (GB)	Maximal unterstützte lokale SSD (GiB)	Maximale Netzwerkbandbreite (Gbit/s)²	GPU-Anzahl	GPU-Arbeitsspeicher³ (GB GDDR6)
`g2-standard-4`	4	16	16 bis 32	375	10	1	24
`g2-standard-8`	8	32	32 bis 54	375	16	1	24
`g2-standard-12`	12	48	48 bis 54	375	16	1	24
`g2-standard-16`	16	64	54 bis 64	375	32	1	24
`g2-standard-24`	24	96	96 bis 108	750	32	2	48
`g2-standard-32`	32	128	96 bis 128	375	32	1	24
`g2-standard-48`	48	192	192 bis 216	1.500	50	4	96
`g2-standard-96`	96	384	384 bis 432	3.000	100	8	192

Einschränkungen von G2

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen G2-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen G2-Maschinentyp verwenden.
Sie können einen G2-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Die G2-Maschinentypen sind nur auf der Cascade Lake-Plattform verfügbar.
Nichtflüchtige Standardspeicher (pd-standard) werden auf Instanzen, die den G2-Maschinentyp verwenden, nicht unterstützt. Informationen zu unterstützten Laufwerkstypen finden Sie unter Unterstützte Laufwerkstypen für G2.
Sie können keine GPUs mit mehreren Instanzen auf einer Instanz erstellen, die einen G2-Maschinentyp verwendet.
Wenn Sie den Maschinentyp einer G2-Instanz ändern müssen, lesen Sie die Informationen unter Beschleunigeroptimierte Instanzen ändern.
Sie können keine Deep Learning VM Images als Bootlaufwerke für Instanzen verwenden, die den G2-Maschinentyp verwenden.
Der aktuelle Standardtreiber für Container-Optimized OS unterstützt keine L4-GPUs, die auf G2-Maschinentypen ausgeführt werden. Außerdem unterstützt Container-Optimized OS nur bestimmte Treiber. Wenn Sie Container-Optimized OS auf G2-Maschinentypen verwenden möchten, lesen Sie die folgenden Hinweise:
- Verwenden Sie eine Container-Optimized OS-Version, die die mindestens empfohlene NVIDIA-Treiberversion 525.60.13 oder höher unterstützt. Weitere Informationen finden Sie in den Versionshinweisen zu Container-Optimized OS.
- Geben Sie bei der Installation des Treibers die neueste verfügbare Version an, die für die L4-GPUs funktioniert. Beispiel: sudo cos-extensions install gpu -- -version=525.60.13.
In den folgenden Szenarien müssen Sie über die Google Cloud CLI oder REST G2-Instanzen erstellen:
- Sie möchten benutzerdefinierte Speicherwerte angeben.
- Sie möchten die Anzahl der sichtbaren CPU-Kerne anpassen.

Unterstützte Laufwerkstypen für G2-Instanzen

G2-Instanzen können folgende Blockspeichertypen verwenden:

Abgestimmter nichtflüchtiger Speicher (pd-balanced)
Nichtflüchtiger SSD-Speicher (Leistung) (pd-ssd)
Hyperdisk ML (hyperdisk-ml)
Hyperdisk Durchsatz (hyperdisk-throughput)
Lokale SSD: Sie können Instanzen, die mit den G2-Maschinentypen erstellt wurden, lokale SSDs hinzufügen.

Maximale Anzahl von Laufwerken pro Instanz¹
Maschinentypen	Alle Laufwerke ²	Hyperdisk ML	Hyperdisk Durchsatz	Lokale SSD
`g2-standard-4`	128	24	24	1
`g2-standard-8`	128	32	32	1
`g2-standard-12`	128	32	32	1
`g2-standard-16`	128	48	48	1
`g2-standard-24`	128	48	48	2
`g2-standard-32`	128	64	64	1
`g2-standard-48`	128	64	64	4
`g2-standard-96`	128	64	64	8

Wenn der Maschinentyp dies unterstützt, können Sie einer Instanz eine Mischung aus Hyperdisk- und Persistent Disk-Volumes anhängen. Es gelten jedoch die folgenden Einschränkungen:

Die Gesamtzahl der Hyperdisk- und Persistent Disk-Volumes darf 128 pro Instanz nicht überschreiten.
Die maximale Gesamt-Laufwerkskapazität (in TiB) für alle Laufwerkstypen darf Folgendes nicht überschreiten:
- Für Maschinentypen mit weniger als 32 vCPUs:
  - 257 TiB für alle Hyperdisk- oder Persistent Disk-Volumes
  - 257 TiB für eine Mischung aus Hyperdisk und Persistent Disk
- Für Maschinentypen mit 32 vCPUs oder mehr:
  - 512 TiB für alle Hyperdisk-Volume
  - 512 TiB für eine Mischung aus Hyperdisk und Persistent Disk
  - 257 TiB für alle Persistent Disk-Volumes

Weitere Informationen zu den Kapazitätslimits finden Sie unter Hyperdisk-Größen- und Anhängelimits und Maximale Kapazität von Persistent Disk.

Beschleunigungsoptimierte Maschinenfamilie

Empfohlene Maschinenserie nach Arbeitslasttyp

Preise und Nutzungsoptionen

Verfügbarkeit von Verbrauchsoptionen nach Maschinentyp

Wartung von beschleunigeroptimierten Maschinentypen

Die A4X Max- und A4X-Maschinenserie

NVLink-Domain

A4X Max und A4X im Vergleich

A4X Max-Maschinentyp (Bare Metal)

A4X-Maschinentyp

Einschränkungen von A4X Max und A4X

Unterstützte Laufwerkstypen für A4X Max- und A4X-Instanzen

A4X Max

A4X

Laufwerks- und Kapazitätslimits

Die A4-Maschinenserie

A4-Maschinentyp

Einschränkungen von A4

Unterstützte Laufwerkstypen für A4-Instanzen

Laufwerks- und Kapazitätslimits

Die A3-Maschinenreihe

A3 Ultra-Maschinentyp

Einschränkungen von A3 Ultra

A3 Mega-Maschinentyp

Einschränkungen von A3 Mega

A3 High-Maschinentyp

Einschränkungen von A3 High

A3 Edge-Maschinentyp

Einschränkungen von A3 Edge

Unterstützte Laufwerkstypen für A3-Instanzen

A3 Ultra

A3 Mega

A3 High

A3 Edge

Laufwerks- und Kapazitätslimits

Die A2-Maschinenserie

A2 Ultra-Maschinentypen

Einschränkungen von A2 Ultra

A2-Standardmaschinentypen

Einschränkungen von A2 Standard

Unterstützte Laufwerkstypen für A2-Instanzen

A2-Ultra

A2-Standard

Die G4-Maschinenserie

G4-Maschinentypen

Einschränkungen von G4

Unterstützte Laufwerkstypen für G4-Instanzen

G4-Peer-to-Peer-Kommunikation (P2P)

Wichtige Vorteile und Leistung

Die G2-Maschinenserie

G2-Maschinentypen

Einschränkungen von G2

Unterstützte Laufwerkstypen für G2-Instanzen

Nächste Schritte