יכול להיות שחלק מהמידע בדף הזה או כולו לא רלוונטי ל-Cloud de Confiance by S3NS. פרטים נוספים מופיעים במאמר מה ההבדל מ-Google Cloud.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

יצירת מופע G2 או G4

במאמר הזה מוסבר איך ליצור מופע של מכונה וירטואלית (VM) שמשתמש בסוג מכונה מסדרת המכונות G2 או G4. סוגי המכונות מסדרת G‏ שעברו אופטימיזציה להאצה מתאימים להרצת אפליקציות עתירות גרפיקה ולהסקת מסקנות (Inference) של למידת מכונה (ML) בצורה חסכונית.

אפשר ליצור את מכונות ה-VM האלה כמכונות VM על פי דרישה. כדי להקטין את העלויות, אפשר גם ליצור מכונות וירטואליות מסוג G2 ו-G4 Spot, או ליצור מכונות וירטואליות מסוג G2 Flex-start. מידע נוסף על יצירת מכונות וירטואליות עם מעבדי GPU מצורפים זמין במאמר סקירה כללית על יצירת מכונה עם מעבדי GPU מצורפים.

כדי לייעל את העלויות של עומסי עבודה שלא דורשים את המשאבים של GPU מלא, אפשר ליצור מכונות וירטואליות עם GPU חלקי (vGPU) שמצורף אליהן, כדי לאפשר למספר עומסי עבודה לגשת ל-GPU פיזי יחיד.

כדי ליצור כמה מכונות וירטואליות מסוג G2 או G4, אפשר להשתמש באחת מהאפשרויות הבאות:

קבוצות מופעי מכונה מנוהלים (MIG): לעומסי עבודה שדורשים זמינות גבוהה, מדרגיות ותיקונים אוטומטיים, אתם יכולים ליצור קבוצת MIG שמשתמשת בתבנית של הגדרות מכונה של GPU.
יצירת מכונות בכמות גדולה: כדי ליצור מספר גדול של מכונות עצמאיות, אפשר ליצור מכונות וירטואליות מסוג G2 ו-G4 בכמות גדולה.

לפני שמתחילים

כדי לעיין במגבלות ובשלבי הכנה נוספים ליצירת מכונות עם GPU מצורף, כמו בחירת תמונת מערכת הפעלה ובדיקת מכסת ה-GPU, אפשר לעיין במאמר סקירה כללית על יצירת מכונה עם GPU מצורף.
אם עדיין לא עשיתם את זה, תצטרכו להגדיר אימות. אימות הוא תהליך שבו מאמתים את הזהות שלכם כדי לקבל גישה לממשקי API ולשירותים של Cloud de Confiance by S3NS . כדי להריץ קוד או דוגמאות מסביבת פיתוח מקומית, אפשר לבצע אימות ל-Compute Engine באחת מהדרכים הבאות:
צריך לבחור את הכרטיסייה הרלוונטית לאופן שבו תכננתם להשתמש בדוגמאות בדף הזה:
המסוף

כשמשתמשים במסוף Cloud de Confiance כדי לגשת לשירותים ולממשקי ה-API, לא צריך להגדיר אימות. Cloud de Confiance by S3NS
gcloud
1. התקינו את ה-CLI של Google Cloud ואז היכנסו ל-CLI של gcloud באמצעות הזהות המאוחדת שלכם. אחרי שנכנסתם לחשבון, אתחלו את ה-CLI של Google Cloud באמצעות הפקודה הבאה:
  gcloud init
  הערה: אם התקנתם את ה-CLI של gcloud, השתמשו בפקודה gcloud components update כדי לבדוק אם מותקנת הגרסה העדכנית.
הגדרת אזור ותחום כברירת מחדל

REST

כדי להשתמש בסביבת פיתוח מקומית בדוגמאות של API בארכיטקטורת REST שבדף הזה, צריך להשתמש בפרטי הכניסה שאתם נותנים ל-CLI של gcloud.

התקינו את ה-CLI של Google Cloud ואז היכנסו ל-CLI של gcloud באמצעות הזהות המאוחדת שלכם.

מידע נוסף מופיע במאמר אימות לשימוש ב-REST במסמכי האימות של Cloud de Confiance .

התפקידים הנדרשים

כדי לקבל את ההרשאות שנדרשות ליצירת מכונות וירטואליות, צריך לבקש מהאדמין להקצות לכם ב-IAM את התפקיד אדמין מכונות של Compute ‏ (v1) (roles/compute.instanceAdmin.v1) בפרויקט. כדי לקרוא הסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.

זהו תפקיד שמוגדר מראש וכולל את ההרשאות שנדרשות ליצירת מכונות וירטואליות. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:

ההרשאות הנדרשות

כדי ליצור מכונות וירטואליות, צריך את ההרשאות הבאות:

‫compute.instances.create בפרויקט
כדי להשתמש באימג' בהתאמה אישית ליצירת המכונה הווירטואלית (VM)‏: ‫compute.images.useReadOnly בקובץ אימג'
כדי להשתמש ב-snapshot ליצירת המכונה הווירטואלית: ‫compute.snapshots.useReadOnly בקובץ snapshot
כדי להשתמש בתבנית של הגדרות מכונה ליצירת המכונה הווירטואלית: compute.instanceTemplates.useReadOnly בתבנית של הגדרות המכונה
כדי לציין רשת משנה למכונה הווירטואלית: ‫compute.subnetworks.use בפרויקט או ברשת המשנה שנבחרה
כדי לציין כתובת IP סטטית למכונה הווירטואלית: ‫compute.addresses.use בפרויקט
כדי להקצות כתובת IP חיצונית למכונה הווירטואלית כשמשתמשים ברשת VPC: ‫compute.subnetworks.useExternalIp בפרויקט או ברשת המשנה שנבחרה
כדי להקצות רשת מדור קודם למכונה הווירטואלית: ‫compute.networks.use בפרויקט
כדי להקצות כתובת IP חיצונית למכונה הווירטואלית כשמשתמשים ברשת מדור קודם: ‫compute.networks.useExternalIp בפרויקט
כדי להגדיר מטא-נתונים של המכונה הווירטואלית: ‫compute.instances.setMetadata בפרויקט
כדי להגדיר תגים למכונה הווירטואלית: ‫compute.instances.setTags במכונה הווירטואלית
כדי להגדיר תוויות למכונה הווירטואלית: ‫compute.instances.setLabels במכונה הווירטואלית
כדי להגדיר חשבון שירות לשימוש של המכונה הווירטואלית: ‫compute.instances.setServiceAccount במכונה הווירטואלית
כדי ליצור דיסק חדש למכונה הווירטואלית: ‫compute.disks.create בפרויקט
כדי לצרף דיסק קיים במצב קריאה-בלבד או במצב קריאה וכתיבה: ‫compute.disks.use בדיסק
כדי לצרף דיסק קיים במצב קריאה-בלבד: ‫compute.disks.useReadOnly בדיסק

יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.

יצירת מכונה עם מעבדי GPU מצורפים

אפשר ליצור מכונה וירטואלית מסוג G2 או G4 שעברה אופטימיזציה לשימוש במאיץ באמצעות מסוף Cloud de Confiance ,‏ Google Cloud CLI או REST.

המסוף

נכנסים לדף Create an instance במסוף Cloud de Confiance .

כניסה לדף Create an instance
בשדה Name (שם), מזינים שם ייחודי למופע. מוסכמות למתן שמות למשאבים
בוחרים אזור ותחום שבהם סוגי המכונות עם GPU זמינים. מידע נוסף זמין במאמר אזורים ותחומים (Zones) של GPU.
בקטע machine types (סוגי מכונות), בוחרים באפשרות GPUs (מעבדים גרפיים).
1. ברשימה סוג ה-GPU, בוחרים את סוג ה-GPU.
  - במכונות G2, בוחרים באפשרות NVIDIA L4
  - במכונות G4, בוחרים באפשרות NVIDIA RTX PRO 6000
2. ברשימה Number of GPUs (מספר יחידות ה-GPU), בוחרים את מספר יחידות ה-GPU.
  - במכונות G4, המסוף בוחר באופן אוטומטי את סוג המכונה המתאים לפי מספר ה-GPU שנבחר.
  - לגבי מכונות G2, כדאי לבדוק את הדברים הבאים:
    - אם בוחרים GPU אחד, אפשר לבחור מתוך קבוצה של סוגי מכונות עם כמויות מוגדרות מראש של vCPU וזיכרון שמתאימות לעומסי העבודה שלכם.
    - אם בוחרים שני כרטיסי GPU או יותר, המסוף בוחר אוטומטית את סוג המכונה המתאים על סמך מספר כרטיסי ה-GPU שנבחרו.
    במכונות G2, אפשר גם לציין סוגי מכונות בהתאמה אישית. כדי לציין את מספר ה-vCPU ואת כמות הזיכרון של המופע, גוררים את הסרגלים או מזינים את הערכים בתיבות הטקסט. במסוף מוצגת עלות משוערת של המופע כשמשנים את מספר ליבות ה-vCPU והזיכרון.
3. אופציונלי: סדרות המכונות G2 ו-G4 תומכות בתחנות עבודה וירטואליות (vWS) של NVIDIA RTX לעומסי עבודה של גרפיקה. אם אתם מתכננים להריץ עומסי עבודה שדורשים הרבה משאבים גרפיים במופע, בוחרים באפשרות הפעלת תחנת עבודה וירטואלית (NVIDIA GRID).
מגדירים את דיסק האתחול באופן הבא:
1. בקטע מערכת הפעלה ואחסון, לוחצים על שינוי. ייפתח הדף Boot disk configuration (הגדרת דיסק האתחול).
2. בדף תצורת דיסק אתחול, מבצעים את הפעולות הבאות:
  1. בכרטיסייה Public images, בוחרים תמונה נתמכת של Compute Engine או Deep Learning VM Images.
  2. מציינים גודל של דיסק האתחול של 40 GiB לפחות.
  3. כדי לאשר את האפשרויות של דיסק האתחול, לוחצים על בחירה.
אופציונלי: מוסיפים SSD מקומי. אפשר להשתמש בכונני SSD מקומיים כדי ליצור דיסקים זמניים מהירים או כדי להזין נתונים ל-GPU, וכך למנוע צווארי בקבוק של קלט/פלט. כדי להוסיף כונני SSD מקומיים למופע:
1. בקטע מערכת הפעלה ואחסון, לוחצים על הוספת SSD מקומי.
2. בשדה ממשק, בוחרים באפשרות NVMe.
3. בקטע Disk capacity (קיבולת הדיסק), בוחרים את מספר התקני ה-SSD המקומיים שרוצים לצרף. המספר המקסימלי של דיסקים מקומיים מסוג SSD לכל מכונה מפורט במגבלות של סדרות המכונות ל-SSD מקומי.
אופציונלי: כדי להשיג רוחב פס רשת גבוה יותר למכונות g4-standard-384 שלכם, מגדירים כמה ממשקי רשת. אפשר להגדיר עד שני ממשקי רשת. ההגדרה הזו יוצרת מכונת g4-standard-384 עם שני ממשקי רשת (2x 200 Gbps). בקטע Networking (רשת), מבצעים את הפעולות הבאות:
1. מרחיבים את ממשק ברירת המחדל של הרשת.
2. מציינים את הרשת ואת רשת המשנה לממשק הראשון.
3. בקטע כרטיס רשת, בוחרים באפשרות gVNIC.
4. לוחצים על הוספת ממשק רשת כדי להוסיף את הממשק השני. מגדירים את ממשק הרשת השני באופן הבא:
  1. בוחרים רשת ורשת משנה אחרות של VPC. כל ממשק רשת חייב להיות ברשת VPC ייחודית.
  2. בקטע כרטיס רשת, בוחרים באפשרות gVNIC.
אופציונלי: הגדרת מודל הקצאת משאבים אחר כדי להקטין את העלויות. בקטע אפשרויות מתקדמות, באפשרות מודל הקצאת מכונות וירטואליות, בוחרים באחת מהאפשרויות הבאות:
- ‫(G2 בלבד) Flex-start: לעומסי עבודה לפרקי זמן קצרים שיכולים להסתדר עם זמן התחלה גמיש. מידע נוסף זמין במאמר מידע על מכונות וירטואליות עם הפעלה גמישה.
- ‫Spot: לעומסי עבודה (workloads) עמידים בכשלים שאפשר להפסיק אותם. מידע נוסף זמין במאמר בנושא מכונות וירטואליות מסוג Spot.
אופציונלי: ברשימה On VM termination בוחרים מה יקרה כש-Compute Engine יבצע דחיקה של מכונות וירטואליות מסוג Spot או כשמכונות וירטואליות מסוג Flex-start יגיעו לסוף משך הפעולה שלהן:
- כדי לעצור את המכונה הווירטואלית במהלך הפסקת הפעולה לפני הזמן, בוחרים באפשרות Stop (ברירת מחדל).
- כדי למחוק את המכונה הווירטואלית במהלך ההפסקה לפני הזמן, בוחרים באפשרות מחיקה.
כדי ליצור את המכונה הווירטואלית ולהפעיל אותה, לוחצים על Create.

gcloud

כדי ליצור מכונה ולהפעיל אותה, משתמשים בפקודה gcloud compute instances create. הפקודה הבאה כוללת את הדגלים הנדרשים.

  gcloud compute instances create VM_NAME \
      --machine-type=MACHINE_TYPE \
      --zone=ZONE \
      --boot-disk-size=DISK_SIZE \
      --image=IMAGE \
      --image-project=IMAGE_PROJECT \
      --maintenance-policy=TERMINATE \
      --restart-on-failure

מחליפים את מה שכתוב בשדות הבאים:

‫VM_NAME: השם של המכונה החדשה.
‫MACHINE_TYPE : סוג המכונה שבחרתם. צריך לבחור אחת מהאפשרויות הבאות:
- סוג מכונה G4.
- סוג מכונה G2. סוגי מכונות G2 תומכים גם בזיכרון מותאם אישית. הזיכרון חייב להיות כפולה של 1024MB ובטווח הזיכרון הנתמך. לדוגמה, כדי ליצור מכונה עם 4 מעבדי vCPU וזיכרון של 19GB, מציינים את הערך --machine-type=g2-custom-4-19456.
‫ZONE: האזור של המכונה. באזור צריך להיות תמיכה בדגם ה-GPU שבחרתם.
‫DISK_SIZE: הגודל של דיסק האתחול ב-GiB. מציינים גודל של דיסק האתחול של 40GiB לפחות.
‫IMAGE: קובץ אימג' של המערכת עם תמיכה ב-GPU. כדי להשתמש בתמונה העדכנית ביותר במשפחת תמונות, מחליפים את הדגל --image בדגל --image-family ומגדירים את הערך שלו למשפחת תמונות שתומכת ב-GPU. לדוגמה: --image-family=rocky-linux-8-optimized-gcp.
אפשר גם לציין תמונה מותאמת אישית או תמונות VM של למידה עמוקה.
‫IMAGE_PROJECT: פרויקט התמונות של Compute Engine שאליו שייכת תמונת מערכת ההפעלה. אם משתמשים בתמונה בהתאמה אישית או בתמונות של מכונות וירטואליות ללמידה עמוקה, צריך לציין את הפרויקט שאליו התמונות האלה שייכות.

דגלים אופציונליים

כדי להגדיר את המופע כך שיתאים לעומס העבודה או למערכת ההפעלה, צריך לכלול אחד או יותר מהדגלים הבאים כשמריצים את הפקודה gcloud compute instances create.

תכונה	תיאור
מודל הקצאת ההרשאות	הגדרת מודל ההקצאה למופע. אפשר לציין `STANDARD`, ‏`SPOT` או `FLEX_START`. אם מציינים `FLEX_START`, צריך לציין דגלים נוספים בפקודה כדי ליצור את המופע. אם לא מציינים מודל הקצאת משאבים, המערכת של Compute Engine מגדירה את הערך ל-`STANDARD`. מידע נוסף זמין במאמר מודלים להקצאת משאבים של מכונות וירטואליות ב-Compute Engine. --provisioning-model=`PROVISIONING_MODEL`
תחנת עבודה וירטואלית	מציינת תחנות עבודה וירטואליות (vWs) של NVIDIA RTX לעומסי עבודה של גרפיקה. --accelerator=type=`VWS_ACCELERATOR_TYPE`,count=`VWS_ACCELERATOR_COUNT` מחליפים את מה שכתוב בשדות הבאים: בקטע `VWS_ACCELERATOR_TYPE`, בוחרים אחת מהאפשרויות הבאות: במקרים של מופעי G4, מציינים `nvidia-rtx-pro-6000-vws` במקרים של מופעי G2, מציינים `nvidia-l4-vws` במקום `VWS_ACCELERATOR_COUNT`, מציינים את מספר יחידות ה-GPU הווירטואליות שרוצים להוסיף.
אחסון SSD מקומי	מצרף למופע דיסקים מקומיים מסוג SSD. אפשר להשתמש בכונני SSD מקומיים כדי ליצור דיסקים מהירים לגירוד או כדי להזין נתונים ל-GPU, וכך למנוע צווארי בקבוק של קלט/פלט. --local-ssd=interface=nvme \ --local-ssd=interface=nvme \ --local-ssd=interface=nvme ... כדי לראות את המספר המקסימלי של דיסקים מקומיים מסוג SSD שאפשר לצרף לכל מכונת VM, אפשר לעיין במאמר מגבלות של SSD מקומי.
ממשק רשת	מצרף כמה ממשקי רשת למופע. במקרים של `g4-standard-384`, אפשר לצרף עד שני ממשקי רשת. אפשר להשתמש בדגל הזה כדי ליצור מכונה עם שני ממשקי רשת (2x 200 Gbps). כל ממשק רשת חייב להיות ברשת VPC ייחודית. --network-interface=network=`VPC_NAME_1`,subnet=`SUBNET_NAME_1`,nic-type=GVNIC \ --network-interface=network=`VPC_NAME_2`,subnet=`SUBNET_NAME_2`,nic-type=GVNIC ממשקי רשת כפולים נתמכים רק בסוגי מכונות `g4-standard-384`. מחליפים את מה שכתוב בשדות הבאים: ‫`VPC_NAME`: השם של רשת ה-VPC. ‫`SUBNET_NAME`: השם של רשת המשנה שמהווה חלק מרשת ה-VPC שצוינה.
מדיניות בנושא מיקום	שולט במיקום של המופע באזור. אתם יכולים לציין מדיניות צפופה כדי למזער את זמן האחזור ברשת במכונות G2, או מדיניות מפוזרת כדי לשפר את העמידות של מכונות G4 או G2 בפני שיבושים ספציפיים לאזור. --resource-policies=`POLICY_NAME` מחליפים את `POLICY_NAME` בשם מדיניות המיקום. אפשר ליצור את המופע רק באותו אזור שבו נמצאת המדיניות.

REST

שולחים בקשת POST אל ה-method‏ instances.insert. אי אפשר לבצע מיגרציה פעילה של מכונות עם GPU, לכן צריך להגדיר את השדה onHostMaintenance לערך TERMINATE. השיטה הבאה כוללת את שדות החובה של גוף הבקשה.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances

{
   "machineType":"projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
   "disks":[
      {
         "type":"projects/PROJECT_ID/zones/ZONE/diskTypes/hyperdisk-balanced",
         "initializeParams":{
            "diskSizeGb":"DISK_SIZE",
            "sourceImage":"SOURCE_IMAGE_URI"
         },
         "boot":true
      }
   ],
   "name":"VM_NAME",
   "networkInterfaces":[
      {
         "network":"projects/PROJECT_ID/global/networks/default"
      }
   ],
   "scheduling":{
      "onHostMaintenance": "TERMINATE",
      "automaticRestart": true
   }
}

מחליפים את מה שכתוב בשדות הבאים:

‫VM_NAME: השם של המכונה החדשה.
‫PROJECT_ID: מזהה הפרויקט.
‫ZONE: האזור של המכונה. באזור הזה צריכה להיות תמיכה במודל ה-GPU שבחרתם.
‫MACHINE_TYPE : סוג המכונה שבחרתם. בוחרים באחת מהאפשרויות הבאות:
- סוג מכונה G4.
- סוג מכונה G2. סוגי מכונות G2 תומכים גם בזיכרון מותאם אישית. הזיכרון חייב להיות כפולה של 1024MB ובטווח הזיכרון הנתמך. לדוגמה, שם סוג המכונה של מופע עם 4 ליבות vCPU ו-19GB של זיכרון יהיה g2-custom-4-19456.
‫SOURCE_IMAGE_URI: ה-URI של התמונה או משפחת התמונות הספציפית שרוצים להשתמש בה. לדוגמה:
- תמונה ספציפית: "sourceImage": "projects/rocky-linux-cloud/global/images/rocky-linux-8-optimized-gcp-v20220719"
- משפחת תמונות: "sourceImage": "projects/rocky-linux-cloud/global/images/family/rocky-linux-8-optimized-gcp"
כשמציינים משפחת תמונות, Compute Engine יוצר מכונה מקובץ האימג' העדכני ביותר של מערכת ההפעלה שלא הוצא משימוש במשפחה הזו. מידע נוסף על המקרים שבהם כדאי להשתמש במשפחות של תמונות זמין במאמר בנושא שיטות מומלצות לשימוש במשפחות של תמונות.
‫DISK_SIZE: הגודל של דיסק האתחול ב-GiB. מציינים גודל של דיסק אתחול של לפחות ‎40 GiB.

שדות אופציונליים

כדי להגדיר עוד את המופע כך שיתאים לעומס העבודה או לדרישות של מערכת ההפעלה, צריך לכלול דגל אחד או יותר מהדגלים הבאים כשמריצים את השיטה instances.insert.

תכונה	תיאור
מודל הקצאת ההרשאות	כדי להקטין את העלויות, אפשר לציין מודל הקצאת משאבים שונה על ידי הוספת השדה `"provisioningModel": "PROVISIONING_MODEL"` לאובייקט `scheduling` בבקשה. מידע נוסף זמין במאמר מודלים להקצאת משאבים של מכונות וירטואליות ב-Compute Engine. "scheduling": { "onHostMaintenance": "TERMINATE", "provisioningModel": "`PROVISIONING_MODEL`" } מחליפים את `PROVISIONING_MODEL` באחד מהערכים הבאים: ‫`STANDARD`: מופע רגיל. זה ערך ברירת המחדל. ‫`SPOT`: VM במודל Spot. אם יוצרים VM במודל Spot, השדות `onHostMaintenance` ו-`automaticRestart` מוחלפים. מכונות וירטואליות מסוג Spot מוזלות מאוד, אבל Compute Engine יכול להפסיק את השימוש בהן בכל שלב כדי לפנות קיבולת. ‫`FLEX_START`: מכונה וירטואלית עם הפעלה גמישה. מכונות וירטואליות עם התחלה גמישה פועלות עד שבעה ימים ויכולות לעזור לכם להשיג משאבים מבוקשים כמו יחידות GPU במחיר מוזל. אם יוצרים מכונה וירטואלית עם תשלום לפי שימוש, צריך לציין שדות נוספים בבקשה. מידע נוסף זמין במאמר יצירת מכונת VM עם הפעלה גמישה.
תחנת עבודה וירטואלית	מציין תחנות עבודה וירטואליות (vWS) של NVIDIA RTX לעומסי עבודה גרפיים. "guestAccelerators": [ { "acceleratorCount": `VWS_ACCELERATOR_COUNT`, "acceleratorType": "projects/`PROJECT_ID`/zones/`ZONE`/acceleratorTypes/`VWS_ACCELERATOR_TYPE`" } ] מחליפים את מה שכתוב בשדות הבאים: בקטע `VWS_ACCELERATOR_TYPE`, בוחרים אחת מהאפשרויות הבאות: במקרים של מופעי G4, מציינים `nvidia-rtx-pro-6000-vws` במקרים של מופעי G2, מציינים `nvidia-l4-vws` במקום `VWS_ACCELERATOR_COUNT`, מציינים את מספר יחידות ה-GPU הווירטואליות שרוצים להוסיף.
אחסון SSD מקומי	מצרף למופע דיסקים מקומיים מסוג SSD. אפשר להשתמש בכונני SSD מקומיים כדי ליצור דיסקים מהירים לגירוד או כדי להזין נתונים ל-GPU, וכך למנוע צווארי בקבוק של קלט/פלט. { "type": "SCRATCH", "autoDelete": true, "initializeParams": { "diskType": "projects/`PROJECT_ID`/zones/`ZONE`/diskTypes/local-nvme-ssd" } } כדי לראות את המספר המקסימלי של דיסקים מקומיים מסוג SSD שאפשר לצרף לכל מכונת VM, אפשר לעיין במאמר מגבלות של SSD מקומי.
ממשק רשת	מצרף כמה ממשקי רשת למופע. במקרים של `g4-standard-384`, אפשר לצרף עד שני ממשקי רשת. כך נוצרת מכונה עם שני ממשקי רשת (2x 200 Gbps). כל ממשק רשת חייב להיות ברשת VPC ייחודית. "networkInterfaces": [ { "network": "projects/`PROJECT_ID`/global/networks/`VPC_NAME_1`", "subnetwork": "projects/`PROJECT_ID`/regions/`REGION`/subnetworks/`SUBNET_NAME_1`", "nicType": "GVNIC" }, { "network": "projects/`PROJECT_ID`/global/networks/`VPC_NAME_2`", "subnetwork": "projects/`PROJECT_ID`/regions/`REGION`/subnetworks/`SUBNET_NAME_2`", "nicType": "GVNIC" } ] ממשקי רשת כפולים נתמכים רק בסוגי מכונות `g4-standard-384`. מחליפים את מה שכתוב בשדות הבאים: ‫`VPC_NAME_1` ו-`VPC_NAME_2`: השם של רשתות ה-VPC. ‫`SUBNET_NAME`: השם של רשת המשנה שמהווה חלק מרשתות ה-VPC שצוינו.
מדיניות בנושא מיקום	שולט במיקום של המופע באזור. אתם יכולים לציין מדיניות צפופה כדי למזער את זמן האחזור ברשת במכונות G2, או מדיניות מפוזרת כדי לשפר את העמידות של מכונות G4 או G2 בפני שיבושים ספציפיים לאזור. "resourcePolicies": [ "projects/`PROJECT_ID`/regions/`REGION`/resourcePolicies/`POLICY_NAME`" ] מחליפים את מה שכתוב בשדות הבאים: ‫`REGION`: האזור שבו קיימת מדיניות המיקום. אפשר ליצור את המופע רק באותו אזור שבו נמצאת המדיניות. ‫`POLICY_NAME`: השם של מדיניות המיקום.

התקנת מנהלי התקנים

אחרי שיוצרים את המכונה, צריך להתקין דרייבר כדי להשתמש ב-GPU. הדרייבר שצריך להתקין תלוי בשאלה אם הפעלתם תחנת עבודה וירטואלית (vWS) של NVIDIA RTX לעומסי עבודה גרפיים כשיצרתם את המכונה.

אם לא הפעלתם תחנת עבודה וירטואלית, תצטרכו להתקין את מנהל התקן ה-GPU במכונה הווירטואלית.
אם הפעלתם תחנת עבודה וירטואלית, צריך להתקין מנהל התקן לתחנת העבודה הווירטואלית.

התקנת דרייברים של vGPU עבור GPUs חלקיים

במכונות G4 שמצורף אליהן פחות מ-GPU אחד, אחרי שיוצרים את המכונה צריך להתקין בה דרייבר vGPU ספציפי שמתחבר לדרייבר המארח של המכונה הפיזית. הוראות מפורטות מופיעות במאמר בנושא התקנת מנהלי התקנים של vGPU (מכונות וירטואליות חלקיות).

(אופציונלי) מצב Multi-Instance GPU ‏ (G4 בלבד)

מצב Multi-Instance GPU ‏ (MIG) הוא תכונה שאפשר להפעיל ב-NVIDIA GPU נתמך.

אחרי שיוצרים מכונת G4, אפשר להפעיל מצב Multi-Instance GPU ‏ (MIG) במעבד GPU יחיד מסוג NVIDIA RTX PRO 6000 שמצורף למכונה. כשמצב MIG מופעל, ה-GPU היחיד מחולק למקסימום שבעה מופעי GPU עצמאיים. כל מופע פועל בו-זמנית, לכל אחד יש זיכרון, מטמון ומעבדים מרובי-ליבות משלו. לאחר מכן, תוכלו להריץ במקביל עומסי עבודה שונים במכונות ה-GPU האלה. השימוש בסוגי מכונות G4 שכוללים מעבדי GPU חלקיים שונה מהשימוש בסוגי מכונות G4 שכוללים מעבדי GPU שלמים. במקרה של מעבדי GPU חלקיים, כמה עומסי עבודה חולקים גישה למעבד GPU פיזי יחיד באמצעות חלוקה למחיצות (vGPU).

מידע נוסף על שימוש ב-GPU עם כמה מופעים זמין במאמר תחילת העבודה עם MIG במסמכי התיעוד של NVIDIA.

מה השלב הבא?

מידע נוסף על פלטפורמות GPU
במאמר טיפול באירועי תחזוקה של מארחי GPU מוסבר איך לטפל בתחזוקה של מארחי GPU.