יכול להיות שחלק מהמידע בדף הזה או כולו לא רלוונטי ל-Cloud de Confiance by S3NS. פרטים נוספים מופיעים במאמר מה ההבדל מ-Google Cloud.

‫Google משתמשת בטכנולוגיית AI כדי לתרגם תוכן לשפה המועדפת עליך. בתרגומים כאלו עשויות להיות שגיאות.

יצירת בקשה לשריון מקום שמור לעתיד במצב יומן

במאמרי עזרה הזה מוסבר איך ליצור מקום שמור לעתיד במצב יומן כדי לשריין משאבי GPU,‏ H4D או TPU למכונות וירטואליות (VM). אפשר להשתמש בבקשות האלה כדי לקבל משאבים מבוקשים ליצירת מכונות וירטואליות שאתם מתכננים להפעיל למשך עד 90 ימים.

אתם יכולים להשתמש בבקשות למקום שמור לעתיד במצב יומן כדי לשריין משאבים להריץ את עומסי העבודה הבאים:

משימות אימון מראש של מודלים
משימות של כוונון עדין של מודלים
עומסי עבודה (workloads) של סימולציות מחשוב עתיר ביצועים (HPC)
עלייה לטווח קצר בעומסי עבודה של הסקת מסקנות

אחרי שצוות Cloud de Confiance by S3NS מאשר את הבקשה, המשאבים השמורים הופכים לזמינים ליצירת מכונות וירטואליות עם GPU,‏ H4D או TPU בתאריך ובשעה שצוינו למסירה. במהלך תקופת ההזמנה, רק הפרויקט שלכם וכל פרויקט שציינתם כששלחתם את הבקשה יוכלו לגשת למשאבים השמורים. אתם יכולים לשתף את המשאבים שהוזמנו עם עד 100 פרויקטים שנמצאים באותו ארגון שבו נמצא הפרויקט שלכם. מידע נוסף על הדרישות וההגבלות שחלות כשיוצרים בקשה במצב יומן זמין במאמר מידע על בקשות להזמנות עתידיות במצב יומן זמין.

לפני שמתחילים

אם אתם לא יכולים להשתמש בבקשות לשמירת מקום לעתיד במצב יומן, יכול להיות שאתם לא עומדים בדרישות לגישה לתכונה הזו ולשימוש בה. במקרה כזה, צריך לפנות לצוות ניהול החשבון או לצוות המכירות.
כדי לשריין מכונות וירטואליות מסוג H4D, צריך לוודא שיש לכם מספיק מכסת CPU. אחרת, הזמנת המשאבים תיכשל. אין צורך במכסה כדי להזמין מכונות וירטואליות עם GPU או TPU.
כדי לשתף את הקיבולת השמורה עם פרויקטים אחרים בארגון, צריך לוודא שלפרויקט שבו רוצים ליצור בקשות למקומות שמורים לעתיד במצב יומן יש הרשאה ליצור הזמנות משותפות. אחרת, תקבלו שגיאות.
אם עדיין לא עשיתם את זה, תצטרכו להגדיר אימות. אימות הוא תהליך שבו מאמתים את הזהות שלכם כדי לקבל גישה לממשקי API ולשירותים של Cloud de Confiance by S3NS . כדי להריץ קוד או דוגמאות מסביבת פיתוח מקומית, אפשר לבצע אימות ל-Compute Engine באחת מהדרכים הבאות:
צריך לבחור את הכרטיסייה הרלוונטית לאופן שבו תכננתם להשתמש בדוגמאות בדף הזה:
המסוף

כשמשתמשים במסוף Cloud de Confiance כדי לגשת לשירותים ולממשקי ה-API, לא צריך להגדיר אימות. Cloud de Confiance by S3NS
gcloud
1. התקינו את ה-CLI של Google Cloud ואז היכנסו ל-CLI של gcloud באמצעות הזהות המאוחדת שלכם. אחרי שנכנסתם לחשבון, אתחלו את ה-CLI של Google Cloud באמצעות הפקודה הבאה:
  gcloud init
  הערה: אם התקנתם את ה-CLI של gcloud, השתמשו בפקודה gcloud components update כדי לבדוק אם מותקנת הגרסה העדכנית.
הגדרת אזור ותחום כברירת מחדל

REST

כדי להשתמש בסביבת פיתוח מקומית בדוגמאות של API בארכיטקטורת REST שבדף הזה, צריך להשתמש בפרטי הכניסה שאתם נותנים ל-CLI של gcloud.

התקינו את ה-CLI של Google Cloud ואז היכנסו ל-CLI של gcloud באמצעות הזהות המאוחדת שלכם.

מידע נוסף מופיע במאמר אימות לשימוש ב-REST במסמכי האימות של Cloud de Confiance .

התפקידים הנדרשים

כדי לקבל את ההרשאות שנדרשות ליצירת בקשה למקום שמור לעתיד במצב יומן, צריך לבקש מהאדמין להקצות לכם ב-IAM את התפקיד משתמש בהזמנה עתידית של Compute (roles/compute.futureReservationUser) בפרויקט. כדי לקרוא הסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.

זהו תפקיד שמוגדר מראש וכולל את ההרשאות שנדרשות ליצירת בקשה למקום שמור לעתיד במצב תצוגת לוח שנה. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:

ההרשאות הנדרשות

כדי ליצור בקשה למקום שמור לעתיד במצב יומן, צריך את ההרשאות הבאות:

כדי ליצור בקשה למקום שמור לעתיד: compute.futureReservations.create בפרויקט
כדי לאפשר ל-Compute Engine ליצור אוטומטית בקשות לשמירת מקום: compute.reservations.create בפרויקט
כדי לראות את הזמינות של משאבים בתאריך עתידי: compute.advice.calendarMode בפרויקט

יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.

יצירת בקשה לשריון מקום שמור לעתיד במצב יומן

כדי ליצור מקום שמור לעתיד במצב יומן:

איך בודקים את הזמינות העתידית של משאבים צפייה בזמינות עתידית של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או יחידות TPU שרוצים לשריין. לאחר מכן, כשיוצרים בקשה, מציינים את המספר, הסוג ומשך ההזמנה של המשאבים שאושרו כזמינים. Cloud de Confiance by S3NS יותר סביר שתאשר את הבקשה אם תספקו את המידע הזה.

הערה: אם יוצרים בקשה באמצעות Cloud de Confiance המסוף, אפשר לדלג על השלב הזה. במהלך יצירת הבקשה, תוכלו לראות את הזמינות העתידית של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או TPU.

ההוראות מפורטות במאמר בנושא צפייה בזמינות עתידית של משאבים.
יצירת בקשה לשמירת מקום ליצור ולשלוח בקשה לשריון מקום שמור לעתיד במצב יומן למכונות וירטואליות עם GPU, למכונות וירטואליות מסוג H4D או ליחידות TPU. אם הצלחתם ליצור בקשה, המערכת של Cloud de Confiance תאשר אותה תוך דקה.

הוראות מפורטות זמינות במאמר בנושא יצירת בקשה למכונות וירטואליות עם GPU, למכונות וירטואליות מסוג H4D או ל-TPU.

הצגת הזמינות העתידית של משאבים

כדי לראות את הזמינות העתידית של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או יחידות TPU באזור מסוים:

למכונות וירטואליות של GPU או H4D, עד 60 ימים מראש
ל-TPU, עד 120 ימים מראש

כדי לראות את הזמינות העתידית של מכונת GPU וירטואלית, מכונת H4D וירטואלית או TPU באזור מסוים, בוחרים באחת מהאפשרויות הבאות:

המסוף

אתם יכולים לראות את הזמינות העתידית של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או מכונות וירטואליות עם TPU באזור מסוים כשאתם יוצרים בקשה למקום שמור לעתיד במצב יומן. מידע נוסף זמין במאמר יצירת בקשה למכונות וירטואליות עם GPU, למכונות וירטואליות מסוג H4D או ל-TPU.

gcloud

כדי לראות את הזמינות העתידית של מכונות וירטואליות עם GPU, מכונות וירטואליות H4D או TPU באזור מסוים, משתמשים בפקודה gcloud compute advice calendar-mode. בהתאם למשאבים שרוצים לראות, כוללים את הדגלים הבאים:

כדי לראות את הזמינות של מכונות וירטואליות עם GPU או מכונות וירטואליות מסוג H4D, כוללים את הדגלים --vm-count ו---machine-type:

gcloud compute advice calendar-mode \
    --vm-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --duration-range=min=MIN_DURATION,max=MAX_DURATION

כדי לראות את הזמינות של TPU, כוללים את הדגלים --chip-count ו---tpu-version:

gcloud compute advice calendar-mode \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --duration-range=min=MIN_DURATION,max=MAX_DURATION

מחליפים את מה שכתוב בשדות הבאים:

‫NUMBER_OF_VMS: מספר המכונות הווירטואליות שרוצים לשריין. הערך חייב להיות לפחות 1 ולא יותר מ-80 למכונות וירטואליות עם GPU או 256 למכונות וירטואליות מסוג H4D.
‫MACHINE_TYPE: סוג ה-GPU או סוג המכונה H4D שרוצים לשריין. מציינים אחד מהערכים הבאים:
- לסוגי מכונות A4, מציינים a4-highgpu-8g.
- לסוגי מכונות A3 Ultra, מציינים a3-ultragpu-8g.
- לסוגי מכונות A3 Mega, מציינים a3-megagpu-8g.
- לסוגי מכונות A3 High עם 8 מעבדי GPU, מציינים a3-highgpu-8g.
- למידע על סוגי מכונות H4D HPC, אפשר לעיין במאמר סוגי מכונות H4D.
‫NUMBER_OF_CHIPS: מספר שבבי ה-TPU שרוצים לשריין. הערך חייב להיות 1,‏ 4,‏ 8,‏ 16,‏ 32,‏ 64,‏ 128,‏ 256,‏ 512 או 1024.
‫TPU_VERSION: גרסת ה-TPU להזמנה. מציינים אחד מהערכים הבאים:
- ‫TPU7x: TPU7X
- ‫TPU v6e: V6E
- ‫TPU v5p: V5P
‫REGION: האזור שבו רוצים להזמין מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או TPU. כדי לבדוק באילו אזורים ואזורי זמינות יש תמיכה, אפשר לעיין במגבלות.
‫FROM_START_TIME ו-TO_START_TIME: התאריכים המוקדם והמאוחר ביותר שבהם רוצים לשריין קיבולת. צריך להמיר את התאריכים האלה לפורמט חותמות זמן RFC 3339:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
מחליפים את מה שכתוב בשדות הבאים:
- ‫YYYY-MM-DD: תאריך בפורמט של שנה בת 4 ספרות, חודש בן 2 ספרות ויום בן 2 ספרות, מופרדים במקפים (-).
- ‫HH:MM:SS: שעה בפורמט של שתי ספרות לשעה (בפורמט 24 שעות), שתי ספרות לדקות ושתי ספרות לשניות, מופרדות בנקודתיים (:).
- ‫OFFSET: אזור הזמן בפורמט של היסט מזמן אוניברסלי מתואם (UTC). לדוגמה, כדי להשתמש בשעון החוף המערבי (PST), מציינים -08:00. כדי לא להשתמש בהזחה, מציינים את הערך Z.
‫MIN_DURATION ו-MAX_DURATION: הזמן המינימלי והמקסימלי שבו רוצים לשמור מקום למשאבים. צריך להזין את הערכים האלה בפורמט של מספר הימים, השעות, הדקות או השניות, ואחריו הערכים d, h, m ו-s בהתאמה. לדוגמה, מציינים 24h ל-24 שעות או 1d2h3m4s ליום אחד, שעתיים, שלוש דקות וארבע שניות.

הפלט אמור להיראות כך:

- recommendationsPerSpec:
    spec:
      endTime: '2026-02-10T00:00:00Z'
      location: zones/us-central1-a
      otherLocations:
        zones/us-central1-b:
          details: Recommendation in this zone is possible.
          status: RECOMMENDED
        zones/us-central1-c:
          details: Temporarily no free capacity in this zone in the
          requested time window.
          status: NO_CAPACITY
        zones/us-central1-f:
          details: This machine family is not supported in this zone.
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2026-02-07T00:00:00Z'

אם המשאבים שביקשתם זמינים, הפלט יכיל את השדות startTime, endTime ו-location. בשדות האלה מצוינים זמן ההתחלה המוקדם ביותר, זמן הסיום המאוחר ביותר והאזורים שבהם המשאבים זמינים.

REST

כדי לראות את הזמינות העתידית של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או TPU באזור מסוים, שולחים GETבקשה לשיטה advice.calendarMode. בהתאם למשאבים שרוצים לראות, כוללים את השדות הבאים בגוף הבקשה:

כדי לראות את הזמינות של מכונות וירטואליות עם GPU או מכונות וירטואליות מסוג H4D, צריך לכלול את השדות instanceCount ו-machineType:

POST https://compute.s3nsapis.fr/compute/v1/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "specificSkuResources": {
          "instanceCount": "NUMBER_OF_VMS",
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "minDuration": "MIN_DURATION",
        "maxDuration": "MAX_DURATION"
      }
    }
  }
}

כדי לראות את הזמינות של TPU, כוללים את השדות acceleratorCount ו-vmFamily:

POST https://compute.s3nsapis.fr/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "aggregateResources": {
          "acceleratorCount": "NUMBER_OF_CHIPS",
          "vmFamily": "TPU_VERSION"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "minDuration": "MIN_DURATION",
        "maxDuration": "MAX_DURATION"
      }
    }
  }
}

מחליפים את מה שכתוב בשדות הבאים:

‫PROJECT_ID: מזהה הפרויקט שבו רוצים לשריין משאבים.
‫REGION: האזור שבו רוצים להזמין מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או יחידות TPU. כדי לבדוק אילו אזורים ותחומים נתמכים, אפשר לעיין בהגבלות.
‫NUMBER_OF_VMS: מספר מכונות ה-GPU או H4D הווירטואליות שרוצים לשריין. במכונות וירטואליות עם GPU, הערך צריך להיות בין 1 ל-80. במכונות וירטואליות מסוג H4D, הערך צריך להיות בין 1 ל-256.
‫MACHINE_TYPE: סוג ה-GPU או סוג המכונה H4D שרוצים לשריין. מציינים אחד מהערכים הבאים:
- לסוגי מכונות A4, מציינים a4-highgpu-8g.
- לסוגי מכונות A3 Ultra, מציינים a3-ultragpu-8g.
- לסוגי מכונות A3 Mega, מציינים a3-megagpu-8g.
- לסוגי מכונות A3 High עם 8 מעבדי GPU, מציינים a3-highgpu-8g.
- למידע על סוגי מכונות H4D HPC, אפשר לעיין במאמר סוגי מכונות H4D.
‫NUMBER_OF_CHIPS: מספר שבבי ה-TPU שרוצים לשריין. הערך חייב להיות 1,‏ 4,‏ 8,‏ 16,‏ 32,‏ 64,‏ 128,‏ 256,‏ 512 או 1024.
‫TPU_VERSION: גרסת ה-TPU להזמנה. מציינים אחד מהערכים הבאים:
- ‫TPU7x: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X
- ‫TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
- ‫TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
‫FROM_START_TIME ו-TO_START_TIME: התאריכים המוקדם והמאוחר ביותר שבהם רוצים לשריין קיבולת. צריך להמיר את התאריכים האלה לפורמט חותמות זמן RFC 3339:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
מחליפים את מה שכתוב בשדות הבאים:
- ‫YYYY-MM-DD: תאריך בפורמט של שנה בת 4 ספרות, חודש בן 2 ספרות ויום בן 2 ספרות, עם מקפים ביניהם (-).
- ‫HH:MM:SS: שעה בפורמט של 2 ספרות, בשיטת זמן של 24 שעות, דקות בפורמט של 2 ספרות ושניות בפורמט של 2 ספרות, מופרדות באמצעות נקודתיים (:).
- ‫OFFSET: אזור הזמן בפורמט של היסט מזמן אוניברסלי מתואם (UTC). לדוגמה, כדי להשתמש בשעון החוף המערבי (PST), מציינים -08:00. כדי לא להשתמש בהזחה, מציינים את הערך Z.
‫MIN_DURATION ו-MAX_DURATION: משך הזמן המינימלי והמקסימלי, בשניות, שבו רוצים לשריין משאבים. הערכים האלה צריכים להיות בפורמט של מספר השניות, ואחריו s. לדוגמה, מציינים 86400s ל-86,400 שניות (24 שעות).

הפלט אמור להיראות כך:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2026-02-07T00:00:00Z",
          "endTime": "2026-02-10T00:00:00Z",
          "otherLocations": {
            "zones/us-central1-b": {
              "status": "RECOMMENDED",
              "details": "Recommendation in this zone is possible."
            },
            "zones/us-central1-c": {
              "status": "NO_CAPACITY",
              "details": "Temporarily no free capacity in this zone in the
                          requested time window."
            },
            "zones/us-central1-f": {
              "status": "NOT_SUPPORTED",
              "details": "This machine family is not supported in this zone."
            }
          },
          "location": "zones/us-central1-a"
        }
      }
    }
  ]
}

יצירת בקשה למכונות וירטואליות עם GPU, למכונות וירטואליות מסוג H4D או למעבדי TPU

כשיוצרים בקשה למקום שמור לעתיד במצב יומן, צריך לציין את תקופת ההזמנה באופן הבא:

שעת התחלה: בהתאם למשאבים שרוצים לשריין, צריך לציין שעת התחלה שהיא לפחות אחד מהערכים הבאים מרגע יצירת הבקשה ושליחתה:
- למכונות וירטואליות עם GPU ו-H4D‏: 87 שעות (3 ימים ו-15 שעות)
- ל-TPU, ‏ 6 שעות
משך: אפשר לשריין משאבים למשך 24 שעות לפחות ו-90 ימים לכל היותר.

כדי ליצור בקשה באמצעות GPU קיים או מכונת H4D וירטואלית כהפניה, משתמשים בCloud de Confiance מסוף. אחרת, בוחרים באחת מהאפשרויות הבאות:

המסוף

פותחים את הדף Reservations במסוף Cloud de Confiance .

כניסה לדף Reservations
לוחצים על הכרטיסייה Future reservations.
לוחצים על ‎ Create future reservation‎. ייפתח הדף Create a future reservation והחלונית Hardware configuration תהיה מסומנת.
בקטע Configurations, מציינים את המאפיינים של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או TPU שרוצים לשריין. אפשר לעשות זאת באחת מהדרכים הבאות:
- כדי לציין מאפיינים של מכונת GPU וירטואלית, מכונת H4D וירטואלית או TPU באופן ישיר, מבצעים את השלבים הבאים:
  1. בוחרים באפשרות Specify machine type (ציון סוג המכונה).
  2. לוחצים על הכרטיסייה GPUs (מעבדי GPU), TPUs (מעבדי TPU) או Compute-optimized (אופטימיזציה לחישובים), ואז בוחרים סוג מכונה עם GPU נתמך, סוג מכונה H4D או גרסת TPU.
- כדי לציין מאפיינים של GPU או של מכונת H4D וירטואלית באמצעות מכונה וירטואלית קיימת כהפניה, בוחרים באפשרות Use existing VM ואז בוחרים את המכונה הווירטואלית.
בקטע חיפוש קיבולת, מבצעים את הפעולות הבאות:
1. ברשימות Region ו-Zone, בוחרים את האזור והתחום שבהם רוצים לשריין את המשאבים.
2. בשדה Total capacity needed (כשמשריינים מכונות וירטואליות עם GPU או H4D) או ברשימה Number of chips (כשמשריינים TPU), מציינים את מספר המכונות הווירטואליות עם GPU, המכונות הווירטואליות עם H4D או שבבי ה-TPU שרוצים לשריין. אפשר לציין את הערכים הבאים:
  - למכונות וירטואליות עם GPU, ערך בין 1 ל-80
  - למכונות וירטואליות מסוג H4D, ערך בין 1 לבין 256
  - בשבבי TPU, ערך של 1,‏ 4,‏ 8,‏ 16,‏ 32,‏ 64,‏ 128,‏ 256,‏ 512 או 1024
3. ברשימה שעת התחלה, בוחרים את שעת ההתחלה של הבקשה.
4. אופציונלי: ברשימה Choose your start date flexibility (בחירת גמישות תאריך ההתחלה), בוחרים את רמת הדיוק של תאריך ההתחלה.
5. בשדה Reservation duration, מציינים לכמה זמן רוצים לשריין את המשאבים.
6. לוחצים על חיפוש קיבולת. לאחר מכן, בטבלה Available capacity, בוחרים באחת מהאפשרויות הזמינות שמכילות את הסוג, המספר ותקופת השמירה של מכונות ה-GPU, מכונות ה-H4D או ה-TPU שרוצים לשריין.
לוחצים על הבא.
בקטע סוג השיתוף, בוחרים את הפרויקטים שרוצים לשתף איתם את הקיבולת שביקשתם:
- כדי להשתמש בקיבולת המוזמנת רק בפרויקט, בוחרים באפשרות Local (מקומית).
- כדי לשתף את הקיבולת המוזמנת עם פרויקטים אחרים, בוחרים באפשרות Shared (משותף), לוחצים על Add projects (הוספת פרויקטים) ופועלים לפי ההנחיות לבחירת הפרויקטים.
חשוב: אפשר לציין את סוג השיתוף ואת הפרויקטים המשותפים רק כשיוצרים בקשה. אי אפשר לשנות את ההגדרות האלה אחרי השליחה.
לוחצים על הבא.
נותנים לבקשה שם בשדה Future reservation name.
בשדה Reservation name, מזינים את השם של המקום השמור ש-Compute Engine יוצר באופן אוטומטי כדי להקצות את הקיבולת שביקשתם.
לוחצים על יצירה.

gcloud

כדי ליצור בקשה לשמירת מקום לעתיד במצב יומן ולשלוח אותה לבדיקה, משתמשים בפקודה gcloud compute future-reservations create. בהתאם למשאבים שרוצים לשריין, מוסיפים את הדגלים הבאים:

כדי להזמין מכונות וירטואליות עם GPU או H4D, צריך לכלול את הדגלים --total-count,‏ --machine-type ו---deployment-type=DENSE:

gcloud compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --total-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --deployment-type=DENSE \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

כדי לשריין TPU, צריך לכלול את הדגלים --chip-count ו---tpu-version:

gcloud compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

מחליפים את מה שכתוב בשדות הבאים:

‫FUTURE_RESERVATION_NAME: שם הבקשה.
‫NUMBER_OF_VMS: מספר מכונות ה-VM עם GPU או H4D שרוצים לשריין:
- במכונות וירטואליות עם GPU, הערך צריך להיות בין 1 ל-80.
- במכונות וירטואליות מסוג H4D, הערך צריך להיות בין 1 ל-256.
מציינים מספר של מכונות וירטואליות ששווה למספר המכונות הווירטואליות שאישרתם שזמינות או קטן ממנו.
‫MACHINE_TYPE: סוג ה-GPU או סוג המכונה H4D שרוצים לשריין.
‫NUMBER_OF_CHIPS: מספר שבבי ה-TPU שרוצים לשריין. מציינים ערך ששווה למספר הצ'יפים שאישרתם שזמינים או נמוך ממנו. הערך צריך להיות אחד מהערכים הבאים: 1,‏ 4,‏ 8,‏ 16,‏ 32,‏ 64,‏ 128,‏ 256,‏ 512 או 1024.
‫TPU_VERSION: גרסת ה-TPU להזמנה.
‫RESERVATION_NAME: השם של המקום השמור ש-Compute Engine יוצר באופן אוטומטי כדי להקצות את הקיבולת שביקשתם.
‫SHARE_TYPE: האם פרויקטים אחרים בארגון יכולים להשתמש בקיבולת השמורה. מציינים אחד מהערכים הבאים:
- כדי להשתמש בקיבולת רק בתוך הפרויקט: local
- כדי לשתף את הקיבולת עם פרויקטים אחרים: projects
אם מציינים את projects, צריך לכלול את הדגל --share-with עם רשימה מופרדת בפסיקים של מזהי פרויקטים – לדוגמה, project-1,project-2. אתם יכולים לציין עד 100 פרויקטים בארגון. אל תכללו ברשימה הזו את מזהה הפרויקט. כברירת מחדל, אפשר להשתמש בקיבולת השמורה.

חשוב: אפשר לציין את סוג השיתוף ואת הפרויקטים המשותפים רק כשיוצרים בקשה. אי אפשר לשנות את ההגדרות האלה אחרי השליחה.
‫START_TIME: שעת ההתחלה של הבקשה, שצריך לעצב כחותמת זמן RFC 3339.
‫END_TIME: שעת הסיום של תקופת ההזמנה, שצריך להזין בפורמט של חותמת זמן RFC 3339. אם רוצים לציין משך זמן בשניות לתקופת ההזמנה במקום שעת סיום, מחליפים את הדגל --end-time בדגל --duration.
‫ZONE: האזור שבו רוצים לשריין משאבים.

REST

כדי ליצור בקשה למקום שמור לעתיד במצב יומן ולשלוח אותה לבדיקה, שולחים בקשת POST אל ה-method‏ futureReservations.insert. בהתאם למשאבים שרוצים לשריין, כוללים את השדות הבאים בגוף הבקשה:

כדי להזמין מכונות וירטואליות עם GPU או H4D, צריך לכלול את השדות totalCount ו-machineType, וגם את השדה deploymentType שמוגדר ל-DENSE:

POST https://compute.s3nsapis.fr/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "deploymentType": "DENSE",
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "specificSkuProperties": {
    "totalCount": NUMBER_OF_VMS,
    "instanceProperties": {
      "machineType": "MACHINE_TYPE"
    }
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

כדי לשריין TPU, צריך לכלול את השדות acceleratorCount ו-vmFamily:

POST https://compute.s3nsapis.fr/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "aggregateReservation": {
    "reservedResources": [
      {
        "accelerator": {
          "acceleratorCount": NUMBER_OF_CHIPS
        }
      }
    ],
    "vmFamily": "TPU_VERSION"
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

מחליפים את מה שכתוב בשדות הבאים:

‫PROJECT_ID: מזהה הפרויקט שבו רוצים ליצור את הבקשה.
‫ZONE: האזור שבו רוצים לשריין משאבים.
‫FUTURE_RESERVATION_NAME: שם הבקשה.
‫RESERVATION_NAME: השם של המקום השמור ש-Compute Engine יוצר באופן אוטומטי כדי להקצות את הקיבולת שביקשתם.
‫SHARE_TYPE: האם פרויקטים אחרים בארגון יכולים להשתמש בקיבולת השמורה. מציינים אחד מהערכים הבאים:
- כדי להשתמש בקיבולת רק בתוך הפרויקט: LOCAL
- כדי לשתף את הקיבולת עם פרויקטים אחרים: SPECIFIC_PROJECTS
אם מציינים את הערך SPECIFIC_PROJECTS, צריך לכלול בשדה shareSettings את השדה projectMap כדי לציין את הפרויקטים שאיתם רוצים לשתף את הקיבולת. אתם יכולים לציין עד 100 פרויקטים בארגון. לא מציינים את מזהה הפרויקט. כברירת מחדל, אתם יכולים להשתמש בקיבולת השמורה.

חשוב: אפשר לציין את סוג השיתוף ואת הפרויקטים המשותפים רק כשיוצרים בקשה. אי אפשר לשנות את ההגדרות האלה אחרי השליחה.

לדוגמה, כדי לשתף את הקיבולת המבוקשת עם שני פרויקטים אחרים, צריך לכלול את הפרטים הבאים:
```
"shareSettings": {
  "shareType": "SPECIFIC_PROJECTS",
  "projectMap": {
    "CONSUMER_PROJECT_ID_1": {
      "projectId": "CONSUMER_PROJECT_ID_1"
    },
    "CONSUMER_PROJECT_ID_2": {
      "projectId": "CONSUMER_PROJECT_ID_2"
    }
  }
}
```
מחליפים את CONSUMER_PROJECT_ID_1 ואת CONSUMER_PROJECT_ID_2 במזהים של שני פרויקטים שרוצים לאפשר להם להשתמש בקיבולת המבוקשת.
‫NUMBER_OF_VMS: מספר מכונות ה-VM עם GPU או H4D שרוצים לשריין:
- במכונות וירטואליות עם GPU, הערך צריך להיות בין 1 ל-80.
- במכונות וירטואליות מסוג H4D, הערך צריך להיות בין 1 ל-256.
מציינים מספר של מכונות וירטואליות ששווה למספר המכונות הווירטואליות שאישרתם שזמינות או קטן ממנו.
‫MACHINE_TYPE: סוג ה-GPU או סוג המכונה H4D שרוצים לשריין.
‫NUMBER_OF_CHIPS: מספר שבבי ה-TPU שרוצים לשריין. מציינים ערך ששווה למספר הצ'יפים שאישרתם שהם זמינים או נמוך ממנו. הערך צריך להיות אחד מהערכים הבאים: 1,‏ 4,‏ 8,‏ 16,‏ 32,‏ 64,‏ 128,‏ 256,‏ 512 או 1024.
‫TPU_VERSION: גרסת ה-TPU להזמנה.
‫START_TIME: שעת ההתחלה של הבקשה, שצריך לעצב כחותמת זמן RFC 3339.
‫END_TIME: שעת הסיום של תקופת ההזמנה, שצריך להזין בפורמט של חותמת זמן RFC 3339. אם רוצים לציין את משך הזמן של תקופת ההזמנה בשניות במקום שעת סיום, מחליפים את השדה endTime בשדה duration.

המאמרים הבאים

איך צופים בהזמנות או בבקשות למקומות שמורים לעתיד
כדי להשתמש בשמירת מקום שנוצרה אוטומטית למכונות וירטואליות עם GPU, למכונות וירטואליות מסוג H4D או ל-TPU ב-Compute Engine, אפשר להשתמש באחת מהשיטות הבאות:
כדי להשתמש בהזמנה שנוצרה אוטומטית למכונות וירטואליות עם GPU או ל-TPU ב-Vertex AI, אפשר להשתמש באחת מהשיטות הבאות:
- איך שומרים מקום בעזרת משימות הסקה אונליין
- איך שומרים מקום בעזרת משימות אימון
איך מוחקים בקשה למקום שמור לעתיד במצב יומן