במאמרי עזרה הזה מוסבר איך ליצור מקום שמור לעתיד במצב יומן כדי לשריין משאבי GPU, H4D או TPU למכונות וירטואליות (VM). אפשר להשתמש בבקשות האלה כדי לקבל משאבים מבוקשים ליצירת מכונות וירטואליות שאתם מתכננים להפעיל למשך עד 90 ימים.
אתם יכולים להשתמש בבקשות למקום שמור לעתיד במצב יומן כדי לשריין משאבים להריץ את עומסי העבודה הבאים:
משימות אימון מראש של מודלים
משימות של כוונון עדין של מודלים
עומסי עבודה (workloads) של סימולציות מחשוב עתיר ביצועים (HPC)
עלייה לטווח קצר בעומסי עבודה של הסקת מסקנות
אחרי שצוות Cloud de Confiance by S3NS מאשר את הבקשה, המשאבים השמורים הופכים לזמינים ליצירת מכונות וירטואליות עם GPU, H4D או TPU בתאריך ובשעה שצוינו למסירה. במהלך תקופת ההזמנה, רק הפרויקט שלכם וכל פרויקט שציינתם כששלחתם את הבקשה יוכלו לגשת למשאבים השמורים. אתם יכולים לשתף את המשאבים שהוזמנו עם עד 100 פרויקטים שנמצאים באותו ארגון שבו נמצא הפרויקט שלכם. מידע נוסף על הדרישות וההגבלות שחלות כשיוצרים בקשה במצב יומן זמין במאמר סקירה כללית של בקשות למקום שמור לעתיד במצב יומן.
לפני שמתחילים
- אם אתם לא יכולים להשתמש בבקשות לשמירת מקום לעתיד במצב יומן, יכול להיות שאתם לא עומדים בדרישות לגישה לתכונה הזו ולשימוש בה. במקרה כזה, צריך לפנות לצוות ניהול החשבון או לצוות המכירות.
- כדי לשריין מכונות וירטואליות מסוג H4D, צריך מכסת CPU מספקת. אחרת, שרייון המשאבים ייכשל. לא נדרשת מכסה כדי לשריין מכונות וירטואליות מסוג GPU או TPU.
- כדי לשתף את הקיבולת השמורה עם פרויקטים אחרים בארגון, צריך לוודא שלפרויקט שבו רוצים ליצור בקשות למקומות שמורים לעתיד במצב יומן יש הרשאה ליצור הזמנות משותפות. אחרת, תקבלו שגיאות.
-
אם עדיין לא עשיתם את זה, תצטרכו להגדיר אימות.
אימות הוא תהליך שבו מאמתים את הזהות שלכם כדי לקבל גישה לממשקי API ולשירותים של Cloud de Confiance by S3NS . כדי להריץ קוד או דוגמאות מסביבת פיתוח מקומית, אפשר לבצע אימות ל-Compute Engine באחת מהדרכים הבאות:
צריך לבחור את הכרטיסייה הרלוונטית לאופן שבו תכננתם להשתמש בדוגמאות בדף הזה:
המסוף
כשמשתמשים במסוף Cloud de Confiance כדי לגשת לשירותים ולממשקי ה-API, לא צריך להגדיר אימות. Cloud de Confiance by S3NS
gcloud
-
התקינו את ה-CLI של Google Cloud ואז היכנסו ל-CLI של gcloud באמצעות הזהות המאוחדת שלכם. אחרי שנכנסתם לחשבון, אתחלו את ה-CLI של Google Cloud באמצעות הפקודה הבאה:
gcloud init
-
- הגדרת אזור ותחום כברירת מחדל
REST
כדי להשתמש בסביבת פיתוח מקומית בדוגמאות של API בארכיטקטורת REST שבדף הזה, צריך להשתמש בפרטי הכניסה שאתם נותנים ל-CLI של gcloud.
התקינו את ה-CLI של Google Cloud ואז היכנסו ל-CLI של gcloud באמצעות הזהות המאוחדת שלכם.
מידע נוסף מופיע במאמר אימות לשימוש ב-REST במסמכי האימות של Cloud de Confiance .
התפקידים הנדרשים
כדי לקבל את ההרשאות שנדרשות ליצירת בקשה למקום שמור לעתיד במצב יומן, צריך לבקש מהאדמין להקצות לכם ב-IAM את התפקיד משתמש בהזמנה עתידית של Compute (roles/compute.futureReservationUser) בפרויקט.
כדי לקרוא הסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
זהו תפקיד שמוגדר מראש וכולל את ההרשאות שנדרשות ליצירת בקשה למקום שמור לעתיד במצב תצוגת לוח שנה. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:
ההרשאות הנדרשות
כדי ליצור בקשה למקום שמור לעתיד במצב יומן, צריך את ההרשאות הבאות:
-
כדי ליצור בקשה למקום שמור לעתיד:
compute.futureReservations.createבפרויקט -
כדי לאפשר ל-Compute Engine ליצור אוטומטית בקשות לשמירת מקום:
compute.reservations.create -
כדי לראות את הזמינות של משאבים בתאריך עתידי:
compute.advice.calendarModeבפרויקט
יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.
יצירת בקשה לשריון מקום שמור לעתיד במצב יומן
כדי ליצור מקום שמור לעתיד במצב יומן:
בודקים את הזמינות העתידית של המשאבים. בודקים את הזמינות העתידית של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או TPU שרוצים לשריין. לאחר מכן, כשיוצרים בקשה, מציינים את המספר, הסוג ומשך השריון של המשאבים שאושרו כזמינים. Cloud de Confiance by S3NS יותר סביר שתאשר את הבקשה אם תספקו את המידע הזה.
ההוראות מפורטות במאמר בנושא צפייה בזמינות עתידית של משאבים.
יצירת בקשה לשמירת מקום ליצור ולשלוח בקשה לשריון מקום שמור לעתיד במצב יומן למכונות וירטואליות עם GPU, למכונות וירטואליות מסוג H4D או ליחידות TPU. אם הצלחתם ליצור בקשה, המערכת של Cloud de Confiance תאשר אותה תוך דקה.
הוראות מפורטות זמינות במאמר בנושא יצירת בקשה למכונות וירטואליות עם GPU, למכונות וירטואליות מסוג H4D או ל-TPU.
הצגת הזמינות העתידית של משאבים
כדי לראות את הזמינות העתידית של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או יחידות TPU באזור מסוים:
למכונות וירטואליות של GPU או H4D, עד 60 ימים מראש
ל-TPU, עד 120 ימים מראש
כדי לראות את הזמינות העתידית של מכונת GPU וירטואלית, מכונת H4D וירטואלית או TPU באזור מסוים, בוחרים באחת מהאפשרויות הבאות:
המסוף
כשיוצרים בקשה למקום שמור לעתיד במצב לוח שנה, אפשר לראות את הזמינות העתידית של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או TPU באזור מסוים. מידע נוסף זמין במאמר יצירת בקשה למכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או TPU במסמך הזה.
gcloud
כדי לראות את הזמינות העתידית של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או TPU באזור מסוים, משתמשים בפקודה gcloud compute advice calendar-mode. כדי לראות את המשאבים שרוצים, כוללים את הדגלים הבאים:
כדי לראות את הזמינות של מכונות וירטואליות עם GPU או מכונות וירטואליות מסוג H4D, כוללים את הדגלים
--vm-countו---machine-type:gcloud compute advice calendar-mode \ --vm-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --duration-range=min=MIN_DURATION,max=MAX_DURATIONכדי לראות את הזמינות של TPU, כוללים את הדגלים
--chip-countו---tpu-version:gcloud compute advice calendar-mode \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --duration-range=min=MIN_DURATION,max=MAX_DURATION
מחליפים את מה שכתוב בשדות הבאים:
NUMBER_OF_VMS: מספר המכונות הווירטואליות שרוצים לשריין. הערך חייב להיות לפחות1ולא יותר מ-80למכונות וירטואליות עם GPU או256למכונות וירטואליות מסוג H4D.
MACHINE_TYPE: סוג ה-GPU או סוג המכונה H4D שרוצים לשריין. מציינים אחד מהערכים הבאים:לסוגי מכונות A4, מציינים
a4-highgpu-8g.לסוגי מכונות A3 Ultra, מציינים
a3-ultragpu-8g.לסוגי מכונות A3 Mega, מציינים
a3-megagpu-8g.עבור סוגי מכונות A3 High עם 8 מעבדי GPU, מציינים
a3-highgpu-8g.למידע על סוגי מכונות H4D ל-HPC, אפשר לעיין במאמר סוגי מכונות H4D.
NUMBER_OF_CHIPS: מספר שבבי ה-TPU שרוצים לשריין. הערך חייב להיות1,4,8,16,32,64,128,256,512או1024.
TPU_VERSION: גרסת ה-TPU להזמנה. מציינים אחד מהערכים הבאים:TPU7x:
TPU7XTPU v6e:
V6ETPU v5p:
V5PTPU v5e:
V5E
אם מציינים TPU v5e, צריך לכלול את הדגל
--workload-type. מגדירים את הדגל הזה לסוג עומסי העבודה שרוצים להריץ ב-TPU:עבור עומסי עבודה שמטפלים בכמויות גדולות של נתונים בפעולה אחת או בכמה פעולות, כמו עומסי עבודה של אימון למידת מכונה (ML), מציינים
BATCH.עבור עומסי עבודה שמטפלים בבקשות בו-זמניות ודורשים השהיה מינימלית ברשת, כמו עומסי עבודה של הסקת מסקנות של ML, מציינים
SERVING.
REGION: האזור שבו רוצים להזמין מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או יחידות TPU. כדי לבדוק באילו אזורים ואזורי זמינות יש תמיכה, אפשר לעיין במגבלות.
FROM_START_TIMEו-TO_START_TIME: התאריכים המוקדמים והמאוחרים ביותר שבהם רוצים לשריין קיבולת. התאריכים האלה צריכים להיות בפורמט חותמת זמן RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSETמחליפים את מה שכתוב בשדות הבאים:
YYYY-MM-DD: תאריך בפורמט של שנה בת 4 ספרות, חודש בן 2 ספרות ויום בן 2 ספרות, מופרדים במקפים (-).
HH:MM:SS: שעה בפורמט של שתי ספרות לשעה (בפורמט 24 שעות), שתי ספרות לדקות ושתי ספרות לשניות, מופרדות בנקודתיים (:).
OFFSET: אזור הזמן בפורמט של היסט מזמן אוניברסלי מתואם (UTC). לדוגמה, כדי להשתמש בשעון החוף המערבי (PST), מציינים-08:00. כדי לא להשתמש בהזחה, מציינים את הערךZ.
MIN_DURATIONו-MAX_DURATION: משך הזמן המינימלי והמקסימלי שבו רוצים לשריין משאבים. צריך להזין את הערכים האלה בפורמט של מספר הימים, השעות, הדקות או השניות, ואחריו הערכיםd,h,mו-sבהתאמה. לדוגמה, מציינים24hל-24 שעות או1d2h3m4sליום אחד, שעתיים, שלוש דקות וארבע שניות.
הפלט אמור להיראות כך:
- recommendationsPerSpec:
spec:
endTime: '2026-02-10T00:00:00Z'
location: zones/us-central1-a
otherLocations:
zones/us-central1-b:
details: Recommendation in this zone is possible.
status: RECOMMENDED
zones/us-central1-c:
details: Temporarily no free capacity in this zone in the
requested time window.
status: NO_CAPACITY
zones/us-central1-f:
details: This machine family is not supported in this zone.
status: NOT_SUPPORTED
recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
recommendationType: FUTURE_RESERVATION
startTime: '2026-02-07T00:00:00Z'
אם המשאבים שביקשתם זמינים, הפלט יכיל את השדות startTime, endTime ו-location. בשדות האלה מצוינים שעת ההתחלה המוקדמת ביותר, שעת הסיום המאוחרת ביותר והאזורים שבהם המשאבים זמינים.
REST
כדי לראות את הזמינות העתידית של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או TPU באזור מסוים, שולחים בקשה לשיטה advice.calendarMode.GET
בהתאם למשאבים שרוצים לראות, כוללים את השדות הבאים בגוף הבקשה:
כדי לראות את הזמינות של מכונות וירטואליות עם GPU או מכונות וירטואליות מסוג H4D, צריך לכלול את השדות
instanceCountו-machineType:POST https://compute.s3nsapis.fr/compute/v1/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "specificSkuResources": { "instanceCount": "NUMBER_OF_VMS", "machineType": "MACHINE_TYPE" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "minDuration": "MIN_DURATION", "maxDuration": "MAX_DURATION" } } } }כדי לראות את הזמינות של TPU, צריך לכלול את השדות
acceleratorCountו-vmFamily:POST https://compute.s3nsapis.fr/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "aggregateResources": { "acceleratorCount": "NUMBER_OF_CHIPS", "vmFamily": "TPU_VERSION" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "minDuration": "MIN_DURATION", "maxDuration": "MAX_DURATION" } } } }
מחליפים את מה שכתוב בשדות הבאים:
PROJECT_ID: מזהה הפרויקט שבו רוצים לשריין משאבים.
REGION: האזור שבו רוצים להזמין מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או יחידות TPU. כדי לבדוק אילו אזורים ותחומים נתמכים, אפשר לעיין בהגבלות.
NUMBER_OF_VMS: מספר מכונות ה-GPU או מכונות H4D שרוצים לשריין. במכונות GPU, הערך צריך להיות בין1ל-80. במכונות H4D, הערך צריך להיות בין1ל-256.
MACHINE_TYPE: סוג ה-GPU או סוג המכונה H4D שרוצים לשריין. מציינים אחד מהערכים הבאים:לסוגי מכונות A4, מציינים
a4-highgpu-8g.לסוגי מכונות A3 Ultra, מציינים
a3-ultragpu-8g.לסוגי מכונות A3 Mega, מציינים
a3-megagpu-8g.עבור סוגי מכונות A3 High עם 8 מעבדי GPU, מציינים
a3-highgpu-8g.למידע על סוגי מכונות H4D ל-HPC, אפשר לעיין במאמר סוגי מכונות H4D.
NUMBER_OF_CHIPS: מספר שבבי ה-TPU שרוצים לשריין. הערך חייב להיות1,4,8,16,32,64,128,256,512או1024.
TPU_VERSION: גרסת ה-TPU להזמנה. מציינים אחד מהערכים הבאים:TPU7x:
VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7XTPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6ETPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5PTPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
אם מציינים TPU v5e, צריך לכלול את השדה
workloadTypeבשדהaggregateResources. בשדה הזה צריך להגדיר את סוגי עומסי העבודה שרוצים להריץ ב-TPU:עבור עומסי עבודה שמטפלים בכמויות גדולות של נתונים בפעולה אחת או בכמה פעולות, כמו עומסי עבודה של אימון למידת מכונה (ML), מציינים
BATCH.עבור עומסי עבודה שמטפלים בבקשות בו-זמניות ודורשים השהיה מינימלית ברשת, כמו עומסי עבודה של הסקת מסקנות של ML, מציינים
SERVING.
FROM_START_TIMEו-TO_START_TIME: התאריכים המוקדמים והמאוחרים ביותר שבהם רוצים לשריין קיבולת. התאריכים האלה צריכים להיות בפורמט חותמת זמן RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSETמחליפים את מה שכתוב בשדות הבאים:
YYYY-MM-DD: תאריך בפורמט של שנה בת 4 ספרות, חודש בן 2 ספרות ויום בן 2 ספרות, עם מקפים ביניהם (-).
HH:MM:SS: שעה בפורמט של שעה בת 2 ספרות בפורמט של 24 שעות, דקות בנות 2 ספרות ושניות בנות 2 ספרות, מופרדות באמצעות נקודתיים (:).
OFFSET: אזור הזמן בפורמט של היסט מזמן אוניברסלי מתואם (UTC). לדוגמה, כדי להשתמש בשעון החוף המערבי (PST), מציינים-08:00. כדי לא להשתמש בהזחה, מציינים את הערךZ.
MIN_DURATIONו-MAX_DURATION: משך הזמן המינימלי והמקסימלי, בשניות, שבו רוצים לשריין משאבים. הערכים האלה צריכים להיות בפורמט של מספר השניות, ואחריוs. לדוגמה, מציינים86400sל-86,400 שניות (24 שעות).
הפלט אמור להיראות כך:
{
"recommendations": [
{
"recommendationsPerSpec": {
"spec": {
"recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
"recommendationType": "FUTURE_RESERVATION",
"startTime": "2026-02-07T00:00:00Z",
"endTime": "2026-02-10T00:00:00Z",
"otherLocations": {
"zones/us-central1-b": {
"status": "RECOMMENDED",
"details": "Recommendation in this zone is possible."
},
"zones/us-central1-c": {
"status": "NO_CAPACITY",
"details": "Temporarily no free capacity in this zone in the
requested time window."
},
"zones/us-central1-f": {
"status": "NOT_SUPPORTED",
"details": "This machine family is not supported in this zone."
}
},
"location": "zones/us-central1-a"
}
}
}
]
}
אם המשאבים שביקשתם זמינים, הפלט יכיל את השדות startTime, endTime ו-location. בשדות האלה מצוינים זמן ההתחלה המוקדם ביותר, זמן הסיום המאוחר ביותר והאזורים שבהם המשאבים זמינים.
יצירת בקשה למכונות וירטואליות עם GPU, למכונות וירטואליות מסוג H4D או למעבדי TPU
כשיוצרים בקשה למקום שמור לעתיד במצב יומן, אפשר לציין את תקופת ההזמנה רק באופן הבא:
שעת התחלה: בהתאם למשאבים שרוצים לשריין, צריך לציין שעת התחלה שהיא לפחות אחד מהערכים הבאים מרגע יצירת הבקשה ושליחתה:
למכונות וירטואליות עם GPU ו-H4D: 87 שעות (3 ימים ו-15 שעות)
ל-TPU, 6 שעות
משך: אפשר לשריין משאבים למשך 24 שעות לפחות ו-90 ימים לכל היותר.
כדי ליצור בקשה באמצעות מכונת וירטואלית קיימת עם GPU או H4D כהפניה, משתמשים בCloud de Confiance מסוף. אחרת, בוחרים באחת מהאפשרויות הבאות:
המסוף
פותחים את הדף Reservations במסוף Cloud de Confiance .
לוחצים על הכרטיסייה Future reservations.
לוחצים על Create future reservation. ייפתח הדף Create a future reservation והחלונית Hardware configuration תהיה מסומנת.
בקטע Configurations, מציינים את המאפיינים של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או TPU שרוצים לשריין. אפשר לעשות זאת באחת מהדרכים הבאות:
כדי לציין מאפיינים של מכונת GPU וירטואלית, מכונת H4D וירטואלית או TPU ישירות, מבצעים את השלבים הבאים:
בוחרים באפשרות Specify machine type (ציון סוג המכונה).
לוחצים על הכרטיסייה GPUs (מעבדי GPU), TPUs (מעבדי TPU) או Compute-optimized (אופטימיזציה לחישובים), ואז בוחרים סוג מכונה עם GPU נתמך, סוג מכונה H4D או גרסת TPU.
כדי לציין מאפיינים של GPU או של מכונת H4D וירטואלית באמצעות מכונה וירטואלית קיימת כהפניה, בוחרים באפשרות Use existing VM ואז בוחרים את המכונה הווירטואלית.
אם ציינתם TPU v5e (CT5LP) בשלב הקודם, ברשימה TPU v5 workload type בוחרים באחת מהאפשרויות הבאות:
כדי להריץ עומסי עבודה ב-TPU שמטפלים בכמויות גדולות של נתונים בפעולה אחת או בכמה פעולות, כמו עומסי עבודה של אימון ML, בוחרים באפשרות Batch.
כדי להריץ עומסי עבודה ב-TPU שמטפלים בבקשות בו-זמניות ודורשים זמן אחזור מינימלי ברשת, כמו עומסי עבודה של הסקת למידת מכונה, בוחרים באפשרות Serving.
בקטע חיפוש קיבולת, מבצעים את הפעולות הבאות:
ברשימות Region ו-Zone, בוחרים את האזור והתחום שבהם רוצים לשריין את המשאבים.
בשדה Total capacity needed (כשמשריינים מכונות וירטואליות עם GPU או H4D) או ברשימה Number of chips (כשמשריינים TPU), מציינים את מספר המכונות הווירטואליות עם GPU, המכונות הווירטואליות עם H4D או שבבי ה-TPU שרוצים לשריין. אפשר לציין את הערכים הבאים:
למכונות וירטואליות עם GPU, ערך בין
1ל-80למכונות וירטואליות מסוג H4D, ערך בין
1לבין256בשבבי TPU, ערך של
1,4,8,16,32,64,128,256,512או1024
ברשימה שעת התחלה, בוחרים את שעת ההתחלה של הבקשה.
אופציונלי: ברשימה בחר את מידת הגמישות של תאריך ההתחלה, בוחרים את מידת הדיוק של תאריך ההתחלה.
בשדה Reservation duration, מציינים את משך הזמן שבו רוצים לשמור מקום למשאבים.
לוחצים על חיפוש קיבולת. לאחר מכן, בטבלה Available capacity, בוחרים באחת מהאפשרויות הזמינות שמכילות את הסוג, המספר ותקופת השמירה של מכונות ה-GPU, מכונות ה-H4D או ה-TPU שרוצים לשריין.
לוחצים על הבא.
בקטע סוג השיתוף, בוחרים את הפרויקטים שרוצים לשתף איתם את הקיבולת שביקשתם:
כדי להשתמש בקיבולת המוזמנת רק בפרויקט, בוחרים באפשרות Local (מקומית).
כדי לשתף את הקיבולת המוזמנת עם פרויקטים אחרים, בוחרים באפשרות Shared (משותף), לוחצים על Add projects (הוספת פרויקטים) ופועלים לפי ההנחיות לבחירת הפרויקטים.
לוחצים על הבא.
נותנים לבקשה שם בשדה Future reservation name.
בשדה Reservation name, מזינים את השם של המקום השמור ש-Compute Engine יוצר באופן אוטומטי כדי להקצות את הקיבולת שביקשתם.
לוחצים על יצירה.
gcloud
כדי ליצור בקשה לשמירת מקום לעתיד במצב יומן ולשלוח אותה לבדיקה, משתמשים בפקודה gcloud compute future-reservations create.
בהתאם למשאבים שרוצים לשריין, מוסיפים את הדגלים הבאים:
כדי להזמין מכונות וירטואליות עם GPU או H4D, צריך לכלול את הדגלים
--total-count,--machine-typeו---deployment-type=DENSE:gcloud compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --total-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONEכדי לשריין TPU, צריך לכלול את הדגלים
--chip-countו---tpu-version:gcloud compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
מחליפים את מה שכתוב בשדות הבאים:
FUTURE_RESERVATION_NAME: שם הבקשה.
NUMBER_OF_VMS: מספר מכונות ה-VM עם GPU או H4D שרוצים לשריין:במכונות וירטואליות עם GPU, הערך צריך להיות בין
1ל-80.במכונות וירטואליות מסוג H4D, הערך צריך להיות בין
1ל-256.
מציינים מספר של מכונות וירטואליות ששווה למספר המכונות הווירטואליות שאישרתם שזמינות או קטן ממנו.
MACHINE_TYPE: סוג ה-GPU או סוג המכונה H4D שרוצים לשריין.
NUMBER_OF_CHIPS: מספר שבבי ה-TPU שרוצים לשריין. מציינים ערך ששווה למספר הצ'יפים שאישרתם שהם זמינים או נמוך ממנו. הערך צריך להיות אחד מהערכים הבאים:1,4,8,16,32,64,128,256,512או1024.
TPU_VERSION: גרסת ה-TPU להזמנה. אם מציינים TPU v5e (V5E), צריך לכלול את הדגל--workload-typeכדי לציין את סוגי עומסי העבודה שיופעלו ב-TPU.
RESERVATION_NAME: השם של המקום השמור ש-Compute Engine יוצר באופן אוטומטי כדי להקצות את הקיבולת שביקשתם.
SHARE_TYPE: האם פרויקטים אחרים בארגון יכולים לצרוך את הקיבולת שהוזמנה. מציינים אחד מהערכים הבאים:כדי להשתמש בקיבולת רק בתוך הפרויקט:
localכדי לשתף את הקיבולת עם פרויקטים אחרים:
projects
אם מציינים את
projects, צריך לכלול את הדגל--share-withשמוגדר לרשימה של מזהי פרויקטים שמופרדים באמצעות פסיקים – לדוגמה,project-1,project-2. אפשר לציין עד 100 פרויקטים בארגון. אל תכללו את מזהה הפרויקט ברשימה הזו. אפשר להשתמש בקיבולת השמורה כברירת מחדל.
START_TIME: שעת ההתחלה של הבקשה, שצריך לעצב כחותמת זמן RFC 3339.
END_TIME: שעת הסיום של תקופת ההזמנה, שצריך להזין בפורמט של חותמת זמן RFC 3339. אם רוצים לציין משך זמן בשניות לתקופת השמירה במקום שעת סיום, מחליפים את הדגל--end-timeבדגל--duration.
ZONE: האזור שבו רוצים לשריין משאבים.
REST
כדי ליצור בקשה למקום שמור לעתיד במצב יומן ולשלוח אותה לבדיקה, שולחים בקשת POST אל ה-method futureReservations.insert.
בהתאם למשאבים שרוצים לשריין, כוללים את השדות הבאים בגוף הבקשה:
כדי להזמין מכונות וירטואליות עם GPU או H4D, צריך לכלול את השדות
totalCountו-machineType, וגם את השדהdeploymentTypeשמוגדר ל-DENSE:POST https://compute.s3nsapis.fr/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "specificSkuProperties": { "totalCount": NUMBER_OF_VMS, "instanceProperties": { "machineType": "MACHINE_TYPE" } }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }כדי לשריין TPU, צריך לכלול את השדות
acceleratorCountו-vmFamily:POST https://compute.s3nsapis.fr/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "aggregateReservation": { "reservedResources": [ { "accelerator": { "acceleratorCount": NUMBER_OF_CHIPS } } ], "vmFamily": "TPU_VERSION" }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
מחליפים את מה שכתוב בשדות הבאים:
PROJECT_ID: מזהה הפרויקט שבו רוצים ליצור את הבקשה.
ZONE: האזור שבו רוצים לשריין משאבים.
FUTURE_RESERVATION_NAME: שם הבקשה.
RESERVATION_NAME: השם של המקום השמור ש-Compute Engine יוצר באופן אוטומטי כדי להקצות את הקיבולת שביקשתם.
SHARE_TYPE: האם פרויקטים אחרים בארגון יכולים לצרוך את הקיבולת השמורה. מציינים אחד מהערכים הבאים:כדי להשתמש בקיבולת רק בתוך הפרויקט:
LOCALכדי לשתף את הקיבולת עם פרויקטים אחרים:
SPECIFIC_PROJECTS
אם מציינים את הערך
SPECIFIC_PROJECTS, צריך לכלול בשדהshareSettingsאת השדהprojectMapכדי לציין את הפרויקטים שאיתם רוצים לשתף את הקיבולת. אתם יכולים לציין עד 100 פרויקטים בארגון. לא מציינים את מזהה הפרויקט. כברירת מחדל, אתם יכולים להשתמש בקיבולת השמורה.לדוגמה, כדי לשתף את הקיבולת המבוקשת עם שני פרויקטים אחרים, צריך לכלול את הפרטים הבאים:
"shareSettings": { "shareType": "SPECIFIC_PROJECTS", "projectMap": { "CONSUMER_PROJECT_ID_1": { "projectId": "CONSUMER_PROJECT_ID_1" }, "CONSUMER_PROJECT_ID_2": { "projectId": "CONSUMER_PROJECT_ID_2" } } }מחליפים את
CONSUMER_PROJECT_ID_1ואתCONSUMER_PROJECT_ID_2במזהים של שני פרויקטים שרוצים לאפשר להם להשתמש בקיבולת המבוקשת.
NUMBER_OF_VMS: מספר מכונות ה-VM עם GPU או H4D שרוצים לשריין:במכונות וירטואליות עם GPU, הערך צריך להיות בין
1ל-80.במכונות וירטואליות מסוג H4D, הערך צריך להיות בין
1ל-256.
מציינים מספר של מכונות וירטואליות ששווה למספר המכונות הווירטואליות שאישרתם שזמינות או קטן ממנו.
MACHINE_TYPE: סוג ה-GPU או סוג המכונה H4D שרוצים לשריין.
NUMBER_OF_CHIPS: מספר שבבי ה-TPU שרוצים לשריין. מציינים ערך ששווה למספר הצ'יפים שאישרתם שהם זמינים או נמוך ממנו. הערך צריך להיות אחד מהערכים הבאים:1,4,8,16,32,64,128,256,512או1024.
TPU_VERSION: גרסת ה-TPU להזמנה. אם מציינים TPU v5e (VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP), צריך לכלול בשדהaggregateResourcesאת השדהworkloadTypeכדי לציין את סוגי עומסי העבודה שיופעלו ב-TPU.
START_TIME: שעת ההתחלה של הבקשה, שצריך לעצב כחותמת זמן RFC 3339.
END_TIME: שעת הסיום של תקופת ההזמנה, שצריך להזין בפורמט של חותמת זמן RFC 3339. אם רוצים לציין את משך הזמן של תקופת ההזמנה בשניות במקום שעת סיום, מחליפים את השדהendTimeבשדהduration.
המאמרים הבאים
כדי להשתמש במכונות וירטואליות עם GPU או H4D, צריך להשתמש בשמירת מקום שנוצרה אוטומטית ב-Compute Engine:
שימוש בהזמנה שנוצרה אוטומטית למכונות וירטואליות עם GPU או ל-TPU ב-Vertex AI: