יצירת מופע TPU
במסמך הזה מוסבר איך ליצור מכונה וירטואלית (VM) של TPU v6e (Trillium), להתחבר אליה ולהריץ בה חישוב. במהלך ההתחלה המהירה הזו, תיצרו מופע TPU שמשתמש באפשרות הצריכה שמוגדרת כברירת מחדל – על פי דרישה.
לפני שמתחילים
-
התקינו את ה-CLI של Google Cloud.
-
הגדירו שה-CLI של gcloud ישתמש בזהות המאוחדת שלכם.
-
כדי לאתחל את ה-CLI של gcloud, הריצו את הפקודה הבאה:
gcloud init -
יוצרים או בוחרים Cloud de Confiance פרויקט.
תפקידים שנדרשים כדי לבחור או ליצור פרויקט
- Select a project: כדי לבחור פרויקט לא צריך תפקיד IAM ספציפי – אפשר לבחור כל פרויקט שקיבלתם בו תפקיד.
-
יצירת פרויקט: כדי ליצור פרויקט, צריך את התפקיד Project Creator (יצירת פרויקטים) (
roles/resourcemanager.projectCreator), שכולל את ההרשאהresourcemanager.projects.create. איך מקצים תפקידים
-
יוצרים Cloud de Confiance פרויקט:
gcloud projects create PROJECT_ID
מחליפים את
PROJECT_IDבשם של פרויקט Cloud de Confiance שיוצרים. -
בוחרים את הפרויקט שיצרתם: Cloud de Confiance
gcloud config set project PROJECT_ID
מחליפים את
PROJECT_IDבשם הפרויקט ב- Cloud de Confiance .
-
אם משתמשים בפרויקט קיים, מוודאים שיש את ההרשאות הנדרשות כדי להשלים את ההדרכה. אם משתמשים בפרויקט חדש, לא צריך לוודא כי כבר יש את ההרשאות הנדרשות.
מפעילים את Compute Engine API:
תפקידים שנדרשים להפעלת ממשקי API
כדי להפעיל ממשקי API, צריך את תפקיד ה-IAM 'אדמין של Service Usage' (
roles/serviceusage.serviceUsageAdmin), שכולל את ההרשאהserviceusage.services.enable. איך מקצים תפקידיםgcloud services enable compute.googleapis.com
התפקידים הנדרשים
כדי לקבל את ההרשאות שדרושות ליצירת מכונת TPU, להתחבר אליה באמצעות SSH ולהריץ פקודות, צריך לבקש מהאדמין להקצות לכם בפרויקט את תפקידי ה-IAM הבאים:
- Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1) - משתמש בחשבון שירות (
roles/iam.serviceAccountUser) - אדמין Service Usage (
roles/serviceusage.serviceUsageAdmin)
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
יכול להיות שאפשר לקבל את ההרשאות הנדרשות גם באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש.
יצירת מופע TPU v6e (Trillium)
מריצים את הפקודות הבאות בטרמינל המקומי או באמצעות Cloud Shell.
כדי ליצור מופע TPU v6e, מריצים את הפקודה
gcloud compute instances createהבאה:gcloud compute instances create quickstart-tpu \ --machine-type=ct6e-standard-4t \ --zone=europe-west4-a \ --image-project=ubuntu-os-accelerator-images \ --image-family=ubuntu-accel-2204-amd64-tpu-v5e-v5p-v6e \ --maintenance-policy=TERMINATEאפשר גם לוודא שהמכונה פועלת באמצעות הפקודה
gcloud compute instances describe:gcloud compute instances describe quickstart-tpu --zone=europe-west4-aבפלט, בודקים את השדה
statusכדי לוודא שהמופע פועל או שהוא עדיין בהמתנה.
התחברות למכונת TPU
אפשר להתחבר למכונת TPU באמצעות מסוף Cloud de Confiance או ה-CLI של gcloud.
כדי להתחבר למכונה הווירטואלית באמצעות SSH, מריצים את הפקודה gcloud compute
ssh הבאה:
gcloud compute ssh quickstart-tpu --zone=europe-west4-a
התקנה של JAX
מריצים את הפקודה הבאה במופע TPU כדי להתקין את מסגרת JAX:
pip install jax[tpu] -f https://storage.googleapis.com/jax-releases/libtpu_releases.html
הרצה של בדיקת מערכת
כדי לוודא של-JAX יש גישה ל-TPU והיא יכולה להריץ פעולות בסיסיות, מריצים את הפקודות הבאות במופע ה-TPU:
מפעילים את מתורגמן Python 3:
python3מייבאים את מודול JAX:
>>> import jaxהצגת מספר ליבות ה-TPU הזמינות:
>>> jax.device_count()בפלט מוצג מספר ליבות ה-TPU. מספר הליבות תלוי בגרסת ה-TPU שבה אתם משתמשים. מידע נוסף זמין במאמר בנושא גרסאות TPU.
ביצוע חישוב
מריצים את הפקודה הבאה כדי לחבר שני מספרים:
>>> jax.numpy.add(1, 1)הפלט אמור להיראות כך:
>>> Array(2, dtype=int32, weak_type=True)יוצאים ממתורגמן Python:
>>> exit()
הסרת המשאבים
כדי לא לצבור חיובים בחשבון על המשאבים שבהם השתמשתם בדף הזה, אתם צריכים למחוק את הפרויקט יחד עם המשאבים. Cloud de Confiance Cloud de Confiance
לחלופין, אם רוצים לשמור את הפרויקט, אפשר למחוק רק את המכונה הווירטואלית באמצעות הפקודה gcloud compute instances delete:
gcloud compute instances delete quickstart-tpu --zone=europe-west4-a