ניהול מערכי נתונים
במאמר הזה מוסבר איך להעתיק מערכי נתונים, ליצור מחדש מערכי נתונים במיקום אחר, לאבטח מערכי נתונים, למחוק מערכי נתונים ולשחזר טבלאות ממערכי נתונים שנמחקו ב-BigQuery. למידע על שחזור (או ביטול מחיקה) של קבוצת נתונים שנמחקה, אפשר לעיין במאמר שחזור קבוצות נתונים שנמחקו.
אדמינים ב-BigQuery יכולים לארגן ולשלוט בגישה לטבלאות ולתצוגות מפורטות שאנליסטים משתמשים בהן. מידע נוסף על מערכי נתונים זמין במאמר מבוא למערכי נתונים.
אי אפשר לשנות את השם של מערך נתונים קיים או להעביר אותו אחרי שהוא נוצר. כדי לשנות את השם של מערך הנתונים, אפשר להעתיק מערך נתונים ולשנות את השם של מערך הנתונים של היעד. כדי להעביר מיקום של מערך נתונים, אפשר לפעול באחת מהשיטות הבאות:
התפקידים הנדרשים
בקטע הזה מפורטים התפקידים וההרשאות שצריך כדי לנהל מערכי נתונים. אם מערך הנתונים של המקור או היעד נמצא באותו פרויקט שבו אתם משתמשים כדי להעתיק, לא תצטרכו הרשאות או תפקידים נוספים במערך הנתונים הזה.
העתקת מערך נתונים
צריך להעניק את התפקידים האלה כדי להעתיק מערך נתונים. העתקה של מערכי נתונים היא בסטטוס בטא.
כדי לקבל את ההרשאות שדרושות להעתקת מערכי נתונים, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים:
- אדמין של BigQuery (
roles/bigquery.admin) – פרויקט היעד - צפייה בנתוני BigQuery (
roles/bigquery.dataViewer) – מערך הנתונים של המקור - עריכה של נתוני BigQuery (
roles/bigquery.dataEditor) – מערך הנתונים של היעד
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
התפקידים המוגדרים מראש האלה כוללים את ההרשאות שנדרשות להעתקת מערכי נתונים. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:
ההרשאות הנדרשות
כדי להעתיק מערכי נתונים, צריך את ההרשאות הבאות:
-
bigquery.transfers.updateבפרויקט היעד -
bigquery.jobs.createבפרויקט היעד -
bigquery.datasets.getבמערך נתוני המקור והיעד -
bigquery.tables.listבמערך נתוני המקור והיעד -
bigquery.datasets.updateבמערך נתוני היעד -
bigquery.tables.createבמערך נתוני היעד
יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.
מחיקה של מערך נתונים
צריך להעניק את ההרשאות האלה כדי למחוק מערך נתונים.
כדי לקבל את ההרשאות שנדרשות למחיקת מערכי נתונים, צריך לבקש מהאדמין להקצות לכם ב-IAM את התפקיד הבעלים של נתוני BigQuery (roles/bigquery.dataOwner) בפרויקט.
כדי לקרוא הסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
זהו תפקיד שמוגדר מראש וכולל את ההרשאות שנדרשות למחיקת מערכי נתונים. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:
ההרשאות הנדרשות
כדי למחוק מערכי נתונים, נדרשות ההרשאות הבאות:
-
bigquery.datasets.deleteבפרויקט -
bigquery.tables.deleteבפרויקט
יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.
העתקת מערכי נתונים
אתם יכולים להעתיק מערך נתונים, כולל נתונים מחולקים למחיצות, בתוך אזור או בין אזורים, בלי לחלץ, להעביר או לטעון מחדש נתונים ל-BigQuery. BigQuery משתמש ב-שירות העברת נתונים ל-BigQuery בקצה העורפי כדי להעתיק מערכי נתונים. מידע על שיקולים לגבי מיקום כשמעבירים נתונים זמין במאמר מיקום הנתונים והעברה שלהם.
לכל הגדרה של העתקת מערך נתונים יכולה להיות הפעלה אחת של העברה בכל פעם. ריצות העברה נוספות מתווספות לתור. אם אתם משתמשים במסוף Cloud de Confiance , אתם יכולים לתזמן העתקות חוזרות ולהגדיר הודעות באימייל או ב-Pub/Sub באמצעות שירות העברת הנתונים ל-BigQuery.
מגבלות
ההגבלות הבאות חלות כשמעתיקים מערכי נתונים:
אי אפשר להעתיק את המשאבים הבאים ממערך נתוני מקור:
- צפיות.
- שגרות, כולל פונקציות מוגדרות על ידי המשתמש (UDF).
- טבלאות חיצוניות.
- טבלאות של סימון נתונים שהשתנו (CDC) אם עבודת ההעתקה מתבצעת בין אזורים. יש תמיכה בהעתקה של טבלאות CDC באותו אזור.
לא ניתן להשתמש במשימת העתקה של טבלה בין אזורים עבור טבלאות שמוצפנות באמצעות מפתחות הצפנה בניהול הלקוח (CMEK), אם מערך הנתונים של היעד לא מוצפן באמצעות CMEK ולא סופק CMEK. אפשר להעתיק טבלאות עם הצפנה כברירת מחדל בין אזורים.
אפשר להעתיק את כל הטבלאות המוצפנות באותו אזור, כולל טבלאות שהוצפנו באמצעות CMEK.
אי אפשר להשתמש במקורות המידע הבאים כערכות נתונים ליעד של עבודות העתקה:
- אחסון שעבר אופטימיזציה לכתיבה.
מערך הנתונים מוצפן באמצעות CMEK אם עבודת ההעתקה מתבצעת בין אזורים והטבלה של מקור הנתונים לא מוצפנת באמצעות CMEK.
עם זאת, מותר להשתמש בטבלאות שמוצפנות באמצעות CMEK כטבלאות יעד כשמעתיקים נתונים באותו אזור.
התדירות המינימלית בין עבודות העתקה היא 12 שעות.
אין תמיכה בהוספת נתונים לטבלה עם או בלי חלוקה למחיצות במערך נתוני היעד. אם אין שינויים בטבלת המקור, המערכת מדלגת על הטבלה. אם טבלת המקור מתעדכנת, המערכת חותכת את טבלת היעד ומחליפה אותה.
אם טבלה קיימת במערך נתוני המקור ובמערך נתוני היעד, והטבלה במקור לא השתנתה מאז ההעתקה האחרונה שבוצעה בהצלחה, המערכת מדלגת עליה. המערכת מדלגת על טבלת המקור גם אם תיבת הסימון החלפת טבלאות היעד מסומנת.
כשמבצעים חיתוך של טבלאות במערך נתוני היעד, עבודת ההעתקה של מערך הנתונים לא מזהה שינויים שבוצעו במשאבים במערך נתוני היעד לפני שהיא מתחילה. עבודת ההעתקה של מערך הנתונים מחליפה את כל הנתונים במערך נתוני היעד, כולל הטבלאות והסכימה.
יכול להיות שהשינויים שבוצעו בטבלאות המקור אחרי שהתחילה משימת ההעתקה לא יופיעו בטבלת היעד.
העתקה של מערך נתונים לא נתמכת באזורי BigQuery Omni.
כדי להעתיק קבוצת נתונים לפרויקט בגבולות גזרה לשירות אחר של VPC Service Controls, צריך להגדיר את כללי התעבורה היוצאת הבאים:
בהגדרת גבולות הגזרה לשירות של VPC Service Controls בפרויקט היעד, ל-IAM principal צריכות להיות ה-methods הבאות:
bigquery.datasets.getbigquery.tables.listbigquery.tables.get,bigquery.tables.getData
בהגדרות של גבולות הגזרה לשירות ב-VPC Service Controls בפרויקט המקור, שיטת ההגדרה של נציג ה-IAM שבו נעשה שימוש צריכה להיות
All Methods.
אם תנסו לעדכן העברה של העתקת מערך נתונים שלא בבעלותכם, יכול להיות שהעדכון ייכשל ותופיע הודעת השגיאה הבאה:
Cannot modify restricted parameters without taking ownership of the transfer configuration.הבעלים של עותק מערך הנתונים הוא המשתמש שמשויך לעותק מערך הנתונים או המשתמש שיש לו גישה לחשבון השירות שמשויך לעותק מערך הנתונים. המשתמש המשויך מופיע בפרטי ההגדרה של עותק מערך הנתונים. כדי לעדכן את עותק מערך הנתונים ולהגדיר בעלות, אפשר לעיין במאמר בנושא עדכון פרטי כניסה. כדי להעניק למשתמשים גישה לחשבון שירות, צריך להיות לכם תפקיד משתמש בחשבון השירות.
הפרמטרים שהבעלים הגביל לגבי עותקים של מערכי נתונים הם:
- פרויקט המקור
- מערך נתונים של מקור
- מערך נתוני יעד
- החלפת ההגדרה של טבלת היעד
כל ההגבלות על העתקת טבלאות בין אזורים חלות.
העתקת מערך נתונים
בוחרים באחת מהאפשרויות הבאות:
המסוף
מפעילים את שירות העברת הנתונים ל-BigQuery למערך הנתונים של היעד.
ודאו שיש לכם את התפקידים הנדרשים.
אם אתם מתכוונים להגדיר התראות על הפעלת העברה ל-Pub/Sub (אפשרות 2 בהמשך השלבים האלה), אתם צריכים את ההרשאה
pubsub.topics.setIamPolicy.אם הגדרתם רק התראות באימייל, לא נדרשות הרשאות Pub/Sub. מידע נוסף זמין במאמר בנושא הפעלת התראות בשירות העברת נתונים ל-BigQuery.
יוצרים מערך נתונים ב-BigQuery באותו אזור או באזור אחר ממערך הנתונים של המקור.
אפשרות 1: שימוש בפונקציית ההעתקה של BigQuery
כדי ליצור העברה חד-פעמית, משתמשים בפונקציית ההעתקה של BigQuery:
עוברים לדף BigQuery.
בחלונית הימנית, לוחצים על כלי הניתוחים:

אם החלונית הימנית לא מוצגת, לוחצים על הרחבת החלונית הימנית כדי לפתוח אותה.
בחלונית Explorer, מרחיבים את הפרויקט, לוחצים על Datasets ובוחרים מערך נתונים.
בקטע פרטי מערך הנתונים, לוחצים על העתקה ואז מבצעים את הפעולות הבאות:
בשדה Dataset, יוצרים מערך נתונים חדש או בוחרים מזהה של מערך נתונים קיים מהרשימה.
שמות מערכי הנתונים בפרויקט צריכים להיות ייחודיים. הפרויקט ומערך הנתונים יכולים להיות באזורים שונים, אבל לא כל האזורים תומכים בהעתקה של מערך נתונים בין אזורים.
בשדה מיקום מוצג המיקום של מערך נתוני המקור.
אופציונלי: כדי להחליף את הנתונים ואת הסכימה של טבלאות היעד בטבלאות המקור, מסמנים את תיבת הסימון החלפת טבלאות היעד. לטבלאות המקור ולטבלאות היעד צריכה להיות אותה סכימת חלוקה למחיצות.
כדי להעתיק את מערך הנתונים, לוחצים על Copy (העתקה).
אפשרות 2: שימוש בשירות העברת נתונים ל-BigQuery
כדי לתזמן העתקות חוזרות ולהגדיר התראות באימייל או ב-Pub/Sub, משתמשים בשירות העברת הנתונים ל-BigQuery במסוף של פרויקט היעד: Cloud de Confiance
עוברים לדף העברות נתונים.
לוחצים על יצירת העברה.
ברשימה מקור, בוחרים באפשרות העתקת מערך נתונים.
בשדה שם תצוגה, מזינים שם להרצת ההעברה.
בקטע Schedule options:
בקטע תדירות החזרה, בוחרים אפשרות לתדירות ההפעלה של ההעברה:
אם בוחרים באפשרות בהתאמה אישית, מזינים תדירות מותאמת אישית – לדוגמה,
every day 00:00. מידע נוסף מופיע במאמר בנושא עיצוב לוח הזמנים.בשדה תאריך ושעת ההתחלה של ההרצה, מזינים את התאריך והשעה שבהם רוצים להתחיל את ההעברה. אם בוחרים באפשרות Start now (התחלה מיידית), האפשרות הזו מושבתת.
בקטע הגדרות יעד, בוחרים מערך נתונים ליעד שבו רוצים לאחסן את נתוני ההעברה. אפשר גם ללחוץ על יצירת מערך נתונים חדש כדי ליצור מערך נתונים חדש לפני שבוחרים אותו להעברה.
בקטע פרטי מקור הנתונים, מזינים את הפרטים הבאים:
- בשדה Source dataset (מערך נתונים של המקור), מזינים את מזהה מערך הנתונים שרוצים להעתיק.
- בשדה פרויקט המקור, מזינים את מזהה הפרויקט של מערך נתוני המקור.
כדי להחליף גם את הנתונים וגם את הסכימה של טבלאות היעד בטבלאות המקור, מסמנים את תיבת הסימון החלפת טבלאות היעד. לשני הטבלאות, המקור והיעד, צריך להיות אותו סכימת חלוקה.
בתפריט Service Account, בוחרים חשבון שירות מתוך חשבונות השירות שמשויכים לCloud de Confiance פרויקט. אפשר לשייך חשבון שירות להעברה במקום להשתמש בפרטי הכניסה של המשתמש. מידע נוסף על שימוש בחשבונות שירות בהעברות נתונים זמין במאמר שימוש בחשבונות שירות.
- אם נכנסתם באמצעות זהות מאוחדת, תצטרכו ליצור חשבון שירות כדי ליצור העברה. אם נכנסתם באמצעות חשבון Google, חשבון שירות להעברה הוא אופציונלי.
- לחשבון השירות צריכים להיות התפקידים הנדרשים.
אופציונלי: בקטע אפשרויות התראות, מבצעים את הפעולות הבאות:
לוחצים על Save.
BQ
מפעילים את שירות העברת הנתונים ל-BigQuery למערך הנתונים של היעד.
ודאו שיש לכם את התפקידים הנדרשים.
כדי ליצור מערך נתונים ב-BigQuery, משתמשים בפקודה
bq mkעם הדגל ליצירת מערך נתונים--datasetוהדגלlocation:bq mk \ --dataset \ --location=LOCATION \ PROJECT:DATASET
מחליפים את מה שכתוב בשדות הבאים:
-
LOCATION: המיקום שאליו רוצים להעתיק את מערך הנתונים -
PROJECT: מזהה הפרויקט של מערך הנתונים של היעד -
DATASET: השם של מערך הנתונים של היעד
-
כדי להעתיק קבוצת נתונים, משתמשים בפקודה
bq mkעם דגל יצירת ההעברה--transfer_configוהדגל--data_source. צריך להגדיר את הדגל--data_sourceלערךcross_region_copy. רשימה מלאה של ערכים תקפים לדגל--data_sourceזמינה במאמר דגלים של transfer-config בהפניה לכלי שורת הפקודה של BigQuery.bq mk \ --transfer_config \ --project_id=PROJECT \ --data_source=cross_region_copy \ --target_dataset=DATASET \ --display_name=NAME \ --service_account_name=SERCICE_ACCOUNT \ --params='PARAMETERS'
מחליפים את מה שכתוב בשדות הבאים:
NAME: השם המוצג של עבודת ההעתקה או של הגדרות ההעברה
SERVICE_ACCOUNT: השם של חשבון השירות שמשמש לאימות ההעברה. חשבון השירות צריך להיות בבעלות אותוproject_idששימש ליצירת ההעברה, וצריכות להיות לו כל ההרשאות הנדרשות.
PARAMETERS: הפרמטרים של הגדרות ההעברה בפורמט JSONהפרמטרים של הגדרת העתקה של מערך נתונים כוללים את האפשרויות הבאות:
-
source_dataset_id: המזהה של מערך נתוני המקור שרוצים להעתיק -
source_project_id: מזהה הפרויקט שבו נמצא מערך הנתונים של המקור -
overwrite_destination_table: דגל אופציונלי שמאפשר לחתוך את הטבלאות של עותק קודם ולרענן את כל הנתונים
גם טבלת המקור וגם טבלת היעד צריכות להיות עם אותה סכימת חלוקה למחיצות.
-
בדוגמאות הבאות מוצג הפורמט של הפרמטרים, על סמך סביבת המערכת שלכם:
Linux: משתמשים במירכאות בודדות כדי לתחום את מחרוזת ה-JSON – לדוגמה:
'{"source_dataset_id":"mydataset","source_project_id":"mysourceproject","overwrite_destination_table":"true"}'שורת הפקודה של Windows: משתמשים במירכאות כפולות כדי להקיף את מחרוזת ה-JSON, ומסמנים בתו בריחה (escape) את המירכאות הכפולות במחרוזת באמצעות קו נטוי הפוך – לדוגמה:
"{\"source_dataset_id\":\"mydataset\",\"source_project_id\":\"mysourceproject\",\"overwrite_destination_table\":\"true\"}"PowerShell: משתמשים בגרש כדי לתחום את מחרוזת ה-JSON, ומסמנים בתו בריחה (escape) את המירכאות הכפולות במחרוזת באמצעות קו נטוי הפוך – לדוגמה:
'{\"source_dataset_id\":\"mydataset\",\"source_project_id\":\"mysourceproject\",\"overwrite_destination_table\":\"true\"}'
לדוגמה, הפקודה הבאה יוצרת הגדרת העתקה של מערך נתונים בשם
My Transferעם מערך נתונים יעד בשםmydatasetופרויקט עם מזההmyproject.bq mk \ --transfer_config \ --project_id=myproject \ --data_source=cross_region_copy \ --target_dataset=mydataset \ --display_name='My Transfer' \ --params='{ "source_dataset_id":"123_demo_eu", "source_project_id":"mysourceproject", "overwrite_destination_table":"true" }'
API
מפעילים את שירות העברת הנתונים ל-BigQuery למערך הנתונים של היעד.
ודאו שיש לכם את התפקידים הנדרשים.
כדי ליצור מערך נתונים ב-BigQuery, קוראים לשיטה
datasets.insertעם משאב מוגדר של מערך נתונים.כדי להעתיק מערך נתונים, משתמשים בשיטה
projects.locations.transferConfigs.createומספקים מופע של המשאבTransferConfig.
Java
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Javaהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Java API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
Python
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Pythonהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Python API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
pip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
כדי להימנע מעלויות אחסון נוספות, כדאי למחוק את מערך הנתונים הקודם.
הצגת משימות של העתקת מערכי נתונים
כדי לראות את הסטטוס ואת הפרטים של עבודת העתקה של מערך נתונים במסוףCloud de Confiance :
נכנסים לדף Data transfers במסוף Cloud de Confiance .
בוחרים העברה שרוצים לראות את הפרטים שלה, ואז מבצעים את הפעולות הבאות:
בדף פרטי ההעברה, בוחרים בהרצת העברה.
כדי לרענן, לוחצים על רענון.
יצירה מחדש של מערכי נתונים במיקום אחר
כדי להעביר מערך נתונים באופן ידני ממיקום אחד למיקום אחר, פועלים לפי השלבים הבאים:
-
מייצאים את הנתונים מטבלאות BigQuery לקטגוריה של Cloud Storage.
אין חיובים על ייצוא נתונים מ-BigQuery, אבל יש חיובים על אחסון הנתונים המיוצאים ב-Cloud Storage. הייצוא ל-BigQuery כפוף למגבלות על משימות חילוץ.
-
מעתיקים או מעבירים את הנתונים מקטגוריית Cloud Storage של הייצוא לקטגוריה חדשה שיצרתם במיקום היעד. לדוגמה, אם אתם מעבירים את הנתונים מ
USאזור מרובה לאזורasia-northeast1טוקיו, תעבירו את הנתונים לקטגוריה שיצרתם בטוקיו. מידע על העברת אובייקטים ב-Cloud Storage זמין במאמר העתקה, שינוי שם והעברה של אובייקטים במסמכי Cloud Storage.העברת נתונים בין אזורים כרוכה בחיובים על תעבורת נתונים יוצאת (egress) ברשת ב-Cloud Storage.
-
יוצרים מערך נתונים חדש ב-BigQuery במיקום החדש, ואז טוענים את הנתונים ממאגר Cloud Storage למערך הנתונים החדש.
לא תחויבו על טעינת הנתונים ל-BigQuery, אבל תחויבו על אחסון הנתונים ב-Cloud Storage עד שתמחקו את הנתונים או את הקטגוריה. תחויבו גם על אחסון הנתונים ב-BigQuery אחרי הטעינה. טעינת נתונים לתוך BigQuery כפופה למגבלות של עבודות טעינה.
אפשר גם להשתמש ב- Managed Service for Apache Airflow כדי להעביר ולהעתיק מערכי נתונים גדולים באופן פרוגרמטי.
למידע נוסף על שימוש ב-Cloud Storage לאחסון ולהעברה של מערכי נתונים גדולים, אפשר לעיין במאמר בנושא שימוש ב-Cloud Storage עם Big Data.
אבטחת מערכי נתונים
מידע על שליטה בגישה למערכי נתונים ב-BigQuery זמין במאמר בנושא שליטה בגישה למערכי נתונים. מידע על הצפנת נתונים זמין במאמר הצפנה במנוחה.
מחיקה של מערכי נתונים
כשמוחקים מערך נתונים באמצעות Cloud de Confiance המסוף, הטבלאות והתצוגות במערך הנתונים, כולל הנתונים שלהן, נמחקים באופן אוטומטי. עם זאת, כשמשתמשים בשיטה אחרת, צריך קודם לרוקן את מערך הנתונים או לציין דגלים, פרמטרים או מילות מפתח מתאימים שמאלצים את ההסרה של התוכן במערך הנתונים.
אם מנסים למחוק מערך נתונים לא ריק בלי הדגלים או הפרמטרים המתאימים, הפעולה נכשלת ומוצגת השגיאה הבאה:
Dataset project:dataset is still in use.
מחיקה של מערך נתונים יוצרת רשומה אחת של יומן ביקורת למחיקה של מערך הנתונים. לא נוצרות רשומות נפרדות ביומן לכל טבלה שנמחקה במערך הנתונים.
כדי למחוק קבוצת נתונים, בוחרים באחת מהאפשרויות הבאות:
המסוף
עוברים לדף BigQuery.
בחלונית הימנית, לוחצים על כלי הניתוחים:

בחלונית Explorer, מרחיבים את הפרויקט, לוחצים על Datasets ואז לוחצים על מערך הנתונים.
בחלונית הפרטים, לוחצים על מחיקה.
בתיבת הדו-שיח מחיקת מערך נתונים, מקלידים
deleteבשדה ולוחצים על מחיקה.
SQL
כדי למחוק קבוצת נתונים, משתמשים בהצהרת DDL DROP SCHEMA.
בדוגמה הבאה נמחקת קבוצת נתונים בשם mydataset:
במסוף Cloud de Confiance , עוברים לדף BigQuery.
מזינים את ההצהרה הבאה בעורך השאילתות:
DROP SCHEMA IF EXISTS mydataset;
כברירת מחדל, אפשר למחוק רק קבוצת נתונים ריקה. כדי למחוק קבוצת נתונים ואת כל התוכן שלה, משתמשים במילת המפתח
CASCADE:DROP SCHEMA IF EXISTS mydataset CASCADE;
לוחצים על הפעלה.
מידע נוסף על הרצת שאילתות זמין במאמר הרצת שאילתה אינטראקטיבית.
BQ
משתמשים בפקודה bq rm עם הדגל --dataset או -d (אופציונלי).
אם מערך הנתונים מכיל טבלאות, צריך להשתמש בדגל -r כדי להסיר את כל הטבלאות במערך הנתונים. אם משתמשים בדגל -r, אפשר להשמיט את הדגל --dataset או -d.
אחרי שמריצים את הפקודה, המערכת מבקשת אישור. אפשר להשתמש בדגל -f כדי לדלג על האישור.
אם אתם מוחקים טבלה בפרויקט שאינו פרויקט ברירת המחדל, צריך להוסיף את מזהה הפרויקט לשם מערך הנתונים בפורמט הבא: PROJECT_ID:DATASET.
bq rm -r -f -d PROJECT_ID:DATASET
מחליפים את מה שכתוב בשדות הבאים:
-
PROJECT_ID: מזהה הפרויקט -
DATASET: השם של מערך הנתונים שרוצים למחוק
לדוגמה:
כדי להסיר מפרויקט ברירת המחדל מערך נתונים בשם mydataset ואת כל הטבלאות שבו, מזינים את הפקודה הבאה. הפקודה משתמשת בדגל -d.
bq rm -r -d mydataset
כשמופיעה בקשה, כותבים y ומקישים על Enter.
מזינים את הפקודה הבאה כדי להסיר את mydataset ואת כל הטבלאות שבו מ-myotherproject. בפקודה לא נעשה שימוש בדגל האופציונלי -d.
הדגל -f משמש לדילוג על האישור.
bq rm -r -f myotherproject:mydataset
אפשר להשתמש בפקודה bq ls כדי לוודא שמערך הנתונים נמחק.
API
קוראים לשיטה datasets.delete כדי למחוק את מערך הנתונים, ומגדירים את הפרמטר deleteContents לערך true כדי למחוק את הטבלאות שבו.
C#
בדוגמת הקוד הבאה מוצג איך מוחקים מערך נתונים ריק.
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי C#הוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery C# API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
pip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
בדוגמת הקוד הבאה מוצגת מחיקה של מערך נתונים וכל התוכן שלו:
המשך
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Goהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Go API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
pip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
Java
בדוגמת הקוד הבאה מוצג איך מוחקים מערך נתונים ריק.
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Javaהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Java API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
pip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
בדוגמת הקוד הבאה מוצגת מחיקה של מערך נתונים וכל התוכן שלו:
Node.js
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Node.jsהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Node.js API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
pip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
PHP
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי PHPהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery PHP API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
pip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
Python
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Pythonהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Python API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
pip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
Ruby
בדוגמת הקוד הבאה מוצג איך מוחקים מערך נתונים ריק.
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Rubyהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Ruby API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
pip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
בדוגמת הקוד הבאה מוצגת מחיקה של מערך נתונים וכל התוכן שלו:
שחזור טבלאות ממערכי נתונים שנמחקו
אפשר לשחזר טבלאות מקבוצת נתונים שנמחקה, אם הן נמצאות בחלון הזמן של קבוצת הנתונים. כדי לשחזר את כל מערך הנתונים, אפשר לעיין במאמר בנושא שחזור של מערכי נתונים שנמחקו.
- יוצרים מערך נתונים עם אותו שם ובאותו מיקום כמו המערך המקורי.
- בוחרים חותמת זמן מלפני המחיקה של מערך הנתונים המקורי בפורמט של אלפיות השנייה מאז ראשית זמן יוניקס (Unix epoch) – לדוגמה,
1418864998000. מעתיקים את הטבלה
originaldataset.table1בשעה1418864998000למערך הנתונים החדש:bq cp originaldataset.table1@1418864998000 mydataset.mytable
כדי למצוא את השמות של הטבלאות הלא ריקות שהיו במערך הנתונים שנמחק, צריך לשלוח שאילתה לתצוגה
INFORMATION_SCHEMA.TABLE_STORAGEשל מערך הנתונים בתוך חלון הזמן של התכונה 'חזרה בזמן'.
שחזור של מערכי נתונים שנמחקו
כדי ללמוד איך לשחזר (או לבטל מחיקה) של קבוצת נתונים שנמחקה, אפשר לעיין במאמר שחזור של קבוצות נתונים שנמחקו.
מכסות
מידע על מכסות העתקה זמין במאמר בנושא משימות העתקה.
נתוני השימוש במשימות העתקה זמינים ב-INFORMATION_SCHEMA. כדי ללמוד איך לשלוח שאילתות לתצוגה INFORMATION_SCHEMA.JOBS, אפשר לעיין במאמר בנושא תצוגה JOBS.
תמחור
למידע על מחירים של העתקת מערכי נתונים, אפשר לעיין במאמר מחירים של רפליקציית נתונים.
BigQuery שולח נתונים דחוסים להעתקה בין אזורים, כך שהנתונים שמחויבים עליהם עשויים להיות קטנים יותר מהגודל בפועל של מערך הנתונים. כאן תוכלו לקרוא מידע נוסף על התמחור ב-BigQuery.