יצירת טבלאות מסודרות באשכולות
כדי להקטין את כמות הנתונים שעוברת עיבוד על ידי שאילתה, אפשר להשתמש בטבלאות מקובצות ב-BigQuery.
בטבלאות מקובצות, הנתונים בטבלה מאורגנים על סמך הערכים של עמודות שצוינו, שנקראות גם עמודות הקיבוץ. מערכת BigQuery ממיינת את הנתונים לפי העמודות המקובצות, ואז מאחסנת את השורות עם ערכים דומים באותם בלוקים פיזיים או בבלוקים פיזיים סמוכים. כששאילתה מסננת עמודה מסודרת באשכולות, BigQuery סורק ביעילות רק את הבלוקים הרלוונטיים ומדלג על הנתונים שלא תואמים למסנן.
למידע נוסף, קראו את המאמרים הבאים:
- מידע נוסף על טבלאות מקובצות ב-BigQuery זמין במאמר מבוא לטבלאות מקובצות.
- במאמר ניהול טבלאות מקובצות מוסבר איך עובדים עם טבלאות מקובצות ואיך שולטים בגישה אליהן.
לפני שמתחילים
התפקידים הנדרשים
כדי לקבל את ההרשאות שדרושות ליצירת טבלה, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים:
- משתמש במשימות BigQuery (
roles/bigquery.jobUser) בפרויקט אם יוצרים טבלה על ידי טעינת נתונים או שמירת תוצאות של שאילתה בטבלה. - BigQuery Data Editor (
roles/bigquery.dataEditor) במערך הנתונים שבו יוצרים את הטבלה.
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
התפקידים המוגדרים מראש האלה מכילים את ההרשאות שנדרשות ליצירת טבלה. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:
ההרשאות הנדרשות
כדי ליצור טבלה, צריך את ההרשאות הבאות:
-
bigquery.tables.createבמערך הנתונים שבו אתם יוצרים את הטבלה. -
bigquery.tables.getDataבכל הטבלאות והתצוגות שהשאילתה מפנה אליהן, אם שומרים את תוצאות השאילתה כטבלה. -
bigquery.jobs.createבפרויקט אם יוצרים את הטבלה על ידי טעינת נתונים או על ידי שמירת תוצאות של שאילתה בטבלה. -
bigquery.tables.updateDataבטבלה אם מוסיפים לטבלה או מחליפים אותה בתוצאות של שאילתה.
יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.
דרישות בנוגע לשמות של טבלאות
כשיוצרים טבלה ב-BigQuery, שם הטבלה צריך להיות ייחודי לכל מערך נתונים. שם הטבלה יכול:
- להכיל תווים באורך של עד 1,024 בייטים בקידוד UTF-8.
- להכיל תווים ב-Unicode בקטגוריות L (אות), M (סימן), N (מספר), Pc (מחבר, כולל קו תחתון), Pd (מקף), Zs (רווח). מידע נוסף זמין במאמר בנושא קטגוריה כללית.
השמות הבאים הם דוגמאות לשמות תקינים של טבלאות:
table 01, ग्राहक, 00_お客様, étudiant-01.
הערות:
- כברירת מחדל, שמות של טבלאות הם תלויי אותיות רישיות.
mytableו-MyTableיכולים להתקיים יחד באותו מערך נתונים, אלא אם הם חלק ממערך נתונים שבו ההבחנה בין אותיות רישיות לאותיות קטנות מושבתת. - חלק משמות הטבלאות והתחיליות של שמות הטבלאות שמורים. אם מוצגת לכם הודעת שגיאה שאומרת ששם הטבלה או התחילית שמורים, צריך לבחור שם אחר ולנסות שוב.
אם כוללים כמה אופרטורים של נקודה (
.) ברצף, המערכת מסירה באופן משתמע את האופרטורים הכפולים.לדוגמה, הקוד הבא:
project_name....dataset_name..table_nameהופך ל:
project_name.dataset_name.table_name
הדרישות לגבי עמודות מסודרות באשכולות
כשיוצרים טבלה ב-BigQuery, אפשר לציין את העמודות שמשמשות ליצירת הטבלה המסודרת באשכולות. אחרי שיוצרים את הטבלה, אפשר לשנות את העמודות שמשמשות ליצירת הטבלה המסודרת באשכולות. פרטים נוספים זמינים במאמר בנושא שינוי מפרט האשכול.
עמודות של אשכולות חייבות להיות עמודות ברמה העליונה, לא חוזרות, והן חייבות להיות מאחד מסוגי הנתונים הבאים:
BIGNUMERICBOOLDATEDATETIMEGEOGRAPHYINT64NUMERICRANGESTRINGTIMESTAMP
אפשר לציין עד ארבע עמודות לאשכולות. כשמציינים כמה עמודות, סדר העמודות קובע את אופן המיון של הנתונים. לדוגמה, אם הטבלה מקובצת לפי העמודות א', ב' וג', הנתונים ממוינים באותו סדר: קודם לפי עמודה א', אחר כך לפי עמודה ב' ואז לפי עמודה ג'. מומלץ למקם את העמודה שמסוננת או שמצטברת הכי הרבה פעמים ראשונה.
גם הסדר של עמודות האשכול משפיע על ביצועי השאילתה ועל התמחור. מידע נוסף על שיטות מומלצות לשאילתות בטבלאות מקובצות זמין במאמר בנושא שאילתות בטבלאות מקובצות.
יצירה של טבלה מסודרת באשכולות ריקה עם הגדרת סכימה
כדי ליצור טבלה מסודרת באשכולות ריקה עם הגדרת סכימה:
המסוף
במסוף Cloud de Confiance , עוברים לדף BigQuery.
- בחלונית הימנית, לוחצים על כלי הניתוחים.
- בחלונית Explorer, מרחיבים את הפרויקט, לוחצים על Datasets ובוחרים מערך נתונים.
- בקטע פרטי מערך הנתונים, לוחצים על יצירת טבלה.
- בחלונית Create table, מציינים את הפרטים הבאים:
- בקטע מקור, בוחרים באפשרות טבלה ריקה ברשימה יצירת טבלה מ.
- בקטע יעד, מציינים את הפרטים הבאים:
- בקטע Dataset (מערך נתונים), בוחרים את מערך הנתונים שבו רוצים ליצור את הטבלה.
- בשדה Table, מזינים את השם של הטבלה שרוצים ליצור.
- מוודאים שהשדה Table type (סוג הטבלה) מוגדר ל-Native table (טבלה מקורית).
- בקטע Schema (סכימה), מזינים את הגדרת הסכימה.
אפשר להזין את פרטי הסכימה באופן ידני באחת מהשיטות הבאות:
- אפשרות 1: לוחצים על Edit as text (עריכה כטקסט) ומדביקים את הסכימה כ-JSON array. כשמשתמשים במערך JSON, יוצרים את הסכימה באותו תהליך שבו יוצרים קובץ סכימת JSON.
כדי לראות את הסכימה של טבלה קיימת בפורמט JSON, מזינים את הפקודה הבאה:
bq show --format=prettyjson dataset.table
- אפשרות 2: לוחצים על הוספת שדה ומזינים את סכימת הטבלה. מציינים את השם, הסוג, והמצב של כל שדה.
- אפשרות 1: לוחצים על Edit as text (עריכה כטקסט) ומדביקים את הסכימה כ-JSON array. כשמשתמשים במערך JSON, יוצרים את הסכימה באותו תהליך שבו יוצרים קובץ סכימת JSON.
כדי לראות את הסכימה של טבלה קיימת בפורמט JSON, מזינים את הפקודה הבאה:
- בשדה סדר האשכולות, מזינים בין שם אחד לארבעה שמות של עמודות, מופרדים בפסיקים.
- אופציונלי: בקטע Advanced options, אם רוצים להשתמש במפתח הצפנה בניהול הלקוח, בוחרים באפשרות Use a customer-managed encryption key (CMEK). כברירת מחדל, BigQuery מצפין את תוכן הלקוחות שמאוחסן במצב מנוחה באמצעות Google Cloud-powered encryption key.
- לוחצים על יצירת טבלה.
SQL
משתמשים בפקודה CREATE TABLE DDL statement עם האפשרות CLUSTER BY. בדוגמה הבאה נוצרת טבלה מסודרת באשכולות בשם myclusteredtable ב-mydataset:
במסוף Cloud de Confiance , עוברים לדף BigQuery.
מזינים את ההצהרה הבאה בעורך השאילתות:
CREATE TABLE mydataset.myclusteredtable ( customer_id STRING, transaction_amount NUMERIC ) CLUSTER BY customer_id OPTIONS ( description = 'a table clustered by customer_id');
לוחצים על הפעלה.
מידע נוסף על הרצת שאילתות זמין במאמר הרצת שאילתה אינטראקטיבית.
BQ
משתמשים בפקודה bq mk עם הדגלים הבאים:
-
--table(או קיצור הדרך-t). -
--schema. אפשר לספק את הגדרת הסכימה של הטבלה בשורה או להשתמש בקובץ סכימת JSON. --clustering_fields. אפשר לציין עד ארבע עמודות לאשכולות.
פרמטרים אופציונליים כוללים את --expiration, --description, --time_partitioning_type, --time_partitioning_field, --time_partitioning_expiration, --destination_kms_key ו---label.
אם אתם יוצרים טבלה בפרויקט שאינו פרויקט ברירת המחדל, צריך להוסיף את מזהה הפרויקט למערך הנתונים בפורמט הבא: project_id:dataset.
--destination_kms_key לא מוסבר כאן. מידע על שימוש ב---destination_kms_key זמין במאמר בנושא מפתחות הצפנה בניהול הלקוח.
מזינים את הפקודה הבאה כדי ליצור טבלה מסודרת באשכולות ריקה עם הגדרת סכימה:
bq mk \ --table \ --expiration INTEGER1 \ --schema SCHEMA \ --clustering_fields CLUSTER_COLUMNS \ --description "DESCRIPTION" \ --label KEY:VALUE,KEY:VALUE \ PROJECT_ID:DATASET.TABLE
מחליפים את מה שכתוב בשדות הבאים:
-
INTEGER1: משך החיים שמוגדר כברירת מחדל לטבלה, בשניות. הערך המינימלי הוא 3,600 שניות (שעה אחת). מועד התפוגה הוא השעה הנוכחית בשעון UTC בתוספת הערך המספרי. אם מגדירים את זמן התפוגה של הטבלה כשיוצרים אותה, הגדרת ברירת המחדל של מערך הנתונים לגבי תפוגת הטבלה מתעלמת מההגדרה הזו. הגדרת הערך הזה מוחקת את הטבלה אחרי הזמן שצוין. -
SCHEMA: הגדרה מוטבעת של סכימה בפורמטCOLUMN:DATA_TYPE,COLUMN:DATA_TYPEאו הנתיב לקובץ סכימת ה-JSON במחשב המקומי. -
CLUSTER_COLUMNS: רשימה מופרדת בפסיקים של עד ארבע עמודות של אשכולות. הרשימה לא יכולה להכיל רווחים. -
DESCRIPTION: תיאור הטבלה, במירכאות. -
KEY:VALUE: זוג מפתח/ערך שמייצג תווית. אפשר להזין כמה תוויות באמצעות רשימה שמופרדת בפסיקים. PROJECT_ID: מזהה הפרויקט.-
DATASET: מערך נתונים בפרויקט. -
TABLE: השם של הטבלה שיוצרים.
כשמציינים את הסכימה בשורת הפקודה, אי אפשר לכלול סוג RECORD (STRUCT), אי אפשר לכלול תיאור של העמודה ואי אפשר לציין את מצב העמודה. ברירת המחדל של כל אמצעי התחבורה היא NULLABLE. כדי לכלול תיאורים, מצבים וסוגים של RECORD, צריך לספק קובץ סכימת JSON במקום זאת.
דוגמאות:
מזינים את הפקודה הבאה כדי ליצור טבלה מסודרת באשכולות בשם myclusteredtable ב-mydataset בפרויקט ברירת המחדל. תוקף הטבלה מוגדר ל-2,592,000 (חודש אחד של 30 יום), התיאור מוגדר ל-This is my clustered table והתווית מוגדרת ל-organization:development. בפקודה נעשה שימוש בקיצור הדרך -t במקום ב---table.
הסכימה מצוינת בשורה כ:
timestamp:timestamp,customer_id:string,transaction_amount:float. השדה שצוין לאשכולות customer_id משמש לאשכול הטבלה.
bq mk \
-t \
--expiration 2592000 \
--schema 'timestamp:timestamp,customer_id:string,transaction_amount:float' \
--clustering_fields customer_id \
--description "This is my clustered table" \
--label org:dev \
mydataset.myclusteredtable
מזינים את הפקודה הבאה כדי ליצור טבלה מסודרת באשכולות בשם myclusteredtable בפרויקט myotherproject, ולא בפרויקט ברירת המחדל. התיאור מוגדר ל-This is my clustered table והתווית מוגדרת ל-organization:development. בפקודה נעשה שימוש בקיצור הדרך -t במקום ב---table. בפקודה הזו לא מצוין תאריך תפוגה לטבלה. אם לערכת הנתונים יש תאריך תפוגה של טבלה שמוגדר כברירת מחדל, הוא יחול. אם למערך הנתונים לא מוגדר תאריך תפוגה של טבלה כברירת מחדל, תוקף הטבלה לא יפוג לעולם.
הסכימה מצוינת בקובץ JSON מקומי: /tmp/myschema.json. השדה customer_id משמש לאשכול הטבלה.
bq mk \
-t \
--expiration 2592000 \
--schema /tmp/myschema.json \
--clustering_fields=customer_id \
--description "This is my clustered table" \
--label org:dev \
myotherproject:mydataset.myclusteredtable
אחרי שיוצרים את הטבלה, אפשר לעדכן את התיאור ואת התוויות שלה.
Terraform
משתמשים במשאב google_bigquery_table.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
בדוגמה הבאה נוצרת טבלה בשם mytable עם אשכולים בעמודות ID ו-Created:
כדי להחיל את הגדרות Terraform בפרויקט ב- Cloud de Confiance , מבצעים את השלבים בקטעים הבאים.
הכנת Cloud Shell
- מפעילים את Cloud Shell.
-
מגדירים את פרויקט ברירת המחדל שבו רוצים להחיל את ההגדרות של Terraform. Cloud de Confiance
תצטרכו להריץ את הפקודה הזו רק פעם אחת לכל פרויקט, ותוכלו לעשות זאת בכל ספרייה.
export GOOGLE_CLOUD_PROJECT=PROJECT_ID
אם תגדירו ערכים ספציפיים בקובץ התצורה של Terraform, הם יבטלו את ערכי ברירת המחדל של משתני הסביבה.
הכנת הספרייה
לכל קובץ תצורה של Terraform צריכה להיות ספרייה משלו (שנקראת גם מודול ברמה הבסיסית).
-
יוצרים ספרייה חדשה ב-Cloud Shell ובה יוצרים קובץ חדש. שם הקובץ חייב לכלול את הסיומת
.tf, למשלmain.tf. במדריך הזה, הקובץ נקראmain.tf.mkdir DIRECTORY && cd DIRECTORY && touch main.tf
-
אם אתם עוקבים אחרי המדריך, תוכלו להעתיק את הקוד לדוגמה בכל קטע או שלב.
מעתיקים את הקוד לדוגמה בקובץ
main.tfהחדש שיצרתם.לחלופין, אפשר גם להעתיק את הקוד מ-GitHub. כדאי לעשות את זה כשקטע הקוד של Terraform הוא חלק מפתרון מקצה לקצה.
- בודקים את הפרמטרים לדוגמה ומשנים אותם בהתאם לסביבה שלכם.
- שומרים את השינויים.
-
מפעילים את Terraform. צריך לעשות זאת רק פעם אחת לכל ספרייה.
terraform init
אופציונלי: תוכלו לכלול את האפשרות
-upgrade, כדי להשתמש בגרסה העדכנית ביותר של הספק של Google:terraform init -upgrade
החלה של השינויים
-
בודקים את ההגדרות ומוודאים שהמשאבים שמערכת Terraform תיצור או תעדכן תואמים לציפיות שלכם:
terraform plan
מתקנים את ההגדרות לפי הצורך.
-
מריצים את הפקודה הבאה ומזינים
yesבהודעה שמופיעה, כדי להחיל את הגדרות Terraform:terraform apply
ממתינים עד שב-Terraform תוצג ההודעה "Apply complete!".
- פותחים את Cloud de Confiance הפרויקט כדי לראות את התוצאות. במסוף Cloud de Confiance , נכנסים למשאבים בממשק המשתמש כדי לוודא שהם נוצרו או עודכנו ב-Terraform.
API
קוראים למתודה tables.insert עם משאב טבלה מוגדר שמציין את המאפיין clustering.fields ואת המאפיין schema.
Python
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Pythonהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Python API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
המשך
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Goהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Go API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
Java
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Javaהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Java API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
יצירת טבלה מסודרת באשכולות מתוצאת שאילתה
יש שתי דרכים ליצור טבלה מסודרת באשכולות מתוצאת שאילתה:
- כותבים את התוצאות לטבלת יעד חדשה ומציינים את עמודות האשכולות.
- באמצעות הצהרת DDL
CREATE TABLE AS SELECT. מידע נוסף על השיטה הזו זמין במאמר יצירת טבלה מסודרת באשכולות מתוצאה של שאילתה בדף שימוש בהצהרות של שפת הגדרת נתונים.
אפשר ליצור טבלה מסודרת באשכולות על ידי שליחת שאילתה לטבלה מחולקת למחיצות (Partitions) או לטבלה ללא מחיצות. אי אפשר לשנות טבלה קיימת לטבלה מסודרת באשכולות באמצעות תוצאות של שאילתה.
כשיוצרים טבלה מסודרת באשכולות מתוצאה של שאילתה, צריך להשתמש ב-SQL סטנדרטי. אין תמיכה ב-SQL מדור קודם לשאילתות על טבלאות מקובצות או לכתיבת תוצאות של שאילתות לטבלאות מקובצות.
SQL
כדי ליצור טבלה מסודרת באשכולות מתוצאה של שאילתה, משתמשים בהצהרת ה-DDL CREATE TABLE עם האפשרות CLUSTER BY. בדוגמה הבאה נוצרת טבלה חדשה עם אשכול לפי customer_id על ידי שאילתה של טבלה קיימת ללא אשכול:
במסוף Cloud de Confiance , עוברים לדף BigQuery.
מזינים את ההצהרה הבאה בעורך השאילתות:
CREATE TABLE mydataset.clustered_table ( customer_id STRING, transaction_amount NUMERIC ) CLUSTER BY customer_id AS ( SELECT * FROM mydataset.unclustered_table );
לוחצים על הפעלה.
מידע נוסף על הרצת שאילתות זמין במאמר הרצת שאילתה אינטראקטיבית.
BQ
מזינים את הפקודה הבאה כדי ליצור טבלת יעד חדשה עם אשכולים מתוצאת שאילתה:
bq --location=LOCATION query \ --use_legacy_sql=false 'QUERY'
מחליפים את מה שכתוב בשדות הבאים:
-
LOCATION: שם המיקום. הדגל--locationהוא אופציונלי. לדוגמה, אם אתם משתמשים ב-BigQuery באזור טוקיו, אתם יכולים להגדיר את הערך של הדגל כ-asia-northeast1. אפשר להגדיר ערך ברירת מחדל למיקום באמצעות הקובץ .bigqueryrc. -
QUERY: שאילתה בתחביר GoogleSQL. אי אפשר להשתמש ב-SQL מדור קודם כדי לשלוח שאילתות לטבלאות מקובצות או כדי לכתוב תוצאות של שאילתות בטבלאות מקובצות. השאילתה יכולה להכיל הצהרתCREATE TABLEDDL שמציינת את האפשרויות ליצירת הטבלה המסודרת באשכולות. אפשר להשתמש ב-DDL במקום לציין את הדגלים הנפרדים של שורת הפקודה.
דוגמאות:
מזינים את הפקודה הבאה כדי לכתוב את תוצאות השאילתה לטבלת יעד מקובצת בשם myclusteredtable ב-mydataset. mydataset נמצא בפרויקט ברירת המחדל שלכם. השאילתה מאחזרת נתונים מטבלה שלא חולקה למחיצות: mytable. העמודה customer_id בטבלה משמשת לאשכול הטבלה. העמודה timestamp בטבלה משמשת ליצירת טבלה עם חלוקה למחיצות.
bq query --use_legacy_sql=false \
'CREATE TABLE
mydataset.myclusteredtable
PARTITION BY
DATE(timestamp)
CLUSTER BY
customer_id
AS (
SELECT
*
FROM
`mydataset.mytable`
);'
API
כדי לשמור את תוצאות השאילתה בטבלה מסודרת באשכולות, צריך לקרוא לשיטה jobs.insert, להגדיר משימת query ולכלול הצהרת CREATE TABLE DDL שיוצרת את הטבלה המסודרת באשכולות.
מציינים את המיקום במאפיין location בקטע jobReference של משאב המשרה.
יצירת טבלה מסודרת באשכולות כשמעלים נתונים
כדי ליצור טבלה מקובצת, מציינים עמודות קיבוץ כשמעלים נתונים לטבלה חדשה. אין צורך ליצור טבלה ריקה לפני טעינת נתונים לתוכה. אפשר ליצור את הטבלה המסודרת באשכולות ולטעון את הנתונים בו-זמנית.
מידע נוסף על טעינת נתונים זמין במאמר מבוא לטעינת נתונים ל-BigQuery.
כדי להגדיר אשכולות כשמגדירים משימת טעינה:
SQL
משתמשים בהצהרה LOAD DATA.
בדוגמה הבאה, נטען נתונים בפורמט AVRO כדי ליצור טבלה שמחולקת למחיצות לפי השדה transaction_date ומקובצת לפי השדה customer_id.
הוא גם מגדיר את המחיצות כך שהתוקף שלהן יפוג אחרי שלושה ימים.
במסוף Cloud de Confiance , עוברים לדף BigQuery.
מזינים את ההצהרה הבאה בעורך השאילתות:
LOAD DATA INTO mydataset.mytable PARTITION BY transaction_date CLUSTER BY customer_id OPTIONS ( partition_expiration_days = 3) FROM FILES( format = 'AVRO', uris = ['gs://bucket/path/file.avro']);
לוחצים על הפעלה.
מידע נוסף על הרצת שאילתות זמין במאמר הרצת שאילתה אינטראקטיבית.
API
כדי להגדיר תצורת אשכולות כשיוצרים טבלה באמצעות משימת טעינה, אפשר לאכלס את מאפייני הטבלה Clustering.
המשך
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Goהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Go API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
Java
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Javaהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Java API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
Python
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Pythonהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Python API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
לפני שמריצים דוגמאות קוד, צריך להגדיר את משתנה הסביבה GOOGLE_CLOUD_UNIVERSE_DOMAIN לערך s3nsapis.fr.
המאמרים הבאים
- מידע על עבודה עם טבלאות מקובצות זמין במאמר ניהול טבלאות מקובצות.
- מידע על שליחת שאילתות לטבלאות מקובצות זמין במאמר בנושא שליחת שאילתות לטבלאות מקובצות.
- לסקירה כללית על התמיכה בטבלאות מחולקות למחיצות ב-BigQuery, אפשר לעיין במאמר מבוא לטבלאות מחולקות למחיצות.
- במאמר יצירת טבלאות עם חלוקה למחיצות מוסבר איך ליצור טבלאות כאלה.
- סקירה כללית על
INFORMATION_SCHEMAזמינה במאמר מבוא ל-BigQueryINFORMATION_SCHEMA.