יכול להיות שחלק מהמידע בדף הזה או כולו לא רלוונטי ל-Cloud de Confiance by S3NS. פרטים נוספים מופיעים במאמר מה ההבדל מ-Google Cloud.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

ניהול נתונים בטבלה

במאמר הזה מוסבר איך לנהל נתונים בטבלאות ב-BigQuery. אפשר לעבוד עם נתונים מטבלאות BigQuery בדרכים הבאות:

טעינת נתונים לטבלה
הוספה לנתוני הטבלה או החלפה שלהם
עיון בנתונים בטבלה (או הצגתם בתצוגה מקדימה)
שאילתת נתונים בטבלה
שינוי נתונים בטבלה באמצעות שפת טיפול בנתונים (DML)
העתקת נתוני הטבלה
ייצוא נתוני טבלה

מידע על ניהול סכימות של טבלאות זמין במאמר שינוי סכימות של טבלאות.

לפני שמתחילים

מקצים תפקידים שמעניקים את ההרשאות הנדרשות למשתמשים שצריכים לבצע כל משימה במסמך הזה. ההרשאות שנדרשות (אם יש כאלה) לביצוע משימה מפורטות בקטע 'הרשאות נדרשות' של המשימה.

טעינת נתונים לטבלה

אפשר לטעון נתונים כשיוצרים טבלה, או ליצור טבלה ריקה ולטעון את הנתונים מאוחר יותר. כשמעלים נתונים, אפשר להשתמש בזיהוי אוטומטי של הסכימה עבור פורמטים נתמכים של נתונים, או לציין את הסכימה.

מידע נוסף על טעינת נתונים זמין במסמכי התיעוד לגבי הפורמט והמיקום של נתוני המקור:

מידע נוסף על טעינת נתונים מ-Cloud Storage
למידע נוסף על טעינת נתונים ממקור מקומי, ראו טעינת נתונים מקבצים מקומיים.

הוספה לנתוני הטבלה והחלפתם

אפשר להחליף נתונים בטבלה באמצעות פעולת טעינה או שאילתה. אפשר להוסיף נתונים לטבלה קיימת על ידי ביצוע פעולת טעינה והוספה, או על ידי הוספת תוצאות של שאילתה לטבלה.

מידע נוסף על הוספה לטבלה או על החלפה של טבלה בזמן טעינת נתונים זמין במסמכי התיעוד של פורמט נתוני המקור:

כדי להוסיף נתונים לטבלה או להחליף את הנתונים בטבלה באמצעות תוצאות של שאילתה, צריך לציין טבלת יעד ולהגדיר את פעולת הכתיבה לאחת מהאפשרויות הבאות:

הוספה לטבלה – הוספת תוצאות השאילתה לטבלה קיימת.
החלפת טבלה – החלפה של טבלה קיימת עם אותו שם באמצעות תוצאות השאילתה.

אפשר להשתמש בשאילתה הבאה כדי לצרף רשומות מטבלה אחת לטבלה אחרת:

  INSERT INTO <projectID>.<datasetID>.<table1> (
    <column2>,
    <column3>) (SELECT * FROM <projectID>.<datasetID>.<table2>)

מידע נוסף על שימוש בתוצאות של שאילתות כדי להוסיף נתונים או להחליף נתונים זמין במאמר כתיבת תוצאות של שאילתות.

עיון בנתוני הטבלה

אפשר לעיין בנתוני הטבלה או לקרוא אותם בדרכים הבאות:

שימוש במסוף Cloud de Confiance
שימוש בפקודה bq head של כלי שורת הפקודה של bq
קריאה לשיטת ה-API‏ tabledata.list
שימוש בספריות הלקוח

ההרשאות הנדרשות

כדי לקרוא נתונים מטבלה וממחיצה, צריך הרשאה לניהול זהויות והרשאות גישה (IAM) ‏bigquery.tables.getData.

כל אחד מתפקידי ה-IAM המוגדרים מראש הבאים כולל את ההרשאות שדרושות לכם כדי לעיין בנתונים של טבלאות ומחיצות:

roles/bigquery.dataViewer
roles/bigquery.dataEditor
roles/bigquery.dataOwner
roles/bigquery.admin

אם יש לכם הרשאה bigquery.datasets.create, אתם יכולים לעיין בנתונים בטבלאות ובמחיצות של מערכי הנתונים שאתם יוצרים.

במאמר תפקידים והרשאות מוגדרים מראש יש מידע נוסף על תפקידים והרשאות ב-IAM ב-BigQuery.

עיון בנתוני הטבלה

כדי לעיין בנתוני הטבלה:

המסוף

נכנסים לדף BigQuery במסוף Cloud de Confiance .

כניסה ל-BigQuery
בחלונית הימנית, לוחצים על כלי הניתוחים:

אם החלונית הימנית לא מוצגת, לוחצים על הרחבת החלונית הימנית כדי לפתוח אותה.
בחלונית Explorer, מרחיבים את הפרויקט, לוחצים על Datasets ואז בוחרים מערך נתונים.
לוחצים על סקירה כללית > טבלאות ובוחרים את הטבלה.
לוחצים על פרטים ורושמים את הערך שמופיע בשדה מספר השורות. יכול להיות שתצטרכו את הערך הזה כדי לשלוט בנקודת ההתחלה של התוצאות באמצעות כלי שורת הפקודה של BigQuery או ה-API.
לוחצים על תצוגה מקדימה. מוצג מדגם של מערך הנתונים.

שורת פקודה

מריצים את הפקודה bq head עם הדגל --max_rows כדי להציג רשימה של כל העמודות במספר מסוים של שורות בטבלה. אם לא מציינים ערך לפרמטר --max_rows, ברירת המחדל היא 100.

כדי לעיין בקבוצת משנה של עמודות בטבלה (כולל עמודות מוטמעות ועמודות חוזרות), משתמשים בדגל --selected_fields ומזינים את העמודות כרשימה מופרדת בפסיקים.

כדי לציין את מספר השורות שרוצים לדלג עליהן לפני הצגת נתוני הטבלה, משתמשים בדגל --start_row=integer (או בקיצור הדרך -s). ערך ברירת המחדל הוא 0. אפשר לאחזר את מספר השורות בטבלה באמצעות הפקודה bq show כדי לאחזר את פרטי הטבלה.

אם הטבלה שאתם מעיינים בה נמצאת בפרויקט שאינו פרויקט ברירת המחדל שלכם, צריך להוסיף את מזהה הפרויקט לפקודה בפורמט הבא: project_id:dataset.table.

bq head \
--max_rows integer1 \
--start_row integer2 \
--selected_fields "columns" \
project_id:dataset.table

כאשר:

‫integer1 הוא מספר השורות שיוצגו.
‫integer2 הוא מספר השורות שיש לדלג עליהן לפני הצגת הנתונים.
‫columns היא רשימה מופרדת בפסיקים של עמודות.
‫project_id הוא מזהה הפרויקט.
‫dataset הוא השם של מערך הנתונים שמכיל את הטבלה.
‫table הוא שם הטבלה שרוצים לעיין בה.

דוגמאות:

מזינים את הפקודה הבאה כדי להציג את כל העמודות ב-10 השורות הראשונות ב-mydataset.mytable. ‫mydataset נמצא בפרויקט ברירת המחדל שלכם.

bq head --max_rows=10 mydataset.mytable

מזינים את הפקודה הבאה כדי להציג את כל העמודות ב-100 השורות הראשונות ב-mydataset.mytable. mydataset נמצא בmyotherproject, ולא בפרויקט ברירת המחדל שלך.

bq head myotherproject:mydataset.mytable

מזינים את הפקודה הבאה כדי להציג רק את field1 ואת field2 ב-mydataset.mytable. הפקודה משתמשת בדגל --start_row כדי לדלג לשורה 100. ‫mydataset.mytable נמצא בפרויקט ברירת המחדל שלכם.

bq head --start_row 100 --selected_fields "field1,field2" mydataset.mytable

מכיוון שהפקודה bq head לא יוצרת עבודת שאילתה, פקודות bq head לא מופיעות בהיסטוריית השאילתות, ולא תחויבו עליהן.

API

כדי לעיין בנתונים של טבלה, צריך להפעיל את tabledata.list. מציינים את שם הטבלה בפרמטר tableId.

אפשר להגדיר את הפרמטרים האופציונליים האלה כדי לשלוט בפלט:

‫maxResults — המספר המקסימלי של תוצאות להחזרה
‫selectedFields — רשימה של עמודות להחזרה, מופרדות בפסיקים. אם לא מצוין, כל העמודות מוחזרות.
‫startIndex – אינדקס מבוסס-אפס של שורת ההתחלה לקריאה

הערכים מוחזרים כשהם עטופים באובייקט JSON שצריך לנתח, כפי שמתואר במסמכי העיון של tabledata.list.