סקירה כללית של ניתוח נתוני השיחות

ניתוח נתוני שיחות ב-BigQuery מאפשר לכם לשוחח עם סוכנים על הנתונים שלכם באמצעות שפה טבעית. כדי לקבל תשובות לגבי הנתונים שלכם, אתם יכולים:

  • ליצור סוכני נתונים שמגדירים באופן אוטומטי את הקשר של הנתונים ואת הוראות העיבוד של שאילתות עבור קבוצה של מקורות ידע, כמו טבלאות, תצוגות, גרפים או פונקציות בהגדרת משתמש (UDF) שאתם בוחרים.
  • אם צריך, אפשר ליצור הקשר והוראות לסוכן בצורה של מטא-נתונים של טבלאות ושדות בהתאמה אישית, הוראות לסוכן לפרש את הנתונים ולשאול עליהם שאילתות, או על ידי יצירת שאילתות מאומתות (שנקראו בעבר שאילתות מוזהבות) כדי להגדיר את סוכן הנתונים כך שיענה ביעילות על שאלות בתרחישי שימוש ספציפיים.

לפני שמתאימים אישית סוכן, מומלץ קודם לעבוד עם ההקשר וההוראות שהסוכן יוצר.

דוגמאות להקשר ולהנחיות שאתם יכולים לספק לסוכן:

  • הקשר. אפשר להגדיר סוכן נתונים לניתוח מכירות כך שיבין שהמונח 'המובילים' מתייחס לנציגי מכירות עם ההכנסה הגבוהה ביותר, ולא רק לנציגי מכירות שסגרו הכי הרבה עסקאות.
  • הוראות אתם יכולים להנחות את סוכן הנתונים לסנן תמיד את הנתונים לפי הרבעון האחרון כשמבקשים ממנו מידע על 'מגמות', או לקבץ את התוצאות לפי 'קטגוריית מוצר' כברירת מחדל.

אחרי שיוצרים סוכני נתונים, אפשר לנהל איתם שיחות כדי לשאול שאלות על נתוני BigQuery באמצעות שפה טבעית. אתם יכולים גם ליצור שיחות ישירות עם מקור נתונים אחד או יותר כדי לקבל תשובות לשאלות בסיסיות חד-פעמיות.

ניתוח שיחות מבוסס על Gemini for Google Cloud ותומך בחלק מהפונקציות של AI ו-ML ב-BigQuery. מידע נוסף זמין במאמר בנושא תמיכה ב-AI וב-ML ב-BigQuery.

איך Gemini for Cloud de Confiance ‎ משתמש בנתונים שלכם, ובאילו מקרים.

סוכני נתונים

סוכני נתונים מורכבים ממקור ידע אחד או יותר, ומקבוצת הוראות ספציפיות לתרחיש לדוגמה לעיבוד הנתונים. כשיוצרים סוכן נתונים, אפשר להגדיר אותו באמצעות האפשרויות הבאות:

  • שימוש במקורות ידע כמו טבלאות, תצוגות ופונקציות מוגדרות על ידי המשתמש (UDF) באמצעות סוכן נתונים. אפשר גם להתחבר לטבלאות Lakehouse כמקורות. מידע נוסף זמין במאמר שליחת שאילתות לנתוני Lakehouse בשפה טבעית.
  • מספקים מטא-נתונים של טבלאות ושדות בהתאמה אישית כדי לתאר את הנתונים בצורה המתאימה ביותר לתרחיש השימוש הנתון.
  • לספק הוראות לפרשנות ולשאילתות של הנתונים, למשל להגדיר את הפרטים הבאים:
    • מילים נרדפות ומונחים עסקיים לשמות של שדות
    • השדות הכי חשובים וערכי ברירת המחדל לסינון ולקיבוץ
  • יוצרים שאילתות מאומתות שהסוכן לגישה לנתונים יכול להשתמש בהן כדי להתאים את מבנה התשובה של הסוכן וללמוד את הלוגיקה העסקית שבה הארגון משתמש. בעבר, שאילתות מאומתות נקראו שאילתות מוצלחות. שאילתות מאומתות יכולות להשתמש בפונקציות נתמכות של AI ו-ML ב-BigQuery, והן תומכות בפרמטרים של שאילתות.
  • יוצרים מונחים מותאמים אישית במילון המונחים של BigQuery לכל סוכן או מייבאים מונחים במילון המונחים העסקי מ-Knowledge Catalog. המונחים האלה עוזרים לסוכן לפרש את ההנחיות של המשתמשים. במאמר יצירה או בדיקה של מונחים במילון המונחים מפורטות המלצות לגבי מתי כדאי להשתמש בכל סוג.

ניהול סוכני נתונים

בכרטיסייה Agent Catalog במסוף Cloud de Confiance , אפשר ליצור סוכני נתונים מהסוגים הבאים, לנהל אותם ולעבוד איתם:

  • סוכן לדוגמה מוגדר מראש לכל פרויקט Cloud de Confiance .
  • רשימה של סוכנים שנמצאים בטיוטה, סוכנים שנוצרו וסוכנים שפורסמו.
  • רשימה של סוכנים שאנשים אחרים יוצרים ומשתפים איתכם.

מידע נוסף זמין במאמר יצירת סוכני נתונים.

שירותים אחרים בפרויקט שתומכים בסוכני נתונים, כמו Conversational Analytics API ו-Data Studio, יכולים לגשת לסוכני נתונים שיוצרים ב-BigQuery. אפשר גם לגשת לסוכן שנוצר במסוף Cloud de Confiance על ידי קריאה אליו באמצעות Conversational Analytics API.

שיחות

שיחות הן צ'אטים שנשמרים עם סוכן נתונים או מקור נתונים. אתם יכולים לשאול את סוכני הנתונים שאלות מורכבות שכוללות מונחים נפוצים כמו 'מכירות' או 'הכי פופולרי', בלי שתצטרכו לציין שמות של שדות בטבלה או להגדיר תנאים לסינון הנתונים. אפשר גם לשאול שאלות לגבי נתונים שנמצאים באובייקטים כמו קובצי PDF. כשסוכן יוצר תשובה, הוא יכול לקבוע אילו מקורות נתונים לשלוח להם שאילתות, ולהשתמש באופטימיזציות כמו חלוקת טבלאות או אינדקסים של חיפושים.

התשובה שמתקבלת בצ'אט כוללת את התכונות הבאות:

  • התשובה לשאלה שלכם כטקסט, קוד או תמונות (מולטי-מודאלי). התשובה יכולה לכלול פונקציות נתמכות של AI ו-ML ב-BigQuery.
  • יצירת תרשימים במקומות המתאימים.
  • ההסבר של הנציג לגבי התוצאות.
  • מטא-נתונים על השיחה, כמו הסוכן ומקורות הנתונים שבהם נעשה שימוש.

כשיוצרים שיחה ישירה עם מקור נתונים, Conversational Analytics API מפרש את השאלה בלי ההקשר והוראות העיבוד שסוכן נתונים מספק. לכן, התוצאות של שיחות ישירות יכולות להיות פחות מדויקות. כדאי להשתמש בסוכני נתונים במקרים שבהם נדרשת רמת דיוק גבוהה יותר.

אפשר ליצור ולנהל שיחות ב-BigQuery באמצעות מסוףCloud de Confiance . מידע נוסף זמין במאמר ניתוח נתונים באמצעות שיחות.

תמיכה ב-AI וב-ML ב-BigQuery

ניתוח נתונים בשיחה תומך בפונקציות ה-AI הבאות בתגובה לשיחות עם סוכני נתונים ומקורות נתונים, ובשאילתות SQL מאומתות שאתם יוצרים.

כדי להריץ שאילתות של AI גנרטיבי, צריך לוודא שיש לכם את ההרשאות הנדרשות.

הסוכן משתמש בפונקציה AI.SEARCH רק בטבלאות שבהן מופעלת יצירה אוטונומית של הטמעה. אחרת, הסוכן משתמש בפונקציה AI.SIMILARITY, שדורשת יצירת הטמעה בזמן אמת.

תרחישים לדוגמה

כדי להפעיל פונקציות נתמכות, משתמשים בהן באחת מהדרכים הבאות:

  • כשיוצרים סוכן ומוסיפים שאילתה מאומתת – למשל, אם אתם מדעני נתונים שמכינים דוח חוזר – אפשר להשתמש בפונקציות AI נתמכות בשאילתה מאומתת כדי לתאר ברירות מחדל ולהפוך את הדוח לאוטומטי.
  • כששואלים סוכן שאלות כלליות לגבי נתונים, בשיחה או בשאילתה מאומתת באמצעות מילות מפתח, הסוכן יוצר SQL בתגובה לשאלות.

בטבלה הבאה מוצגות דוגמאות להנחיות מדוגמה אחת שמפעילות את השימוש בפונקציות של AI או ML:

תרחיש שימוש דוגמאות לשימוש מערך נתונים ציבורי
תחזיות ‫"Predict the number of trips for the next month" (תחזית לגבי מספר הנסיעות בחודש הבא). bigquery-public-data.san_francisco_bikeshare.bikeshare_trips
זיהוי חריגה ‫"Find outliers in trips per day for 2018 using 2017 as a baseline." bigquery-public-data.san_francisco_bikeshare.bikeshare_trips
גורמים מרכזיים ‫"Identify the key drivers for changes in trip volume between 2017 and 2018" (זיהוי הגורמים העיקריים לשינויים בנפח הנסיעות בין 2017 ל-2018). bigquery-public-data.austin_bikeshare.bikeshare_trips
יצירת טקסט על ידי מודל שפה גדול (LLM) "לכל כתבה בקטגוריה 'ספורט', סכם את העמודה 'גוף הכתבה' במשפט אחד או שניים". bigquery-public-data.bbc_news.fulltext
סינון סמנטי "תסנן את המאמרים בקטגוריית הטכנולוגיה כדי למצוא מאמרים שדנים בפריצות דרך בתחום הבינה המלאכותית". bigquery-public-data.bbc_news.fulltext
דירוג סמנטי ‫"For the articles in the entertainment category, provide a rating indicating their degree of positive sentiment." bigquery-public-data.bbc_news.fulltext
סיווג סמנטי "תתייג כל ביקורת לפי הנושא העיקרי של המבקר: משחק, עלילה, צילום, בימוי או אחר" bigquery-public-data.imdb.reviews
חיפוש סמנטי ‫"Find the top 5 reviews that most closely match 'tension-building psychological thriller'" ‏(מצא את 5 הביקורות המובילות שהכי קרובות לתיאור 'מותחן פסיכולוגי עם מתח הולך וגובר') bigquery-public-data.imdb.reviews

תמיכה בתרשימים

ניתוח שיחות תומך בשימוש בגרף כמקור נתונים. כששואלים שאלות על הגרף, הסוכן יוצר שאילתות GQL או SQL כדי לענות עליהן. נציגים יכולים להשתמש ב תיאורים ובמילים נרדפות שאתם מגדירים בתוויות ובמאפיינים של הגרף כדי לשפר את איכות התוצאות. סוכנים יכולים גם להשתמש במדדים שמוגדרים בתרשים כדי לבצע צבירה רב-רמתית. אם התשובה כוללת נתיבי גרף, מוצגים תרשימים של הגרף.

לדוגמה, אפשר להשתמש בסוכן לדוגמה Look Graph ב-BigQuery בדף הסוכנים כדי לשאול שאלות דומות לשאלות הבאות לגבי הגרף bigquery-public-data.thelook_ecommerce.graph:

  • Which product is most popular among 25-year-olds?
  • Show me the connection between bow tie orders and distribution centers

מגבלות

ההגבלות הבאות חלות כשמשתמשים בתרשים כמקור נתונים:

  • אפשר להשתמש בתרשים אחד לכל היותר כמקור נתונים לכל סוכן או שיחה.
  • אי אפשר לשלב טבלאות וגרפים כמקורות נתונים.

אבטחה

אתם יכולים לנהל את הגישה לניתוח נתוני השיחות ב-BigQuery באמצעות תפקידים והרשאות של IAM ב-Conversational Analytics API. במאמרים התפקידים הנדרשים של סוכן הנתונים והתפקידים הנדרשים של שיחות מפורט מידע על התפקידים שנדרשים לפעולות ספציפיות.

ניתוח שיחות כולל את תכונות האבטחה ואמצעי ההגנה הבאים:

  • הוא יכול לגשת רק לנתונים ולמשאבים שיש לכם הרשאה לגשת אליהם.
  • הוא פועל בהתאם לאמצעי האבטחה של VPC-SC.
  • היא לא יכולה לבצע פעולות כתיבה ולא יכולה להריץ שאילתות DML.
  • הוא לא יכול להריץ פונקציות מרחוק.
  • הוא יכול לגשת רק למקורות מידע שאתם בוחרים באופן מפורש.
  • היסטוריית השיחות שלכם משותפת רק איתכם. אי אפשר לשתף אותו עם משתמשים אחרים.
  • כשיוצרים סוכן נתונים, צריך להיות לכם גישה לשאילתות של כל מקור ידע שאתם מוסיפים.

מיקומים

ניתוח שיחות תומך בשלושה מיקומים שקובעים את האחסון של משאבי הסוכן והשיחה, ואת המיקום שמשמש לעיבוד למידת מכונה:

  • מספר אזורים בארה"ב
  • מספר אזורים באיחוד האירופי
  • עולמי

ההתנהגויות הבאות מוגדרות כברירת מחדל כשיוצרים סוכנים ושיחות:

  • אם כל מקורות הידע שלכם מגיעים מאזורים בארה"ב, המערכת משתמשת ב-MREP בארה"ב.
  • אם כל מקורות הידע שלכם מגיעים מאזורים באיחוד האירופי, המערכת משתמשת ב-MREP באיחוד האירופי.
  • אחרת, נעשה שימוש במיקום הגלובלי.

כשיוצרים סוכן, אפשר לבחור מיקום אחר. אחרי ששומרים את הסוכן, אי אפשר לשנות את המיקום שלו.

סוכנים שנוצרו לפני 4 ביוני 2026 נמצאים במיקום הגלובלי.

תמחור

החיוב על שאילתות שמופעלות כשיוצרים סוכני נתונים ומנהלים שיחות עם סוכני נתונים או עם מקורות נתונים הוא לפי תמחור של BigQuery Compute. מידע נוסף זמין במאמר בנושא תמחור של סוכנים.

שיטות מומלצות

כדאי לפעול לפי השיטות המומלצות הבאות כשעובדים עם ניתוח שיחות:

  • לפני שמוסיפים את הטבלאות כמקורות נתונים, מבצעים ניקוי נתונים בטבלאות.

  • אפשר לאחד טבלאות קשורות בתצוגה ולהשתמש בתצוגה הזו כמקור נתונים, במקום להסתמך על הסוכן שיקבע את הדרך הנכונה לאיחוד הנתונים.

  • מריצים סריקות של פרופילים על הנתונים.

  • הגדרת ההיקף של הסוכנים. לסוכנים עם היקף רחב יכולים להיות סתירות בהוראות, פלט מעורפל וביצועים לא עקביים. אם הסוכן שלכם צריך יותר מ-20 מקורות נתונים, אם הוא משמש צוותים שמשתמשים בהגדרות שונות של מדדים או אם הוא נותן עדיפות לסוג אחד של תוצאות על חשבון סוג אחר, כדאי ליצור סוכנים נוספים.

  • מספקים הקשר לסוכן. הסדר שבו כדאי לתת עדיפות לסוגי ההקשר הוא:

    1. שאילתות מאומתות. שאילתות SQL דטרמיניסטיות שמופעלות כשהן תואמות להנחיית משתמש.
    2. מילוני מונחים. הגדרות של מונחים שמקשרים עמודות להקשר סמנטי.
    3. הוראות לסוכן הגדרות וכללים גלובליים שכתובים בשפה טבעית, כמו הגדרות של לוח שנה פיסקלי או כללי עיצוב.
  • מוסיפים תיאורים לטבלאות ולעמודות.

  • אל תשכפלו הגדרות של מונחים במילון המונחים ב-Knowledge Catalog ובמילון המונחים המותאם אישית ב-BigQuery.

  • כדי לנהל את העלויות של הסוכנים, אפשר להגדיר מגבלות הוצאה ברמת הפרויקט, ברמת המשתמש וברמת השאילתה.

  • איך שואלים שאלות יעילות בשיחות.

  • הסבר על שמירה ומחיקה של נתונים בשיחות עם סוכני נתונים.

מגבלות

מידע נוסף על מגבלות בנוגע לשאילתות, לשיחות, לנתונים ולתצוגות חזותיות זמין במאמר מגבלות ידועות של Conversational Analytics API.

מכסת נפח משותפת דינמית

מכסת השימוש המשותפת הדינמית (DSQ) ב-Gemini Enterprise Agent Platform מנהלת את הקיבולת של מודל Gemini. בניגוד למכסות רגילות, DSQ מאפשרת לכם לגשת למאגר גדול של משאבים משותפים ללא מגבלה קבועה לכל פרויקט על תפוקת המודל.

הביצועים, כמו זמן האחזור, עשויים להשתנות בהתאם לעומס הכולל של המערכת. בזמנים של ביקוש גבוה במאגר המשותף, יכול להיות שתיתקלו מדי פעם בשגיאות זמניות של 429 Resource Exhausted. השגיאות האלה מצביעות על כך שהקיבולת של המאגר המשותף מוגבלת באופן זמני, אבל לא על כך שהגעתם למגבלת מכסה ספציפית בפרויקט. כדי לבדוק את הקיבולת, צריך לנסות לשלוח את הבקשה שוב אחרי השהיה קצרה.

זיהוי וניתוח של שאילתות שנוצרו על ידי סוכנים

משימות BigQuery שמבוצעות על ידי סוכן נתונים כוללות תוויות ספציפיות. התוויות האלה מאפשרות לכם לזהות, לסנן ולנתח את המשימות של הסוכן.

אפשר להשתמש בתוויות האלה למשימות הבאות:

זיהוי התוויות של סוכן הנתונים במסוף Cloud de Confiance

‫BigQuery מוסיף תוויות למשימות שמופעלות על ידי סוכן נתונים. כדי לקבל את מפתח התווית לסינון ולניתוח אחר, אפשר לראות את מפתח התווית בCloud de Confiance מסוף.

כדי לראות את מפתח התווית של סוכן נתונים:

  1. במסוף Cloud de Confiance , צופים בפרטי המשימה.

  2. בחלונית Query job details (שאילתת פרטי משרה), מאתרים את הקטע Labels (תוויות) ומחפשים תוויות עם הקידומת ca, כמו ca-bq-job: true.

ניתוח של עבודות שנוצרו על ידי סוכנים

אפשר להשתמש בתווית כדי לנתח את המשימות שנוצרו על ידי הסוכן. לדוגמה, כדי לבדוק כמה משימות הופעלו על ידי סוכן נתונים, מריצים את השאילתה הבאה על התצוגה INFORMATION_SCHEMA.JOBS:

SELECT
  COUNT(*) AS job_count
FROM
  `PROJECT_ID`.`region-REGION`.INFORMATION_SCHEMA.JOBS
WHERE
  EXISTS (
    SELECT 1
    FROM UNNEST(labels) AS label
    WHERE label.key = 'ca-bq-job' AND label.value = 'true'
  );

מחליפים את מה שכתוב בשדות הבאים:

  • PROJECT_ID: מזהה הפרויקט ב- Cloud de Confiance .
  • REGION: האזור שבו המשימות פועלות (לדוגמה, us או eu).

המאמרים הבאים