סקירה כללית על AI שניתן להסבר ב-BigQuery

במאמר הזה מוסבר איך BigQuery ML תומך בבינה מלאכותית (AI) שניתן להסביר אותה, לפעמים נקראת XAI.

ה-AI שניתן להסבר עוזר לכם להבין את התוצאות שמודל למידת המכונה החזוי שלכם יוצר למשימות סיווג ורגרסיה, על ידי הגדרת התרומה של כל תכונה בשורה של נתונים לתוצאה החזויה. המידע הזה נקרא בדרך כלל שיוך תכונות. אתם יכולים להשתמש במידע הזה כדי לוודא שהמודל מתנהג כמצופה, כדי לזהות הטיות במודלים וכדי לקבל מידע שיעזור לכם לשפר את המודל ואת נתוני האימון.

גם BigQuery ML וגם Gemini Enterprise Agent Platform מציעים פתרונות AI הניתנים להסברה, הכוללים הסברים מבוססי-פיצ'רים. אפשר לבצע הסבר ב-BigQuery ML, או לרשום את המודל ב-Agent Platform ולבצע הסבר שם.

יכולת הסברה מקומית לעומת יכולת הסברה גלובלית

יש שני סוגים של יכולת הסברה: יכולת הסברה מקומית ויכולת הסברה גלובלית. הם נקראים גם חשיבות מקומית של מאפיינים וחשיבות גלובלית של מאפיינים.

  • יכולת הסברה מקומית מחזירה ערכי שיוך של תכונות לכל דוגמה מוסברת. הערכים האלה מתארים את מידת ההשפעה של תכונה מסוימת על התחזית ביחס לתחזית הבסיסית.
  • יכולת הסברה גלובלית מחזירה את ההשפעה הכוללת של התכונה על המודל, ולרוב מתקבלת על ידי צבירת שיוכי התכונה על פני קבוצת הנתונים כולה. ערך מוחלט גבוה יותר מצביע על כך שהתכונה השפיעה יותר על התחזיות של המודל.

פתרונות AI הניתן להסברה ב-BigQuery ML

‫AI ניתן להסברה ב-BigQuery ML תומך במגוון מודלים של למידת מכונה, כולל מודלים של סדרות זמנים ומודלים שאינם של סדרות זמנים. כל אחד מהמודלים משתמש בשיטה שונה להסבר.

קטגוריית המודל סוגי מודלים שיטת ההסברה הסבר בסיסי על השיטה פונקציות הסבר מקומיות פונקציות הסבר גלובליות
מודלים בפיקוח רגרסיה לינארית ולוגיסטית ערכי Shapley ערכי Shapley למודלים ליניאריים שווים ל-model weight * feature value, כאשר ערכי המאפיינים הם סטנדרטיים והמשקלים של המודל מאומנים עם ערכי המאפיינים הסטנדרטיים. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
שגיאות תקניות וערכי P סטיית התקן וערכי ה-p משמשים לבדיקת מובהקות ביחס למשקלים של המודל. לא רלוונטי ML.ADVANCED_WEIGHTS4
Boosted trees

Random forest
Tree SHAP ‫Tree SHAP הוא אלגוריתם לחישוב ערכי SHAP מדויקים למודלים שמבוססים על עץ החלטות. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
חישוב צריכת הנתונים המשוערת הערכה של ערכי התרומה של התכונה. הוא מהיר ופשוט יותר בהשוואה ל-Tree SHAP. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
חשיבות התכונות על סמך מדד ג'יני ציון חשיבות גלובלי של תכונה שמציין כמה שימושית או חשובה הייתה כל תכונה בבניית מודל העץ המחוזק או מודל היער האקראי במהלך האימון. לא רלוונטי ML.FEATURE_IMPORTANCE
רשת נוירונים עמוקה (DNN)

Wide-and-Deep
Integrated gradients שיטה שמבוססת על גרדיאנטים ומחשבת ביעילות את שיוכי התכונות, עם אותם מאפיינים אקסיומטיים כמו ערך Shapley. היא מספקת אומדן מבוסס-דגימה של שיוכים מדויקים של תכונות. הדיוק שלו נקבע על ידי הפרמטר integrated_gradients_num_steps. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
AutoML Tables דגימת Shapley מודל Shapley עם דגימה מקצה קרדיט לתוצאה של המודל לכל תכונה, ומתחשב בפרמוטציות שונות של התכונות. השיטה הזו מספקת קירוב של ערכי Shapley המדויקים על סמך דגימה. לא רלוונטי ML.GLOBAL_EXPLAIN2
מודלים של סדרות זמנים ARIMA_PLUS פירוק של סדרות עיתיות מפרק את סדרת הזמנים לכמה רכיבים אם הרכיבים האלה קיימים בסדרת הזמנים. המרכיבים כוללים מגמה, עונתיות, חגים, שינויים הדרגתיים, ושיאים ושפל. פרטים נוספים זמינים במאמר בנושא modeling pipeline של ARIMA_PLUS. ML.EXPLAIN_FORECAST3 לא רלוונטי
ARIMA_PLUS_XREG פירוק של סדרות זמן
ו-
ערכי Shapley
מפרק את סדרת הזמנים למספר רכיבים, כולל מגמה, עונתיות, חגים, שינויים הדרגתיים, עליות וירידות חדות (בדומה ל-ARIMA_PLUS). השיוך של כל רגרסור חיצוני מחושב על סמך ערכי Shapley, ששווים ל-model weight * feature value. ML.EXPLAIN_FORECAST3 לא רלוונטי

1ML_EXPLAIN_PREDICT היא גרסה מורחבת של ML.PREDICT.

2ML.GLOBAL_EXPLAIN מחזירה את ההסבר הגלובלי שמתקבל על ידי חישוב השיוך המוחלט הממוצע שכל מאפיין מקבל לכל השורות בקבוצת הנתונים של ההערכה.

3ML.EXPLAIN_FORECAST היא גרסה מורחבת של ML.FORECAST.

4ML.ADVANCED_WEIGHTS היא גרסה מורחבת של ML.WEIGHTS.

AI ניתן להסברה ב-Agent Platform

AI ניתן להסברה זמין ב-Agent Platform עבור קבוצת המשנה הבאה של מודלים של למידה מפוקחת שאפשר לייצא:

סוג המודל שיטת AI שניתנת להסברה
dnn_classifier הדרגות משולבות
dnn_regressor הדרגות משולבות
dnn_linear_combined_classifier הדרגות משולבות
dnn_linear_combined_regressor הדרגות משולבות
boosted_tree_regressor דגימה של ערכי Shapley
boosted_tree_classifier דגימה של ערכי Shapley
random_forest_regressor דגימה של ערכי Shapley
random_forest_classifier דגימה של ערכי Shapley

מידע נוסף על השיטות האלה

הפעלת AI שניתן להסביר במרשם המודלים

אם מודל BigQuery ML רשום במרשם המודלים, ואם זה סוג מודל שתומך ב-AI ניתן להסברה, אפשר להפעיל את AI ניתן להסברה במודל כשפורסים אותו לנקודת קצה. כשרושמים את מודל BigQuery ML, כל המטא-נתונים המשויכים מאוכלסים באופן אוטומטי.

  1. רישום מודל BigQuery ML במאגר המודלים.
  2. עוברים לדף מרשם המודלים מהקטע BigQuery במסוף Cloud de Confiance .
  3. ממרשם המודלים, בוחרים את מודל ה-BigQuery ML ולוחצים על גרסת המודל כדי לעבור לדף הפרטים של המודל.
  4. בוחרים באפשרות פעולות נוספות מגרסת המודל.
  5. לוחצים על Deploy to endpoint.
  6. מגדירים את נקודת הסיום – יוצרים שם לנקודת הסיום ולוחצים על 'המשך'.
  7. בוחרים סוג מכונה, לדוגמה, n1-standard-2.
  8. בקטע Model settings, בקטע logging, מסמנים את תיבת הסימון כדי להפעיל את האפשרויות של Explainability.
  9. לוחצים על Done (סיום) ואז על Continue (המשך) כדי לפרוס את ה-API בנקודת הקצה.

כדי ללמוד איך להשתמש ב-XAI במודלים שלכם מ-מרשם המודלים, אפשר לעיין במאמר קבלת הסבר אונליין באמצעות המודל שפרסתם.

המאמרים הבאים