סקירה כללית על AI גנרטיבי
במאמר הזה מתוארות הפונקציות של בינה מלאכותית (AI) גנרטיבית שנתמכות ב-BigQuery. הפונקציות האלה מקבלות קלט בשפה טבעית ומשתמשות במודלים של Vertex AI שעברו אימון מראש ובמודלים מובנים של BigQuery.
סקירה כללית
ב-BigQuery יש מגוון פונקציות AI שיכולות לעזור לכם במשימות כמו:
- ליצור תוכן יצירתי.
- לנתח טקסט או נתונים לא מובנים, כמו תמונות, לזהות סנטימנטים ולענות על שאלות.
- לסכם את הרעיונות המרכזיים או את הרושם שמתקבל מהתוכן.
- חילוץ נתונים מובְנים מטקסט.
- סיווג טקסט או נתונים לא מובנים לקטגוריות שהוגדרו על ידי המשתמש.
- ליצור הטמעות כדי לחפש טקסט, תמונות וסרטונים דומים.
- לדרג את הקלט כדי למיין אותו לפי איכות, דמיון או קריטריונים אחרים.
הקטגוריות הבאות של פונקציות AI יעזרו לכם לבצע את המשימות האלה:
פונקציות AI לשימוש כללי: הפונקציות האלה מאפשרות לכם שליטה מלאה ושקיפות בבחירת המודל, ההנחיה והפרמטרים לשימוש.
ביצוע הסקה של LLM, למשל כדי לענות על שאלות לגבי הנתונים
-
AI.GENERATEהיא פונקציית ההסקה הכי גמישה, שמאפשרת לכם לנתח כל נתון מובנה או לא מובנה. -
AI.GENERATE_TEXTהיא גרסה שלAI.GENERATEשמחזירה ערך של טבלה, ותומכת גם במודלים של שותפים ובמודלים פתוחים.
-
יצירת פלט מובנה, כמו שליפת שמות, כתובות או תיאורי אובייקטים מטקסט, מסמכים או תמונות.
AI.GENERATE, כשמציינים סכימת פלט.-
AI.GENERATE_TABLEהיא גרסה שלAI.GENERATEשמחזירה טבלה, קוראת למודל מרוחק ומאפשרת לכם לציין סכימת פלט מותאמת אישית. - אם סכימת הפלט כוללת שדה יחיד, אפשר להשתמש באחת מהפונקציות הייעודיות:
AI.GENERATE_BOOL,AI.GENERATE_DOUBLEאוAI.GENERATE_INT.
יצירת הטמעות לחיפוש סמנטי ולאשכול
-
AI.EMBED: יצירת הטמעה מנתוני טקסט או תמונה. -
AI.GENERATE_EMBEDDING: פונקציה שמחזירה טבלה ומוסיפה לטבלה עמודה של נתוני טקסט, תמונה, אודיו, סרטון או מסמך מוטמעים.
-
פונקציות AI מנוהלות: הפונקציות האלה כוללות תחביר יעיל והן מותאמות לעלות ולאיכות.
סינון הנתונים באמצעות תנאים בשפה טבעית
AI.IF
דירוג הקלט, למשל לפי איכות או סנטימנט
AI.SCORE
סיווג קלט לקטגוריות שהוגדרו על ידי המשתמש
AI.CLASSIFY
פונקציות ספציפיות למשימות: הפונקציות האלה משתמשות בממשקי Cloud AI API כדי לעזור לכם לבצע משימות כמו עיבוד שפה טבעית, תרגום אוטומטי, עיבוד מסמכים, תמלול אודיו וראייה ממוחשבת.
פונקציות AI לשימוש כללי
פונקציות AI לשימוש כללי מאפשרות לכם שליטה מלאה ושקיפות בבחירת המודל, ההנחיה והפרמטרים לשימוש. הפלט שלהם כולל מידע מפורט על הפנייה למודל, כולל הסטטוס והתשובה המלאה של המודל, שעשויה לכלול מידע על דירוג הבטיחות או ציטוטים.
ביצוע הסקת מסקנות על ידי מודל שפה גדול (LLM)
הפונקציה AI.GENERATE היא פונקציית הסקה גמישה שפועלת על ידי שליחת בקשות למודל Gemini ב-Vertex AI והחזרת התשובה של המודל. אפשר להשתמש בפונקציה הזו כדי לנתח נתונים של טקסט, תמונה, אודיו, סרטון או PDF. לדוגמה, אפשר לנתח תמונות של ריהוט לבית כדי ליצור טקסט לעמודה design_type, כך שלמק"ט הריהוט יהיה תיאור משויך, כמו mid-century modern או farmhouse.
אתם יכולים לבצע משימות של AI גנרטיבי באמצעות מודלים מרוחקים ב-BigQuery ML כדי להפנות למודלים שנפרסו ב-Vertex AI או מתארחים בו באמצעות הפונקציה AI.GENERATE_TEXT שיוצרת טבלה.
אפשר להשתמש בסוגים הבאים של מודלים מרוחקים:
מודלים מרוחקים על כל אחד ממודלי Gemini שזמינים בדרך כלל או בגרסת טרום-השקה כדי לנתח תוכן של טקסט, תמונה, אודיו, וידאו או PDF מטבלאות רגילות או מטבלאות אובייקטים באמצעות הנחיה שאתם מספקים כארגומנט של פונקציה.
מודלים מרוחקים של Anthropic Claude, Mistral AI או Llama, או מודלים נתמכים בקוד פתוח, כדי לנתח הנחיה שאתם מספקים בשאילתה או מעמודה בטבלה רגילה.
כדי להתנסות ביצירת טקסט ב-BigQuery ML, אפשר לעיין בנושאים הבאים:
- ליצור טקסט באמצעות מודל Gemini והפונקציה
AI.GENERATE_TEXT. - יצירת טקסט באמצעות מודל Gemma והפונקציה
AI.GENERATE_TEXT. - ניתוח תמונות באמצעות מודל Gemini.
- יצירת טקסט באמצעות הפונקציה
AI.GENERATE_TEXTעם הנתונים שלכם. - איך משפרים מודל באמצעות הנתונים שלכם
במודלים מסוימים, אפשר גם להגדיר התאמה מפוקחת, שמאפשרת לאמן את המודל על הנתונים שלכם כדי שיתאים יותר לתרחיש השימוש שלכם. כל ההסקה מתבצעת ב-Vertex AI. התוצאות מאוחסנות ב-BigQuery.
יצירת נתונים מובְנים
יצירת נתונים מובנים דומה מאוד ליצירת טקסט, אבל אפשר לעצב את התשובה מהמודל על ידי ציון סכימת SQL. לדוגמה, אפשר ליצור טבלה שמכילה את השם, מספר הטלפון, הכתובת, הבקשה והצעת המחיר של לקוח מתוך תמליל של שיחת טלפון.
אפשר ליצור נתונים מובְנים בדרכים הבאות:
הפונקציה
AI.GENERATEקוראת לנקודת קצה של Vertex AI ויכולה ליצור ערךSTRUCTעם הסכימה המותאמת אישית שלכם.כדי לנסות את התכונה, אפשר לקרוא איך משתמשים בפלט מובנה כשמפעילים את הפונקציה
AI.GENERATE.הפונקציה
AI.GENERATE_TABLEקוראת למודל מרוחק והיא פונקציה שמחזירה טבלה עם הסכימה המותאמת אישית שלכם.כדי לנסות ליצור נתונים מובְנים, אפשר לעיין במאמר בנושא יצירת נתונים מובְנים באמצעות הפונקציה
AI.GENERATE_TABLE.בשדה פלט יחיד, אפשר להשתמש באחת מפונקציות ההסקה המיוחדות הבאות:
יצירת הטמעות
הטמעה היא וקטור מספרי רב-ממדי שמייצג ישות נתונה, כמו קטע טקסט או קובץ אודיו. יצירת הטמעות מאפשרת לכם לתעד את הסמנטיקה של הנתונים באופן שמקל על ניתוח הנתונים והשוואה ביניהם.
אלה כמה תרחישי שימוש נפוצים להטמעת יצירה:
- שימוש ב-RAG (יצירה משופרת באמצעות אחזור) כדי לשפר את התשובות של המודל לשאילתות של משתמשים על ידי הפניה לנתונים נוספים ממקור מהימן. RAG מספקת דיוק עובדתי טוב יותר ועקביות בתגובות, וגם גישה לנתונים חדשים יותר מנתוני האימון של המודל.
- ביצוע חיפוש מולטי-מודאלי. לדוגמה, שימוש בהזנת טקסט כדי לחפש תמונות.
- ביצוע חיפוש סמנטי כדי למצוא פריטים דומים להמלצות, להחלפה ולביטול כפילויות ברשומות.
- יצירת הטמעות לשימוש עם מודל k-means לאשכול.
מידע נוסף על יצירת הטמעות ושימוש בהן לביצוע המשימות האלה זמין במאמר מבוא להטמעות ולחיפוש וקטורי.
פונקציות AI מנוהלות
פונקציות AI מנוהלות מיועדות לאוטומציה של משימות שגרתיות, כמו סיווג, סידור או סינון. הפונקציות האלה משתמשות ב-Gemini ולא דורשות התאמה אישית. BigQuery משתמש בהנדסת הנחיות ויכול לבחור את המודל והפרמטרים המתאימים לשימוש במשימה הספציפית כדי לבצע אופטימיזציה של האיכות והעקביות של התוצאות. כל פונקציה מחזירה ערך סקלרי, כמו BOOL, FLOAT64 או STRING, ולא כוללת מידע נוסף על הסטטוס מהמודל.
אלה פונקציות ה-AI המנוהלות שזמינות:
-
AI.IF: סינון טקסט או נתונים מרובי-אופנים, כמו בסעיףWHEREאוJOIN, על סמך הנחיה. לדוגמה, אפשר לסנן את תיאורי המוצרים לפי אלה שמתארים פריט שיכול להיות מתנה טובה. -
AI.SCORE: דירוג קלט על סמך הנחיה כדי לדרג שורות לפי איכות, דמיון או קריטריונים אחרים. אפשר להשתמש בפונקציה הזו בסעיףORDER BYכדי לחלץ את K הפריטים המובילים לפי הניקוד. לדוגמה, אפשר למצוא את 10 ביקורות המשתמשים הכי חיוביות או הכי שליליות על מוצר מסוים. -
AI.CLASSIFY: סיווג טקסט לקטגוריות שהוגדרו על ידי המשתמש. אפשר להשתמש בפונקציה הזו בסעיףGROUP BYכדי לקבץ את נתוני הקלט לפי הקטגוריות שאתם מגדירים. לדוגמה, אפשר לסווג כרטיסי תמיכה לפי הנושאים שלהם: חיוב, משלוח, איכות המוצר או נושא אחר.
במדריך ביצוע ניתוח סמנטי באמצעות פונקציות AI מנוהלות מופיעות דוגמאות לשימוש בפונקציות האלה.
במדריך בנושא מחברות, ניתוח סמנטי באמצעות פונקציות AI, מוסבר איך להשתמש בפונקציות AI מנוהלות וכלליות.
פונקציות ספציפיות למשימות
בנוסף לפונקציות הכלליות יותר שמתוארות בקטעים הקודמים, אפשר לפתח פתרונות ספציפיים למשימות ב-BigQuery ML באמצעות ממשקי Cloud AI. דוגמאות למשימות נתמכות:
מידע נוסף זמין במאמר סקירה כללית של פתרונות שמתאימים למשימות ספציפיות.
מיקומים
המיקומים הנתמכים ליצירת טקסט ולמודלים להטמעה משתנים בהתאם לסוג ולגרסה של המודל שבו אתם משתמשים. מידע נוסף זמין במאמר בנושא מיקומים.
תמחור
אתם מחויבים על משאבי החישוב שבהם אתם משתמשים כדי להריץ שאילתות על מודלים. מודלים מרוחקים מבצעים קריאות למודלים של Vertex AI, ולכן גם שאילתות שמופנות למודלים מרוחקים כרוכות בחיובים מ-Vertex AI.
מידע נוסף זמין במאמר תמחור ב-BigQuery ML.
מעקב אחרי עלויות
הפונקציות של ה-AI הגנרטיבי ב-BigQuery פועלות על ידי שליחת בקשות ל-Vertex AI, מה שיכול לייצר עלויות. כדי לעקוב אחרי העלויות של Vertex AI שנובעות ממשימה שמריצים ב-BigQuery, פועלים לפי השלבים הבאים:
- הצגת דוחות החיוב בחיוב ב-Cloud.
להשתמש במסננים כדי לצמצם את התוצאות.
בשדה 'שירותים', בוחרים באפשרות Vertex AI.
כדי לראות את החיובים על עבודה ספציפית, מסננים לפי תווית.
מגדירים את המפתח ל-
bigquery_job_id_prefixואת הערך למזהה המשרה של המשרה. אם מזהה המשרה ארוך מ-63 תווים, צריך להשתמש רק ב-63 התווים הראשונים. אם מזהה המשימה מכיל אותיות רישיות, צריך לשנות אותן לאותיות קטנות. אפשר גם לשייך משרות לתווית בהתאמה אישית כדי שיהיה קל יותר לחפש אותן בהמשך.
יכול להיות שיחלפו עד 24 שעות עד שחלק מהחיובים יופיעו בחיוב ב-Cloud.
מעקב
כדי להבין טוב יותר את ההתנהגות של פונקציות AI שאתם קוראים להן ב-BigQuery, אתם יכולים להפעיל רישום ביומן של בקשות ותשובות. כדי לרשום ביומן את הבקשה והתשובה המלאות שנשלחו אל Vertex AI והתקבלו ממנו, פועלים לפי השלבים הבאים:
הפעלת יומני בקשות ותגובות ב-Vertex AI. היומנים מאוחסנים ב-BigQuery. צריך להפעיל בנפרד את הרישום ביומן לכל מודל בסיסי ואזור שונים. כדי לרשום ביומן שאילתות שמופעלות באזור
us, צריך לציין את האזורus-central1בבקשה. כדי לרשום ביומן שאילתות שמופעלות באזורeu, צריך לציין את האזורeurope-west4בבקשה.מריצים שאילתה באמצעות פונקציית AI שמבצעת קריאה ל-Vertex AI באמצעות המודל שהפעלתם עבורו רישום ביומן בשלב הקודם.
כדי לראות את הבקשה והתגובה המלאות של Vertex AI, שולחים שאילתה לטבלת הרישום כדי למצוא שורות שבהן השדה
labels.bigquery_job_id_prefixבעמודהfull_requestתואם ל-63 התווים הראשונים של מזהה המשימה. אפשר גם להשתמש בתווית שאילתה מותאמת אישית כדי לחפש את השאילתה ביומנים.לדוגמה, אפשר להשתמש בשאילתה שדומה לשאילתה הבאה:
SELECT * FROM `my_project.my_dataset.request_response_logging` WHERE JSON_VALUE(full_request, '$.labels.bigquery_job_id_prefix') = 'bquxjob_123456...';
המאמרים הבאים
- לקבלת מבוא ל-AI ול-ML ב-BigQuery, אפשר לעיין במאמר מבוא ל-AI ול-ML ב-BigQuery.
- מידע נוסף על ביצוע הסקה על מודלים של למידת מכונה זמין במאמר סקירה כללית על הסקת מודלים.
- מידע נוסף על פונקציות והצהרות SQL נתמכות במודלים של AI גנרטיבי זמין במאמר תרחישי שימוש מקצה לקצה במודלים של AI גנרטיבי.