מבוא ל-AI ב-BigQuery

‫BigQuery מציע יכולות שונות של AI שמאפשרות לכם:

  • ביצוע למידת מכונה (ML) לצורך חיזוי.
  • להריץ הסקה על מודלים גדולים של שפה (LLM) כמו Gemini.
  • פיתוח אפליקציות באמצעות הטמעות וחיפוש וקטורי.
  • שימוש בסוכנים מובנים כדי לקבל עזרה בתכנות.
  • ליצור צינורות נתונים.
  • גישה לפונקציונליות של BigQuery באמצעות כלי סוכנים.

למידת מכונה

באמצעות BigQuery ML, אתם יכולים לאמן מודלים, להעריך אותם ולהריץ הסקה על מודלים למשימות כמו חיזוי סדרות זמנים, זיהוי אנומליות, סיווג, רגרסיה, אשכולות, צמצום ממדים והמלצות.

אפשר לעבוד עם היכולות של BigQuery ML דרך מסוףCloud de Confiance , כלי שורת הפקודה של BigQuery,‏ API בארכיטקטורת REST או במחברות Colab Enterprise. השימוש ב-BigQuery ML מאפשר למומחי SQL להשתמש בכלים ובכישורים קיימים של SQL כדי ליצור מודלים ולהעריך אותם. כך הם יכולים להשתמש בלמידת מכונה (ML) בלי להעביר נתונים, ולקצר את תהליך פיתוח המודלים. אתם יכולים להשתמש ב-BigQuery ML כדי לבצע את סוגי המשימות הבאים של למידת מכונה:

מידע נוסף זמין במאמר מבוא ל-ML ב-BigQuery.

פונקציות AI

ב-BigQuery יש פונקציות SQL שונות שאפשר להשתמש בהן למשימות AI כמו יצירת טקסט, ניתוח טקסט או נתונים לא מובנים ותרגום. הפונקציות האלה ניגשות ל-Gemini ולמודלים של LLM של שותפים שזמינים מ-Gemini Enterprise Agent Platform, מממשקי Cloud AI API או ממודלים מובנים של BigQuery כדי לבצע את המשימות האלה.

יש כמה קטגוריות של פונקציות AI:

  • פונקציות של AI גנרטיבי. הפונקציות האלה עוזרות לכם לבצע משימות כמו יצירת תוכן, ניתוח, סיכום, חילוץ נתונים מובנים, סיווג, יצירת הטמעה והעשרת נתונים. יש שני סוגים של פונקציות מבוססות-AI גנרטיבי:

    • פונקציות AI לשימוש כללי מאפשרות לכם שליטה מלאה ושקיפות בבחירת המודל, ההנחיה והפרמטרים לשימוש.
    • פונקציות AI מנוהלות מציעות תחביר יעיל למשימות שגרתיות כמו סינון, דירוג וסיווג. מערכת BigQuery יכולה לבחור בשבילכם מודל לאופטימיזציה של העלות והאיכות.
  • פונקציות ספציפיות למשימה. הפונקציות האלה עוזרות לכם להשתמש ב-Cloud AI APIs למשימות כמו:

מידע נוסף זמין במאמר סקירה כללית של פתרונות ספציפיים למשימות.

‫BigQuery מציע מגוון פונקציות ותכונות חיפוש שיעזרו לכם למצוא ביעילות נתונים ספציפיים או לגלות קווי דמיון בין נתונים, כולל נתונים מולטימודליים.

  • חיפוש טקסט. אפשר להשתמש בפונקציה SEARCH כדי לבצע חיפוש של אסימונים בטקסט לא מובנה או בנתוני JSON חצי מובנים. כדי לשפר את ביצועי החיפוש, אפשר ליצור אינדקס חיפוש, שמאפשר ל-BigQuery לבצע אופטימיזציה של שאילתות שמשתמשות בפונקציה SEARCH, וגם בפונקציות ובאופרטורים אחרים. מידע נוסף זמין במאמר חיפוש נתונים שנוספו לאינדקס.

  • יצירת הטמעה. הטמעה היא וקטור מספרי רב-ממדי שמייצג ישויות כמו טקסט או תמונות, ולרוב נוצר על ידי מודלים של ML. אתם יכולים ליצור הטבעות מולטימודאליות באמצעות מודלים שסופקו על ידי Agent Platform או מתארחים בה, או באמצעות מודלים שיובאו והורצו ב-BigQuery.

    אפשר גם להגדיר ש-BigQuery יעדכן באופן אוטומטי עמודה של הטמעות באמצעות הפעלה של יצירת הטמעות אוטונומית (גרסת Preview).

  • חיפוש וקטורי. אפשר להשתמש בפונקציה VECTOR_SEARCH כדי לחפש הטמעות ולמצוא פריטים דומים מבחינה סמנטית. אפשר להשתמש בפונקציה AI.SEARCH (תצוגה מקדימה) כדי לחפש בטבלאות שמופעל בהן יצירה אוטונומית של הטמעה. כדי לשפר את הביצועים של חיפוש וקטורי, אפשר ליצור אינדקס וקטורי שמשתמש בטכניקות חיפוש של שכן קרוב משוער כדי לספק תוצאות מהירות יותר ומשוערות יותר.

    תרחישי שימוש נפוצים בחיפוש וקטורי כוללים חיפוש סמנטי, המלצות ו-Retrieval-Augmented Generation (יצירה משולבת-אחזור, RAG). מידע נוסף זמין במאמר בנושא מבוא לחיפוש וקטורי.

תכונות AI שמסייעות

תכונות העזרה מבוססות-AI ב-BigQuery, שנקראות ביחד Gemini ב-BigQuery, עוזרות לכם לגלות, להכין, לשלוח שאילתות ולהציג את הנתונים שלכם.

  • תובנות מנתונים. ליצור שאלות בשפה טבעית לגבי הנתונים, יחד עם שאילתות ה-SQL שיענו על השאלות האלה.
  • הכנת נתונים. ליצור המלצות בהתאם להקשר כדי לנקות, לשנות ולהעשיר את הנתונים.
  • עזרה בכתיבת קוד SQL יצירה, השלמה והסבר של שאילתות SQL.
  • עזרה בכתיבת קוד Python יצירה, השלמה והסבר של קוד Python, כולל PySpark ו-BigQuery DataFrames.
  • קנבס נתונים. אפשר לשלוח שאילתות לנתונים בשפה טבעית, להציג את התוצאות בתרשימים ולשאול שאלות המשך.
  • כלי לתרגום SQL אתם יכולים ליצור כללי תרגום של SQL משופר על ידי Gemini כדי לעזור לכם להעביר שאילתות שנכתבו בניב אחר ל-GoogleSQL.

סוכנים

סוכנים הם כלי תוכנה שיכולים להשתמש ב-AI כדי להשלים משימות בשמכם. אתם יכולים להשתמש בסוכנים מובנים או ליצור סוכנים משלכם כדי לעבד, לנהל, לנתח ולהמחיש את הנתונים:

  • אפשר להשתמש בסוכן מדע הנתונים כדי לבצע אוטומציה של ניתוח נתונים ראשוני, עיבוד נתונים, משימות של למידת מכונה ותובנות לגבי ויזואליזציה במחברת Colab Enterprise.

  • אפשר להשתמש בסוכן הנדסת הנתונים כדי ליצור, לשנות ולנהל צינורות עיבוד נתונים לטעינה ולעיבוד של נתונים ב-BigQuery. אתם יכולים להשתמש בהנחיות בשפה טבעית כדי ליצור צינורות להעברת נתונים ממקורות נתונים שונים, או להתאים צינורות קיימים להעברת נתונים לצרכים שלכם בתחום הנדסת הנתונים.

  • אפשר להשתמש בסוכן לניתוח נתונים בשיחה כדי לנהל צ'אט עם הנתונים בשפה יומיומית. הסוכן הזה מורכב ממקור נתונים אחד או יותר ומקבוצה של הוראות ספציפיות לתרחיש שימוש לעיבוד הנתונים האלה. ניתוח שיחות תומך בשימוש בחלק מהפונקציות של BigQuery ML.

  • אפשר להשתמש ב-Gemini CLI כדי ליצור אינטראקציה עם נתונים ב-BigQuery במסוף באמצעות הנחיות בשפה טבעית.

  • אפשר ליצור סוכנים במהירות ובאופן איטרטיבי באמצעות ערכת הכלים MCP בקוד פתוח או כלי ADK.

המאמרים הבאים