פיתוח אפליקציות מבוססות-AI גנרטיבי באמצעות Cloud SQL

בדף הזה תוכלו לקרוא סקירה כללית על היכולות שמציע Cloud SQL ל-PostgreSQL כדי לעזור לכם לפתח אפליקציות AI גנרטיבי. כדי להתחיל לעבוד עם אפליקציה לדוגמה, אפשר לעיין במאמר שימוש ב-Cloud SQL באפליקציות AI גנרטיביות.

שליפה משופרת של מידע (RAG) היא טכניקה לאופטימיזציה של הפלט של מודל שפה גדול (LLM) על ידי הפניה למאגר ידע מהימן לפני יצירת תשובה. טכנולוגיית RAG משפרת את הדיוק של אפליקציות מבוססות-AI גנרטיבי. מסדי נתונים של Cloud SQL מציעים יכולות שמותאמות ליישומי RAG ו-AI גנרטיבי, כפי שמוסבר בדף הזה.

יצירת הטמעות וקטוריות

הטמעות וקטוריות חיוניות ל-RAG כי הן מאפשרות הבנה סמנטית וחיפוש יעיל של דמיון. ההטמעות האלה הן ייצוגים מספריים של טקסט, תמונות, אודיו ווידאו. מודלים של הטמעה יוצרים את ההטמעות הווקטוריות כך שאם שני פריטי תוכן דומים מבחינה סמנטית, ההטמעות שלהם ממוקמות קרוב זו לזו במרחב הווקטורי של ההטמעה.

‫Cloud SQL משתלב עם Vertex AI. אתם יכולים להשתמש במודלים שמארח Vertex AI כדי ליצור הטמעות וקטוריות באמצעות שאילתות SQL.

‫Cloud SQL מרחיב את התחביר של PostgreSQL עם פונקציית הטמעה ליצירת הטמעות וקטוריות של טקסט. אחרי שיוצרים את ההטמעות האלה, אפשר לאחסן אותן במסד נתונים של Cloud SQL בלי להזדקק למסד נתונים נפרד של וקטורים.

אפשר גם להשתמש ב-Cloud SQL כדי לאחסן הטבעות וקטוריות שנוצרו מחוץ ל-Cloud SQL. לדוגמה, אתם יכולים לאחסן הטבעות וקטוריות שנוצרו באמצעות מודלים שעברו אימון מראש ב-Vertex AI Model Garden. אפשר להשתמש בהטמעות הווקטוריות האלה כקלט לפונקציות pgvector לצורך חיפושים של דמיון וחיפושים סמנטיים.

אחסון, יצירת אינדקס ושאילתות של הטמעות וקטוריות באמצעות pgvector

אתם יכולים לאחסן, ליצור אינדקס ולשאול שאילתות על הטמעות וקטוריות ב-Cloud SQL באמצעות התוסף pgvector PostgreSQL.

מידע נוסף על הגדרת התוסף הזה זמין במאמר הגדרת תוספי PostgreSQL. מידע נוסף על אחסון, יצירת אינדקס ושליחת שאילתות לגבי הטמעות וקטוריות זמין במאמרים בנושא אחסון הטמעה שנוצרה ושליחת שאילתות לגבי הטמעות ויצירת אינדקס שלהן באמצעות pgvector.

הפעלת חיזויים אונליין באמצעות שאילתות SQL

אתם יכולים להפעיל תחזיות אונליין באמצעות מודלים שמאוחסנים ב-Vertex AI Model Garden באמצעות שאילתות SQL.

שימוש בשילוב LangChain

‫Cloud SQL משתלב עם LangChain, מסגרת תזמור של מודלים גדולים של שפה (LLM) בקוד פתוח, כדי לפשט את הפיתוח של אפליקציות AI גנרטיביות. אפשר להשתמש בחבילות LangChain הבאות:

שיפור הביצועים של חיפוש וקטורי

כדי לשפר את הביצועים של חיפוש וקטורי, אפשר להשתמש ב:

  • מטמון נתונים: שימוש במטמון נתונים מובנה שמנצל כונן SSD מקומי ומהיר כדי לאחסן דפי נתונים שנקראים לעיתים קרובות. אפשר לשפר את ביצועי הקריאה עד פי שלושה בהשוואה לקריאה מדיסק אחסון מתמיד (persistent disk).
  • מדדים של מטמון נתונים: אופטימיזציה של שאילתות על סמך היעילות של השימוש במטמון הנתונים בחיפוש וקטורי.

    ‫Cloud SQL מספק את המדדים הבאים ב-Metrics Explorer ב-Cloud Monitoring:

    מדד תיאור תווית מדד
    מטמון הנתונים שנעשה בו שימוש השימוש במטמון הנתונים (בבייטים) database/data_cache/bytes_used
    מכסת מטמון הנתונים גודל מטמון הנתונים המקסימלי (בבייטים) database/data_cache/quota
    מספר המציאות במטמון הנתונים המספר הכולל של פעולות קריאה של פגיעה במטמון נתונים עבור מופע database/postgresql/data_cache/hit_count
    מספר אי המציאות במטמון של נתונים המספר הכולל של פעולות קריאה של אי מציאה במטמון הנתונים של מופע database/postgresql/data_cache/miss_count
    שיעור מציאות במטמון נתונים היחס בין פעולות קריאה של מציאה במטמון הנתונים לבין פעולות קריאה של אי מציאה במטמון הנתונים של מופע
    database/postgresql/data_cache/hit_ratio
  • תובנות לגבי המערכת: מספקות מדדים של המערכת, כמו ניצול המעבד (CPU), ניצול הדיסק וקצב העברת הנתונים, כדי לעזור לכם לעקוב אחרי תקינות המופעים ולפתור בעיות שמשפיעות על הביצועים של אפליקציות הבינה המלאכותית הגנרטיבית. כדי לראות את המדדים האלה, משתמשים בלוח הבקרה של תובנות המערכת של Cloud SQL.

  • תובנות לגבי שאילתות: זיהוי, אבחון ומניעה של בעיות בביצועים של שאילתות. הפעולה הזו עוזרת לשפר את הביצועים של חיפוש וקטורי באפליקציות של AI גנרטיבי.

    אתם יכולים להשתמש בלוח הבקרה של Cloud SQL Query Insights כדי לבחון את הביצועים של השאילתות המובילות ולנתח את השאילתות האלה באמצעות תוכניות שאילתות חזותיות. אתם יכולים גם לעקוב אחרי הביצועים ברמת האפליקציה ולעקוב אחרי המקור של שאילתה בעייתית במערך האפליקציות עד למסד הנתונים באמצעות SQLcommenter. זוהי ספריית מיפוי יחסי בין אובייקטים (ORM) בקוד פתוח, עם כלי אוטומטי למדידת ביצועים.

    התכונה 'תובנות לגבי שאילתות' יכולה גם לעזור לכם להשתלב עם כלי ניטור האפליקציות (APM) הקיימים שלכם, כדי שתוכלו לפתור בעיות בשאילתות באמצעות כלים שאתם מכירים.

היתרונות של שימוש ב-Cloud SQL באפליקציות AI גנרטיבי

השימוש ב-Cloud SQL כדי לפתח אפליקציות של AI גנרטיבי מספק את היתרונות הבאים:

  • שימוש ב-PostgreSQL כדי ליצור אפליקציות AI גנרטיבי. ‫Cloud SQL ל-PostgreSQL תומך ב-pgvector ומשולב עם Vertex AI ועם LangChain.
  • שימוש בשירות מהימן עם הגנה על נתונים, אבטחה וניהול ברמה שמתאימה לארגונים. השימוש ב-Cloud SQL מאפשר לכם ליהנות מהיתרונות הבאים:
    • הסכם רמת שירות (SLA) לזמינות גבוהה של 99.99%, כולל תחזוקה
    • שירות מנוהל שמספק תכונות כמו גיבויים אוטומטיים, שכפול, תיקוני אבטחה, הצפנה והגדלה אוטומטית של קיבולת האחסון
    • יכולות אבטחה, ניהול ותאימות
  • שילוב עם נתונים תפעוליים הקשריים. אפשר להשתמש בצירופים ובמסננים על נתונים תפעוליים, תוך שימוש בהטמעות וקטוריות, כדי לקבל תשובות עדכניות, מדויקות ורלוונטיות בהקשר של אפליקציות AI גנרטיבי.
  • צמצום העומס התפעולי. אפשר להשתמש ב-Cloud SQL כמסד נתונים וקטורי כדי לצמצם את המאמצים התפעוליים שקשורים לייצוא נתונים למסד נתונים וקטורי נפרד.
  • גישה למודלים הכי חדשים של AI גנרטיבי. אפשר להשתמש בשאילתות SQL כדי לגשת למודלי ה-AI העדכניים ביותר שמתארחים ב-Vertex AI.

איך מתחילים להשתמש ב-Cloud SQL באפליקציות AI גנרטיבי

כדי להתחיל ליצור אפליקציות AI גנרטיבי, אפשר להשתמש באפליקציה לדוגמה. האפליקציה משתמשת ב-Cloud SQL, ב-Vertex AI וב-Google Kubernetes Engine‏ (GKE) או ב-Cloud Run. אתם יכולים להשתמש באפליקציה כדי ליצור API בסיסי של צ'אטבוט ש:

  • שילוב של GKE או Cloud Run עם Cloud SQL,‏ Vertex AI ו-pgvector
  • הדגמה של קישוריות ל-Cloud SQL באמצעות Private Service Connect בענן וירטואלי פרטי (VPC)
  • שימוש ב-Terraform כדי להגדיר את התשתית
  • נעשה שימוש ב-Python עם asyncpg ועם FastAPI
  • תמיכה בהגדרת Cloud SQL ואפליקציה שפועלת ב-GKE או ב-Cloud Run בפרויקטים נפרדים Cloud de Confiance

הפתרון מכיל את התוכן הבא:

  • תבניות Terraform להגדרת התשתית עם שיטות מומלצות לאבטחה
  • אפליקציה לדוגמה של צ'אטבוט מבוסס-LLM שאפשר לפרוס ב-GKE או ב-Cloud Run

המאמרים הבאים