このページの一部またはすべての情報は、S3NS の Cloud de Confiance に適用されない場合があります。詳細については、Google Cloud との違いをご確認ください。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

グラフを検索する

このチュートリアルでは、グラフデータに対してセマンティック検索を行う方法について、自律型エンベディング生成と AI.SEARCH 関数を使用して説明します。

目標

このチュートリアルでは、次のタスクについて説明します。

人物、金融口座、口座所有権、口座振替に関する情報を保持するテーブルを作成します。
自律型エンベディング生成を使用して、エンベディングのメンテナンスワークフローを簡素化します。
テーブルに保存されているデータ間の関係を定義するグラフを作成します。
グラフノードで AI.SEARCH 関数を使用して、口座の説明に対してセマンティック検索を行います。
グラフエッジで AI.SEARCH 関数を使用して、口座振替のメモに対してセマンティック検索を行います。

費用

このドキュメントでは、課金対象である次のコンポーネントを使用します Cloud de Confiance by S3NS：

BigQuery: You incur costs for the data that you process in BigQuery.

このドキュメントに記載されているタスクの完了後、作成したリソースを削除すると、それ以上の請求は発生しません。詳細については、クリーンアップをご覧ください。

始める前に

コンソール

In the Cloud de Confiance console, on the project selector page, select or create a Cloud de Confiance project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
- Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.
Note: If you don't plan to keep the resources that you create in this procedure, create a project instead of selecting an existing project. After you finish these steps, you can delete the project, removing all resources associated with the project.

Go to project selector
Verify that billing is enabled for your Cloud de Confiance project.
Enable the BigQuery API.
Roles required to enable APIs
To enable APIs, you need the serviceusage.services.enable permission. If you created the project, then you likely already have this permission through the Owner role (roles/owner). Otherwise, you can get this permission through the Service Usage Admin role (roles/serviceusage.serviceUsageAdmin). Learn how to grant roles.
Enable the API

プロジェクトに次のロールがあることを確認します。 BigQuery データ編集者、 プロジェクト IAM 管理者
ロールを確認する
1. コンソールで、[IAM] ページに移動します。 Cloud de Confiance
  IAM に移動
2. プロジェクトを選択します。
3. [Principal] 列で、自分または自分が所属するグループの行をすべて確認します。所属するグループについては、管理者にお問い合わせください。
4. 自分を指定または含むすべての行について、[ロール] 列で、ロールのリストに必要なロールが含まれているかどうかを確認します。
ロールを付与する
1. コンソールで、[IAM] ページに移動します。 Cloud de Confiance
  IAM に移動
2. プロジェクトを選択します。
3. [Grant access] をクリックします。
4. [新しいプリンシパル] フィールドに、ユーザー ID を入力します。これは通常、Workforce Identity プール内のユーザーの ID です。詳細については、 IAM ポリシーで Workforce プールユーザーを表すをご覧いただくか、管理者にお問い合わせください。
5. [**ロールを選択**] をクリックして、ロールを検索します。
6. 追加のロールを付与するには、 [Add another role] をクリックして各ロールを追加します。
7. [保存] をクリックします。

gcloud

Google Cloud CLI をインストールします。
フェデレーション ID（連携 ID）を使用するように gcloud CLI を構成します。

詳細については、連携 ID を使用して gcloud CLI にログインするをご覧ください。
gcloud CLI を初期化するには、次のコマンドを実行します:
```
gcloud init
```
プロジェクトを作成または選択します Cloud de Confiance 。
プロジェクトを選択または作成するために必要なロール
- プロジェクトを選択する: プロジェクトの選択には特定の IAM ロールは必要ありません。ロールが付与されているプロジェクトを選択できます。
- プロジェクトを作成する: プロジェクトを作成するには、プロジェクト作成者ロール（roles/resourcemanager.projectCreator）が必要です。これには resourcemanager.projects.create 権限が含まれています。詳しくは、ロールを付与する方法をご覧ください。
注: この手順で作成するリソースをそのまま保持する予定でない場合、既存のプロジェクトを選択するのではなく、新しいプロジェクトを作成してください。チュートリアルの終了後にそのプロジェクトを削除すれば、プロジェクトに関連するすべてのリソースを削除できます。
- プロジェクトを作成します。 Cloud de Confiance
```
gcloud projects create PROJECT_ID
```
  PROJECT_ID は、作成する Cloud de Confiance プロジェクトの名前に置き換えます。
- 作成した Cloud de Confiance プロジェクトを選択します。
```
gcloud config set project PROJECT_ID
```
  PROJECT_ID は、 Cloud de Confiance プロジェクトの名前に置き換えます。
プロジェクトで課金が有効になっていることを確認します Cloud de Confiance 。
BigQuery API を有効にします。
API を有効にするために必要なロール
API を有効にするには、serviceusage.services.enable 権限が必要です。プロジェクトを作成した場合、オーナーロール（roles/owner）を通じてこの権限が付与されている可能性があります。それ以外の場合は、Service Usage Admin ロール（roles/serviceusage.serviceUsageAdmin）を通じてこの権限を取得できます。ロールを付与する方法をご覧ください。
```
gcloud services enable bigquery.googleapis.com
```

ユーザーアカウントにロールを付与します。次の IAM ロールごとに、次のコマンドを 1 回実行します。 roles/bigquery.dataEditor, roles/resourcemanager.projectIamAdmin
```
gcloud projects add-iam-policy-binding PROJECT_ID --member="user:USER_IDENTIFIER" --role=ROLE
```
次のように置き換えます。
- PROJECT_ID: プロジェクト ID。
- USER_IDENTIFIER: ユーザーアカウントの ID。アカウント。例については、 IAM ポリシーで Workforce プールユーザーを表すをご覧ください。
- ROLE: ユーザーアカウントに付与する IAM ロール。

テーブルを作成する

次の例で作成するテーブルとグラフを保存するには、データセットを作成します。次のクエリは、graph_search という名前のデータセットを作成します。

CREATE SCHEMA IF NOT EXISTS graph_search;

次の表には、人物とアカウントに関する情報と、これらのエンティティ間の関係が含まれています。

Person: 人物に関する情報。
Account: 銀行口座に関する情報。
PersonOwnAccount: 誰がどの口座を所有しているかに関する情報。
AccountTransferAccount: 口座間の振替に関する情報。

これらのテーブルを作成するには、次の CREATE TABLE ステートメントを実行します。

CREATE OR REPLACE TABLE graph_search.Person (
  id               INT64,
  name             STRING,
  PRIMARY KEY (id) NOT ENFORCED
);

CREATE OR REPLACE TABLE graph_search.Account (
  id                    INT64,
  create_time           TIMESTAMP,
  is_blocked            BOOL,
  description           STRING,
  description_embedding STRUCT<result ARRAY<FLOAT64>, status STRING>
                          GENERATED ALWAYS AS (
                          AI.EMBED(description, model => 'embeddinggemma-300m')
                          ) STORED OPTIONS( asynchronous = TRUE ),
  PRIMARY KEY (id) NOT ENFORCED
);

CREATE OR REPLACE TABLE graph_search.PersonOwnAccount (
  id               INT64 NOT NULL,
  account_id       INT64 NOT NULL,
  create_time      TIMESTAMP,
  PRIMARY KEY (id, account_id) NOT ENFORCED,
  FOREIGN KEY (id) REFERENCES graph_search.Person(id) NOT ENFORCED,
  FOREIGN KEY (account_id) REFERENCES graph_search.Account(id) NOT ENFORCED
);

CREATE OR REPLACE TABLE graph_search.AccountTransferAccount (
  id               INT64 NOT NULL,
  to_id            INT64 NOT NULL,
  amount           FLOAT64,
  create_time      TIMESTAMP NOT NULL,
  order_number     STRING,
  notes            STRING,
  notes_embedding  STRUCT<result ARRAY<FLOAT64>, status STRING>
                     GENERATED ALWAYS AS (
                     AI.EMBED(notes, model => 'embeddinggemma-300m')
                     ) STORED OPTIONS( asynchronous = TRUE ),
  PRIMARY KEY (id, to_id, create_time) NOT ENFORCED,
  FOREIGN KEY (id) REFERENCES graph_search.Account(id) NOT ENFORCED,
  FOREIGN KEY (to_id) REFERENCES graph_search.Account(id) NOT ENFORCED
);

Account および AccountTransferAccount テーブルは、自律型エンベディング生成を使用して、description および notes 列のエンベディングを維持します。

このチュートリアルでは、BigQuery で実行され、短い文字列に適している embeddinggemma-300m モデルを使用します。128 トークンを超える長い文字列の場合は、text-embedding-005 などの別のエンベディングモデルを選択する必要があります。詳細については、エンベディングモデルの選択をご覧ください。

データを挿入する

次のクエリは、テーブルにサンプルデータを挿入します。`INSERT` INSERT ステートメントではエンベディング列が省略され、BigQuery によって自動的に入力されます。

INSERT INTO graph_search.Account
  (id, create_time, is_blocked, description)
VALUES
  (7,"2020-01-10 06:22:20.222",false,"Fund for a refreshing tropical vacation"),
  (16,"2020-01-27 17:55:09.206",true,"Fund for a rainy day!"),
  (20,"2020-02-18 05:44:20.655",false,"Saving up for travel");

INSERT INTO graph_search.Person
  (id, name)
VALUES
  (1,"Alex"),
  (2,"Dana"),
  (3,"Lee");

INSERT INTO graph_search.AccountTransferAccount
  (id, to_id, amount, create_time, order_number, notes)
VALUES
  (7,16,300,"2020-08-29 15:28:58.647","304330008004315", "wedding present"),
  (7,16,100,"2020-10-04 16:55:05.342","304120005529714", "birthday gift"),
  (16,20,300,"2020-09-25 02:36:14.926","103650009791820", "for shared cost of dinner"),
  (20,7,500,"2020-10-04 16:55:05.342","304120005529714", "fees for tuition"),
  (20,16,200,"2020-10-17 03:59:40.247","302290001484851", "loved the lunch");

INSERT INTO graph_search.PersonOwnAccount
  (id, account_id, create_time)
VALUES
  (1,7,"2020-01-10 06:22:20.222"),
  (2,20,"2020-01-27 17:55:09.206"),
  (3,16,"2020-02-18 05:44:20.655");

グラフを作成する

次のクエリは、 CREATE PROPERTY GRAPH ステートメントを使用して、graph_search データセットに FinGraph というグラフを作成します。 Account テーブルと Person テーブルはノードテーブルです。AccountTransferAccount テーブルと PersonOwnAccount テーブルはエッジテーブルで、ノードテーブル間の関係を表します。

CREATE OR REPLACE PROPERTY GRAPH graph_search.FinGraph
NODE TABLES (graph_search.Account, graph_search.Person)
EDGE TABLES (
  graph_search.PersonOwnAccount
    SOURCE KEY (id) REFERENCES Person (id)
    DESTINATION KEY (account_id) REFERENCES Account (id)
    LABEL Owns,
  graph_search.AccountTransferAccount
    SOURCE KEY (id) REFERENCES Account (id)
    DESTINATION KEY (to_id) REFERENCES Account (id)
    LABEL Transfers
);

ノードを検索

次のクエリは、レジャー旅行と休暇の口座を所有しているユーザーを示しています。最初のクエリでは、 DECLARE ステートメントを使用して、 similar_account という変数を作成します。この変数は、DEFAULT 句で初期化されます。この句では、AI.SEARCH を呼び出して、説明が accounts for leisure travel and vacation に最も意味的に類似している口座を検索します。このクエリでは、AI.SEARCH の呼び出しで top_k 引数を 2 に設定して、結果の数を制限します。2 番目のクエリは、口座の説明とともに口座所有者の名前を返すグラフクエリです。

DECLARE similar_account DEFAULT ((
SELECT ARRAY_AGG(base.id)
FROM
  AI.SEARCH(
    (SELECT * FROM graph_search.Account WHERE description_embedding IS NOT NULL),
    'description',
    'accounts for leisure travel and vacation',
    top_k => 2)
));

GRAPH graph_search.FinGraph
MATCH (p:Person)-[:Owns]->(a:Account)
WHERE a.id IN UNNEST(similar_account)
RETURN p.name, a.description;

次のような結果になります。

+------+-----------------------------------------+
| name | description                             |
+------+-----------------------------------------+
| Dana | Saving up for travel                    |
| Alex | Fund for a refreshing tropical vacation |
+------+-----------------------------------------+

エッジを検索

次のクエリは、食費に関連する口座振替を行ったユーザーを示しています。最初のクエリでは、AI.SEARCH 関数を使用して、food_transfers という変数に値を設定します。この変数には、関連するメモが food に最も意味的に類似している振替の注文番号が格納されます。このクエリでは、AI.SEARCH の呼び出しで top_k 引数を 2 に設定して、結果の数を制限します。2 番目のクエリは、振替メモとともに口座所有者の名前を返すグラフクエリです。

DECLARE food_transfers DEFAULT ((
SELECT ARRAY_AGG(base.order_number)
FROM
  AI.SEARCH(
    (SELECT * FROM graph_search.AccountTransferAccount WHERE notes_embedding IS NOT NULL),
    'notes',
    'food',
    top_k => 2)
));

GRAPH graph_search.FinGraph
MATCH (p:Person)-[:Owns]->(:Account)-[t:Transfers]->(:Account)
WHERE t.order_number IN UNNEST(food_transfers)
RETURN p.name, t.notes;

次のような結果になります。

+------+---------------------------+
| name | notes                     |
+------+---------------------------+
| Dana | loved the lunch           |
| Lee  | for shared cost of dinner |
+------+---------------------------+

ベクトルインデックスを作成する

ベクトルインデックスを使用すると、検索のレイテンシとコンピューティング費用を削減できます。このチュートリアルのテーブルは小さすぎて、ベクトルインデックスを使用できません。ベクトルインデックスは、テーブルが大きく、通常は数百万行ある場合に便利です。 BigQuery には、IVF と TreeAH の 2 種類のインデックスがあります。インデックスの作成とタイプの選択の詳細については、ベクトルインデックスを管理するをご覧ください。

クリーンアップ

このチュートリアルで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、リソースを含むプロジェクトを削除するか、プロジェクトを維持して個々のリソースを削除します。

プロジェクトを削除する

注意 : プロジェクトを削除すると、次のような影響があります。

プロジェクト内のすべてのものが削除されます。既存のプロジェクトを使用してこのドキュメントのタスクを行った場合、そのプロジェクトを削除すると、プロジェクト内で行った他の作業もすべて削除されます。
カスタムプロジェクト ID が失われます。このプロジェクトを作成したときに、将来使用するカスタムプロジェクト ID を作成した可能性があります。そのプロジェクト ID を使用した URL（例: appspot.com）を保持するには、プロジェクト全体ではなく、プロジェクト内の選択したリソースだけを削除します。

複数のアーキテクチャ、チュートリアル、クイックスタートを実施する予定がある場合は、プロジェクトを再利用するとプロジェクトの割り当て上限を超えないようにすることができます。

プロジェクトを削除します。 Cloud de Confiance

gcloud projects delete PROJECT_ID

次のステップ

BigQuery Graph の詳細を確認する。
グラフを作成してクエリを実行する方法を確認する。
ベクトルインデックスの作成、セマンティック検索、RAG の実行の詳細を確認する。