このページの一部またはすべての情報は、S3NS の Cloud de Confiance に適用されない場合があります。詳細については、Google Cloud との違いをご確認ください。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

グローバルクエリ

グローバルクエリを使用すると、複数のリージョンに保存されているデータを参照する SQL クエリを実行できます。たとえば、us-central1 にあるテーブルと europe-central2 にあるテーブルを結合するグローバルクエリを実行できます。このドキュメントでは、プロジェクトでグローバルクエリを有効にして実行する方法について説明します。

始める前に

プロジェクトでグローバルクエリが有効になっていることを確認し、グローバルクエリを実行するために必要な権限があることを確認します。

グローバルクエリを有効にする

プロジェクトまたは組織でグローバルクエリを有効にするには、ALTER PROJECT SET OPTIONS ステートメントまたは ALTER ORGANIZATION SET OPTIONS ステートメントを使用して、デフォルト構成を変更します。

リージョンでグローバルクエリを実行するには、クエリを実行するプロジェクトのそのリージョンで enable_global_queries_execution 引数を true に設定します。
グローバルクエリでリージョンからデータをコピーできるようにするには、データを含むプロジェクトのそのリージョンで enable_global_queries_data_access 引数を true に設定します。
クエリがリモートテーブルにアクセスするたびに、これらのオプションがチェックされます。
グローバルクエリは 1 つのプロジェクトで実行し、別のプロジェクトの他のリージョンからデータを取得できます。

例: クロスプロジェクト構成

次の例は、別のプロジェクトのテーブルにアクセスするクエリを 1 つのプロジェクトで実行する方法を示しています。

us-central1 リージョンでジョブを実行しているプロジェクト query_project があり、europe-west1 リージョンにあるテーブル data_project.dataset.my_table にアクセスするクエリを実行するとします。

SET @@location='us-central1';
SELECT
  *
FROM
  `query_project.dataset.my_table`
  JOIN `data_project.dataset.my_other_table` USING id;

このグローバルクエリを正常に実行するには、次の構成が必要です。

グローバルクエリを実行するリージョン（us-central1）のプロジェクト（query_project）でグローバルクエリの実行を有効にする必要があります。
```
ALTER PROJECT `query_project`
SET OPTIONS (
`region-us-central1.enable_global_queries_execution` = TRUE
);
```
データを含むプロジェクト（data_project）のリージョン（europe-west1）からグローバルクエリでデータをコピーできるようにする必要があります。
```
ALTER PROJECT `data_project`
SET OPTIONS (
`region-europe-west1.enable_global_queries_data_access` = TRUE
);
```

リモートテーブルを含むビューを作成して使用する場合も、同じ原則が適用されます。クエリを実行するプロジェクトで enable_global_queries_execution が有効になっている必要があります。

これらの ALTER PROJECT オペレーションは、異なるプロジェクトとリージョンを参照するため、個別に実行する必要があります。変更が有効になるまで数分かかることがあります。

必要な権限

グローバルクエリを実行するには、bigquery.jobs.createGlobalQuery 権限が必要です。この権限を含む事前定義ロールは、BigQuery 管理者ロールのみです。BigQuery 管理者ロールを付与せずにグローバルクエリを実行する権限を付与するには、次の操作を行います。

「BigQuery グローバルクエリ実行者」などのカスタムロールを作成します。
このロールに bigquery.jobs.createGlobalQuery を追加します。
このロールを選択したユーザーまたはサービスアカウントに割り当てます。

データのクエリ

グローバルクエリを実行するには、データが単一のロケーションにある場合と同じように SQL クエリを作成します。クエリで参照されるデータが複数のロケーションに保存されている場合、BigQuery はグローバルクエリの実行を試みます。場合によっては、BigQuery がクエリのロケーションを自動的に選択します。それ以外の場合は、クエリを実行するロケーションを指定する必要があります。選択したロケーションに存在しないクエリで参照されるデータは、そのロケーションにコピーされます。

次の例は、2 つの異なる場所に保存されている 2 つの異なるデータセットのテーブルを結合するグローバルクエリとして実行されます。

SELECT id, tr_date, product_id, price FROM us_dataset.transactions
UNION ALL
SELECT id, tr_date, product_id, price FROM europe_dataset.transactions

自動ロケーション選択

次の場合は、クエリを実行するロケーションが自動的に決定され、変更できません。

データ変更言語クエリ（INSERT、UPDATE、DELETE ステートメント）は、常にターゲットテーブルのロケーションで実行されます。
CREATE TABLE AS SELECT ステートメントなどのデータ定義言語クエリは、リソースが作成または変更されたロケーションで常に実行されます。
宛先テーブルが指定されたクエリは、常に宛先テーブルがあるロケーションで実行されます。

ロケーションを選択してください

通常、グローバルクエリが実行される場所を決定します。この判断を行うには、次の点を考慮してください。

グローバルクエリは、データをあるロケーションから別のロケーションに一時的にコピーします。組織にデータ所在地の要件があり、ロケーション A のデータをロケーション A から移動させたくない場合は、クエリのロケーションを A に設定します。
ロケーション間で転送されるデータ量を最小限に抑え、クエリの費用を削減するには、クエリ対象データの大部分が保存されているリージョンでクエリを実行します。

オンラインショップを運営しており、商品のリストは us-central1 に、取引は us-south1 リージョンに保存しているとします。カタログ内の商品よりもトランザクションが多い場合は、us-south1 リージョンでクエリを実行する必要があります。

グローバルクエリについて

グローバルクエリを効率的かつ費用対効果の高い方法で実行するには、その実行の背後にあるメカニズムを理解することが重要です。

異なるロケーションにあるデータを使用するには、データを 1 つのロケーションに複製する必要があります。以下は、BigQuery によって実行されるグローバルクエリワークフローの抽象化です。

クエリをユーザーの宣言から実行するか、自動的に実行するかを決定します。このロケーションはプライマリロケーションと呼ばれ、クエリで参照される他のすべてのロケーションはリモートロケーションと呼ばれます。
各リモートリージョンでサブクエリを実行して、プライマリリージョンでクエリを完了するために必要なデータを収集します。
このデータをリモートロケーションからプライマリロケーションにコピーします。
データをプライマリロケーションの一時テーブルに 24 時間保存します。
プライマリロケーションで収集されたすべてのデータを使用して最終クエリを実行します。
クエリ結果を返します。

BigQuery は、リージョン間で転送されるデータ量を最小限に抑えようとします。たとえば次のようになります。

SET @@location = 'EU';
SELECT
  t1.col1, t2.col2
FROM
  eu_dataset.table1 t1
  JOIN us_dataset.table2 t2 using col3
WHERE
  t2.col4 = 'ABC'

BigQuery は、テーブル t2 のすべてを米国から EU に複製する必要はありません。リクエストされた列（col2 と col3）と WHERE 条件（t2.col4 = 'ABC'）に一致する行のみを転送すれば十分です。ただし、プッシュダウンと呼ばれるこれらのメカニズムはクエリ構造に依存するため、転送されるデータ量が大きくなることがあります。データの小さなサブセットでグローバルクエリをテストし、データが必要な場合にのみ転送されることを確認することをおすすめします。

オブザーバビリティ

リモートリージョンに送信されたクエリテキストを確認するには、ジョブ履歴を確認します。リモートジョブのジョブ ID は、元のクエリと同じですが、_xregion 接尾辞が追加されています。

グローバルクエリをオフにする

プロジェクトまたは組織のグローバルクエリを無効にするには、ALTER PROJECT SET OPTIONS statement または ALTER ORGANIZATION SET OPTIONS statement を使用して、デフォルト構成を変更します。

リージョンでグローバルクエリを無効にするには、そのリージョンで enable_global_queries_execution 引数を false または NULL に設定します。
グローバルクエリがリージョンからデータをコピーすることを禁止するには、そのリージョンで enable_global_queries_data_access 引数を false または NULL に設定します。

次の例は、プロジェクトレベルでグローバルクエリを無効にする方法を示しています。

ALTER PROJECT PROJECT_ID
SET OPTIONS (
  `region-REGION.enable_global_queries_execution` = false,
  `region-REGION.enable_global_queries_data_access` = false
);

次のように置き換えます。

PROJECT_ID: 変更するプロジェクトの名前
REGION: グローバルクエリを無効にするリージョンの名前

変更が有効になるまで数分かかることがあります。

料金

グローバルクエリの費用は、次のコンポーネントで構成されます。

リモートロケーションのすべてのサブクエリのコンピューティング費用（これらのロケーションの料金モデルに基づく）
実行されるリージョンの最終クエリのコンピューティング費用（そのリージョンの料金モデルに基づく）
データレプリケーションの料金に基づく、異なるロケーション間のデータコピーの費用
ストレージ料金に基づく、リモートリージョンからプライマリリージョンにコピーされたデータ（24 時間）の保存費用

割り当て

グローバルクエリの割り当てについては、クエリジョブをご覧ください。

制限事項

クエリの実行の詳細と実行グラフに、リモートロケーションから処理および転送されたバイト数が表示されません。この情報は、ジョブ履歴で確認できるコピージョブに表示されます。グローバルクエリによって作成されたコピージョブのジョブ ID には、クエリジョブのジョブ ID が接頭辞として付加されます。
サンドボックスモードでは、グローバルクエリはサポートされていません。
リージョンエンドポイントを使用する場合、グローバルクエリはサポートされていません。
グローバルクエリでは、リージョン間のデータ転送に必要な時間のため、単一リージョンクエリよりもレイテンシが大きくなります。
グローバルクエリは、リージョン間のデータ転送を回避するためにキャッシュを使用しません。
グローバルクエリを使用して、疑似列（_PARTITIONTIME など）に対してクエリを実行することはできません。
グローバルクエリを使用して RANGE 型の列にクエリを実行することはできません。
グローバルクエリで柔軟な列名を使用して列をクエリすることはできません。
グローバルクエリでリモートリージョンから INFORMATION_SCHEMA ビューをクエリすることはできません。
グローバルな承認済みビューと承認済みルーティンはサポートされていません（あるロケーションのビューまたはルーティンが、別のロケーションのデータセットにアクセスすることを承認されている場合）。代わりに、データが配置されているリージョンに承認済みビューを作成し、グローバルクエリを使用して承認済みビューにクエリを実行します。
グローバルクエリに対するマテリアライズドビューはサポートされていません。
グローバルクエリが STRUCT 列を参照している場合、リモートサブクエリにプッシュダウンは適用されません。パフォーマンスを最適化するには、リモートリージョンでビューを作成し、STRUCT 列をフィルタして、必要なフィールドのみを個々の列として返すようにすることをご検討ください。
グローバルクエリはアトミックに実行されません。データレプリケーションは成功したが、クエリ全体が失敗した場合でも、データレプリケーションに対して課金されます。
グローバルクエリの実行の一部としてリモートリージョンに作成された一時テーブルは、グローバルクエリの結果を暗号化するように構成された CMEK 鍵（テーブル、データセット、プロジェクトのいずれかのレベル）がグローバルである場合にのみ、顧客管理の暗号鍵（CMEK）を使用して暗号化されます。リモート一時テーブルが常に CMEK を使用して保護されるようにするには、リモートリージョンでグローバルクエリを実行するプロジェクトのデフォルトの KMS 鍵を設定します。
グローバルクエリは Assured Workloads ではサポートされていません。
1 つのグローバルクエリで、リージョンごとに最大 10 個のリモートテーブルにアクセスできます。