このページの情報の一部またはすべては、S3NS の Trusted Cloud には適用されない場合があります。
データセットの概要
このページでは、BigQuery のデータセットの概要について説明します。
データセット
データセットは、特定のプロジェクト内に含まれています。データセットは、テーブルとビューへのアクセスを整理して制御するための最上位のコンテナです。テーブルとビューはデータセットに属していなければなりません。したがって、データを BigQuery に読み込む前に、1 つ以上のデータセットを作成する必要があります。データセット名を完全修飾するとき、GoogleSQL では projectname.datasetname
形式、bq コマンドライン ツールでは projectname:datasetname
形式を使用します。
ロケーション
データセットの作成時に BigQuery データを保存するロケーションを指定します。BigQuery データセットのロケーションの一覧については、BigQuery のロケーションをご覧ください。データセットの作成後はロケーションを変更することはできませんが。
BigQuery は、クエリ対象のテーブルを含むデータセットと同じロケーションでクエリを処理します。BigQuery では、サービス固有の規約に従って、選択されたロケーション
データの保持
データセットでは、削除または変更されたデータを復元が必要となる場合に備えて短時間保持するために、タイムトラベルとフェイルセーフ期間が組み合わせて使用されます。詳細については、タイムトラベルとフェイルセーフによるデータの保持をご覧ください。
外部データセット
BigQuery データセットに加えて、次の外部データセット(外部データソースへのリンク)を作成できます。
外部データセットは連携データセットとも呼ばれ、どちらの用語も同じ意味で使用されます。
作成された外部データセットには、参照先の外部データソースのテーブルが含まれます。これらのテーブルのデータは BigQuery にコピーされず、使用のたびにクエリされます。詳細については、Spanner 連携クエリをご覧ください。
制限事項
BigQuery データセットには次の制限があります。
- データセットのロケーションは、作成時にのみ設定できます。データセットの作成後はそのロケーションを変更できません。
- 1 つのクエリで参照されるすべてのテーブルは、同じロケーションにあるデータセット内に保存されている必要があります。
外部データセットでは一部のオプションがサポートされていません。これには、大文字と小文字を区別しないテーブル名の有効/無効、テーブルの有効期限、レプリカ、タイムトラベル、デフォルトの照合順序、デフォルトの丸めモードがあります。
テーブルをコピーする場合、コピー元とコピー先のテーブルが同じロケーションに存在する必要があります。
データセット名は各プロジェクトで一意である必要があります。
割り当て
データセットの割り当てと上限の詳細については、割り当てと上限をご覧ください。
セキュリティ
BigQuery でデータセットへのアクセスを制御するには、データセットへのアクセスの制御をご覧ください。データ暗号化の詳細については、保存データの暗号化をご覧ください。
次のステップ
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-08-08 UTC。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["必要な情報がない","missingTheInformationINeed","thumb-down"],["複雑すぎる / 手順が多すぎる","tooComplicatedTooManySteps","thumb-down"],["最新ではない","outOfDate","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["サンプル / コードに問題がある","samplesCodeIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2025-08-08 UTC。"],[[["Datasets are top-level containers within a project that organize and control access to tables and views, requiring at least one dataset to be created before loading data into BigQuery."],["Dataset locations are set during creation and cannot be changed afterward, impacting where data is stored and processed, with an option to copy or recreate the dataset if needed in a different location."],["Storage billing models for datasets can be chosen as either logical or physical, influencing storage pricing, although changing this model has a 14-day waiting period before another change can be made."],["External datasets, also known as federated datasets, link to external data sources like Spanner or AWS Glue, enabling queries without copying data into BigQuery."],["Datasets have limitations, such as location immutability post-creation, the need for tables in a query to be in the same location, and constraints on storage billing model changes."]]],[]]