数据集简介

此页面简要介绍 BigQuery 中的数据集。

数据集

数据集包含在特定项目中,数据集是用来组织和控制视图访问权限的顶级容器。表或视图必须属于数据集,因此需要创建至少一个数据集,才能将数据加载到 BigQuery 中。 使用 GoogleSQL 时,请使用 projectname.datasetname 格式来完全限定数据集名称;使用 bq 命令行工具时,请使用 projectname:datasetname 格式来完全限定数据集名称。

位置

您在创建数据集时会指定一个位置用于存储 BigQuery 数据。如需查看 BigQuery 数据集位置的列表,请参阅 BigQuery 位置。创建数据集后,该位置无法更改。

BigQuery 在包含待查询表的数据集所在的位置处理查询。BigQuery将您的数据存储在选定位置。

数据保留

数据集将时间旅行故障安全期结合使用,以将已删除和修改的数据保留一小段时间,以防您需要恢复数据。如需了解详情,请参阅使用时间旅行和故障安全功能保留数据

外部数据集

除了 BigQuery 数据集之外,您还可以创建外部数据集,即指向外部数据源的链接:

外部数据集也称为联合数据集;这两个术语可互换使用。

创建后,外部数据集将包含引用的外部数据源中的表。这些表中的数据不会复制到 BigQuery 中,而是在每次使用时进行查询。如需了解详情,请参阅 Spanner 联合查询

限制

BigQuery 数据集有以下限制:

  • 数据集位置只能在创建时设置。创建数据集后,就无法再更改其位置。
  • 查询中引用的所有表必须存储在位于同一位置的数据集中。
  • 外部数据集不支持表到期、副本、时间旅行、默认排序规则、默认舍入模式,或用于启用或停用不区分大小写的表名称的选项。

  • 复制表时,包含源表和目标表的数据集必须位于同一位置。

  • 各个项目的数据集名称不得重复。

配额

要详细了解数据集配额和限制,请参阅配额和限制

安全性

如需控制对 BigQuery 中数据集的访问权限,请参阅控制对数据集的访问权限。 如需了解数据加密,请参阅静态加密

后续步骤