Introdução aos conjuntos de dados

Nesta página, você encontra uma visão geral dos conjuntos de dados no BigQuery.

Conjuntos de dados

Um conjunto de dados fica contido em um projeto específico. Os conjuntos de dados são contêineres de nível superior usados na organização e no controle de acesso a suas tabelas e visualizações. É obrigatório que uma tabela ou visualização pertença a um conjunto de dados, então crie pelo menos um desses conjuntos antes de carregar dados no BigQuery. Use o formato projectname.datasetname para qualificar totalmente um nome do conjunto de dados ao usar o GoogleSQL, ou o formato projectname:datasetname para qualificar totalmente um nome de tabela ao usar a ferramenta de linha de comando bq.

Local

Você especifica um local para armazenar os dados do BigQuery ao criar um conjunto de dados. Para conferir uma lista de locais de conjuntos de dados do BigQuery, consulte Locais do BigQuery. O BigQuery armazena os dados no local selecionado. Por exemplo, se você escolher EU ou uma região com base na UE para o local do conjunto de dados, os principais dados de cliente do BigQuery ficarão na União Europeia.

Depois da criação, não é possível alterar o local, .

Se você não especificar um local, ele será determinado de uma das seguintes maneiras:

  • O local dos conjuntos de dados referenciados na solicitação. Por exemplo, se uma consulta referenciar uma tabela ou uma visualização em um conjunto de dados armazenado na região asia-northeast1, o job de consulta será executado em asia-northeast1.
  • A região especificada para uma conexão referenciada em uma solicitação.
  • O local de uma tabela de destino.

Se o local não for especificado explicitamente e não puder ser determinado pelos recursos na solicitação, o local padrão será usado. Se o local padrão não estiver definido, o job será executado na multirregião US.

Retenção de dados

Uso de conjuntos de dados de tempo de deslocamento em conjunto com o período de segurança contra falhas para reter dados excluídos e modificados por um curto período caso seja necessário recuperá-los. Para mais informações, consulte Retenção de dados com tempo de deslocamento e segurança contra falhas.

Conjuntos de dados externos

Além dos conjuntos de dados do BigQuery, é possível criar conjuntos de dados externos, que são links para fontes de dados externas:

Os conjuntos de dados externos também são conhecidos como conjuntos de dados federados. Os dois termos são usados de forma intercambiável.

Depois de criados, os conjuntos de dados externos contêm tabelas de uma fonte de dados externa referenciada. Os dados dessas tabelas não são copiados para o BigQuery, mas consultados sempre que são usados. Para mais informações, consulte Consultas federadas do Spanner.

Limitações

Os conjuntos de dados do BigQuery estão sujeitos às seguintes limitações:

  • O local do conjunto de dados só pode ser definido no momento da criação. Depois que um conjunto de dados é criado, o local não pode ser alterado.
  • Todas as tabelas referenciadas em uma consulta precisam ser armazenadas em conjuntos de dados no mesmo local.
  • Os conjuntos de dados externos não são compatíveis com expiração de tabelas, réplicas, viagem no tempo, ordenação padrão, modo de arredondamento padrão ou a opção de ativar ou desativar nomes de tabelas que não diferenciam maiúsculas de minúsculas.

  • Ao copiar uma tabela, os conjuntos de dados que contêm as tabelas de origem e de destino precisam estar no mesmo local.

  • Os conjuntos de dados de cada projeto precisam ter nomes exclusivos.

Cotas

Para mais informações sobre cotas e limites de conjuntos de dados, consulte Cotas e limites.

Segurança

Para controlar o acesso a conjuntos de dados no BigQuery, consulte Como controlar o acesso a conjuntos de dados. Para saber mais sobre criptografia de dados, consulte Criptografia em repouso.

A seguir