Introdução aos conjuntos de dados
Nesta página, você encontra uma visão geral dos conjuntos de dados no BigQuery.
Conjuntos de dados
Um conjunto de dados fica contido em um projeto específico. Os conjuntos de dados
são contêineres de nível superior usados na organização e no controle de acesso a suas
tabelas e visualizações. É obrigatório
que uma tabela ou visualização pertença a um conjunto de dados, então
crie pelo menos um desses conjuntos antes de
carregar dados no BigQuery.
Use o formato projectname.datasetname para qualificar totalmente um nome do conjunto de dados
ao usar o GoogleSQL, ou o formato projectname:datasetname
para qualificar totalmente um nome de tabela ao usar a ferramenta de linha de comando bq.
Local
Você especifica um local para armazenar os dados do BigQuery ao criar um conjunto de dados. Para conferir uma lista de locais de conjuntos de dados do BigQuery, consulte Locais do BigQuery. O BigQuery armazena os dados no local selecionado.
Por exemplo, se você escolher EU ou uma região com base na UE para o local do conjunto de dados, os principais dados de cliente do BigQuery ficarão na União Europeia.
Depois da criação, não é possível alterar o local, .
Se você não especificar um local, ele será determinado de uma das seguintes maneiras:
- O local dos conjuntos de dados referenciados na solicitação. Por exemplo, se uma consulta referenciar uma tabela ou uma visualização em um conjunto de dados armazenado na região
asia-northeast1, o job de consulta será executado emasia-northeast1. - A região especificada para uma conexão referenciada em uma solicitação.
- O local de uma tabela de destino.
Se o local não for especificado explicitamente e não puder ser determinado pelos
recursos na solicitação, o local padrão será usado. Se o local padrão não estiver definido, o job será executado na multirregião US.
Retenção de dados
Uso de conjuntos de dados de tempo de deslocamento em conjunto com o período de segurança contra falhas para reter dados excluídos e modificados por um curto período caso seja necessário recuperá-los. Para mais informações, consulte Retenção de dados com tempo de deslocamento e segurança contra falhas.
Conjuntos de dados externos
Além dos conjuntos de dados do BigQuery, é possível criar conjuntos de dados externos, que são links para fontes de dados externas:
Os conjuntos de dados externos também são conhecidos como conjuntos de dados federados. Os dois termos são usados de forma intercambiável.
Depois de criados, os conjuntos de dados externos contêm tabelas de uma fonte de dados externa referenciada. Os dados dessas tabelas não são copiados para o BigQuery, mas consultados sempre que são usados. Para mais informações, consulte Consultas federadas do Spanner.
Limitações
Os conjuntos de dados do BigQuery estão sujeitos às seguintes limitações:
- O local do conjunto de dados só pode ser definido no momento da criação. Depois que um conjunto de dados é criado, o local não pode ser alterado.
- Todas as tabelas referenciadas em uma consulta precisam ser armazenadas em conjuntos de dados no mesmo local.
Os conjuntos de dados externos não são compatíveis com expiração de tabelas, réplicas, viagem no tempo, ordenação padrão, modo de arredondamento padrão ou a opção de ativar ou desativar nomes de tabelas que não diferenciam maiúsculas de minúsculas.
Ao copiar uma tabela, os conjuntos de dados que contêm as tabelas de origem e de destino precisam estar no mesmo local.
Os conjuntos de dados de cada projeto precisam ter nomes exclusivos.
Cotas
Para mais informações sobre cotas e limites de conjuntos de dados, consulte Cotas e limites.
Segurança
Para controlar o acesso a conjuntos de dados no BigQuery, consulte Como controlar o acesso a conjuntos de dados. Para saber mais sobre criptografia de dados, consulte Criptografia em repouso.
A seguir
- Para mais informações sobre a criação de conjuntos de dados, consulte Como criar conjuntos de dados.
- Para mais informações sobre como atribuir controles de acesso a conjuntos de dados, consulte Como controlar o acesso a conjuntos de dados.