Introdução aos conjuntos de dados
Nesta página, você encontra uma visão geral dos conjuntos de dados no BigQuery.
Conjuntos de dados
Um conjunto de dados fica contido em um projeto específico. Os conjuntos de dados
são contêineres de nível superior usados na organização e no controle de acesso a suas
tabelas e visualizações. É obrigatório
que uma tabela ou visualização pertença a um conjunto de dados, então
crie pelo menos um desses conjuntos antes de
carregar dados no BigQuery.
Use o formato projectname.datasetname
para qualificar totalmente um nome do conjunto de dados
ao usar o GoogleSQL, ou o formato projectname:datasetname
para qualificar totalmente um nome de tabela ao usar a ferramenta de linha de comando bq.
Local
Você especifica um local para armazenar os dados do BigQuery ao criar um conjunto de dados. Para conferir uma lista de locais de conjuntos de dados do BigQuery, consulte Locais do BigQuery. Depois da criação, não é possível alterar o local,.
O BigQuery processa consultas no mesmo local em que o conjunto de dados que contém as tabelas que você está consultando. O BigQuery armazena os dados no local selecionado
Retenção de dados
Uso de conjuntos de dados de tempo de deslocamento em conjunto com o período de segurança contra falhas para reter dados excluídos e modificados por um curto período caso seja necessário recuperá-los. Para mais informações, consulte Retenção de dados com tempo de deslocamento e segurança contra falhas.
Conjuntos de dados externos
Além dos conjuntos de dados do BigQuery, você pode criar conjuntos de dados externos, que são links para fontes de dados externas:
Os conjuntos de dados externos também são conhecidos como conjuntos de dados federados, e os dois termos são usados de forma intercambiável.
Depois de criados, os conjuntos de dados externos contêm tabelas de uma fonte de dados externa referenciada. Os dados dessas tabelas não são copiados para o BigQuery, mas consultados sempre que são usados. Para mais informações, consulte Consultas federadas do Spanner.
Limitações
Os conjuntos de dados do BigQuery estão sujeitos às seguintes limitações:
- O local do conjunto de dados só pode ser definido no momento da criação. Depois que um conjunto de dados é criado, o local não pode ser alterado.
- Todas as tabelas referenciadas em uma consulta precisam ser armazenadas em conjuntos de dados no mesmo local.
Os conjuntos de dados externos não são compatíveis com a expiração de tabelas, réplicas, viagem no tempo, ordenação padrão, modo de arredondamento padrão ou a opção de ativar ou desativar o nome de tabelas sem distinção entre maiúsculas e minúsculas.
Ao copiar uma tabela, os conjuntos de dados que contêm as tabelas de origem e de destino precisam estar no mesmo local.
Os conjuntos de dados de cada projeto precisam ter nomes exclusivos.
Cotas
Para mais informações sobre cotas e limites de conjuntos de dados, consulte Cotas e limites.
Segurança
Para controlar o acesso a conjuntos de dados no BigQuery, consulte Como controlar o acesso a conjuntos de dados. Para saber mais sobre criptografia de dados, consulte Criptografia em repouso.
A seguir
- Para mais informações sobre a criação de conjuntos de dados, consulte Como criar conjuntos de dados.
- Para mais informações sobre como atribuir controles de acesso a conjuntos de dados, consulte Como controlar o acesso a conjuntos de dados.