Algumas ou todas as informações nesta página podem não se aplicar ao Cloud de Confiance by S3NS. Consulte o artigo Diferenças em relação ao Google Cloud para mais detalhes.

Esta página foi traduzida pela API Cloud Translation.

Gerir dados de tabelas

Este documento descreve como gerir os dados das tabelas no BigQuery. Pode trabalhar com dados de tabelas do BigQuery das seguintes formas:

Carregue dados numa tabela
Anexe ou substitua dados de tabelas
Explorar (ou pré-visualizar) dados de tabelas
Consultar dados de tabelas
Modifique os dados das tabelas através da linguagem de manipulação de dados (DML)
Copie dados da tabela
Exporte dados de tabelas

Para obter informações sobre a gestão de esquemas de tabelas, consulte o artigo Modificar esquemas de tabelas.

Antes de começar

Atribua funções que concedam as autorizações necessárias aos utilizadores que precisam de realizar cada tarefa neste documento. As autorizações necessárias (se aplicável) para realizar uma tarefa são apresentadas na secção "Autorizações necessárias" da tarefa.

Carregar dados numa tabela

Pode carregar dados quando cria uma tabela ou pode criar uma tabela vazia e carregar os dados mais tarde. Quando carrega dados, pode usar a deteção automática de esquemas para formatos de dados suportados ou pode especificar o esquema.

Para mais informações sobre o carregamento de dados, consulte a documentação sobre o formato e a localização dos dados de origem:

Para mais informações sobre o carregamento de dados a partir do Cloud Storage, consulte:
Para mais informações sobre o carregamento de dados a partir de uma origem local, consulte o artigo Carregar dados a partir de ficheiros locais.

Anexar e substituir dados de tabelas

Pode substituir os dados da tabela através de uma operação de carregamento ou consulta. Pode anexar dados adicionais a uma tabela existente executando uma operação de carregamento e anexação ou anexando os resultados da consulta à tabela.

Para mais informações sobre como anexar ou substituir uma tabela ao carregar dados, consulte a documentação do formato de dados de origem:

Para acrescentar ou substituir uma tabela com os resultados da consulta, especifique uma tabela de destino e defina a disposição de escrita como:

Anexar à tabela: anexa os resultados da consulta a uma tabela existente.
Substituir tabela: substitui uma tabela existente com o mesmo nome usando os resultados da consulta.

Pode usar a seguinte consulta para anexar registos de uma tabela a outra:

  INSERT INTO <projectID>.<datasetID>.<table1> (
    <column2>,
    <column3>) (SELECT * FROM <projectID>.<datasetID>.<table2>)

Para mais informações sobre a utilização dos resultados das consultas para acrescentar ou substituir dados, consulte o artigo Escrever resultados de consultas.

Explorar dados de tabelas

Pode procurar ou ler dados de tabelas das seguintes formas:

Usar a Cloud de Confiance consola
Usar o comando bq head da ferramenta de linhas de comando bq
Chamar o método da API tabledata.list
Usar as bibliotecas de cliente

Autorizações necessárias

Para ler dados de tabelas e partições, precisa da autorização de bigquery.tables.getData Identity and Access Management (IAM).

Cada uma das seguintes funções de IAM predefinidas inclui as autorizações de que precisa para procurar dados de tabelas e partições:

roles/bigquery.dataViewer
roles/bigquery.dataEditor
roles/bigquery.dataOwner
roles/bigquery.admin

Se tiver a autorização bigquery.datasets.create, pode procurar dados nas tabelas e nas partições dos conjuntos de dados que criar.

Para mais informações sobre as funções e as autorizações do IAM no BigQuery, consulte o artigo Funções e autorizações predefinidas.

Explorar dados de tabelas

Para procurar dados de tabelas:

Consola

Na Cloud de Confiance consola, abra a página do BigQuery.

Aceda ao BigQuery
No painel esquerdo, clique em Explorador:

Se não vir o painel do lado esquerdo, clique em Expandir painel do lado esquerdo para o abrir.
No painel Explorador, expanda o seu projeto, clique em Conjuntos de dados e, de seguida, selecione um conjunto de dados.
Clique em Vista geral > Tabelas e, de seguida, selecione a tabela.
Clique em Detalhes e tome nota do valor em Número de linhas. Pode precisar deste valor para controlar o ponto de partida dos resultados através da ferramenta de linhas de comando bq ou da API.
Clique em Pré-visualizar. É apresentado um conjunto de dados de exemplo.

Linha de comandos

Emita o comando bq head com a flag --max_rows para listar todas as colunas num determinado número de linhas da tabela. Se --max_rows não for especificado, o valor predefinido é 100.

Para procurar um subconjunto de colunas na tabela (incluindo colunas aninhadas e repetidas), use a flag --selected_fields e introduza as colunas como uma lista separada por vírgulas.

Para especificar o número de linhas a ignorar antes de apresentar os dados da tabela, use a flag --start_row=integer (ou o atalho -s). O valor predefinido é 0. Pode obter o número de linhas numa tabela através do comando bq show para obter informações da tabela.

Se a tabela que está a explorar estiver num projeto diferente do projeto predefinido, adicione o ID do projeto ao comando no seguinte formato: project_id:dataset.table.

bq head \
--max_rows integer1 \
--start_row integer2 \
--selected_fields "columns" \
project_id:dataset.table

Onde:

integer1 é o número de linhas a apresentar.
integer2 é o número de linhas a ignorar antes de apresentar os dados.
columns é uma lista de colunas separadas por vírgulas.
project_id é o ID do seu projeto.
dataset é o nome do conjunto de dados que contém a tabela.
table é o nome da tabela a explorar.

Exemplos:

Introduza o seguinte comando para apresentar uma lista de todas as colunas nas primeiras 10 linhas em mydataset.mytable. mydataset está no seu projeto predefinido.

bq head --max_rows=10 mydataset.mytable

Introduza o seguinte comando para apresentar uma lista de todas as colunas nas primeiras 100 linhas em mydataset.mytable. mydataset está em myotherproject e não no seu projeto predefinido.

bq head myotherproject:mydataset.mytable

Introduza o seguinte comando para apresentar apenas field1 e field2 em mydataset.mytable. O comando usa a flag --start_row para avançar para a linha 100. mydataset.mytable está no seu projeto predefinido.

bq head --start_row 100 --selected_fields "field1,field2" mydataset.mytable

Uma vez que o comando bq head não cria uma tarefa de consulta, os comandos bq head não aparecem no seu histórico de consultas e não lhe são cobrados.

API

Procure os dados de uma tabela chamando tabledata.list. Especifique o nome da tabela no parâmetro tableId.

Configure estes parâmetros opcionais para controlar a saída:

maxResults: número máximo de resultados a devolver
selectedFields: lista de colunas separadas por vírgulas a devolver; se não for especificado, são devolvidas todas as colunas
startIndex — Índice baseado em zero da linha inicial a ler

Os valores são devolvidos envolvidos num objeto JSON que tem de analisar, conforme descrito na documentação de referência tabledata.list.