Pode explorar os resultados das consultas do BigQuery através dos blocos de notas do Colab Enterprise no BigQuery.
Neste tutorial, consulta dados de um conjunto de dados públicos do BigQuery e explora os resultados da consulta num bloco de notas.
Autorizações necessárias
Para criar e executar blocos de notas, precisa das seguintes funções de gestão de identidade e de acesso (IAM):
- Utilizador do BigQuery (
roles/bigquery.user) - Notebook Runtime User (
roles/aiplatform.notebookRuntimeUser) - Code Creator (
roles/dataform.codeCreator)
Abra os resultados da consulta num bloco de notas
Pode executar uma consulta SQL e, em seguida, usar um bloco de notas para explorar os dados. Esta abordagem é útil se quiser modificar os dados no BigQuery antes de trabalhar com eles ou se precisar apenas de um subconjunto dos campos na tabela.
Na Cloud de Confiance consola, aceda à página BigQuery.
No campo Escreva para pesquisar, introduza
bigquery-public-data.Se o projeto não for apresentado, introduza
bigqueryno campo de pesquisa e, de seguida, clique em Pesquisar em todos os projetos para fazer corresponder a string de pesquisa aos projetos existentes.Selecione bigquery-public-data > ml_datasets > penguins.
Para a tabela penguins, clique em Ver ações e, de seguida, em Consultar.
Adicione um asterisco (
*) para a seleção de campos à consulta gerada, de modo que seja lida como no exemplo seguinte:SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;
Clique em Executar.
Na secção Resultados da consulta, clique em Abrir em e, de seguida, clique em Bloco de notas.
Prepare o notebook para utilização
Prepare o bloco de notas para utilização associando-o a um tempo de execução e definindo os valores predefinidos da aplicação.
- No cabeçalho do bloco de notas, clique em Associar para associar ao tempo de execução predefinido.
- No bloco de código Setup, clique em Executar célula.
Explore os dados
- Para carregar os dados de pinguins para um BigQuery DataFrame e mostrar os resultados, clique em Executar célula no bloco de código na secção Conjunto de resultados carregado da tarefa do BigQuery como um DataFrame.
- Para obter métricas descritivas para os dados, clique em Executar célula no bloco de código na secção Mostrar estatísticas descritivas com describe().
- Opcional: use outras funções ou pacotes do Python para explorar e analisar os dados.
O exemplo de código seguinte mostra a utilização de
bigframes.pandas
para analisar dados e bigframes.ml
para criar um modelo de regressão linear a partir de dados de pinguins num
DataFrame do BigQuery: