Visualize gráficos com os DataFrames do BigQuery
Este documento demonstra como traçar vários tipos de gráficos através da biblioteca de visualização BigQuery DataFrames.
A bigframes.pandas
API
oferece um ecossistema completo de ferramentas para Python. A API suporta operações estatísticas avançadas e pode visualizar as agregações geradas a partir de DataFrames do BigQuery. Também pode mudar de
BigQuery DataFrames para um pandas
DataFrame com operações de amostragem incorporadas.
Histograma
O exemplo seguinte lê dados da tabela para traçar um histograma sobre a distribuição das profundidades do bico de pinguins:bigquery-public-data.ml_datasets.penguins
Gráfico de linhas
O exemplo seguinte usa dados da tabela bigquery-public-data.noaa_gsod.gsod2021
para traçar um gráfico de linhas das alterações da temperatura mediana ao longo do ano:
Gráfico de áreas
O exemplo seguinte usa a tabela bigquery-public-data.usa_names.usa_1910_2013
para acompanhar a popularidade dos nomes na história dos EUA e foca-se nos nomes Mary
, Emily
e Lisa
:
Gráfico de barras
O exemplo seguinte usa a tabela bigquery-public-data.ml_datasets.penguins
para
visualizar a distribuição dos sexos dos pinguins:
Gráfico de dispersão
O exemplo seguinte usa a tabela bigquery-public-data.new_york_taxi_trips.tlc_yellow_trips_2021
para explorar a relação entre os valores das tarifas de táxi e as distâncias das viagens:
Visualizar um grande conjunto de dados
O BigQuery DataFrames transfere dados para o seu computador local para visualização. O número de pontos de dados a transferir está limitado a 1000 por predefinição. Se o número de pontos de dados exceder o limite máximo, os DataFrames do BigQuery usam uma amostragem aleatória do número de pontos de dados igual ao limite máximo.
Pode substituir este limite definindo o parâmetro sampling_n
ao traçar um gráfico, conforme mostrado no exemplo seguinte:
Representação gráfica avançada com parâmetros pandas e Matplotlib
Pode transmitir mais parâmetros para ajustar o seu gráfico, tal como pode fazer com o pandas, porque a biblioteca de representação gráfica dos DataFrames do BigQuery é baseada no pandas e no Matplotlib. As secções seguintes descrevem exemplos.
Tendência de popularidade dos nomes com subgráficos
Usando os dados do histórico de nomes do exemplo de gráfico de área, o exemplo seguinte cria gráficos individuais para cada nome definindo subplots=True
na chamada da função plot.area()
:
Gráfico de dispersão de viagens de táxi com várias dimensões
Usando dados do exemplo de gráfico de dispersão, o exemplo seguinte
muda o nome das etiquetas do eixo x e do eixo y, usa o parâmetro passenger_count
para os tamanhos dos pontos, usa pontos de cor com o parâmetro tip_amount
e redimensiona a figura:
O que se segue?
- Saiba como usar os DataFrames do BigQuery.
- Saiba como usar frames de dados do BigQuery no dbt.
- Explore a referência da API BigQuery DataFrames.