Monitorize consultas contínuas
Pode monitorizar as consultas contínuas do BigQuery através das seguintes ferramentas do BigQuery:
INFORMATION_SCHEMA
visualizações- Gráficos de execução de consultas
- Histórico profissional
- Explorador de trabalhos administrativos
Devido à natureza de execução prolongada de uma consulta contínua do BigQuery, as métricas que são normalmente geradas após a conclusão de uma consulta SQL podem estar ausentes ou ser imprecisas.
Use INFORMATION_SCHEMA
visualizações
Pode usar várias vistas INFORMATION_SCHEMA
para monitorizar consultas contínuas e reservas de consultas contínuas.
Ver detalhes do trabalho
Pode usar a vista
JOBS
para obter
metadados de tarefas de consulta contínuas.
A seguinte consulta devolve os metadados de todas as consultas contínuas ativas. Os metadados incluem a data/hora da marca de água de saída, que representa o ponto até ao qual a consulta contínua processou dados com êxito.
Na Trusted Cloud consola, aceda à página BigQuery.
No editor de consultas, execute a seguinte consulta:
SELECT start_time, job_id, user_email, query, state, reservation_id, continuous_query_info.output_watermark FROM `PROJECT_ID.region-REGION.INFORMATION_SCHEMA.JOBS` WHERE creation_time > TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 7 day) AND continuous IS TRUE AND state = "RUNNING" ORDER BY start_time DESC
Substitua o seguinte:
PROJECT_ID
: o ID do projeto.REGION
: qualquer nome da região do conjunto de dados. Por exemplo,region-us
.
Veja os detalhes da atribuição de reservas
Pode usar as vistas
ASSIGNMENTS
e
RESERVATIONS
para obter
detalhes de atribuição de reservas de consultas contínuas.
Devolve detalhes de atribuição de reservas para consultas contínuas:
Na Trusted Cloud consola, aceda à página BigQuery.
No editor de consultas, execute a seguinte consulta:
SELECT reservation.reservation_name, reservation.slot_capacity FROM `ADMIN_PROJECT_ID.region-LOCATION.INFORMATION_SCHEMA.ASSIGNMENTS` AS assignment INNER JOIN `ADMIN_PROJECT_ID.region-LOCATION.INFORMATION_SCHEMA.RESERVATIONS` AS reservation ON (assignment.reservation_name = reservation.reservation_name) WHERE assignment.assignee_id = 'PROJECT_ID' AND job_type = 'CONTINUOUS';
Substitua o seguinte:
ADMIN_PROJECT_ID
: o ID do projeto de administração que detém a reserva.LOCATION
: a localização da reserva.PROJECT_ID
: o ID do projeto atribuído à reserva. Apenas são devolvidas informações sobre consultas contínuas em execução neste projeto.
Veja informações sobre o consumo de ranhuras
Pode usar as vistas
ASSIGNMENTS
,
RESERVATIONS
e
JOBS_TIMELINE
para obter
informações contínuas sobre o consumo de slots de consultas.
Devolve informações de consumo de ranhuras para consultas contínuas:
Na Trusted Cloud consola, aceda à página BigQuery.
No editor de consultas, execute a seguinte consulta:
SELECT jobs.period_start, reservation.reservation_name, reservation.slot_capacity, SUM(jobs.period_slot_ms) / 1000 AS consumed_total_slots FROM `ADMIN_PROJECT_ID.region-LOCATION.INFORMATION_SCHEMA.ASSIGNMENTS` AS assignment INNER JOIN `ADMIN_PROJECT_ID.region-LOCATION.INFORMATION_SCHEMA.RESERVATIONS` AS reservation ON (assignment.reservation_name = reservation.reservation_name) INNER JOIN `PROJECT_ID.region-LOCATION.INFORMATION_SCHEMA.JOBS_TIMELINE` AS jobs ON ( UPPER(CONCAT('ADMIN_PROJECT_ID:LOCATION.', assignment.reservation_name)) = UPPER(jobs.reservation_id)) WHERE assignment.assignee_id = 'PROJECT_ID' AND assignment.job_type = 'CONTINUOUS' AND jobs.period_start BETWEEN TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 1 DAY) AND CURRENT_TIMESTAMP() GROUP BY 1, 2, 3 ORDER BY jobs.period_start DESC;
Substitua o seguinte:
ADMIN_PROJECT_ID
: o ID do projeto de administração que detém a reserva.LOCATION
: a localização da reserva.PROJECT_ID
: o ID do projeto atribuído à reserva. Apenas são devolvidas informações sobre consultas contínuas em execução neste projeto.
Também pode monitorizar as reservas de consultas contínuas através de outras ferramentas, como o explorador de métricas e os gráficos de recursos administrativos. Para mais informações, consulte o artigo Monitorize as reservas do BigQuery.
Use o gráfico de execução de consultas
Pode usar o gráfico de execução de consultas para obter estatísticas gerais e estatísticas de desempenho para uma consulta contínua. Para mais informações, consulte o artigo Veja estatísticas de desempenho das consultas.
Veja o histórico de trabalhos
Pode ver os detalhes das tarefas de consulta contínua no seu histórico de tarefas pessoal ou no histórico de tarefas do projeto. Para mais informações, consulte o artigo Veja os detalhes da tarefa.
Tenha em atenção que a lista de tarefas do histórico é ordenada pela hora de início da tarefa, pelo que as consultas contínuas que estão a ser executadas há algum tempo podem não estar perto do início da lista.
Use o explorador de tarefas administrativas
No explorador de tarefas administrativas, filtre as suas tarefas para mostrar consultas contínuas definindo o filtro Categoria da tarefa como Consulta contínua.
Utilize o Cloud Monitoring
Pode ver métricas específicas das consultas contínuas do BigQuery através do Cloud Monitoring. Para mais informações, consulte os artigos Crie painéis de controlo, gráficos e alertas e leia acerca das métricas disponíveis para visualização.
Alerta sobre consultas com falhas
Em vez de verificar rotineiramente se as suas consultas contínuas falharam, pode ser útil criar um alerta para receber uma notificação em caso de falha. Uma forma de o fazer é criar uma métrica baseada em registos do Cloud Logging personalizada com um filtro para os seus trabalhos e uma política de alertas do Cloud Monitoring com base nessa métrica:
- Quando cria uma consulta contínua, use um
prefixo de ID da tarefa personalizado.
Várias consultas contínuas podem partilhar o mesmo prefixo.
Por exemplo, pode usar o prefixo
prod-
para indicar uma consulta de produção. Na Trusted Cloud consola, aceda à página Métricas baseadas em registos.
Clique em Criar métrica. É apresentado o painel Criar métrica de registos.
Para Tipo de métrica, selecione Contador.
Na secção Detalhes, atribua um nome à métrica. Por exemplo,
CUSTOM_JOB_ID_PREFIX-metric
.Na secção Seleção de filtros, introduza o seguinte no editor de Criação de filtros:
resource.type = "bigquery_project" protoPayload.resourceName : "projects/PROJECT_ID/jobs/CUSTOM_JOB_ID_PREFIX" severity = ERROR
Substitua o seguinte:
PROJECT_ID
: o nome do seu projeto.CUSTOM_JOB_ID_PREFIX
: o nome do prefixo do ID da tarefa personalizado que definiu para a sua consulta contínua.
Clique em Criar métrica.
No menu de navegação, clique em Métricas baseadas em registos. A métrica que acabou de criar aparece na lista de métricas definidas pelo utilizador.
Na linha da métrica, clique em
Mais ações e, de seguida, em Criar alerta a partir da métrica.Clicar em Seguinte. Não precisa de alterar as predefinições na página Modo de configuração de políticas.
Clicar em Seguinte. Não tem de alterar as predefinições na página Configurar acionador de alerta.
Selecione os canais de notificação e introduza um nome para a política de alerta.
Clique em Criar política.
Pode testar o seu alerta executando uma consulta contínua com o prefixo do ID da tarefa personalizado que selecionou e, em seguida, cancelando-o. A receção do alerta no seu canal de notificação pode demorar alguns minutos.
Repetir consultas com falha
Voltar a tentar uma consulta contínua com falha pode ajudar a evitar situações em que um pipeline contínuo está inativo durante um período prolongado ou requer intervenção humana para ser reiniciado. Seguem-se alguns aspetos importantes a ter em conta quando tenta novamente uma consulta contínua com falhas:
- Se o reprocessamento de alguma quantidade de dados processados pela consulta anterior antes da falha é tolerável.
- Como processar a limitação de novas tentativas ou a utilização da retirada exponencial.
Uma abordagem possível para automatizar a repetição de consultas é a seguinte:
Crie um destino do Cloud Logging com base num filtro de inclusão que corresponda aos seguintes critérios para encaminhar registos para um tópico do Pub/Sub:
resource.type = "bigquery_project" protoPayload.resourceName : "projects/PROJECT_ID/jobs/CUSTOM_JOB_ID_PREFIX" severity = ERROR
Substitua o seguinte:
PROJECT_ID
: o nome do seu projeto.CUSTOM_JOB_ID_PREFIX
: o nome do prefixo do ID da tarefa personalizado que definiu para a sua consulta contínua.
Crie uma função do Cloud Run que seja acionada em resposta ao Pub/Sub que recebe registos correspondentes ao seu filtro.
A função do Cloud Run pode aceitar a carga útil de dados da mensagem do Pub/Sub e tentar iniciar uma nova consulta contínua usando a mesma sintaxe SQL da consulta com falha, mas no início, imediatamente após a paragem da tarefa anterior.
Por exemplo, pode usar uma função semelhante à seguinte:
Python
Antes de experimentar este exemplo, siga as Pythoninstruções de configuração no início rápido do BigQuery com bibliotecas cliente. Para mais informações, consulte a API Python BigQuery documentação de referência.
Para se autenticar no BigQuery, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para bibliotecas de cliente.
Antes de executar exemplos de código, defina a variável GOOGLE_CLOUD_UNIVERSE_DOMAIN
environment
como s3nsapis.fr
.
O que se segue?
- Saiba como criar e executar consultas contínuas.