Gerenciar pipelines
Neste documento, descrevemos como gerenciar pipelines do BigQuery, incluindo como programar e excluir pipelines.
Este documento também descreve como visualizar e gerenciar metadados de pipeline no Knowledge Catalog.
Os pipelines são gerados pelo Dataform.
Antes de começar
- Crie um pipeline do BigQuery.
- Para gerenciar metadados de pipeline no Knowledge Catalog, verifique se a API Dataplex está ativada no seu Cloud de Confiance projeto.
Funções exigidas
Para receber as permissões necessárias para gerenciar pipelines, peça ao administrador que conceda a você os seguintes papéis do IAM:
-
Para excluir pipelines:
Administrador do Dataform (
roles/dataform.Admin) no pipeline -
Para conferir e executar pipelines:
Leitor do Dataform (
roles/dataform.Viewer) no projeto
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias usando papéis personalizados ou outros papéis predefinidos.
Para gerenciar metadados de pipeline no Knowledge Catalog, verifique se você tem os papéis do Knowledge Catalog necessários.
Para mais informações sobre o IAM do Dataform, consulte Controlar o acesso com o IAM.
Ver todos os pipelines
Para ver uma lista de todos os pipelines no seu projeto, faça o seguinte:
No console Cloud de Confiance , acesse a página BigQuery.
No painel à esquerda, clique em Explorer:

Se o painel esquerdo não aparecer, clique em Expandir painel esquerdo para abrir.
No painel Explorer, expanda o projeto e clique em Pipelines.
Conferir execuções manuais anteriores
Para conferir as execuções manuais anteriores de um pipeline selecionado, siga estas etapas:
No console Cloud de Confiance , acesse a página BigQuery.
No painel à esquerda, clique em Explorer:

No painel Explorer, expanda o projeto, clique em Pipelines e selecione um pipeline.
Clique em Execuções.
Opcional: para atualizar a lista de execuções anteriores, clique em Atualizar.
Configurar alertas para execuções de pipeline com falha
Cada pipeline tem um ID de repositório do Dataform correspondente. Cada execução do pipeline do BigQuery é registrada no Cloud Logging usando o ID do repositório do Dataform correspondente. Você pode usar o Cloud Monitoring para observar tendências nos registros do Cloud Logging para execuções de pipeline do BigQuery e receber notificações quando as condições descritas ocorrerem.
Para receber alertas quando uma execução de pipeline do BigQuery falhar, crie uma política de alertas baseada em registros para o ID de repositório do Dataform correspondente. Para instruções, consulte Configurar alertas para invocações de fluxo de trabalho com falha.
Para encontrar o ID do repositório do Dataform do seu pipeline, faça o seguinte:
No console Cloud de Confiance , acesse a página BigQuery.
No painel à esquerda, clique em Explorer:

No painel Explorer, expanda o projeto, clique em Pipelines e selecione um pipeline.
Clique em Configurações.
O ID do repositório do Dataform do seu pipeline é exibido na parte de baixo da guia Configurações.
Excluir um pipeline
Para excluir um pipeline de forma permanente, siga estas etapas:
No console Cloud de Confiance , acesse a página BigQuery.
No painel à esquerda, clique em Explorer:

No painel Explorer, expanda o projeto e clique em Pipelines.
Encontre o pipeline que você quer excluir.
Clique em Ver ações ao lado do pipeline e clique em Excluir.
Clique em Excluir.
Gerenciar metadados no Knowledge Catalog
Com o Knowledge Catalog, é possível armazenar e gerenciar metadados de pipelines. Os pipelines estão disponíveis no Knowledge Catalog por padrão, sem configuração adicional.
Você pode usar o Knowledge Catalog para gerenciar pipelines em todos os locais de pipeline. O gerenciamento de pipelines no Knowledge Catalog está sujeito às cotas e limites do Knowledge Catalog e aos preços do Knowledge Catalog.
O Knowledge Catalog recupera automaticamente os seguintes metadados dos pipelines:
- Nome do recurso de dados
- Ativo de dados principal
- Local do recurso de dados
- Tipo de recurso de dados
- Projeto Cloud de Confiance correspondente
O Knowledge Catalog registra pipelines como entradas com os seguintes valores:
- Grupo de entradas do sistema
- O grupo de entradas do sistema
para pipelines é
@dataform. Para conferir os detalhes das entradas de pipeline no Knowledge Catalog, acesse o grupo de entradas do sistemadataform. Para instruções sobre como ver uma lista de todas as entradas em um grupo de entradas, consulte Ver detalhes de um grupo de entradas na documentação do Knowledge Catalog. - Tipo de entrada do sistema
- O tipo de entrada do sistema
para pipelines é
dataform-code-asset. Para ver detalhes dos pipelines, é necessário acessar o tipo de entrada do sistemadataform-code-asset, filtrar os resultados com um filtro baseado em aspecto e definir o campotypeno aspectodataform-code-assetcomoWORKFLOW. Em seguida, selecione uma entrada do pipeline escolhido. Para instruções sobre como ver detalhes de um tipo de entrada selecionado, consulte Ver detalhes de um tipo de entrada na documentação do Knowledge Catalog. Para instruções sobre como ver os detalhes de uma entrada selecionada, consulte Ver detalhes de uma entrada na documentação do Knowledge Catalog. - Tipo de aspecto do sistema
- O tipo de aspecto do sistema
para pipelines é
dataform-code-asset. Para fornecer mais contexto aos pipelines no Knowledge Catalog anotando entradas de pipeline de dados com aspectos, veja o tipo de aspectodataform-code-asset, filtre os resultados com um filtro baseado em aspecto e defina o campotypedentro do aspectodataform-code-assetcomoWORKFLOW. Para instruções sobre como anotar entradas com aspectos, consulte Gerenciar aspectos e enriquecer metadados na documentação do Knowledge Catalog. - Tipo
- O tipo para telas de dados é
WORKFLOW. Esse tipo permite filtrar pipelines no tipo de entrada do sistemadataform-code-assete no tipo de aspectodataform-code-assetusando a consultaaspect:dataplex-types.global.dataform-code-asset.type=WORKFLOWem um filtro baseado em aspectos.
Para instruções sobre como pesquisar recursos no Knowledge Catalog, consulte Pesquisar recursos de dados no Knowledge Catalog na documentação do Knowledge Catalog.
A seguir
- Saiba mais sobre os pipelines do BigQuery.
- Saiba como criar pipelines.
- Saiba como programar pipelines.