Neste documento, descrevemos como criar uma assinatura do BigQuery. É possível usar o console Trusted Cloud , a Google Cloud CLI, a biblioteca de cliente ou a API Pub/Sub para criar uma assinatura do BigQuery.
Antes de começar
Antes de ler este documento, confira se você conhece os seguintes conceitos:
Como as assinaturas funcionam.
O fluxo de trabalho para assinaturas do BigQuery.
Como configurar um tópico de mensagens inativas para lidar com falhas de mensagens.
Além de ter familiaridade com o Pub/Sub e o BigQuery, verifique se você atende aos seguintes pré-requisitos antes de criar uma assinatura do BigQuery:
Uma tabela do BigQuery existe. Ou crie uma ao criar a assinatura do BigQuery, conforme descrito nas seções posteriores deste documento.
Compatibilidade entre o esquema do tópico do Pub/Sub e a tabela do BigQuery. Se você adicionar uma tabela do BigQuery incompatível, vai receber uma mensagem de erro relacionada à compatibilidade. Para mais informações, consulte Compatibilidade de esquema.
Papéis e permissões necessárias
Confira a seguir uma lista de diretrizes sobre papéis e permissões:
Para criar uma assinatura, é necessário configurar o controle de acesso no nível do projeto.
Você também precisa de permissões no nível do recurso se as assinaturas e os tópicos estiverem em projetos diferentes, conforme discutido mais adiante nesta seção.
Para criar uma assinatura do BigQuery, o agente de serviço do Pub/Sub ou uma conta de serviço personalizada precisa ter permissão para gravar na tabela específica do BigQuery. Para mais informações sobre como conceder essas permissões, consulte a próxima seção deste documento.
É possível configurar uma assinatura do BigQuery em um projeto para gravar em uma tabela do BigQuery em outro projeto.
Para receber as permissões necessárias para criar assinaturas do BigQuery,
peça ao administrador para conceder a você o
papel do IAM de Editor do Pub/Sub (roles/pubsub.editor
)
no projeto.
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Esse papel predefinido contém as permissões necessárias para criar assinaturas do BigQuery. Para conferir as permissões exatas necessárias, expanda a seção Permissões necessárias:
Permissões necessárias
As seguintes permissões são necessárias para criar assinaturas do BigQuery:
-
Extrair de uma assinatura:
pubsub.subscriptions.consume
-
Crie uma assinatura:
pubsub.subscriptions.create
-
Excluir uma assinatura:
pubsub.subscriptions.delete
-
Fazer uma assinatura:
pubsub.subscriptions.get
-
Listar uma assinatura:
pubsub.subscriptions.list
-
Atualizar uma assinatura:
pubsub.subscriptions.update
-
Anexe uma assinatura a um tópico:
pubsub.topics.attachSubscription
-
Acessar a política do IAM de uma assinatura:
pubsub.subscriptions.getIamPolicy
-
Configure a política do IAM para uma assinatura:
pubsub.subscriptions.setIamPolicy
Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.
Para permitir que um principal em um projeto crie uma assinatura do BigQuery em outro projeto, conceda a ele o papel de editor do Pub/Sub (roles/pubsub.editor
) em ambos. Isso fornece as permissões necessárias para criar a nova assinatura do BigQuery e anexá-la ao tópico original. O papel de editor do Pub/Sub (roles/pubsub.editor
) no tópico também ajuda a anexar assinaturas do BigQuery em um projeto diferente ao tópico.
Atribuir papéis a contas de serviço
Alguns serviços do Trusted Cloud by S3NS têm contas de serviço gerenciado pelo Trusted Cloudque permitem que os
serviços acessem seus recursos. Essas contas de serviço são
conhecidas como agentes de serviço. O Pub/Sub cria e mantém um
agente de serviço para cada projeto no formato
service-project-number@gcp-sa-pubsub.s3ns-system.iam.gserviceaccount.com
.
Você pode permitir que o agente de serviço do Pub/Sub ou uma conta de serviço personalizada grave na tabela do BigQuery.
Conceder permissão ao agente de serviço do Pub/Sub significa que qualquer usuário com permissão para criar uma assinatura no seu projeto pode gravar na tabela do BigQuery. Se você quiser fornecer uma permissão mais granular para gravar na tabela do BigQuery, configure uma conta de serviço personalizada.
Para mais informações sobre o IAM do BigQuery, consulte Papéis e permissões do BigQuery.
Atribuir papéis do BigQuery ao agente de serviço do Pub/Sub
Se você quiser criar uma assinatura do BigQuery usando o agente de serviço do Pub/Sub, ele precisará de permissão para gravar na tabela específica do BigQuery e ler os metadados dela.
Conceda o papel de editor de dados do BigQuery (roles/bigquery.dataEditor
) ao agente de serviço do Pub/Sub. É possível conceder a
permissão em uma tabela individual ou no projeto como um todo.
Tabela
No Trusted Cloud console, acesse o BigQuery Studio.
Na caixa de pesquisa do painel "Explorador" chamada Filtrar por nome e rótulos, digite o nome da tabela e pressione Enter.
Clique na tabela em que você quer conceder permissão.
Na tabela, selecione
Mais ações > Compartilhar > Permissões.Ou clique na tabela e, na página principal, clique em Compartilhamento > Permissões.
A janela Permissões de compartilhamento é aberta.
Clique em Adicionar principal.
Em Adicionar principais, insira o nome do agente de serviço do Pub/Sub para o projeto que contém a assinatura. O formato do agente de serviço é
service-project-number@gcp-sa-pubsub.s3ns-system.iam.gserviceaccount.com
. Por exemplo, para um projeto comproject-number=112233445566
, o agente de serviço tem o formatoservice-112233445566@gcp-sa-pubsub.s3ns-system.iam.gserviceaccount.com
.No menu suspenso Selecionar um papel, insira
BigQuery
e selecione o papel Editor de dados do BigQuery.Clique em Salvar.
Projeto
No console Trusted Cloud , acesse a página IAM.
Clique em Conceder acesso.
Na seção Adicionar principais, insira o nome do agente de serviço do Pub/Sub. O formato do agente de serviço é
service-project-number@gcp-sa-pubsub.s3ns-system.iam.gserviceaccount.com
. Por exemplo, para um projeto comproject-number=112233445566
, o agente de serviço tem o formatoservice-112233445566@gcp-sa-pubsub.s3ns-system.iam.gserviceaccount.com
.Na seção Atribuir papéis, clique em Adicionar outro papel.
No menu suspenso Selecionar um papel, insira
BigQuery
e selecione o papel Editor de dados do BigQuery.Clique em Salvar.
Atribuir papéis do BigQuery a uma conta de serviço personalizada
Se você quiser usar uma conta de serviço personalizada para gravar em uma tabela do BigQuery, defina as seguintes permissões:
- A conta de serviço personalizada precisa ter permissão para gravar na tabela específica do BigQuery e ler os metadados dela.
- O agente de serviço do Pub/Sub precisa ter a permissão
iam.serviceAccounts.getAccessToken
na conta de serviço personalizada. - O usuário que cria a assinatura precisa ter a permissão
iam.serviceAccounts.actAs
na conta de serviço personalizada.
Crie a conta de serviço e conceda permissões seguindo estas etapas:
Crie a conta de serviço personalizada. A conta de serviço precisa estar no mesmo projeto que a assinatura.
Conceda o papel de editor de dados do BigQuery (
roles/bigquery.dataEditor
) à conta de serviço personalizada.É possível conceder a permissão da conta de serviço em uma única tabela no projeto ou em todas as tabelas do projeto. Para isso, consulte a seção apropriada em Atribuir papéis do BigQuery ao agente de serviço do Pub/Sub. No procedimento, substitua o endereço de e-mail do agente de serviço do Pub/Sub pelo endereço de e-mail personalizado da conta de serviço.
Conceda ao agente de serviço do Pub/Sub a permissão
iam.serviceAccounts.getAccessToken
na conta de serviço personalizada ou em todas as contas de serviço do projeto. Para conceder essa permissão, atribua o papelroles/iam.serviceAccountTokenCreator
ao agente de serviço do Pub/Sub.Escolha o método adequado com base nos seus requisitos.
Conta de serviço
No console Trusted Cloud , acesse a página Contas de serviço.
Insira o nome da conta de serviço personalizada no Filtro.
Selecione a conta de serviço na lista.
Clique em Principais com acesso.
Clique em Conceder acesso.
Na seção Adicionar principais, insira o nome do agente de serviço do Pub/Sub para o projeto que contém a assinatura. O formato do agente de serviço é
service-project-number@gcp-sa-pubsub.s3ns-system.iam.gserviceaccount.com
. Por exemplo, para um projeto comproject-number=112233445566
, o agente de serviço tem o formatoservice-112233445566@gcp-sa-pubsub.s3ns-system.iam.gserviceaccount.com
.No menu suspenso Selecionar um papel, insira
Service Account
e selecione o papel Criador de token de conta de serviço.Clique em Salvar.
Projeto
No console Trusted Cloud , acesse a página IAM.
Clique em Conceder acesso.
Na seção Adicionar principais, insira o nome da sua conta de serviço personalizada.
Na seção Atribuir papéis, clique em Adicionar outro papel.
No menu suspenso Selecionar um papel, insira
Service Account
e selecione o papel Criador de token de conta de serviço.Clique em Salvar.
Se você criou a conta de serviço personalizada, já tem a permissão iam.serviceAccounts.actAs
necessária. Se você precisar conceder a permissão na conta de serviço a outra pessoa:
No console Trusted Cloud , acesse a página Contas de serviço.
Insira o nome da conta de serviço personalizada no Filtro.
Selecione a conta de serviço na lista.
Clique em Principais com acesso.
Clique em Conceder acesso.
Na seção Adicionar principais, insira o nome da conta a que você quer conceder acesso.
No menu suspenso Selecionar um papel, insira
Service Account
e selecione o papel Usuário da conta de serviço.Além disso, se a tabela do BigQuery for do Apache Iceberg, conceda à conta de serviço do Pub/Sub o papel de Administrador do Storage (
roles/storage.admin
) para acessar o bucket do Cloud Storage.Clique em Salvar.
Propriedades da assinatura do BigQuery
Ao configurar uma assinatura do BigQuery, é possível especificar as seguintes propriedades.
Propriedades comuns
Saiba mais sobre as propriedades comuns de assinatura que podem ser definidas em todas as assinaturas.
Usar esquema de tópicos
Com essa opção, o Pub/Sub usa o esquema do tópico do Pub/Sub a que a assinatura está anexada. Além disso, o Pub/Sub grava os campos nas mensagens nas colunas correspondentes da tabela do BigQuery.
Ao usar essa opção, verifique os seguintes requisitos adicionais:
Os campos no esquema de tópicos e no esquema do BigQuery precisam ter os mesmos nomes e tipos compatíveis entre si.
Qualquer campo opcional no esquema de tópicos também precisa ser opcional no esquema do BigQuery.
Os campos obrigatórios no esquema de tópicos não precisam ser obrigatórios no esquema do BigQuery.
Se houver campos do BigQuery que não estão presentes no esquema de tópicos, eles precisam estar no modo
NULLABLE
.Se o esquema de tópico tiver campos extras que não estão presentes no esquema do BigQuery e puderem ser descartados, selecione a opção Descartar campos desconhecidos.
Você pode selecionar apenas uma das propriedades de assinatura: Usar esquema de tópico ou Usar esquema de tabela.
Se você não selecionar a opção Usar esquema de tópicos ou Usar esquema de tabela,
verifique se a tabela do BigQuery tem uma coluna chamada data
do
tipo BYTES
, STRING
ou JSON
. O Pub/Sub grava a mensagem nessa coluna do BigQuery.
As mudanças no esquema de tópicos do Pub/Sub ou no esquema de tabela do BigQuery podem não entrar em vigor imediatamente com as mensagens gravadas na tabela do BigQuery. Por exemplo, se a opção Descartar campos desconhecidos estiver ativada e um campo estiver presente no esquema do Pub/Sub, mas não no do BigQuery, as mensagens gravadas na tabela do BigQuery ainda poderão não conter o campo depois de adicioná-lo ao esquema do BigQuery. Com o tempo, os esquemas vão se sincronizar, e as mensagens subsequentes vão incluir o campo.
Ao usar a opção Usar esquema de tópico na sua assinatura do BigQuery, você também pode aproveitar a captura de dados alterados (CDC) do BigQuery. A CDC atualiza as tabelas do BigQuery processando e aplicando mudanças às linhas atuais.
Para saber mais sobre esse recurso, consulte Fazer streaming de atualizações da tabela com captura de dados alterados.
Para saber como usar esse recurso com assinaturas do BigQuery, consulte Captura de dados de alterações do BigQuery.
Usar esquema de tabela
Com essa opção, o Pub/Sub usa o esquema da tabela do BigQuery para gravar os campos de uma mensagem JSON nas colunas correspondentes. Ao usar essa opção, verifique os seguintes requisitos adicionais:
Os nomes de cada coluna na tabela do BigQuery só podem conter letras (a-z, A-Z), números (0-9) ou sublinhados (_).
As mensagens publicadas precisam estar no formato JSON.
As seguintes conversões JSON são compatíveis:
Tipo de JSON Tipo de dados do BigQuery string
NUMERIC
,BIGNUMERIC
,DATE
,TIME
,DATETIME
ouTIMESTAMP
number
NUMERIC
,BIGNUMERIC
,DATE
,TIME
,DATETIME
ouTIMESTAMP
- Ao usar
number
paraDATE
,DATETIME
,TIME
ouTIMESTAMP
conversões, o número precisa obedecer às representações aceitas. - Ao usar
number
para conversão deNUMERIC
ouBIGNUMERIC
, a precisão e o intervalo de valores são limitados aos aceitos pelo padrão IEEE 754 para aritmética de ponto flutuante. Se você precisar de alta precisão ou um intervalo maior de valores, use conversões destring
paraNUMERIC
ouBIGNUMERIC
. - Ao usar
string
para conversõesNUMERIC
ouBIGNUMERIC
, o Pub/Sub pressupõe que a string é um número legível (por exemplo,"123.124"
). Se o processamento da string como um número legível falhar, o Pub/Sub vai tratar a string como bytes codificados com o BigDecimalByteStringEncoder.
- Ao usar
Se o tópico da assinatura tiver um esquema associado a ele, a propriedade de codificação da mensagem precisará ser definida como
JSON
.Se houver campos do BigQuery que não estão presentes nas mensagens, eles precisam estar no modo
NULLABLE
.Se as mensagens tiverem campos extras que não estão no esquema do BigQuery e puderem ser descartados, selecione a opção Descartar campos desconhecidos.
Você pode selecionar apenas uma das propriedades de assinatura: Usar esquema de tópico ou Usar esquema de tabela.
Se você não selecionar a opção Usar esquema de tópicos ou Usar esquema de tabela,
verifique se a tabela do BigQuery tem uma coluna chamada data
do
tipo BYTES
, STRING
ou JSON
. O Pub/Sub grava a mensagem nessa coluna do BigQuery.
As mudanças no esquema da tabela do BigQuery podem não entrar em vigor imediatamente com as mensagens gravadas na tabela. Por exemplo, se a opção Descartar campos desconhecidos estiver ativada e um campo estiver presente nas mensagens, mas não no esquema do BigQuery, as mensagens gravadas na tabela do BigQuery ainda poderão não conter o campo depois de adicioná-lo ao esquema do BigQuery. Com o tempo, o esquema é sincronizado e as mensagens subsequentes incluem o campo.
Ao usar a opção Usar esquema de tabela na sua assinatura do BigQuery, você também pode aproveitar a captura de dados alterados (CDC) do BigQuery. A CDC atualiza as tabelas do BigQuery processando e aplicando mudanças às linhas existentes.
Para saber mais sobre esse recurso, consulte Fazer streaming de atualizações da tabela com captura de dados alterados.
Para saber como usar esse recurso com assinaturas do BigQuery, consulte Captura de dados de alterações do BigQuery.
Remover campos desconhecidos
Essa opção é usada com as opções Usar esquema de tópicos ou Usar esquema de tabela. Quando ativada, essa opção permite que o Pub/Sub descarte qualquer campo presente no esquema ou na mensagem do tópico, mas não no esquema do BigQuery. Os campos que não fazem parte do esquema do BigQuery são descartados ao gravar a mensagem na tabela do BigQuery.
Sem a opção Descartar campos desconhecidos definida, as mensagens com campos extras não são gravadas no BigQuery e permanecem no backlog da assinatura, a menos que você configure um tópico de mensagens mortas.
A configuração Descartar campos desconhecidos não afeta campos que não estão definidos no esquema de tópico do Pub/Sub ou no esquema de tabela do BigQuery. Nesse caso, uma mensagem válida do Pub/Sub é entregue à assinatura. No entanto, como o BigQuery não tem colunas definidas para esses campos extras, eles são descartados durante o processo de gravação do BigQuery. Para evitar esse comportamento, verifique se todos os campos contidos na mensagem do Pub/Sub também estão no esquema da tabela do BigQuery.
O comportamento em relação a campos extras também pode depender do tipo de esquema específico (Avro, buffer de protocolo) e da codificação (JSON, binário) usados. Para informações sobre como esses fatores afetam o processamento de campos extras, consulte a documentação do tipo de esquema e da codificação específicos.
Gravar metadados
Essa opção permite que o Pub/Sub grave os metadados de cada mensagem em colunas adicionais na tabela do BigQuery. Caso contrário, os metadados não serão gravados na tabela do BigQuery.
Se você selecionar a opção Gravar metadados, verifique se a tabela do BigQuery tem os campos descritos na tabela a seguir.
Se você não selecionar a opção Gravar metadados, a tabela de destino do BigQuery só vai exigir o campo data
, a menos que use_topic_schema
seja verdadeiro. Se você selecionar as opções Gravar metadados e Usar esquema de tópico, o esquema do tópico não poderá conter campos com nomes que correspondam aos dos parâmetros de metadados.
Essa limitação inclui versões camelcase desses parâmetros snake case.
Parâmetros | |
---|---|
subscription_name |
STRING Nome de uma assinatura. |
message_id |
STRING ID de uma mensagem |
publish_time |
TIMESTAMP O horário de publicação de uma mensagem. |
data |
BYTES, STRING ou JSON O corpo da mensagem. O campo |
attributes |
STRING ou JSON Um objeto JSON que contém todos os atributos da mensagem. Ele também contém outros campos que fazem parte da mensagem do Pub/Sub, incluindo a chave de ordenação, se presente. |
Criar uma assinatura do BigQuery
Os exemplos a seguir mostram como criar uma assinatura com entrega do BigQuery.
Console
No console Trusted Cloud , acesse a página Assinaturas.
Clique em Criar assinatura.
No campo ID da assinatura, insira um nome. Para informações sobre como nomear uma assinatura, consulte Diretrizes para nomear um tópico ou uma assinatura.
Escolha ou crie um tópico no menu suspenso. A assinatura recebe mensagens do tópico.
Selecione Tipo de entrega como Gravar no BigQuery.
Selecione o projeto da tabela do BigQuery.
Selecione um conjunto de dados ou crie um. Para saber como criar um conjunto de dados, consulte Como criar conjuntos de dados.
Selecione uma tabela ou crie uma. Para informações sobre como criar uma tabela, consulte Criar tabelas.
Recomendamos ativar o envio para fila de mensagens inativas para lidar com falhas de mensagens. Para mais informações, consulte Tópico de mensagens inativas.
Clique em Criar.
Você também pode criar uma assinatura na página Tópicos. Esse atalho é útil para associar tópicos a assinaturas.
No console Trusted Cloud , acesse a página Tópicos.
Clique em more_vert ao lado do tópico em que você quer criar uma assinatura.
No menu de contexto, selecione Criar assinatura.
Selecione Tipo de entrega como Gravar no BigQuery.
Selecione o projeto da tabela do BigQuery.
Selecione um conjunto de dados ou crie um. Para saber como criar um conjunto de dados, consulte Como criar conjuntos de dados.
Selecione uma tabela ou crie uma. Para informações sobre como criar um conjunto de dados, consulte Como criar tabelas.
Recomendamos ativar o envio para fila de mensagens inativas para lidar com falhas de mensagens. Para mais informações, consulte Tópico de mensagens inativas.
Clique em Criar.
gcloud
-
In the Trusted Cloud console, activate Cloud Shell.
Para criar uma assinatura do Pub/Sub, use o comando
gcloud pubsub subscriptions create
:gcloud pubsub subscriptions create SUBSCRIPTION_ID \ --topic=TOPIC_ID \ --bigquery-table=PROJECT_ID.DATASET_ID.TABLE_ID
Se você quiser usar uma conta de serviço personalizada, forneça-a como um argumento adicional:
gcloud pubsub subscriptions create SUBSCRIPTION_ID \ --topic=TOPIC_ID \ --bigquery-table=PROJECT_ID.DATASET_ID.TABLE_ID --bigquery-service-account-email=SERVICE_ACCOUNT_NAME
Substitua:
SUBSCRIPTION_ID
: especifica o ID da assinatura.TOPIC_ID
: especifica o ID do tema. O tópico exige um esquema.PROJECT_ID
: especifica o ID do projeto.DATASET_ID
: especifica o ID de um conjunto de dados existente. Para criar um conjunto de dados, consulte Criar conjuntos de dados.TABLE_ID
: especifica o ID de uma tabela atual. A tabela precisa de um campodata
se o tópico não tiver um esquema. Para criar uma tabela, consulte Criar uma tabela vazia com uma definição de esquema.SERVICE_ACCOUNT_NAME
: especifica o nome da conta de serviço a ser usada para gravar no BigQuery.
C++
Antes de tentar esse exemplo, siga as instruções de configuração do C++ em Guia de início rápido: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Pub/Sub C++.
C#
Antes de tentar esse exemplo, siga as instruções de configuração do C# em Guia de início rápido: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Pub/Sub C#.
Go
O exemplo a seguir usa a versão principal da biblioteca de cliente do Go Pub/Sub (v2). Se você ainda estiver usando a biblioteca v1, consulte o guia de migração para a v2. Para conferir uma lista de exemplos de código da v1, consulte os exemplos de código descontinuados.
Antes de tentar esse exemplo, siga as instruções de configuração do Go em Guia de início rápido: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Pub/Sub Go.
Java
Antes de tentar essa amostra, siga as instruções de configuração do Java em Guia de início rápido: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Pub/Sub Java.
Node.js
Antes de tentar essa amostra, siga as instruções de configuração do Node.js em Guia de início rápido: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Pub/Sub Node.js.
Node.ts
Antes de tentar essa amostra, siga as instruções de configuração do Node.js em Guia de início rápido: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Pub/Sub Node.js.
PHP
Antes de tentar esse exemplo, siga as instruções de configuração do PHP em Guia de início rápido: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Pub/Sub PHP.
Python
Antes de tentar esse exemplo, siga as instruções de configuração do Python em Guia de início rápido: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Pub/Sub Python.
Ruby
O exemplo a seguir usa a biblioteca de cliente do Ruby Pub/Sub v3. Se você ainda estiver usando a biblioteca v2, consulte o guia de migração para a v3. Para conferir uma lista de exemplos de código do Ruby v2, consulte os exemplos de código descontinuados.
Antes de tentar esse exemplo, siga as instruções de configuração do Ruby em Guia de início rápido: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Pub/Sub Ruby.
Monitorar uma assinatura do BigQuery
O Cloud Monitoring oferece várias métricas para monitorar assinaturas.
Para conferir uma lista de todas as métricas disponíveis relacionadas ao Pub/Sub e as descrições delas, consulte a documentação do Monitoring para o Pub/Sub.
Você também pode monitorar as assinaturas no Pub/Sub.
A seguir
- Crie ou modifique uma assinatura com comandos
gcloud
. - Crie ou modifique uma assinatura com APIs REST.
- Resolver problemas de uma assinatura do BigQuery.