Cotas de taxa e limites do sistema do Compute Engine

Neste documento, listamos as cotas de taxa e os limites do sistema do Compute Engine que especificam o número de solicitações que podem ser feitas aos métodos da API Compute Engine.

As cotas restringem a quantidade de um Cloud de Confiance by S3NS recurso que o projeto pode usar. Se você quiser mudar o valor da cota para acomodar mais uso de recursos, solicite um ajuste de cota. Os limites do sistema são restrições fixas que não podem ser aumentadas ou diminuídas. Saiba mais em Visão geral das cotas do Cloud.

Cotas de taxa e limites do sistema

As cotas de taxa (também conhecidas como cotas de API) definem o número de solicitações que podem ser feitas para a API Compute Engine. Essas cotas se aplicam por projeto. Cada cota se aplica a um grupo de um ou mais métodos da API Compute Engine. Ao usar a CLI gcloud ou o Cloud de Confiance console, você também faz solicitações à API, e estas solicitações são contabilizadas na sua cota de taxa. Se você usar as contas de serviço para acessar a API, isso também será contabilizado na cota de taxa.

O Google aplica cotas de taxa a um intervalo por minuto para cada grupo. Se o projeto atingir o número máximo de solicitações de API em 60 segundos, será necessário aguardar o preenchimento da cota de taxa antes de fazer mais solicitações nesse grupo. Por exemplo, se um projeto atingir um limite de cota às 10h00min15s, a cota será preenchida no início do próximo intervalo sincronizado, como 10h01min00s, em vez de ser preenchida imediatamente. Se o projeto exceder uma cota de taxa, você receberá um erro 403 com o motivo rateLimitExceeded. Para resolver esse erro, aguarde um minuto e tente sua solicitação novamente. A cota precisa ser restaurada novamente no início do próximo intervalo.

O número de solicitações que você pode fazer à API Compute Engine é definido por cotas de API, conforme descrito nas tabelas a seguir. Cada grupo é contado separadamente. Dessa maneira, você atinge a cota máxima em cada grupo simultaneamente.

Cotas de taxa e limites do sistema para métodos globais

As seções a seguir listam as cotas que definem o número de solicitações que podem ser feitas aos métodos globais da API Compute Engine.

Cotas e limites do sistema simplificados da API para métodos globais

Para melhorar a capacidade de descoberta e gerenciamento da cota da API Compute Engine, Cloud de Confiance o número de métricas de cota foi reduzido, consolidando as métricas em menos cotas. Essas métricas de cota simplificadas também oferecem limites mais altos para cada cota.

Para conferir uma lista completa de métodos globais e as métricas de cota que rastreiam o custo de cada método, consulte Referência de métricas de cota da API Compute Engine.

A tabela a seguir lista as cotas e métricas simplificadas da API para a API Compute Engine:

Cota e descrição Nome da métrica
Solicitações de leitura por minuto (GlobalReadsPerMinutePerProject)
Cota para métodos globais get e list.
compute.googleapis.com/global_reads
Solicitações de gravação por minuto (GlobalWritesPerMinutePerProject)
Cota para métodos de gravação globais que não estão incluídos em outras métricas de cota.
compute.googleapis.com/global_writes
Solicitações de invalidação de cache por minuto (GlobalCacheInvalidationRequestsPerMinutePerProject)
Cota para métodos globais UrlMapsService.InvalidateCache.
compute.googleapis.com/global_cache_invalidation_requests

A tabela a seguir lista os limites e métricas do sistema para a API Compute Engine:

Limite do sistema e descrição Nome da métrica
Listar solicitações utilizáveis por minuto (GlobalListUsablePerMinutePerProject)
Limite do sistema para métodos globais ListUsable métodos.
compute.googleapis.com/list_usable_requests
Overhead de custo da lista filtrada (ListRequestsFilterCostOverheadPerMinutePerProject)

Limite do sistema para *.list e *.aggregatedList métodos globais com filtros.

Cloud de Confiance cobra o uso de cota para essa métrica, além das cotas da métrica compute.googleapis.com/global_reads. Haverá cobranças de cota se houver mais de 10 mil recursos filtrados fora das solicitações da lista. A API Compute Engine rejeita as solicitações de lista se você exceder esse limite de cota.

compute.googleapis.com/filtered_list_cost_overhead
Taxa por projeto: 750 mil recursos filtrados das solicitações de lista por região por minuto. Como a cota é cobrada a cada 10 mil recursos, você verá o limite como 75 (750 mil/10 mil) quando consultar esse limite de cota no Cloud de Confiance console.
Solicitações por minuto (GlobalRequestsPerMinutePerProject)

Limite do sistema para todas as solicitações globais de leitura e gravação.

compute.googleapis.com/global_requests

Cotas e limites do sistema legados da API para métodos globais

A tabela a seguir lista todas as cotas da API Compute Engine para métodos globais.

Cota e descrição Nome da métrica
Consultas por minuto (defaultPerMinutePerProject)
Cota para métodos globais de lista e mutação que não estão incluídos em outras métricas de cota.

Os métodos get a seguir também usam essa métrica default:

  • networkFirewallPolicies.get
  • projects.getXpnHost
  • projects.getXpnResources
compute.googleapis.com/default
Solicitações de leitura (legado) (ReadRequestsPerMinutePerProject)
Cota para métodos globais *.get.
compute.googleapis.com/read_requests
Solicitações de lista (ListRequestsPerMinutePerProject)
Cota para métodos globais *.list.
compute.googleapis.com/list_requests
Solicitações de leitura de operação (OperationReadRequestsPerMinutePerProject)
Cota para globalOperations.get método.
compute.googleapis.com/operation_read_requests
Solicitações globais de mutação de recursos (GlobalResourceWriteRequestsPerMinutePerProject)
Cota para os métodos images.delete, images.deprecate, images.insert, images.setLabels, snapshots.delete, snapshots.insert, snapshots.setLabels, machineImages.insert e machineImages.delete.
compute.googleapis.com/global_resource_write_requests
Solicitações de mutação pesadas (HeavyWeightWriteRequestsPerMinutePerProject)
Cota para patch, delete, e insert métodos para os recursos interconnects.
compute.googleapis.com/heavy_weight_write_requests
Solicitações de leitura pesadas (HeavyWeightReadRequestsPerMinutePerProject)
Cota para *.aggregatedList métodos.
compute.googleapis.com/heavy_weight_read_requests

As cotas a seguir se aplicam a APIs globais com cotas por método:

Cota e descrição Nome da métrica Limite padrão
Solicitações de inserção de licença
Cotas para o método licenses.insert.
compute.googleapis.com/license_insert_requests
  • Cota por projeto (LicenseInsertRequestsPerMinutePerProject): 2,5 solicitações/segundo (150 solicitações/minuto)
  • Cota diária por projeto (LicenseInsertRequestsPerDayPerProject): 30 solicitações/dia
Configurações do projeto de solicitações comuns de metadados de instância
Cota para o método projects.setCommonInstanceMetadata.
compute.googleapis.com/project_set_common_instance_metadata_requests Cota por projeto (ProjectSetCommonInstanceMetadataRequestsPerMinutePerProject): 36 solicitações/minuto

Cotas de taxa e limites do sistema para métodos regionais e zonais

As seções a seguir listam todas as cotas que se aplicam a métodos que usam métricas regionais.

Cotas e limites simplificados da API para métodos regionais e zonais

A tabela a seguir lista as métricas de cota simplificadas da API para métodos regionais e zonais da API Compute Engine. Para conferir uma lista completa de métodos regionais e zonais e as métricas de cota que rastreiam o uso de cada método, consulte Referência de métricas de cota da API Compute Engine.

Cota e descrição Nome da métrica
Solicitações de leitura por minuto por região (ReadRequestsPerMinutePerProjectPerRegion)
Cota para métodos regionais e zonais `get` and `list` methods.
compute.googleapis.com/reads_per_region
Solicitações de gravação por região (WritesPerMinutePerProjectPerRegion)
Cota para métodos de gravação regionais e zonais que não estão incluídos em outras métricas de cota.
compute.googleapis.com/writes_per_region

A tabela a seguir lista os limites do sistema para métodos regionais e zonais da API Compute Engine:

Limite do sistema e descrição Nome da métrica
Listar solicitações utilizáveis por região (ListUsablePerMinutePerProjectPerRegion)
Limite do sistema para métodos regionais e zonais ListUsable métodos.
compute.googleapis.com/list_usable_requests_per_region
Overhead de custo da lista filtrada por região

Limite do sistema para *.list e *.aggregatedList métodos regionais e zonais com filtros.

Cloud de Confiance cobra o uso de cota para essa métrica, além das cotas da métrica compute.googleapis.com/reads_per_region. Haverá cobranças de cota se houver mais de 10 mil recursos filtrados fora das solicitações da lista. A API Compute Engine rejeita as solicitações de lista se você exceder esse limite.

compute.googleapis.com/filtered_list_cost_overhead_per_region
Taxa por projeto (ListRequestsFilterCostOverheadPerMinutePerProjectPerRegion): 750 mil recursos filtrados das solicitações de lista por região por minuto. Como a cota é cobrada a cada 10 mil recursos, você verá o limite como 75 (750 mil/10 mil) quando consultar esse limite de cota no Cloud de Confiance console.
Solicitações por minuto por região (RequestsPerMinutePerProjectPerRegion)

Limite do sistema para todas as solicitações regionais de leitura e gravação.

compute.googleapis.com/requests_per_region

Cotas e limites do sistema legados da API para métodos regionais

A tabela a seguir lista todas as cotas da API Compute Engine para métodos regionais e zonais.

Cota e descrição Nome da métrica
Consultas (QueriesPerMinutePerRegion)
Cota para métodos regionais e zonais que criam, modificam ou excluem recursos do Compute Engine. Por exemplo, instances.insert, disks.update, e instances.delete métodos.

Os métodos get, list e patch a seguir também usam essa métrica default_per_region:

  • projects.listXpnHosts
  • instances.getScreenshot
  • instances.getGuestAttributes
  • instances.getShieldedInstanceIdentity
  • instances.getEffectiveFirewalls
  • projects.listXpnHosts
  • instanceGroupManagers.listManagedInstances
  • instanceGroupManagers.listErrors
  • instanceGroupManagers.listPerInstanceConfigs
  • regionInstanceGroupManagers.listManagedInstances
  • regionInstanceGroupManagers.listErrors
  • regionInstanceGroupManagers.listPerInstanceConfigs
  • resourcePolicies.patch
compute.googleapis.com/default_per_region
Solicitações de leitura (legado) (ReadRequestsPerMinutePerRegion)
Cota para métodos regionais e zonais get como autoscalers.get, disks.get, instances.get, e machineTypes.get.
compute.googleapis.com/read_requests_per_region
Solicitações de lista (ListRequestsPerMinutePerRegion)
Cota para métodos regionais e zonais list como autoscalers.list, disks.list, instances.list, e machineTypes.list.
compute.googleapis.com/list_requests_per_region
Solicitações de leitura de operação (OperationReadRequestsPerMinutePerRegion)
Cota para regionOperations.get e zoneOperations.get métodos.
compute.googleapis.com/operation_read_requests_per_region
Solicitações de mutação de recurso global por região (GlobalResourceWriteRequestsPerMinutePerProjectPerRegion)
Cota para os disks.createSnapshot, e regionDisks.createSnapshot métodos.
compute.googleapis.com/global_resource_write_requests_per_region
Solicitações de saída de porta serial de instância (GetSerialPortOutputRequestsPerMinutePerProjectPerRegion)
Cota para o método instances.getSerialPortOutput.
compute.googleapis.com/get_serial_port_output_requests_per_region
Solicitações de leitura pesadas (HeavyWeightReadRequestsPerMinutePerRegion)
Cota para os métodos regionOperations.wait, zoneOperations.wait, e regionNetworkFirewallPolicies.getEffectiveFirewalls.
compute.googleapis.com/heavy_weight_read_requests_per_region
Solicitações de mutação pesadas por região HeavyWeightWriteRequestsPerMinutePerProjectPerRegion
Cota para patch, delete, e insert métodos para interconnectAttachments recurso e para o networks.updatePeering método.
compute.googleapis.com/heavy_weight_write_requests_per_region
Solicitações de evento de manutenção de simulação de instância (SimulateMaintenanceEventRequestsPerMinutePerProjectPerRegion)
Cota para o método instances.simulateMaintenanceEvent.
compute.googleapis.com/simulate_maintenance_event_requests_per_region
Solicitações de referenciador de lista de instâncias InstanceListReferrersRequestsPerMinutePerProjectPerRegion
Cota para o método instances.listReferrers.
compute.googleapis.com/instance_list_referrers_requests_per_region
Solicitações de gravação de endpoint de rede NetworkEndpointWriteRequestsPerMinutePerProjectPerRegion
Cota para networkEndpointGroups.attachNetworkEndpoints e networkEndpointGroups.detachNetworkEndpoints métodos.
compute.googleapis.com/network_endpoint_write_requests_per_region
Solicitações de lista de endpoints de rede (NetworkEndpointListRequestsPerMinutePerProjectPerRegion)
Cota para o método networkEndpointGroups.listNetworkEndpoints.
compute.googleapis.com/network_endpoint_list_requests_per_region
Solicitações de gravação do endpoint de rede regional (RegionalNetworkEndpointWriteRequestsPerMinutePerProjectPerRegion)
Cota para regionNetworkEndpointGroups.attachNetworkEndpoints e regionNetworkEndpointGroups.detachNetworkEndpoints métodos.
compute.googleapis.com/regional_network_endpoint_write_requests_per_region
Solicitações da lista de endpoints da rede regional (RegionalNetworkEndpointListRequestsPerMinutePerProjectPerRegion)
Cota para o método regionNetworkEndpointGroups.listNetworkEndpoints.
compute.googleapis.com/regional_network_endpoint_list_requests_per_region

A tabela a seguir lista os limites do sistema legados para métodos regionais e zonais da API Compute Engine:

Limite do sistema e descrição Nome da métrica
Overhead de custo da lista filtrada

Limite do sistema para *.list e *.aggregatedList métodos com filtros.

Cloud de Confiance cobra o uso de cota para essa métrica, além das cotas das métricas compute.googleapis.com/list_requests_per_region e compute.googleapis.com/heavy_weight_read_requests_per_region. Haverá cobranças de cota se houver mais de 10 mil recursos filtrados fora das solicitações da lista. A API Compute Engine rejeita as solicitações de lista se você exceder esse limite.

compute.googleapis.com/filtered_list_cost_overhead_per_region
Taxa por projeto (ListRequestsFilterCostOverheadPerMinutePerProjectPerRegion): 750 mil recursos filtrados das solicitações de lista por região por minuto. Como a cota é cobrada a cada 10 mil recursos, você verá o limite como 75 (750 mil/10 mil) quando consultar esse limite de cota no Cloud de Confiance console.

Solicitar um aumento nas cotas de taxa

Se você precisar de uma cota maior para fazer solicitações de API, solicite um aumento na cota da API no Cloud de Confiance console. Para mais detalhes, consulte Solicitar um ajuste de cota.

Práticas recomendadas

Siga as práticas recomendadas da API Compute Engine para preservar as cotas de taxa e atenuar os efeitos das cotas de taxa.

A seguir