Quando cria uma máquina virtual (VM) ou uma instância bare metal com o Compute Engine, especifica uma série de máquinas e um tipo de máquina para a instância. Cada série de máquinas está associada a uma ou mais plataformas de CPU. Se estiverem disponíveis várias plataformas de CPU para uma série de máquinas, pode selecionar uma plataforma de CPU mínima para a instância de computação.
Uma plataforma de CPU oferece vários processadores físicos e cada um destes processadores é designado por núcleo. Para os processadores disponíveis no Compute Engine, um único núcleo da CPU pode ser executado como vários threads de hardware através da multithreading simultânea (SMT), que é conhecida nos processadores Intel como tecnologia Intel Hyper-Threading. No Compute Engine, cada thread de hardware é denominada CPU virtual (vCPU). Algumas séries de máquinas, como C4A, T2D, H4D e H3, não usam SMT e, em vez disso, cada vCPU representa um núcleo. Quando as vCPUs são comunicadas à instância como ocupando diferentes núcleos virtuais, o Compute Engine verifica se estas vCPUs nunca partilham o mesmo núcleo físico.
O tipo de máquina da sua instância de computação especifica o número de vCPUs e pode inferir o número de núcleos da CPU física através da relação vCPU por núcleo predefinida para essa série de máquinas:
- Para as séries de máquinas C4A, T2D, T2A, H4D (pré-visualização), H3 e A4X, as instâncias do Compute Engine têm sempre uma vCPU por núcleo.
- Para todas as outras séries de máquinas, as instâncias de computação têm duas vCPUs por núcleo por predefinição.
Opcionalmente, pode definir o número de threads por núcleo para um valor não predefinido, o que pode beneficiar algumas cargas de trabalho. É importante notar que, quando o faz, o tipo de máquina da sua instância de computação deixa de refletir o número correto de vCPUs. Em alternativa, o preço e o número de núcleos de CPU físicos permanecem os mesmos que seriam para a proporção predefinida de duas vCPUs por núcleo, e o número de vCPUs é metade do valor indicado pelo tipo de máquina.
Processadores ARM
Para processadores Arm, o Compute Engine usa um thread por núcleo. Cada vCPU é mapeada para um núcleo físico sem SMT.
A tabela seguinte descreve os processadores Arm disponíveis para instâncias do Compute Engine.
Processador da CPU | SKU do processador | Tipos e séries de máquinas suportados |
---|---|---|
Processadores NVIDIA Grace com núcleos Arm Neoverse V2 | Superchip | A4X |
Processadores Google Axion | C4A | |
Ampere Altra | Q64-30 | Tau T2A |
Processadores x86
Para a maioria dos processadores x86, cada CPU virtual é implementada como um único thread de hardware. A série de máquinas H3 é a exceção, com uma vCPU a representar um núcleo físico.
Processadores Intel
Nos processadores Intel Xeon, a tecnologia Intel Hyper-Threading suporta vários processos em execução em simultâneo em cada núcleo. O tipo de máquina da sua instância de computação determina o número de vCPUs e a memória.
Processador da CPU | SKU do processador | Tipos e séries de máquinas suportados | Frequência base (GHz) | Frequência turbo de todos os núcleos (GHz) | Frequência turbo máxima de núcleo único (GHz) |
---|---|---|---|---|---|
Processador Intel Xeon Scalable (Granite Rapids) de 6.ª geração |
|||||
Processador Intel® Xeon® Platinum 6985P-C |
2.81 | 3,9 | 4.2 | ||
Processador Intel Xeon Scalable (Emerald Rapids) de 5.ª geração |
|||||
Processador Intel Xeon Platinum 8581C |
2.1 | 2.9 | 4,0 | ||
2.3 | 3.1 | 4,0 | |||
2.1 | 2.9 | 3.3 | |||
Processador Intel Xeon Scalable (Sapphire Rapids) de 4.ª geração |
Processador Intel Xeon Platinum 8490H | 1,9 | 2.9 | 3,5 | |
Processador Intel Xeon Platinum 8481C | 2.2 | 3,0 | 3,0 | ||
2.2 | 3,0 | 3,8 | |||
2,0 | 3,8 | 2.9 | |||
Processador Intel Xeon Scalable (Ice Lake) 3.ª geração |
Processador Intel Xeon Platinum 8373C |
2.6 | 3.4 | 3,5 | |
Processador escalável Intel Xeon (Cascade Lake) 2.ª geração |
|||||
Processador Intel Xeon Gold 6268CL | 2.8 | 3.4 | 3,9 | ||
Processador Intel Xeon Gold 6253CL | 3.1 | 3,8 | 3,9 | ||
Processador Intel Xeon Platinum 8280L | 2.5 | 3.4 | 4,0 | ||
Processador Intel Xeon Platinum 8273CL | 2.2 | 2.9 | 3,7 | ||
Processador Intel Xeon Scalable (Skylake) 1.ª geração |
Processador Intel Xeon Scalable Platinum 8173M | 2,0 | 2.7 | 3,5 | |
Intel Xeon E7 (Broadwell E7) | Processador Intel Xeon E7-8880V4 | 2.2 | 2.6 | 3.3 | |
Intel Xeon E5 v4 (Broadwell E5) | Processador Intel Xeon E5-2696V4 | 2.2 | 2.8 | 3,7 | |
Intel Xeon E5 v3 (Haswell) | Processador Intel Xeon E5-2696V3 | 2.3 | 2.8 | 3,8 | |
Intel Xeon E5 v2 (Ivy Bridge) | Processador Intel Xeon E5-2696V2 | 2.5 | 3.1 | 3,5 | |
Intel Xeon E5 (Sandy Bridge) | Processador Intel Xeon E5-2689 | 2.6 | 3.2 | 3.6 |
1Os tipos de máquinas C4 que usam a CPU Intel Granite Rapids têm uma frequência base de 2,8, no entanto, a vPMU apresenta 2,3 para fins de compatibilidade.
Os tipos de máquinas 2N2 com 96 ou mais vCPUs requerem a CPU Intel Ice Lake.
Processadores AMD
Os processadores AMD oferecem desempenho e escalabilidade otimizados através da SMT. Na maioria dos casos, o Compute Engine usa dois threads por núcleo e cada vCPU é um thread. H4D e Tau T2D são as exceções em que o Compute Engine usa um thread por núcleo e cada vCPU é mapeada para um núcleo físico. O tipo de máquina da sua instância de computação determina o número de vCPUs e a quantidade de memória atribuídos à instância.
Processador da CPU | SKU do processador | Séries de máquinas suportadas | Frequência base (GHz) | Frequência efetiva (GHz) | Frequência máxima de aumento (GHz) |
---|---|---|---|---|---|
AMD EPYC Turin 5.ª geração |
AMD EPYC™ 9B45 | 2.7 | 3,5 | 4.1 | |
AMD EPYC Genoa 4.ª geração |
AMD EPYC™ 9B14 | 2.6 | 3.3 | 3,7 | |
AMD EPYC Milan 3.ª geração |
AMD EPYC™ 7B13 | 2,45 | 2.8 | 3,5 | |
AMD EPYC Rome 2.ª geração |
AMD EPYC™ 7B12 | 2,25 | 2.7 | 3.3 |
Comportamento de frequência
As tabelas anteriores descrevem as especificações de hardware das CPUs disponíveis com o Compute Engine, mas tenha em atenção os seguintes pontos:
Frequência: a frequência de um PC, ou a velocidade de relógio, mede o número de ciclos que a CPU executa por segundo, medido em GHz (gigahertz). Geralmente, as frequências mais elevadas indicam um melhor desempenho. No entanto, os diferentes designs da CPU processam as instruções de forma diferente, pelo que uma CPU mais antiga com uma velocidade de processamento mais elevada pode ser superada por uma CPU mais recente com uma velocidade de processamento mais baixa, porque a arquitetura mais recente processa as instruções de forma mais eficiente.
Frequência base: a frequência à qual a CPU é executada quando o sistema está inativo ou sob carga leve. Quando funciona na sua frequência base, a CPU consome menos energia e produz menos calor.
O ambiente convidado de uma instância de computação reflete a frequência base, independentemente da frequência a que a CPU está realmente a ser executada.
Frequência turbo de todos os núcleos: a frequência à qual cada CPU é normalmente executada quando todos os núcleos no encaixe não estão inativos ao mesmo tempo. As diferentes cargas de trabalho colocam exigências diferentes na CPU de um sistema. As tecnologias de aumento resolvem esta diferença e ajudam os processos a adaptar-se às exigências da carga de trabalho, aumentando a frequência da CPU.
- A maioria das instâncias de computação recebe a frequência turbo de todos os núcleos, mesmo que apenas a frequência base seja anunciada ao ambiente convidado.
- Os processadores ARM Ampere Altra podem oferecer um desempenho mais previsível, porque a frequência dos processadores ARM é sempre a frequência turbo de todos os núcleos.
As instâncias C4 podem ser executadas na frequência turbo máxima de todos os núcleos definindo o campo AdvancedMachineFeature como
ALL_CORE_MAX
. Se este campo não estiver definido, a instância é executada na definição predefinida, que é a frequência não restrita.A definição
ALL_CORE_MAX
não está disponível com instâncias de computação C4D ou C4A.
Frequência turbo máxima: a frequência que uma CPU visa quando é exigida por uma aplicação exigente, como um videojogo ou uma aplicação de modelagem de design. É a frequência máxima de núcleo único que uma CPU atinge sem overclocking.
Tecnologias de gestão de energia do processador: os processadores Intel suportam várias tecnologias para otimizar o consumo de energia. Estas tecnologias dividem-se em duas categorias ou estados:
- Os estados C são estados em que a CPU reduziu ou desativou funções selecionadas.
- Os estados de desempenho (P-states) oferecem uma forma de dimensionar a frequência e a voltagem à qual o processador é executado para reduzir o consumo de energia da CPU.
Todos os tipos de máquinas C4 e determinados tipos de máquinas C2 (30 e 60 vCPUs), C2D (56 e 112 vCPUs) e M2 (208 e 416 vCPUs) suportam sugestões de estado C fornecidas pela instância através da instrução
MWAIT
.As instâncias do Compute Engine não oferecem instalações para o controlo dos estados P por parte do cliente.
Funcionalidades da CPU
Os fabricantes de chips adicionam tecnologias avançadas para cálculos, gráficos, virtualização e gestão de memória às CPUs que produzem. Trusted Cloud by S3NS suporta a utilização de algumas destas funcionalidades avançadas com o Compute Engine.
Extensões de vetores avançadas
As extensões de vetores avançadas (AVX) são extensões de instrução única, vários dados (SIMD) à arquitetura do conjunto de instruções x86 para microprocessadores da Intel e da Advanced Micro Devices (AMD). O AVX fornece novas instruções e um novo esquema de codificação.
Para mais informações, consulte o artigo Extensões de vetores avançadas.
O AVX está disponível com todos os processadores x86 usados pelo Compute Engine.
Advanced Vector Extensions (AVX2)
O AVX2 (também conhecido como Haswell New Instructions) introduz as seguintes adições ao AVX:
- Expande a maioria das instruções de números inteiros vetoriais SSE e AVX para 256 bits
- Adiciona suporte para Gather, permitindo que os elementos vetoriais sejam carregados a partir de localizações de memória não contíguas
- Permutações de qualquer tipo com granularidade DWORD e QWORD
- Desvios vetoriais
O AVX2 está disponível com as seguintes plataformas de CPU:
- Processadores Intel Xeon E5 v3 (Haswell) e mais recentes
- Todos os processadores AMD
Extensões de vetor avançadas (AVX512)
O AVX-512 expande o AVX para compatibilidade de 512 bits através da codificação do prefixo EVEX. O AVX-512 oferece aceleração integrada para cargas de trabalho exigentes que envolvem processamento pesado baseado em vetores. O registo grande para o acelerador AVX-512 suporta 32 números de vírgula flutuante de precisão dupla e 64 de precisão simples, além de oito números inteiros de 64 bits e 16 de 32 bits.
Para mais informações sobre o AVX-512, consulte o artigo O que é o Intel AVX-512?.
O AVX-512 está disponível com as seguintes plataformas de CPU:
- Processador Intel Xeon Scalable (Skylake) de 1.ª geração e processadores mais recentes
- Processadores AMD EPYC Genoa de 4.ª geração e mais recentes
Extensões de matriz avançadas
As extensões de matriz avançadas (AMX) da Intel são uma nova extensão da arquitetura do conjunto de instruções (ISA) concebida para acelerar as cargas de trabalho de inteligência artificial (IA) e aprendizagem automática (ML). O AMX introduz novas instruções que podem ser usadas para realizar a multiplicação de matrizes e operações de convolução, que são duas das operações mais comuns na IA e no ML.
A AMX introduz registos bidimensionais denominados mosaicos sobre os quais os aceleradores podem realizar operações. A AMX destina-se a ser uma arquitetura extensível. O primeiro acelerador implementado chama-se unidade de multiplicação de matrizes de mosaicos (TMUL). Cada núcleo da CPU do processador Sapphire Rapids tem uma unidade AMX TMUL independente.
Para ver detalhes técnicos sobre o Intel AMX, consulte o artigo Suporte do Intel AMX no 5.16. A Intel oferece um tutorial sobre AMX em Exemplo de código: extensões de matriz avançadas da Intel (Intel AMX) – funções intrínsecas.
O AMX está disponível com processadores Intel Xeon de 4.ª geração (Sapphire Rapids) e posteriores. O AMX não está disponível com processadores AMD ou Arm.
Requisitos para usar o AMX
As instruções Intel AMX têm determinados requisitos mínimos de software, como:
- Para imagens personalizadas, o AMX é suportado com a versão 5.16 ou posterior do kernel do Linux.
- O Compute Engine oferece suporte para AMX nas seguintes imagens públicas:
- CentOS Stream 9
- SO otimizado para contentores 109 LTS ou posterior
- RHEL 8 (compilação mais recente) ou posterior
- Rocky Linux 8 (compilação mais recente) ou posterior
- Ubuntu 22.04 ou posterior
- Windows Server 2022 ou posterior
- Tensorflow 2.9.1 ou superior
- Extensão Intel para Intel Optimization for PyTorch
Funcionalidades da CPU disponíveis para instâncias bare metal
Além de oferecer todos os recursos de computação brutos do servidor, as instâncias bare metal que são executadas em processadores Intel Xeon Scalable de 4.ª geração e posteriores podem usar vários aceleradores e transferências específicos de funções incorporados:
- Intel-QAT: a tecnologia Intel QuickAssist (Intel QAT) acelera a compressão, a encriptação e a desencriptação
- Intel-DLB: o balanceador de carga dinâmico da Intel (Intel DLB) ajuda a acelerar as filas de dados
- Intel IAA: o Intel In-Memory Analytics Accelerator (Intel IAA) melhora o desempenho do processamento de consultas.
- Intel DSA: o Intel Data Streaming Accelerator (Intel DSA) ajuda a copiar e mover dados mais rapidamente.
Computação confidencial
Para proteger os seus dados enquanto estão a ser usados, podem ser usadas plataformas de CPU que suportam tecnologias de computação confidencial para criar instâncias de VM confidencial.
Para saber mais sobre os requisitos para criar uma instância de VM confidencial, consulte as configurações suportadas.
O que se segue?
- Saiba mais sobre as famílias de máquinas.
- Saiba mais acerca das instâncias do Compute Engine.
- Saiba mais sobre as imagens.
- Saiba como especificar uma plataforma de CPU mínima.