Algumas ou todas as informações nesta página podem não se aplicar ao Cloud de Confiance by S3NS. Consulte o artigo Diferenças em relação ao Google Cloud para mais detalhes.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Vista geral do armazenamento para clusters do GKE

Autopilot Padrão

Este documento aborda as opções de armazenamento suportadas pelo GKE e algumas considerações importantes para selecionar a melhor opção para as necessidades da sua empresa. Para determinar que família de máquinas é adequada para a sua seleção, consulte a comparação de séries de máquinas.

O GKE suporta os seguintes tipos de armazenamento e integrações:

Armazenamento de blocos com o Persistent Disk
Armazenamento de blocos com o Google Cloud Hyperdisk
Bloqueie o armazenamento com pools de armazenamento Hyperdisk
Armazenamento em blocos efémero e não processado através do SSD local
Sistema de ficheiros paralelos (Google Cloud Managed Lustre)
Sistema de ficheiros de rede (Filestore)
Acesso ao armazenamento de objetos de IA/aprendizagem automática através do Run:ai Model Streamer
Armazenamento de objetos com o Cloud Storage FUSE
Bases de dados geridas
Crie artefactos

Armazenamento em bloco (Persistent Disk)

Os volumes do Persistent Disk são dispositivos duradouros de armazenamento de rede geridos pelo Compute Engine aos quais os seus clusters do GKE podem aceder, como os discos físicos de um computador ou um servidor. Quando os seus clusters requerem espaço de armazenamento adicional, pode anexar mais volumes de discos persistentes aos seus nós ou redimensionar os volumes de discos persistentes existentes. Pode permitir que o GKE aprovisione dinamicamente PersistentVolumes com base no disco persistente ou pode aprovisionar discos manualmente.

Esta opção de armazenamento é suportada em clusters do GKE Autopilot e Standard.

Por predefinição, os volumes de discos persistentes são recursos zonais (mantidos numa única zona numa região). Pode criar volumes de discos persistentes regionais (mantidos em duas zonas na mesma região). Também pode anexar um volume do Persistent Disk como só de leitura a vários nós em simultâneo. Esta funcionalidade é suportada para volumes de discos persistentes zonais e regionais.

O armazenamento do disco persistente no GKE é persistente, o que significa que os dados armazenados nos seus discos persistem mesmo que o pod que o está a usar seja terminado.

Por que motivo deve usar o armazenamento do Persistent Disk

Use o armazenamento do Persistent Disk se os seus clusters precisarem de acesso a um armazenamento em bloco duradouro de elevado desempenho e alta disponibilidade. Normalmente, um volume de disco persistente está associado a um único pod. Esta opção de armazenamento suporta o modo de acesso ReadWriteOnce. O GKE oferece suporte para a configuração de volumes de discos persistentes com uma variedade de opções de latência e desempenho, incluindo as seguintes:

Disco persistente equilibrado: adequado para aplicações empresariais padrão. Esta opção oferece um equilíbrio entre o desempenho e o custo. Com o apoio de unidades de estado sólido (SSD). Esta é a opção predefinida para o aprovisionamento dinâmico de volumes em clusters e nós com o GKE 1.24 ou posterior.
Performance Persistent Disk: adequado para estatísticas de expansão horizontal, bases de dados e colocação em cache persistente. Esta opção é ideal para cargas de trabalho sensíveis ao desempenho. Com o apoio de unidades de estado sólido (SSD).
Disco persistente padrão: adequado para cargas de trabalho de grandes volumes de dados e computação. Esta opção é o tipo de disco mais económico. Apoiado por unidades de disco rígido (HDD) padrão.
Disco persistente extremo: adequado para aplicações empresariais, como SAP HANA e Oracle. Esta opção oferece o desempenho mais elevado para satisfazer as necessidades das maiores bases de dados na memória. Com o apoio de unidades de estado sólido (SSD). Para aplicações críticas para o desempenho, em que o disco persistente não oferece desempenho suficiente, use discos Hyperdisk Extreme.

Para começar a usar esta opção de armazenamento, consulte estes recursos:

Para saber mais sobre os tipos de discos disponíveis, consulte as Opções de armazenamento na documentação do Compute Engine.
O controlador CSI do Persistent Disk do Compute Engine é a principal forma de usar o armazenamento do Persistent Disk com o GKE. Para obter instruções, consulte o artigo Usar o controlador CSI de disco persistente do Compute Engine.

Armazenamento em bloco (Google Cloud Hyperdisk)

Os volumes Hyperdisk usam a próxima geração de Cloud de Confiance armazenamento em blocos. Os volumes Hyperdisk permitem-lhe ajustar dinamicamente o desempenho do seu armazenamento em blocos à sua carga de trabalho. Pode configurar as operações de entrada/saída por segundo (IOPS) e o débito de forma independente para as suas aplicações e adaptar-se às necessidades de desempenho em constante mudança ao longo do tempo.

Esta opção de armazenamento é suportada em clusters do GKE Autopilot e Standard. Os volumes Hyperdisk são recursos zonais, sujeitos à disponibilidade regional. O armazenamento do Hyperdisk no GKE é persistente, o que significa que os dados armazenados nos seus discos persistem mesmo que o pod que os está a usar seja terminado.

Por que motivo deve usar o armazenamento Hyperdisk

Use o armazenamento Hyperdisk se precisar de redimensionar e ajustar dinamicamente as IOPS ou a taxa de transferência. Normalmente, um volume do Hyperdisk está associado a um único pod. Esta opção de armazenamento suporta o ReadWriteOncemodo de acesso. Pode selecionar as seguintes opções de armazenamento do Hyperdisk para o GKE com base nas suas necessidades de preço/desempenho:

Hyperdisk Balanced: a melhor opção para a maioria das cargas de trabalho. Esta é uma boa opção para implementar a maioria das apps empresariais e de linha de negócio, bem como bases de dados e servidores Web.
Débito do Hyperdisk: otimizado para um débito elevado e económico. Esta é uma boa opção se o seu exemplo de utilização tiver como alvo a análise de dados de expansão horizontal (por exemplo, Hadoop ou Kafka), a restauração de dados inativos de servidores de cópia de segurança e cargas de trabalho sensíveis a custos orientadas para o débito.
Hyperdisk Extreme: otimizado para o desempenho de IOPS. Esta é uma boa opção se estiver a implementar cargas de trabalho de alto desempenho, como sistemas de gestão de bases de dados.
Hyperdisk ML: otimizado para cargas de trabalho de preparação e inferência de IA/ML que precisam de carregar rapidamente os pesos dos modelos. Use esta opção para reduzir a inatividade dos recursos de GPU/TPU devido a gargalos de latência.

As opções de armazenamento do Hyperdisk são suportadas em clusters do GKE Autopilot e Standard.

Para começar a usar esta opção de armazenamento, consulte estes recursos:

Para uma vista geral, consulte o artigo Acerca do Hyperdisk para GKE.
Para os limites por disco, incluindo a taxa de débito máxima e as IOPs, consulte os limites do Hyperdisk por disco na documentação do Compute Engine.
Para configurar e consumir o débito do Hyperdisk e o armazenamento Extreme nos seus clusters, consulte o artigo Aumente o desempenho do armazenamento com o Hyperdisk.

Armazenamento em bloco (conjunto de armazenamento Hyperdisk)

Um conjunto de armazenamento Hyperdisk é um conjunto pré-aprovisionado de recursos de armazenamento (capacidade, débito e IOPS) que os discos no seu cluster do GKE podem usar. Os recursos de armazenamento são partilhados entre todos os hiperdiscos que criar no conjunto de armazenamento.

Os clusters padrão permitem que os discos de arranque Hyperdisk (para sistemas operativos) e os Hyperdisks anexados (para armazenamento de dados) façam parte de um conjunto de armazenamento. Os clusters do GKE Autopilot só suportam Hyperdisks associados para pools de armazenamento.

Para começar a usar esta opção de armazenamento, consulte os seguintes recursos:

Para uma vista geral, consulte o artigo Acerca dos conjuntos de armazenamento Hyperdisk.
Para configurar o Hyperdisk Storage Pool nos seus clusters do GKE, consulte o artigo Otimize o desempenho e o custo do armazenamento com o Hyperdisk Storage Pool.

Armazenamento em bloco efémero e não processado (SSD local)

Os discos SSD locais são unidades físicas que estão associadas diretamente aos seus nós. Podem oferecer um melhor desempenho, mas são efémeras. Cada volume de SSD local está associado a um nó específico. Não pode mover o volume para um nó diferente.

Esta opção de armazenamento é suportada em clusters padrão do GKE. O suporte do Autopilot para SSD local está disponível em pré-visualização em máquinas A2 Ultra A100, em clusters e pools de nós com o GKE 1.27 e posterior.

O armazenamento efémero suportado pelo armazenamento SSD local no GKE está associado ao ciclo de vida de um pod. Quando o seu Pod é terminado, o armazenamento efémero associado a esse Pod também é eliminado.

Por que motivo deve usar o SSD local

A utilização do armazenamento SSD local em clusters do GKE é adequada se precisar de armazenamento em cache rápido para bases de dados e para estatísticas em tempo real, ou armazenamento efémero otimizado para flash que ofereça as latências mais baixas. O armazenamento SSD local pode ser particularmente eficaz como uma camada de colocação em cache à frente do Cloud Storage para exemplos de utilização de IA/AA, processamento em lote, estatísticas e bases de dados na memória.

Para começar a usar esta opção de armazenamento, consulte estes recursos:

Para uma vista geral, consulte o artigo Acerca do armazenamento SSD local para o GKE.
Para configurar e consumir o armazenamento SSD local nos seus clusters como emptyDir, consulte o artigo Aprovisione e use o armazenamento efémero suportado por SSD local.
Para configurar e consumir o armazenamento SSD local nos seus clusters como recursos local PersistentVolumes, consulte o artigo Aprovisione e use o armazenamento em bloco não processado suportado por SSD local.

Sistema de ficheiros paralelos (Google Cloud Managed Lustre)

O Lustre gerido é um sistema de ficheiros paralelo de alto desempenho totalmente gerido no Cloud de Confiance, integrado com o GKE através do controlador CSI do Lustre gerido. Foi concebido para cargas de trabalho exigentes que requerem armazenamento persistente, escalável e de elevado débito, particularmente em IA/ML e computação de alto desempenho (HPC). O controlador CSI Lustre gerido automatiza a gestão do ciclo de vida das instâncias do Lustre gerido, permitindo-lhe aprovisioná-las e aceder às mesmas através de objetos Kubernetes padrão, como PersistentVolumes e PersistentVolumeClaims.

Esta opção de armazenamento é suportada em clusters do GKE Autopilot e Standard que executam nós do SO otimizado para contentores. O armazenamento Lustre gerido no GKE é persistente, pelo que os dados permanecem mesmo que o pod que o usa seja terminado.

Por que usar o armazenamento Lustre gerido

Use o armazenamento Lustre gerido para cargas de trabalho que exigem um elevado débito e acesso a ficheiros de baixa latência a partir de vários pods em simultâneo. É uma boa escolha para os seguintes exemplos de utilização:

IA/ML: cargas de trabalho de preparação e inferência que precisam de aceder a grandes conjuntos de dados.
HPC: simulações científicas e de engenharia em grande escala.

Para começar a usar esta opção de armazenamento, consulte estes recursos:

Para ver uma vista geral da funcionalidade, consulte o artigo Acerca do controlador CSI Lustre gerido pela Google Cloud.
Para criar e usar um volume suportado por uma nova instância do Lustre gerido, consulte o artigo Aceda a instâncias do Lustre gerido com o controlador CSI do Lustre gerido do Google Cloud.
Para se ligar a uma instância do Lustre gerida existente, consulte o artigo Aceda a instâncias do Lustre geridas existentes com o controlador CSI do Lustre gerido do Google Cloud.

Sistema de arquivos de rede (Filestore)

O Filestore oferece um sistema de ficheiros partilhado baseado na nuvem para dados não estruturados, com acesso ao sistema de ficheiros em rede (NFS). As instâncias do Filestore funcionam como servidores de ficheiros que oferecem armazenamento duradouro com acesso ReadWriteMany para os seus clusters do GKE. Cloud de Confiance As instâncias do Filestore estão separadas do anfitrião e requerem uma operação manual mínima. As comutações por falha da carga de trabalho são perfeitas porque não existem operações de infraestrutura para anexar ou desanexar volumes.

Esta opção de armazenamento é suportada em clusters do GKE Autopilot e Standard. O armazenamento do Filestore com o nível de serviço empresarial tem, por predefinição, disponibilidade regional, enquanto os outros níveis de serviço têm disponibilidade zonal. O armazenamento do Filestore no GKE é persistente, o que significa que os dados armazenados nas suas instâncias persistem mesmo que o pod que o está a usar seja terminado.

Porquê usar o armazenamento do Filestore

Use o armazenamento do Filestore se as suas aplicações precisarem de acesso ao sistema de ficheiros de rede (NFS) e de vários leitores e escritores. Esta opção de armazenamento é adequada se o seu exemplo de utilização envolver sistemas de gestão de conteúdo, migração de aplicações, análise de dados, renderização e processamento de multimédia.

Para uma maior rentabilidade, as partilhas múltiplas do Filestore para o GKE permitem-lhe partilhar uma instância de nível empresarial do Filestore de 10 GiB ou superior com até 80 PersistentVolumes.

Para começar a usar esta opção de armazenamento, consulte estes recursos:

Para uma vista geral, consulte o artigo Acerca do apoio técnico do Filestore para o GKE.
O controlador CSI do Filestore é a principal forma de usar o armazenamento do Filestore com o GKE. Para ver instruções, consulte o artigo Aceda a instâncias do Filestore com o controlador CSI do Filestore.
Para ver instruções sobre partilhas múltiplas do Filestore, consulte o artigo Otimize o armazenamento com partilhas múltiplas do Filestore para o GKE.

Armazenamento de objetos (Cloud Storage FUSE)

O Cloud Storage é um local de armazenamento de objetos para dados binários e de objetos, blobs e dados não estruturados. O controlador CSI do FUSE do Cloud Storage gere a integração do FUSE do Cloud Storage com as APIs Kubernetes para consumir contentores do Cloud Storage existentes como volumes. Pode usar o controlador CSI do FUSE do Cloud Storage para montar contentores como sistemas de ficheiros em nós do GKE.

O controlador CSI do FUSE do Cloud Storage suporta os modos de acesso ReadWriteMany, ReadOnlyMany e ReadWriteOnce em clusters do GKE Autopilot e Standard. Os objetos do Cloud Storage têm disponibilidade regional. Os dados do Cloud Storage no GKE são persistentes, o que significa que os dados armazenados nos seus contentores permanecem mesmo que o pod que os está a usar seja terminado.

Porquê usar o FUSE do Cloud Storage

A opção FUSE do Cloud Storage é adequada se precisar de semântica de ficheiros à frente do Cloud Storage para portabilidade. O Cloud Storage FUSE também é uma escolha comum para os programadores que querem armazenar e aceder a dados de modelos e de preparação de aprendizagem automática (AA) como objetos no Cloud Storage.

Para começar a usar esta opção de armazenamento, consulte estes recursos:

Para uma vista geral, consulte o FUSE do Cloud Storage.
Para consumir Cloud de Confiance by S3NS contentores nos seus clusters, consulte o artigo Aceda a contentores do Cloud Storage com o controlador FUSE do CSI do Cloud Storage.

Acesso ao armazenamento de objetos de IA/ML através do Run:ai Model Streamer

O Run:ai Model Streamer é um SDK Python concebido para acelerar o carregamento de grandes modelos de IA em GPUs através do streaming de ponderações de modelos diretamente do armazenamento de objetos, como o Cloud Storage, para a memória da GPU. Esta solução de código aberto usa uma implementação de C++ de alto desempenho para ler tensores de modelos em simultâneo, o que pode reduzir significativamente os tempos de arranque a frio para motores de inferência.

O streamer de modelos integra-se com servidores de inferência, como o vLLM, e funciona com modelos armazenados no Cloud Storage. Embora o streamer acelere o acesso aos dados, os dados do modelo subjacentes armazenados em contentores do Cloud Storage permanecem persistentes, o que significa que os dados persistem mesmo que o Pod que os usa seja terminado.

Por que motivo usar o Run:ai Model Streamer

Recomendamos o Run:ai Model Streamer se precisar de acelerar os tempos de carregamento de modelos para inferência, particularmente quando acede a ficheiros safetensors do Cloud Storage com frameworks de publicação como vLLM ou SGLang. Ao ativar a transferência de dados paralela, o streamer foi concebido para carregar modelos muito mais rapidamente do que os métodos convencionais, o que aumenta a utilização e a eficiência gerais da GPU para cargas de trabalho de IA em grande escala.

Para começar no GKE, consulte o artigo Acelere o carregamento de modelos no GKE com o Run:ai model streamer e o vLLM.

Bases de dados geridas

Uma base de dados gerida, como o Cloud SQL ou o Spanner, oferece uma sobrecarga operacional reduzida e está otimizada para a Cloud de Confiance infraestrutura. As bases de dados geridas requerem menos esforço para manter e operar do que uma base de dados que implementa diretamente no Kubernetes.

Por que motivo usar bases de dados geridas

A utilização de uma Cloud de Confiance base de dados gerida permite que as suas cargas de trabalho com estado no GKE acedam a dados persistentes enquanto automatizam tarefas de manutenção, como cópias de segurança, aplicação de patches e escalabilidade. Cria uma base de dados, cria a sua app e permite que o Cloud de Confiance a dimensione por si. No entanto, isto também significa que pode não ter acesso à versão exata de uma base de dados, uma extensão ou o tipo exato de base de dados que quer.

O GKE oferece suporte para a ligação a serviços de Cloud de Confiance bases de dados geridas incluindo o seguinte:

AlloyDB para PostgreSQL: base de dados totalmente gerida e compatível com PostgreSQL com desempenho, disponibilidade e escala superiores para cargas de trabalho transacionais e analíticas. Consulte o artigo Estabeleça ligação do Google Kubernetes Engine ao AlloyDB para PostgreSQL.
Cloud SQL: base de dados MySQL, PostgreSQL e SQL Server totalmente gerida. Consulte o artigo Estabeleça ligação a partir do Google Kubernetes Engine.
Spanner: base de dados relacional escalável horizontalmente com elevada consistência e disponibilidade. Consulte o artigo Implemente uma app com o GKE Autopilot e o Cloud Spanner.
Memorystore for Redis: serviço de armazenamento de dados na memória totalmente gerido. Consulte o artigo Ligar a uma instância do Redis a partir de um cluster do Google Kubernetes Engine.

Para começar a usar esta opção de armazenamento, consulte estes recursos:

As suas Cloud de Confiance by S3NS opções de base de dados, explicadas.
Para considerações sobre a utilização de uma base de dados gerida ou uma base de dados contentorizada alojada no GKE, consulte o artigo Planeie as implementações da sua base de dados no GKE.

Crie artefactos (Artifact Registry)

O Artifact Registry é um gestor de repositórios para imagens de contentores, pacotes de SO e pacotes de idiomas que cria e implementa.

Por que motivo deve usar o Artifact Registry

O Artifact Registry é uma opção adequada para armazenar as suas imagens de contentores privados, gráficos Helm e outros artefactos de compilação.

Para extrair imagens de repositórios Docker do Artifact Registry para o GKE, consulte o artigo Implementar no Google Kubernetes Engine na documentação do Artifact Registry.

O que se segue?

Leia a publicação no blogue Um mapa das opções de armazenamento em Cloud de Confiance.
Crie uma estratégia de armazenamento ideal para a sua carga de trabalho na nuvem.
Compreenda como usar as abstrações de armazenamento do Kubernetes no GKE: PersistentVolumes, StatefulSets.
Consulte a página de recursos Dados no GKE para saber mais sobre as soluções de dados que pode integrar com o GKE.