本页面上的部分或全部信息可能不适用于 Cloud de Confiance by S3NS。如需了解详情，请参阅与 Google Cloud 的区别。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Cloud de Confiance by S3NS 上的 TPU 简介

张量处理单元 (TPU) 是 Google 定制开发的专用集成电路 (ASIC)，旨在加速机器学习 (ML) 和人工智能 (AI) 工作负载。无论您是训练复杂的基础模型数周，还是运行大规模推理，TPU 都能提供可伸缩的专用计算资源，并针对 JAX 和 PyTorch 等框架进行了优化。

Cloud TPU 旨在处理要求最严苛的 AI 工作负载。主要优势包括：

何时使用 TPU

TPU 针对特定工作负载进行了优化，例如：

TPU 不适合以下工作负载：

您可以根据自己的运营需求，使用以下 Cloud de Confiance by S3NS 产品来访问和预配 TPU。

借助 Compute Engine，您可以创建和管理单个 TPU 虚拟机或切片，从而实现对 TPU 虚拟机的完整生命周期管理。Google 建议您使用 Compute Engine 而不是旧版 Cloud TPU API 来预配 TPU 资源。

Google Kubernetes Engine (GKE) 提供了一个全代管式式多租户 Kubernetes 环境，用于编排大规模 AI 工作负载。GKE 支持 TPU 节点和节点池生命周期管理，包括创建、配置和删除 TPU 虚拟机。

如需了解详情，请参阅 GKE 中的 TPU 简介。

Cloud TPU API（包括 Google Cloud CLI 和 Cloud TPU 的 Cloud 客户端库）已停止开发。对于 TPU 资源的预配和管理，Google 建议您根据自己的编排和工作负载需求使用 Compute Engine 或 GKE。

如需了解详情，请参阅从 Cloud TPU API 迁移。

Compute Engine 支持以下 TPU 版本：

如需详细了解每个 TPU 版本，请参阅 TPU 机器。