Amazon EC2 P5en 实例现已在 AWS 美国西部(北加利福尼亚)区域推出
发布于:
2025年5月6日
即日起,由 NVIDIA H200 GPU 提供支持的 Amazon Elastic Compute Cloud (Amazon EC2) P5en 实例将在 AWS 美国西部(北加利福尼亚)区域推出。这些实例针对生成式人工智能和高性能计算 (HPC) 应用程序进行了优化。
P5en 实例采用 8 个 H200 GPU,与 P5 实例采用的 H100 GPU 相比,其 GPU 内存大小和 GPU 内存带宽分别为 1.7 倍和 1.4 倍。P5en 实例将 H200 GPU 与高性能的第四代定制 Intel Xeon 可扩展处理器搭配,支持 CPU 和 GPU 之间的 Gen5 PCIe,提供高达 4 倍的带宽,从而提高人工智能的训练和推理性能。与使用上一代 EFA 和 Nitro 的 P5 相比,P5en 采用 Nitro v5 和高达 3200 Gbps 的第三代 EFA,将延迟降低了 35%。这有助于提高分布式训练工作负载的集体通信性能,如深度学习、生成式人工智能、实时数据处理和高性能计算(HPC)应用程序。为了满足客户对大规模低延迟的需求,P5en 实例部署在 Amazon EC2 UltraClusters 中,为分布式训练和紧密耦合的 HPC 工作负载提供市场领先的扩展能力。
要了解有关 P5en 实例的更多信息,请参阅 Amazon EC2 P5en 实例。