发布于: Jul 26, 2023
今天,AWS 宣布全面推出 Amazon Elastic Compute Cloud (Amazon EC2) P5 实例,这种实例由最新的 NVIDIA H100 Tensor Core GPU 提供支持。这些实例在 Amazon EC2 中为深度学习和高性能计算 (HPC) 应用程序提供了最高的性能。 与上一代基于 GPU 的实例相比,它们可帮助您将问题解决时间缩短多达 6 倍,并将训练机器学习模型的成本降低高达 40%。
您可以使用 Amazon EC2 P5 实例来训练和部署日益复杂的大型语言模型 (LLM) 和扩散模型,为要求最苛刻的生成式人工智能应用程序提供支持。这包括问题解答、代码生成、视频和图像生成、语音识别等。您还可以使用 P5 实例在药物发现、地震分析、天气预报和财务建模领域大规模部署要求苛刻的 HPC 应用程序。
为了实现这些性能改进和成本节约,与上一代基于 GPU 的实例相比,P5 实例搭配 NVIDIA H100 Tensor Core GPU,CPU 性能提高了 2 倍,系统内存提高了 2 倍,本地存储空间增加了 4 倍。它们为分布式训练和紧密耦合的 HPC 工作负载提供市场领先的横向扩展功能,使用第二代 Elastic Fabric Adapter (EFA) 技术实现了高达 3,200Gbps 的网络连接。为了满足客户对低延迟和大规模的需求,在 Amazon EC2 UltraClusters 中部署了 P5 实例。这些实例在多达 20,000 个 H100 GPU 中提供 PB 级的非阻塞互连,从而实现高达 20 百亿亿次的聚合计算能力。
P5 实例现已在美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)AWS 区域推出,大小为 p5.48xl。
要了解有关 P5 实例的更多信息,请参阅 Amazon EC2 P5 实例。