发布于: Dec 9, 2022
Amazon SageMaker 模型训练现在支持预览 ml.p4de.24xlarge(p4de) 实例,由 NVIDIA A100 GPU 和高性能 HBM2e GPU 内存提供支持。这些实例为需要训练大型语言模型 (LLM)、计算机视觉(对象检测、语义分割)和生成式人工智能的使用案例提供了目前性能最高的计算基础设施。
P4de 实例具备多达 8 个 NVIDIA A100 GPU,具有 80GB 高性能 HBM2e GPU 内存,比 p4d 实例中的 GPU 高 2 倍。更高的 GPU 内存主要有助于减少涉及高精度数据和复杂模型的大型数据集的工作流程的训练时间和成本。与
p4d 类似,
它们还支持多达 96 个 vCPU、高达 400Gbps 使用 EFA 和 GPUDirect RDMA 的网络带宽,以及高达 8TB 的基于 NVMe 的本地 SSD 存储。
SageMaker 模型训练在 AWS 美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)区域支持预览 p4de 实例。
要了解有关 p4de 实例的更多信息,请访问 AWS 新闻博客或 Amazon EC2 P4 实例页面。要开始使用 p4de 实例,请阅读 Amazon SageMaker 文档和 SageMaker 模型训练页面。有关 p4de 定价的更多信息,请访问 Amazon SageMaker 定价网页。