SageMaker Hyperpod 灵活训练计划现在支持即时启动和多种服务

发布于: 2025年3月4日

自 2025 年 2 月 14 日起,SageMaker 灵活训练计划现在支持即时启动,允许客户预订最快在接下来的 30 分钟内开始的计划。
Amazon SageMaker 灵活训练计划 (FTP) 使客户可以轻松访问 GPU 容量来运行 ML 工作负载。使用灵活训练计划的客户可以放心地规划 ML 开发周期,因为他们知道他们将在特定日期为预订的时间获得所需的 GPU。无需长期承诺,因此客户可以获得容量保障,同时只需为完成工作负载所需的 GPU 时间付费。

灵活训练计划支持在 30 分钟内开始预订(视可用性而定),可加快运行机器学习工作负载的客户的计算资源采购。系统会首先尝试找到与客户要求精确匹配的单个连续的预留容量区块。如果连续区块不可用,SageMaker 会自动将总持续时间拆分为两个时段,并尝试使用两个单独的预留容量区块来完成请求。此外,此次发布之后,灵活训练计划将返回多达三个不同的选项,让您可以灵活地采购计算资源。

您可以使用 SageMaker AI 控制台或编程方法创建训练计划。SageMaker AI 控制台提供了一个可视化图形界面,让您可以全面了解您的选项,而编程创建则可以使用 AWS CLI 或 SageMaker SDK 直接与训练计划 API 交互来完成。您可以点击此处开始 API 体验。