Amazon SageMaker HyperPod 现在支持自定义 AMI(亚马逊机器映像)
发布于:
2025年8月12日
Amazon SageMaker HyperPod 现在支持自定义 AMI,使客户能够使用预先配置的、经过安全强化的环境部署集群,以满足其特定组织要求。在 HyperPod 上部署 AI/ML 工作负载的客户需要自定义的环境,这些环境既要满足严格的安全性、合规性和操作要求,又能保持快速的集群启动时间,但经常会遇到复杂的生命周期配置脚本,从而减慢部署速度并在集群节点之间造成不一致。
这一功能允许客户在 HyperPod 针对性能进行了优化的基本 AMI 的基础上进行构建,同时将自定义的安全代理、合规性工具、专有库和专用驱动程序直接整合到映像中,从而缩短启动时间、提高可靠性并增强安全合规性。安全团队可以将组织策略直接嵌入到基础映像中,从而允许 AI/ML 团队使用预先批准的环境,在满足企业安全标准的同时缩短训练时间。在使用 CreateCluster API 创建新的 HyperPod 集群、使用 UpdateCluster API 添加实例组或使用 UpdateClusterSoftware API 修补现有集群时,您可以指定自定义 AMI。自定义 AMI 必须使用 HyperPod 的公共基础 AMI 构建,以保持与分布式训练库和集群管理功能的兼容性。
此功能现已在支持 Amazon SageMaker HyperPod 的所有 AWS 区域推出。要了解有关自定义 AMI 的更多信息,请参阅 Amazon SageMaker HyperPod 用户指南。