SageMaker HyperPod 现在支持对计算资源进行精细的配额分配

发布于: 2025年8月14日

SageMaker HyperPod 任务治理现在支持对实例内的 GPU、Trainium 加速器、vCPU 和 vCPU 内存进行精细的计算配额分配。管理员可以在团队之间分配精细的计算配额,从而优化计算资源分配并保持在预算范围内。

数据科学家经常执行不需要整个 HyperPod 实例的 LLM 任务,例如训练或推理,从而导致加速计算资源利用率不足。HyperPod 任务治理使管理员能够管理团队之间的计算配额分配。通过此功能,管理员现在可以战略性地分配计算资源,确保公平访问,防止资源垄断,并最大限度地提高集群利用率。除了实例级分配外,此功能还支持精细的计算配额分配,从而与组织的工作负载需求保持一致。

SageMaker HyperPod 任务治理功能现已在提供 HyperPod 的所有 AWS 区域推出:美国东部(弗吉尼亚州北部)、美国西部(北加利福尼亚)、美国西部(俄勒冈州)、亚太地区(孟买)、亚太地区(新加坡)、亚太地区(悉尼)、亚太地区(东京)、欧洲地区(法兰克福)、欧洲地区(爱尔兰)、欧洲地区(伦敦)、欧洲地区(斯德哥尔摩)和南美洲(圣保罗)。

要了解更多信息,请访问 SageMaker HyperPod 网页HyperPod 任务治理文档