SageMaker HyperPod 现在支持对计算资源进行精细的配额分配

发布于: 2025年8月14日

SageMaker HyperPod 任务治理现在支持对实例内的 GPU、Trainium 加速器、vCPU 和 vCPU 内存进行精细的计算配额分配。管理员可以在团队之间分配精细的计算配额，从而优化计算资源分配并保持在预算范围内。

数据科学家经常执行不需要整个 HyperPod 实例的 LLM 任务，例如训练或推理，从而导致加速计算资源利用率不足。HyperPod 任务治理使管理员能够管理团队之间的计算配额分配。通过此功能，管理员现在可以战略性地分配计算资源，确保公平访问，防止资源垄断，并最大限度地提高集群利用率。除了实例级分配外，此功能还支持精细的计算配额分配，从而与组织的工作负载需求保持一致。

SageMaker HyperPod 任务治理功能现已在提供 HyperPod 的所有 AWS 区域推出：美国东部（弗吉尼亚州北部）、美国西部（北加利福尼亚）、美国西部（俄勒冈州）、亚太地区（孟买）、亚太地区（新加坡）、亚太地区（悉尼）、亚太地区（东京）、欧洲地区（法兰克福）、欧洲地区（爱尔兰）、欧洲地区（伦敦）、欧洲地区（斯德哥尔摩）和南美洲（圣保罗）。

要了解更多信息，请访问 SageMaker HyperPod 网页和 HyperPod 任务治理文档。

SageMaker HyperPod 现在支持对计算资源进行精细的配额分配

了解

资源

开发人员

帮助