发布于: Feb 28, 2018
现在,您可以通过 Amazon SageMaker 控制台、AWS Auto Scaling API 和 AWS 开发工具包配置终端节点的 Auto Scaling,简化容量管理工作。借助 Amazon SageMaker,您可以为每个终端节点指定实例数量和类型,以提供推理所需的扩展。如果推理容量发生变化,您可以更改为每个终端节点提供支持的实例的数量和/或类型,以适应相关变化。使用 Auto Scaling 后,您可以自动调整推理容量,以便以较低的成本维持预期性能。在 Amazon SageMaker 控制台中,您可以配置终端节点的实例数下限和上限,然后选择每个实例的吞吐量。Amazon SageMaker 会通过监控部署的模型来自动调整实例数量,确保吞吐量维持在所需的水平,以响应应用程序流量变化。如此一来,便可以更加轻松地管理生产环境中的模型,并有助于降低所部署模型的成本。
Auto Scaling in Amazon SageMaker 面向以下 AWS 区域推出:美国东部(弗吉尼亚北部和俄亥俄)、欧洲(爱尔兰)和美国西部(俄勒冈)。参阅相关文档,了解关于 Amazon SageMaker 中的自动扩展模型的更多详细信息。