Ya está disponible Auto Scaling en Amazon SageMaker

Publicado en: Feb 28, 2018

Ahora puede configurar el Auto Scaling de sus puntos de enlace desde la consola de Amazon SageMaker, la API de AWS Auto Scaling y el SDK de AWS, facilitando las tareas de administración de la capacidad. Mediante Amazon SageMaker, puede especificar el número y el tipo de instancias por cada punto de enlace para escalar sus inferencias según sus necesidades. Si cambia el volumen de su inferencia, puede cambiar el número o el tipo de las instancias que respaldan cada punto de enlace para dar cabida a dicho cambio. Al utilizar Auto Scaling, puede ajustar automáticamente la capacidad de la inferencia para mantener un desempeño predecible a un costo reducido. Desde la consola de Amazon SageMaker, puede configurar el número mínimo y máximo de instancias para el punto de enlace y, a continuación, seleccionar la tasa de transferencia por instancia. Amazon SageMaker se encargará de monitorizar los modelos implementados para ajustar automáticamente el número de instancias y mantener la tasa de transferencia dentro de los niveles deseados, respondiendo a los cambios en el tráfico de las aplicaciones. De esta forma, resulta más fácil gestionar modelos en producción, y puede ayudar a reducir el costo de los modelos implementados.

Auto Scaling en Amazon SageMaker está disponible en las regiones de AWS EE.UU Este (Norte de Virginia y Ohio), UE (Irlanda) y EE.UU Oeste (Oregón). Visite la documentación para más conocer más detalles acerca del escalado automático de modelos en Amazon SageMaker.

Ya está disponible Auto Scaling en Amazon SageMaker

Finalización de la compatibilidad con Internet Explorer