Publicado en: Dec 1, 2019
Los operadores para Kubernetes de Amazon SageMaker facilitan a los desarrolladores y los científicos de datos utilizando Kubernetes entrenar, ajustar e implementar modelos de aprendizaje automático (ML) en Amazon SageMaker.
Los clientes utilizan Kubernetes, un sistema de orquestación de contenedor de propósito general, para configurar canales replicables y mantener mayor control y portabilidad sobre sus cargas de trabajo. Pero cuando se ejecutan cargas de trabajo ML en Kubernetes, los clientes también deben administrar y optimizar la infraestructura de ML subyacente, garantizar una alta disponibilidad y confiabilidad, brindar herramientas de ML para que los científicos de datos sean más productivos y cumplan con los requisitos regulatorios y de seguridad adecuados. Con los operadores de Amazon SageMaker para Kubernetes, los clientes pueden recurrir a SageMaker utilizando las API de Kubernetes o las herramientas de Kubernetes como kubectl para crear e interactuar con sus trabajos de ML en SageMaker. Esto le da a los clientes de Kubernetes beneficios de portabilidad y estandarización para Kubernetes y EKS, junto con los beneficios de los servicios ML completamente administrados con Amazon SageMaker.
Los clientes pueden utilizar los operadores de Amazon SageMaker para el entrenamiento de modelo, las optimizaciones de hiperparámetros de modelo, interfaz en tiempo real e inferencia de lote. Para el entrenamiento de modelo, los clientes de Kubernetes ahora pueden aprovechar todos los beneficios del entrenamiento de modelo ML completamente administrado en SageMaker, que incluye Managed Spot Training para ahorrar hasta un 90 % del costo y entrenamiento distribuido para reducir el tiempo de entrenamiento al escalar a nodos GPU múltiples. Los recursos de cálculo únicamente se ofrecen cuando se los solicita, escalados según se necesite y apagados automáticamente cuando se completan los trabajos, asegurando cerca de un 100 % de utilización. Para adaptar los hiperparámetros, los clientes pueden utilizar el Ajuste de modelo automático de SageMaker, y así ahorrar días o incluso semanas de tiempo de los científicos de datos y mejorar la precisión del modelo. Los clientes también utilizan instancia de spot para el Ajuste de modelo automático. En conclusión, los clientes pueden utilizar los operadores de SageMaker para implementar los modelos entrenados en SageMaker para los clústeres de escalado automático completamente administrados, extender a través de múltiples zonas de disponibilidad para ofrecer un gran desempeño y disponibilidad para de lote o en tiempo real.
Los operadores de Amazon SageMaker para Kubernetes se encuentran en general disponibles en el momento de escribir este documento en EE. UU. Este (Ohio), EE. UU. Este (Norte de Virginia), EE. UU. Oeste (Oregón) y UE (Irlanda). Puede comenzar con los tutoriales paso a paso en nuestra guía de usuario y repositorio de GitHub.