Publicado: Dec 1, 2019
O Amazon SageMaker Operators for Kubernetes facilita o treinamento, o ajuste e a implantação de modelos de machine learning (ML) no Amazon SageMaker para desenvolvedores e cientistas de dados que usam o Kubernetes.
Os clientes usam o Kubernetes, um sistema de orquestração de contêineres de uso geral, para configurar pipelines repetíveis e manter maior controle e portabilidade sobre as cargas de trabalho. Porém, ao executar cargas de trabalho de ML no Kubernetes, os clientes também precisam gerenciar e otimizar a infraestrutura subjacente de ML, garantir alta disponibilidade e confiabilidade, fornecer ferramentas de ML para tornar os cientistas de dados mais produtivos e cumprir os requisitos regulatórios e de segurança apropriados. Com o Amazon SageMaker Operators for Kubernetes, os clientes podem invocar o SageMaker usando a API Kubernetes ou as ferramentas Kubernetes, como o kubectl, para criar e interagir com os trabalhos de ML no SageMaker. Isso oferece aos clientes do Kubernetes os benefícios de portabilidade e padronização do Kubernetes e do EKS, além dos benefícios dos serviços de ML totalmente gerenciados com o Amazon SageMaker.
Os clientes podem usar os operadores do Amazon SageMaker para treinamento de modelos, otimizações de hiperparâmetros de modelos, inferência em tempo real e inferência em lote. Para o treinamento do modelo, os clientes da Kubernetes agora podem aproveitar todos os benefícios do treinamento totalmente gerenciado do modelo de ML no SageMaker, incluindo o Managed Spot Training para economizar até 90% em custo e o treinamento distribuído para reduzir o tempo de treinamento, escalando para vários nós da GPU. Os recursos de computação são provisionados apenas quando solicitados, redimensionados conforme necessário e desligados automaticamente quando os trabalhos são concluídos, garantindo quase 100% de utilização. Para ajuste de hiperparâmetros, os clientes podem usar o Ajuste automático de modelos do SageMaker, economizando dias ou mesmo semanas dos cientistas de dados, melhorando a precisão do modelo. Os clientes também podem usar a instância spot para o ajuste automático de modelos. Por inferência, os clientes podem usar o SageMaker Operators para implantar modelos treinados no SageMaker em clusters de escalabilidade automática totalmente gerenciados, espalhados por várias zonas de disponibilidade, para oferecer alta performance e disponibilidade para previsão em tempo real ou em lote.
No momento em que este documento foi redigido, o Amazon SageMaker Operators for Kubernetes estava disponível no Leste dos EUA (Ohio), Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon) e UE (Irlanda). Você pode começar com os tutoriais passo a passo em nosso guia do usuário e no repositório do GitHub.