Publicado: Jul 8, 2022
Temos o prazer de anunciar hoje que os experimentos do Amazon SageMaker Autopilot que geram modelos de ML com alta performance de modelos passaram a executar até 2x mais rápido. O Amazon SageMaker Autopilot é um produto de machine learning (ML) com baixo uso de código que cria, treina e ajusta automaticamente os melhores modelos de ML com base em seus dados, permitindo a você manter controle e visibilidade totais. No entanto, com o crescimento do tamanho dos conjuntos de dados, o custo computacional do treinamento e ajuste de modelos pode ser tornar alto.
A partir de hoje, o SageMaker Autopilot inicializará hiperparâmetros usando o método de uso de dados sem treinamento prévio (zero-shot) e instâncias ml.m5.12xlarge (48 vCPUs, 192 GiB de memória) para ajudar a reduzir o número de avaliações padrão de 250 para 100. Com essa alteração, os experimentos do SageMaker Autopilot que geram o modelo de ML de melhor performance serão concluídos em até menos da metade do tempo. Para avaliar os ganhos de performance, usamos vários conjuntos de dados de referência do OpenML, com tamanhos entre 0,5 MB e 1 GB. Os resultados mostraram as seguintes reduções de tempo de execução das tarefas do Autopilot: até 45% (média de 230 para 120 minutos) para conjuntos de dados menores (menos de 100 MB) e até 40% (média de 540 para 430 minutos) para conjuntos de dados médios (de 100 MB a 1 GB) e grandes (mais de 1 GB). Com esses aprimoramentos, você já pode executar experimentos do SageMaker Autopilot em menos tempo sem precisar alterar as configurações dos trabalhos atuais.
Para saber mais sobre o SageMaker Autopilot, acesse a página de produto do SageMaker Autopilot e a documentação.