Publicado: Sep 1, 2022
O SageMaker Autopilot cria, treina e ajusta automaticamente os melhores modelos de machine learning com base em dados, permitindo a você manter controle e visibilidade totais. A partir de hoje, você pode personalizar as divisões de dados usadas para treinar e validar modelos durante a criação de experimentos do Autopilot para treinar um modelo de machine learning. Por padrão, o Autopilot divide o conjunto de dados especificado em partes de 80% e 20%, destinadas respectivamente a treinamento e validação. Com este lançamento, você pode personalizar as porcentagens de divisão de dados para treinamento e validação. Como alternativa, também é possível fornecer dois conjuntos de dados, um para treinamento e outro para validação. Esse recurso está disponível no Amazon SageMaker Studio e na API do SageMaker Autopilot.
Além disso, para aumentar a eficiência da seleção de conjuntos de dados para treinamento e validação, esta versão também inclui uma melhor interface de usuário, com uma experiência simples de navegação no S3 e um fluxo de trabalho detalhado e orientado que ajuda a manter controle e visibilidade totais das configurações avançadas.
Para começar a usar, atualize o Amazon SageMaker Studio para a versão mais recente e execute o SageMaker Autopilot no SageMaker Studio Launcher ou no fluxo de trabalho de treinamento de modelos do Amazon SageMaker Data Wrangler. Para saber mais sobre como atualizar o Studio, consulte a documentação.
Esses novos recursos e experiências já estão disponíveis em todas as regiões em que o SageMaker Autopilot é oferecido. Para começar a usar, consulte Como criar um experimento com o Autopilot e a referência de API do SageMaker Autopilot. Para saber mais, acesse a página de produto do SageMaker Autopilot.