Publicado: Jun 7, 2023
Hoje, a AWS anunciou um novo atributo no SageMaker Pipelines, o serviço de gerenciamento de fluxo de trabalho de ML, para permitir que os usuários executem as etapas desejadas em um pipeline como um subfluxo de trabalho. O novo atributo, chamado Execução seletiva, permite executar as etapas selecionadas em um pipeline, evitando executar novamente todo o pipeline. Como cientista de dados, cientista aplicado ou engenheiro de ML iterando em um pipeline para experimentar e implantar modelos de ML em grande escala, você pode usar esse atributo para iniciar a execução de um pipeline nas etapas desejadas, economizar horas de processamento e simplificar o gerenciamento do código usado para execuções.
Ao iterar em seu fluxo de trabalho do modelo de ML nos SageMaker Pipelines, você pode usar o atributo de execução seletiva para testar várias configurações de parâmetros de tempo de execução, como tipo e contagem de instâncias. Você pode selecionar as etapas em um pipeline e fornecer qualquer execução anterior como referência. As saídas das etapas não selecionadas são obtidas automaticamente da execução da referência, evitando, assim, reexecutá-las. Como resultado, as execuções seletivas ajudam você a economizar tempo e custos de recursos de infraestrutura ao executar o fluxo de trabalho em várias iterações durante os estágios de experimentação e produção de um modelo de ML.
Você pode executar execuções seletivas nos cadernos do SageMaker Studio via PythonSDK e colaborar usando código compartilhável e repetível. O novo atributo pode ser acessado em todas as regiões públicas da AWS nas quais o SageMaker Pipelines está disponível. Saiba mais sobre o Amazon SageMaker Pipelines aqui e encontre o guia detalhado do desenvolvedor na seção Execução seletiva aqui.