Publicado: Dec 27, 2023
Temos o prazer de anunciar o lançamento de uma nova maneira fácil e segura de se conectar remotamente ao ambiente de treinamento de modelos no Amazon SageMaker para melhorar a observabilidade e acelerar a depuração.
A partir de hoje, você pode realizar a depuração remota do código de treinamento de modelos em execução no SageMaker a partir do seu ambiente de desenvolvimento local. Agora você pode diagnosticar facilmente um trabalho de treinamento paralisado, usar ferramentas de linha de comando para monitorar os recursos computacionais subjacentes, depurar o script de treinamento e, em seguida, corrigi-lo e executá-lo rapidamente. Esse novo recurso usa o AWS Systems Manager (SSM) para oferecer acesso em nível de shell ao contêiner de treinamento subjacente. Se você usa sua própria Amazon Virtual Private Cloud (VPC) para seu trabalho de treinamento de modelos, também pode usar o AWS PrivateLink para configurar um endpoint da VPC para SSM e conectar-se aos contêineres de forma privada.
Esse atributo já está disponível em todas as regiões nas quais o Treinamento de modelos do Amazon SageMaker é oferecido. Saiba mais consultando a página da documentação.