Publicado: Aug 24, 2023
Temos o prazer de anunciar uma demonstração do Amazon SageMaker Profiler, uma ferramenta avançada de observabilidade para grandes workloads de aprendizado profundo. Com esse novo recurso, você poderá acessar insights granulares de criação de perfil relacionados ao hardware de computação para otimizar a performance do treinamento de modelos.
Para os clientes que desenvolvem grandes modelos de aprendizado profundo para casos de uso de visão computacional, PLN ou modelos básicos, o número de instâncias computacionais necessárias e os custos associados são significativos. Eles precisam de visibilidade dos tempos ativos do kernel, da latência de lançamento ou de outros cronogramas relacionados aos processos da GPU/CPU. O SageMaker Profiler permite identificar oportunidades de otimização por meio de métricas de utilização de GPU e CPU, gráficos de rastreamento de GPU/CPU de alta resolução, anotações personalizadas e visibilidade da utilização de precisão mista. Ele permite que os usuários identifiquem gargalos devido à utilização desigual de recursos. Também é mais eficiente na redução da sobrecarga durante o treinamento, escalável no suporte a uma maior duração de criação de perfil e a um maior número de perfis de instâncias de treinamento criados por workload. Isso ajuda a fornecer informações mais confiáveis aos cientistas de dados enquanto tentam otimizar a performance do hardware para workloads de treinamento distribuídas em grande escala.
O Amazon SageMaker Profiler está disponível nas seguintes regiões: Leste dos EUA (Ohio), Leste dos EUA (N. da Virgínia), Oeste dos EUA (Oregon), Europa (Frankfurt) e Europa (Irlanda) usando o suporte a instâncias de computação padrão. Durante essa demonstração, o SageMaker Profiler estará disponível gratuitamente para clientes nas regiões com suporte.