Publié le: Aug 24, 2023
Nous avons le plaisir d'annoncer la version préliminaire d'Amazon SageMaker Profiler, un outil d'observabilité avancée pour les charges de travail de deep learning de grande envergure. Grâce à cette nouvelle fonctionnalité, vous pourrez accéder à des informations de profilage granulaires liées au matériel informatique afin d'optimiser les performances de formation des modèles.
Pour les clients développant des modèles de deep learning volumineux pour la vision par ordinateur, NLP ou des cas d'utilisation de modèles de base, le nombre d'instances de calcul nécessaires et les coûts associés sont élevés. Ils ont besoin de visibilité sur la durée d'activité du noyau, la latence de lancement ou tout autre délai associé aux processus GPU/CPU. SageMaker Profiler permet d'identifier les opportunités d'optimisation grâce à des mesures d'utilisation du GPU et du CPU, des tracés haute résolution fondés sur GPU/CPU, des annotations personnalisées et une visibilité sur l'utilisation précise mixte. Il permet aux utilisateurs d'identifier les goulots d'étranglement dus à une utilisation inégale des ressources. Il est également plus efficace pour réduire les frais généraux pendant la formation, évolutif pour prendre en charge une durée de profilage plus longue et un plus grand nombre d'instances de formation profilées par charge de travail. Ces éléments permettent de fournir des informations plus fiables aux scientifiques des données tout en essayant d'optimiser les performances matérielles pour les charges de travail de formation distribuées à grande échelle.
Amazon SageMaker Profiler est disponible dans les régions suivantes : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Oregon), Europe (Francfort) et Europe (Irlande) avec la prise en charge d'instance de calcul par défaut. Dans cette version préliminaire, SageMaker Profiler est disponible gratuitement pour les clients dans les régions prises en charge.