Publié le: Oct 25, 2022
Amazon SageMaker élargit l'accès à huit nouvelles familles d'instances de machine learning (ML) basées sur Graviton2 et Graviton3, afin que les clients disposent de plus d'options pour optimiser leurs coûts et leurs performances lors du déploiement de leurs modèles ML sur SageMaker. Désormais, les clients peuvent utiliser ml.c7g, ml.m6g, ml.m6gd, ml.c6g, ml.c6gd, ml.c6gn, ml.r6g et ml.r6gd pour les options de déploiement de modèles d'inférence en temps réel et asynchrone.
Amazon SageMaker prend désormais en charge 7 familles d'instances : ml.m6g, ml.m6gd, ml.c6g, ml.c6gd, ml.c6gn, ml.r6g et ml.r6gd, qui sont alimentées par les processeurs AWS Graviton2, lesquels offrent aux clients des performances jusqu'à 40 % supérieures à celles des instances comparables de cinquième génération basées sur x86, pour le même prix, et ce pour un large éventail de charges de travail. Les instances ML basées sur Graviton2 sont disponibles dans toutes les régions commerciales. Pour savoir quelles familles d'instances sont disponibles dans la région de votre choix, veuillez consulter notre page de tarification.
S'appuyant sur les améliorations apportées par Graviton2, les instances basées sur Graviton3 offrent des performances jusqu'à 25 % supérieures, des performances en virgule flottante jusqu'à 2 fois supérieures et un accès à la mémoire 50 % plus rapide grâce à la technologie de pointe de la mémoire DDR5 par rapport aux processeurs Graviton2. Spécifiquement pour les charges de travail ML, les processeurs AWS Graviton3 offrent des performances jusqu'à 3 fois supérieures à celles des processeurs AWS Graviton2, ainsi que la prise en charge du format bfloat16. Amazon SageMaker prend désormais en charge la famille d'instances ml.c7g. Les instances ml.c7g sont disponibles dans les régions suivantes : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Oregon) et Europe (Irlande).
Pour commencer, sélectionnez une instance basée sur Graviton lorsque vous créez votre configuration de point de terminaison SageMaker. Pour en savoir plus sur la tarification de ces instances, consultez notre page de tarification.