Publié le: Feb 28, 2018
Vous pouvez désormais configurer Auto Scaling pour vos points de terminaison depuis la console Amazon SageMaker, l'API AWS Auto Scaling et le SDK AWS, facilitant ainsi la gestion des capacités. Amazon SageMaker vous permet de spécifier le nombre et le type d'instances par point de terminaison afin de fournir l'échelle dont vous avez besoin pour vos inférences. Si votre volume d'inférences évolue, vous pouvez modifier le nombre et/ou le type d'instances qui supportent chaque point de terminaison pour tenir compte de ce changement. Auto Scaling vous permet d'ajuster automatiquement votre capacité d'inférences afin de conserver des performances prévisibles à un faible coût. Depuis la console Amazon SageMaker, vous pouvez configurer le nombre minimal et maximal d'instances pour votre point de terminaison, puis sélectionner le débit par instance. Amazon SageMaker surveillera vos modèles déployés pour ajuster automatiquement le nombre d'instances et maintenir le débit aux niveaux souhaités, en réponse aux changements du trafic des applications. La gestion des modèles en production en est ainsi simplifiée, et le coût des modèles déployés peut être réduit.
Auto Scaling dans Amazon SageMaker est actuellement disponible dans les régions AWS USA Est (Virginie du Nord et Ohio), UE (Irlande) et USA Ouest (Oregon). Consultez la documentation pour plus d'informations sur la mise à l'échelle automatique des modèles dans Amazon SageMaker.