게시된 날짜: Feb 28, 2018
이제 Amazon SageMaker 콘솔, AWS Auto Scaling API 및 AWS SDK에서 엔드포인트의 Auto Scaling을 구성할 수 있습니다. 따라서 용량을 관리하기가 훨씬 쉬워졌습니다. Amazon SageMaker를 사용하면 추론에 필요한 규모를 제공하기 위한 엔드포인트당 인스턴스 수와 유형을 지정할 수 있습니다. 추론 볼륨이 바뀌면 인스턴스의 수 또는 유형을 변경할 수 있으며, 이 변경 사항은 각 엔드포인트에 다시 반영됩니다. Auto Scaling을 사용하면 추론 용량을 자동으로 조절하여 낮은 비용으로 예측 가능한 성능을 유지할 수 있습니다. Amazon SageMaker 콘솔에서 엔드포인트의 최대 및 최소 인스턴스 수를 구성한 다음 인스턴스당 처리량을 선택합니다. 그러면 Amazon SageMaker가 배포된 모델을 모니터링하면서 애플리케이션 트래픽의 변화에 따라 인스턴스 수를 자동으로 조정하고 처리량을 원하는 수준으로 유지합니다. 따라서 운영 환경에서 모델을 손쉽게 관리하고 배포된 모델의 비용을 절감할 수 있습니다.
Amazon SageMaker의 Auto Scaling은 미국 동부(버지니아 북부 및 오하이오), EU(아일랜드), 미국 서부(오레곤) AWS 리전에서 사용할 수 있습니다. Amazon SageMaker에서 모델을 자동으로 조정하는 자세한 방법은 설명서를 참조하십시오.