Amazon SageMaker 中的 Auto Scaling 現已可用

張貼日期: Feb 28, 2018

現在您可以從 Amazon SageMaker 主控台、AWS Auto Scaling API 及 AWS SDK 設定端點 Auto Scaling，使容量管理更簡單。使用 Amazon SageMaker，您可以指定每個端點之執行個體的數目和類型，以提供推斷所需的擴展。如果您的推斷容量變更，則可以變更支援每個端點的執行個體的數目和/或類型，以配合此變更。透過使用 Auto Scaling，您可以自動調整推斷容量，以便以較低成本維持可預測的效能。從 Amazon SageMaker 主控台，您針對端點設定執行個體最小和最大數目，然後選取每個執行個體的輸送量。Amazon SageMaker 將監控您的部署模型，以自動調整執行個體計數並將輸送量保持在想要的水平，以對應用程式流量變更做出回應。這可讓您輕鬆管理生產模型，且可降低所部署模型的成本。

Amazon SageMaker 中的 Auto Scaling 在美國東部 (維吉尼亞北部與俄亥俄)、歐洲 (愛爾蘭) 及美國西部 (奧勒岡) 的 AWS 區域皆可使用。如需有關在 Amazon SageMaker 中自動擴展模型的更多詳細資料，請瀏覽說明文件。

Amazon SageMaker 中的 Auto Scaling 現已可用

結束對 Internet Explorer 的支援