張貼日期: Feb 28, 2018
現在您可以從 Amazon SageMaker 主控台、AWS Auto Scaling API 及 AWS SDK 設定端點 Auto Scaling,使容量管理更簡單。使用 Amazon SageMaker,您可以指定每個端點之執行個體的數目和類型,以提供推斷所需的擴展。如果您的推斷容量變更,則可以變更支援每個端點的執行個體的數目和/或類型,以配合此變更。透過使用 Auto Scaling,您可以自動調整推斷容量,以便以較低成本維持可預測的效能。從 Amazon SageMaker 主控台,您針對端點設定執行個體最小和最大數目,然後選取每個執行個體的輸送量。Amazon SageMaker 將監控您的部署模型,以自動調整執行個體計數並將輸送量保持在想要的水平,以對應用程式流量變更做出回應。這可讓您輕鬆管理生產模型,且可降低所部署模型的成本。
Amazon SageMaker 中的 Auto Scaling 在美國東部 (維吉尼亞北部與俄亥俄)、歐洲 (愛爾蘭) 及美國西部 (奧勒岡) 的 AWS 區域皆可使用。如需有關在 Amazon SageMaker 中自動擴展模型的更多詳細資料,請瀏覽說明文件。