Inserito il: Feb 28, 2018
Ora puoi configurare l'Auto Scaling dei tuoi endpoint dalla console di Amazon SageMaker, dall'API Auto Scaling AWS e dall'SDK AWS, semplificando la gestione della capacità. Grazie ad Amazon SageMaker puoi specificare il numero e il tipo di istanze per ogni endpoint per fornire il dimensionamento necessario alle inferenze. Se il volume dell'inferenza varia puoi cambiare il numero e/o il tipo di istanze che supportano ogni endpoint per adattarsi a tale modifica. Grazie all'Auto Scaling puoi regolare automaticamente la capacità di inferenza per mantenere prestazioni prevedibili a basso costo. Dalla console di Amazon SageMaker si configura il numero minimo e massimo di istanze per il tuo endpoint per poi selezionare il throughput per istanza. Amazon SageMaker monitorerà i modelli distribuiti per regolare automaticamente il conteggio delle istanze e mantenere il throughput al livello desiderato, in risposta alle variazioni del traffico dell'applicazione. Questo rende più semplice la gestione dei modelli in produzione e può aiutare a ridurre i costi dei modelli distribuiti.°
Auto Scaling in Amazon SageMaker è disponibile nelle regioni AWS Stati Uniti orientali (Virginia settentrionale e Ohio), UE (Irlanda) e Stati Uniti occidentali (Oregon). Visita la documentazione per ulteriori dettagli sul ridimensionamento automatico dei modelli in Amazon SageMaker.°