Publié le: Jul 19, 2019
Batch Transform d'Amazon SageMaker vous permet d'exécuter des prévisions sur des ensembles de données conservés dans Amazon S3. Ce service est idéal dans le cas de scénarios pour lesquels vous travaillez avec de grands lots de données et n'avez pas besoin de latence au millième de seconde. Vous pouvez désormais configurer vos tâches Batch Transform pour exclure certains attributs de données des demandes de prévision et lier tout ou partie de vos attributs de données d'entrée avec les résultats des prévisions. Par conséquent, vous n'avez plus besoin de pré-traitement ou de post-traitement lorsque vous exécutez des prévisions de lot sur des données au format CSV ou JSON.
Prenons pour exemple un ensemble de données qui inclut trois attributs : l'ID, l'âge et la taille. L'attribut ID est un nombre généré de manière aléatoire ou séquentiel qui ne contient pas de signal pour le problème ML et qui n'a pas été utilisé lors de la formation du modèle de ML. Vous pouvez désormais configurer vos tâches Batch Transform afin que celles-ci excluent l'attribut ID de chaque enregistrement pour n'envoyer que les attributs d'âge et de taille dans les demandes de prévision envoyées au modèle. Vous pouvez également configurer vos tâches Batch Transform de manière à associer l'attribut ID aux résultats de prévision dans la sortie finale S3 de la tâche. Conserver des attributs au niveau des enregistrements de cette manière peut être utile pour analyser les résultats des prévisions.
Cette nouvelle fonctionnalité est disponible dans toutes les régions dans lesquelles Amazon SageMaker est disponible. Pour en savoir plus sur cette fonctionnalité, consultez le Guide de développeur Amazon SageMaker.