Publicado en: Jul 19, 2019
La transformación por lotes de Amazon SageMaker le permite ejecutar predicciones en bases de datos almacenadas en Amazon S3. Es ideal para los casos en los que se trabaja con lotes de datos de gran tamaño y no se necesita una latencia inferior a un milisegundo. Ahora puede configurar los trabajos de transformación por lotes para que se excluyan determinados atributos de datos en las solicitudes de predicciones y vincular una parte o la totalidad de los atributos de datos de entrada con resultados de predicciones. Como resultado, ya no necesita realizar tareas adicionales de pre y posprocesamiento al momento de ejecutar predicciones en lote en datos que se encuentren en formato CSV o JSON.
Por ejemplo, considere un conjunto de datos que incluya tres atributos: ID, edad y altura. El atributo ID es un número secuencial o un número generado aleatoriamente que no porta ninguna señal para el problema de aprendizaje automático y no se utilizó al momento de entrenar el modelo de aprendizaje automático. Ahora puede configurar los trabajos de Batch Transform para que se excluya el atributo ID de cada registro y se pasen únicamente los atributos edad y altura en las solicitudes de predicciones enviadas al modelo. También puede configurar los trabajos de Batch Transform para que se asocie el atributo ID con los resultados de las predicciones en el resultado del trabajo para S3. Retener atributos a nivel de registro de esta manera puede resultar útil para analizar los resultados de las predicciones.
Esta nueva capacidad se encuentra disponible en todas las regiones en las que se ofrece Amazon SageMaker. Para obtener más información sobre esta característica, consulte la Guía para desarrolladores de Amazon SageMaker.