Publicado en: Sep 30, 2022
Amazon SageMaker Data Wrangler reduce, de semanas a minutos, el tiempo que lleva agregar y preparar datos para el aprendizaje automático (ML). El Piloto automático de Amazon SageMaker crea, entrena y ajusta automáticamente los mejores modelos de aprendizaje automático en función de sus datos, a la vez que le permite mantener el control y la visibilidad completos. Con tan solo unos clics, Data Wrangler permite una preparación unificada de datos y una experiencia de capacitación de modelos con Amazon SageMaker Autopilot. Esta integración se ha mejorado para incluir y volver a utilizar la transformación de Data Wrangler como el imputador de valores faltantes,los codificadores ordinales y one-hot, etc., junto con los modelos de piloto automático para la inferencia de ML. Cuando prepara los datos en Data Wrangler y entrena un modelo mediante la invocación del piloto automático, ahora puede implementar los modelos entrenados junto con todas las características de transformaciones de Data Wrangler como una canalización de inferencia en serie de SageMaker. Esto permitirá el procesamiento previo automático de los datos sin procesar con la reutilización de las transformaciones de la función de Data Wrangler al momento de la inferencia. Actualmente, esta función solo es compatible para los flujos de Data Wrangler que no usan transformaciones unidas, agrupadas, concatenadas y de serie temporal.
Antes de este lanzamiento, cuando se usaban los modelos de Piloto automático entrenados con los datos preparados de Data Wrangler, los datos presentados para la inferencia necesitaban un procesamiento previo en SageMaker Data Wrangler. Este procesamiento previo era necesario antes de presentar los datos para la inferencia tanto en tiempo real como en el modo por lotes. A partir de hoy, después de preparar los datos con Data Wrangler y entrenar un modelo en el piloto automático de SageMaker, puede hacer predicciones por lote que incluye las transformaciones del debate de datos o la implementación de modelos entrenados junto con las transformaciones de Data Wrangler detrás de un punto de conexión de SageMaker. Esta inclusión automática de la transformación del debate de datos permite la inferencia que elimina la necesidad del procesamiento previo manual de datos está disponible en la inferencia en tiempo real y en lotes.
Esta nueva experiencia ahora está disponible en todas las regiones donde están disponibles SageMaker Data Wrangler y el Piloto automático de SageMaker. Para comenzar, consulte el documento Entrenar modelos automáticamente en su flujo de datos o revise la publicación del blog.