Publicado en: Nov 12, 2021
Amazon SageMaker Autopilot crea, forma y ajusta de forma automática los mejores modelos de machine learning en función de los datos, a la vez que permite mantener un control y una visibilidad completos. Como una parte de la creación de modelos, SageMaker Autopilot limpia, prepara y preprocesa datos de forma automática para optimizar el rendimiento de los modelos de machine learning. A partir del día de hoy, Autopilot genera una gran cantidad adicional de información sobre datos que puede servir para mejorar la calidad de los datos y, por lo tanto, crear modelos de mayor calidad que se ajusten mejor a sus necesidades comerciales.
Una parte de la información sobre datos más importante que se genera a partir de ahora incluye poder de predicción, correlación entre características, distribución de columnas de destino, filas duplicadas, filas anómalas, distribución de clases desequilibradas y cardinalidad para la respuesta de destino de clasificación multiclase. Esta información se presenta en el notebook de exploración de datos que genera Autopilot y se pone a su disposición de manera anticipada previo al inicio del proceso de formación. Cuando sea posible, esta información también incluirá recomendaciones para solucionar cualquier problema detectado relacionado con la calidad de los datos antes de intentar preprocesarlos de forma automática y seleccionarlos.
La información sobre datos y las recomendaciones ahora se generan en todas las regiones de AWS que admiten SageMaker Autopilot en la actualidad. Para obtener más información, consulte información sobre datos. Para comenzar a utilizar SageMaker Autopilot, consulte Introducción o acceda a Autopilot desde SageMaker Studio.