Publicado en: May 5, 2022
Amazon SageMaker Canvas es una interfaz visual interactiva que permite a analistas empresariales generar predicciones de ML precisas por su cuenta, sin necesidad de contar con experiencia en machine learning o escribir líneas de código. SageMaker Canvas facilita el acceso y la combinación de datos de diversos orígenes, limpia automáticamente los datos y aplica diversos ajustes de datos y crea modelos de ML para generar predicciones precisas con unos pocos clics.
Hoy, Amazon SageMaker Canvas anuncia nuevas características de preparación de datos que facilitan la administración, exploración y modificación de conjuntos de datos antes de crear modelos de ML. Entre sus características clave se incluyen:
- Filtrado de filas para explorar y modificar conjuntos de datos: ahora puede previsualizar y eliminar filas con valores que faltan y valores atípicos. También puede especificar condiciones adicionales para previsualizar y eliminar filas de su conjunto de datos. Por ejemplo, para tipos de datos numéricos, puede especificar condiciones como “greater than” (mayor que), “less than” (menor que), “equal to” (igual que), “in between” (entre) y más. La lista de las condiciones compatibles varían según el tipo de datos y están documentadas aquí
- Formatos de marca temporal ampliados y transformaciones para extraer fechas y hora: ahora puede extraer información de fecha y hora de la columna de marca temporal y crear nuevas columnas. De esta manera, es más fácil preparar y transformar sus datos de serie temporal y agregar la transformación a su receta de modelo con tan solo unos clics. Además, SageMaker Canvas ahora es compatible con varios formatos de marca temporal, de modo que se facilita el trabajo con datos de series temporales para problemas de previsión. Si desea obtener una lista completa de formatos de marca temporal y de las capacidades de extracción de fecha y hora, consulte aquí
Además de la lista anterior de características de preparación y transformación de datos, ahora puede renombrar conjuntos de datos y columnas para utilizarlos con más facilidad. Otras actualizaciones para mayor facilidad de uso incluyen mensajería de cara al usuario mejorada con acciones recomendadas, y visibilidad del recuento de celdas de un conjunto de datos antes de crear un modelo de ML.
A partir de hoy, las nuevas actualizaciones de preparación de datos y facilidad de uso están disponibles en todas las regiones compatibles con Amazon SageMaker Canvas. Para obtener más información y comenzar, consulte la documentación de Amazon SageMaker Canvas y la página del producto.