Publié le: Dec 4, 2023
Amazon SageMaker Canvas prend désormais en charge des fonctionnalités complètes de préparation des données optimisées par Amazon SageMaker Data Wrangler. Vous pouvez désormais importer des données tabulaires, chronologiques, images et textes à partir de plus de 50 sources de données, générer des rapports Data Quality and Insights, et transformer des données à l'aide de plus de 300 opérateurs intégrés pour créer et utiliser des modèles de machine learning (ML), le tout sans écrire de code. Grâce à cette intégration, vous pouvez faire passer la préparation des données pour le ML de quelques semaines à quelques minutes, grâce à SageMaker Canvas.
L'agrégation, l'analyse et la transformation de grandes quantités de données sont essentielles, mais constituent souvent la partie la plus chronophage du flux de travail du machine learning. Les clients peuvent désormais analyser et visualiser rapidement les données afin d'identifier les problèmes liés aux données susceptibles d'avoir un impact sur la qualité du modèle à l'aide du rapport Data Quality and Insights, nettoyer les données et créer des fonctionnalités pour le ML à l'aide de plus de 300 transformations soutenues par Spark. Il est désormais possible de créer un flux visuel de préparation des données dans SageMaker Canvas et importer des données depuis Amazon S3, Amazon Athena, Amazon Redshift, Salesforce Data Cloud, Snowflake et plus de 50 sources de données. Une fois les données préparées, les clients peuvent adapter les étapes de préparation des données pour les exécuter sur des tâches de traitement Spark distribuées, exporter le jeu de données pour former des modèles ou prévoir les résultats à l'aide de modèles de machine learning et de modèles de fondation prêts à l'emploi. Ils peuvent également exporter leur flux de données en tant qu'étape d'un pipeline SageMaker pour concevoir des fonctionnalités, former des modèles ou transformer des données en temps quasi réel à des fins d'inférence dans SageMaker Studio.
Les nouvelles fonctionnalités de préparation des données sont disponibles dans toutes les régions AWS où SageMaker Canvas est pris en charge. Pour en savoir plus, consultez la le blog et la documentation technique AWS.