Publié le: Nov 12, 2021
Amazon SageMaker Autopilot crée, entraîne et ajuste automatiquement les meilleurs modèles de machine learning en fonction de vos données, tout en vous permettant de conserver un contrôle et une visibilité complets. Dans le cadre de la création de modèles, SageMaker Autopilot nettoie, prépare et prétraite automatiquement les données, afin d'optimiser les performances des modèles de machine learning. À partir d'aujourd'hui, Autopilot génère plusieurs informations supplémentaires sur les données qui peuvent vous aider à améliorer la qualité des données et créer ainsi des modèles de meilleure qualité qui répondent mieux aux besoins de votre entreprise.
La puissance de prédiction, la corrélation entre les caractéristiques, la distribution des colonnes cibles, les lignes dupliquées, les lignes anormales, la distribution déséquilibrée des classes, la cardinalité pour la réponse cible de la classification multi-classes figurent parmi les informations les plus importantes désormais générées. Ces informations sont présentées dans le bloc-notes d'exploration des données généré par Autopilot et sont disponibles dès le début du processus d'entraînement. Dans la mesure du possible, ces indicateurs comprennent également des recommandations pour résoudre les problèmes de qualité des données détectés avant de tenter de prétraiter et de gérer automatiquement les données.
Les informations sur les données et les recommandations sont désormais générés dans toutes les régions AWS où SageMaker Autopilot est actuellement pris en charge. Pour en savoir plus, consultez Informations sur les données. Pour démarrer avec SageMaker Autopilot, consultez Démarrer ou accédez à Autopilot dans SageMaker Studio.