发布于: Nov 12, 2021
Amazon SageMaker Autopilot 可根据您的数据自动构建、训练和调整最佳机器学习模型,同时允许您保持完全控制和可见性。作为构建模型的一部分,SageMaker Autopilot 会自动清洗、准备和预处理数据,以优化机器学习模型的性能。自即日起,Autopilot 可生成更多的一些数据洞察,因而可以帮助您提高数据质量,从而构建更高质量的模型以更好地满足您的业务需求。
现在生成的一些最重要的数据洞察包括预测能力、特征之间的相关性、目标列分布、重复行、异常行、不平衡的类分布、多类分类目标响应的基数。这些洞察会在由 Autopilot 生成的数据探索笔记本中提供,并且在训练过程开始之前就会提供给您。在可能的情况下,这些洞察还包括在尝试自动预处理和策管数据之前修复任何检测到的数据质量问题的建议。