发布于: May 6, 2022
Amazon SageMaker Data Wrangler 可将 Amazon SageMaker Studio 中的机器学习(ML)所需数据的聚合和准备时间从数周减少至几分钟。Amazon SageMaker Studio 是首个适用于 ML 的完全集成式开发环境(IDE)。借助 SageMaker Data Wrangler,您可以简化数据准备和特征工程的过程,并从单个直观的界面完成数据准备工作流程的每个步骤,包括数据选择、清洗、探索和可视化等。SageMaker Data Wrangler 原定设置以 ml.m5.4xlarge 规模运行。SageMaker Data Wrangler 包括以 PySpark 编写的内置数据转换和分析,能够在原定设置实例上高效处理高达数百 GB 的大型数据集。