发布于: Sep 29, 2022
Amazon SageMaker Canvas 现在支持数学函数和运算符以进行更丰富的数据探索,从而允许您在数据中定义新特征。SageMaker Canvas 是一个可视化的点击式服务,可帮助业务分析师自行生成准确的 ML 预测,而不需要任何机器学习经验,也无需编写任何代码。
SageMaker Canvas 支持多种数据转换来筛选、联接和修改数据集,并支持高级可视化以了解数据中变量之间的关系。即日起,您可以将数学函数和逻辑运算符与这些数据转换结合使用,以便在构建 ML 模型之前更好地了解数据的分布。这些函数和运算符的结果允许您创建可以针对特定属性可视化的新特征。支持的数学函数包括加法、减法、乘法、除法、平均值、标准偏差、差异、指数和对数。此外,SageMaker Canvas 还支持 if-then-else 语句等逻辑运算符,用于定义特定条件,并为您更好地理解、分发和探索数据提供灵活性。
借助这项新功能,SageMaker Canvas 实现了划分,这是一种数据预处理技术。划分是一种将相关数值或类别值分组到称为箱的较小数量集合中的方法。例如,如果有一个跟踪家具物品的数据集,则可以将它们分组到不同的箱中,例如办公室家具、客厅家具或卧室家具。划分有助于识别异常值、无效值,并减少数据集的非线性,从而提高 ML 模型的准确性。