AWS Glue 额外增加了 13 个新变换,包括标记重复项
发布于:
2024年6月19日
AWS Glue 现在提供 13 种新的内置转换:标记列中的重复项、设置电话号码格式、设置大小写格式、填充模式、标记重复行、删除重复项、月份名称、是偶数、加密哈希、解密、加密、int 到 IP 以及 IP 到 int。AWS Glue 是一项无服务器数据集成服务,它可以让分析用户更轻松地发现、准备、移动和集成来自多个来源的数据。借助这些新的转换,ETL 开发人员无需为这些常见的转换任务编写自定义代码,即可快速构建更复杂的数据管道。
这些新转换中的每一个都满足了独特的数据处理需求。例如,使用“移除重复项”、“标记列中的重复项”或“标记重复行”可突出显示或移除数据集中的重复行,使用“加密哈希”可将算法应用于列中的哈希值,使用“加密转换”可加密源列中的值,使用“解密转换”可对这些列进行解密。新的转换可用于基于代码的作业。
这些新的转换现已在所有提供 AWS Glue 4.0 的 AWS 区域推出。请访问 AWS 区域服务列表,了解最新的可用性信息
要了解更多信息,请访问 AWS Glue 文档。