发布于: Jun 4, 2021
借助 AWS Glue Studio,您现在可在可视化作业编辑器中为流式提取、转换和加载(ETL)作业指定设置。利用该功能,您可以针对您的用例优化 AWS Glue 流式 ETL 作业。您可以针对以下事项进行选择:用于从数据流中读取数据的窗口大小;是检测每条记录的架构还是使用 AWS Glue 数据目录中的架构;微调 AWS Glue 作业从流中读取的方式的连接设置。
AWS Glue 流式 ETL 作业会持续消耗来自流源的数据,在运行中清理和转换数据,并在几秒内使数据可供分析使用。AWS Glue Studio 是 AWS Glue 中的一个可视化界面,借助它,可以轻松地创作、运行和监控流式 ETL 作业。
该新功能已在 AWS Glue Studio 可用 的 AWS 区域提供:美国东部(弗吉尼亚北部和俄亥俄)、美国西部(加利福尼亚北部、俄勒冈)、非洲(开普敦)、亚太地区(香港、孟买、大阪、首尔、新加坡、悉尼、东京)、加拿大(中部)、欧洲(法兰克福、爱尔兰、伦敦、米兰、巴黎、斯德哥尔摩)、中东(巴林)和南美洲(圣保罗)。
要了解更多信息,请访问我们关于流式 ETL 作业 和 AWS Glue Studio 的文档。