Amazon DataZone 在预览版中引入由 API 驱动、与 OpenLineage 兼容的数据沿袭可视化功能

发布于: 2024年6月27日

Amazon DataZone 在预览版中引入了数据沿袭功能,帮助客户可视化来自支持 OpenLineage 的系统或通过 API 的沿袭事件,并跟踪数据从来源到消费的移动过程。Amazon DataZone 是一项数据管理服务,客户可以通过治理和访问控制跨组织边界大规模编目、发现、共享和治理数据。

Amazon DataZone 的数据沿袭功能可以捕获并可视化数据资产和列的转换,提供数据从来源到消费的移动过程视图。使用 Amazon DataZone 与 OpenLineage 兼容的 API,域管理员和数据生产者可以捕获和存储超出 Amazon DataZone 可用范围的沿袭事件,包括 Amazon S3、AWS Glue 和其他服务中的转换。Amazon DataZone 中的数据消费者可以从资产沿袭的全面视图中获得对资产来源的信心,而数据生产者则可以通过了解资产的消费来评估资产变更的影响。此外,Amazon DataZone 还会对每个事件的沿袭进行版本编排,使用户能够随时对沿袭进行可视化,或者跨资产或任务的历史记录对比转换。这种历史沿袭让用户能更深入地了解数据是如何演变的,对于故障排除、审计和验证数据资产的完整性至关重要。

Amazon DataZone 数据沿袭在所有推出 Amazon DataZone 的 AWS 区域提供预览版本。

要了解更多信息,请访问 Amazon DataZone,阅读 AWS 新闻博客,并开始使用数据沿袭文档