Amazon SageMaker Catalog 推出了 S3 表类数据存储服务治理功能

发布于: 2025年5月15日

Amazon SageMaker Catalog 与 Amazon S3 表类数据存储服务集成,使用户可以轻松发现、共享和治理 S3 表类数据存储服务,以及使用与 Apache Iceberg 兼容的所有工具和引擎访问和查询数据。借助基于 Amazon DataZone 构建的 Amazon SageMaker Catalog,用户可以使用生成式 AI 创建的元数据进行语义搜索,安全地发现和访问已获批准的数据和模型,也可以直接使用自然语言询问 Amazon Q 开发者版来查找数据。

S3 表类数据存储服务提供了首款内置 Apache Iceberg 支持的云对象存储。数据发布者可以将 S3 表类数据存储服务加入 SageMaker Lakehouse,并通过将其添加到 SageMaker Catalog 来增强其可发现性。发布者可以灵活选择是直接发布表类数据存储服务,还是使用重要的业务元数据对其进行扩充,从而使所有用户更容易理解和找到所需的数据。在使用方面,用户可以搜索相关表,通过订阅工作流程(需经发布者批准)请求访问权限,并将这些数据用于高级分析和 AI 开发项目。这种端到端工作流程显著改善了整个组织中 S3 表类数据存储服务的数据可访问性、治理和利用率。

支持 S3 表类数据存储服务的 SageMaker Catalog 现已在提供 Amazon SageMaker 的所有 AWS 区域推出。

要了解更多信息,请访问 Amazon SageMaker。开始使用 S3 表类数据存储服务并使用用户文档进行发布。