- 分析›
- Amazon SageMaker›
- Amazon SageMaker Catalog
Amazon SageMaker Catalog
安全地发现、治理和协作处理数据和人工智能
概览
Amazon SageMaker Catalog 简化了结构化和非结构化数据、人工智能模型、商业智能控制面板和应用程序中数据和人工智能的发现、治理和协作流程。您可以使用生成式人工智能创建的元数据进行语义搜索,安全地发现和访问已获批准的数据和模型,也可以直接使用自然语言询问 Amazon Q 开发者版来查找数据。用户可以在 Amazon SageMaker 融通式合作开发工作室中集中使用具有精细访问控制的单一权限模型,以一致地定义和强制执行访问策略。通过轻松发布和订阅工作流程,无缝共享和协作处理数据和人工智能资产。通过数据质量监控、数据分类以及数据和人工智能资产的端到端自动化列级沿袭,让整个组织安心无忧。
优势
使用基于 Amazon Datazone 构建的 SageMaker Catalog,大规模发现您的数据和人工智能资产。使用生成式人工智能增强数据发现,以便通过业务背景来自动丰富您的数据和元数据,让所有用户都能更轻松地查找、理解和使用数据。通过按表和列名称或业务术语表术语进行筛选,共享数据、人工智能模型、提示和生成式人工智能资产。自动为每个数据集推荐有价值的列和相关的分析应用程序,确保能够使用正确的数据快速构建正确的模型。通过项目在单项体验中发布和订阅工作流程,使用无缝数据和人工智能共享,支持集中式和分散式治理模型。
功能
数据和人工智能目录
通过单一目录,对结构化数据、非结构化数据、人工智能模型、商业智能控制面板以及应用程序进行发现、治理与协作。
商业词汇表
使用共享的业务定义和可自定义的元数据表单对术语进行标准化。支持限制性分类术语,以实施对敏感数据进行一致的标记,并支持下游的治理工作流。
数据血统
跟踪数据在不同系统之间的移动和变化情况。与 OpenLineage 兼容的沿袭有助于用户了解数据的来源、转换过程以及使用模式,从而增强信任度、便于调试以及实现治理。
数据质量监控
查看来自 AWS 和第三方工具的数据质量指标。使用者在搜索过程中能够获得信任感和相关背景信息,而数据团队则可以通过 API 将外部质量指标整合到一个统一的门户中。
数据发现
通过业务背景信息来丰富技术元数据,以便用户能够快速找到、理解并信任他们所使用的数据。
自动推荐元数据
利用 LLM 驱动的自动化技术来生成有利于业务发展的名称和描述,从而提升技术资产的上下文、一致性和清晰度。
语义搜索
使用自然语言查询查找数据和模型。语义搜索能够理解用户的意图、上下文以及各种关联关系(而不仅仅是关键词),从而返回更相关的结果。
商业智能控制面板
通过将数据整合到 SageMaker 中,并利用 Amazon Quick Suite 功能(如交互式控制面板、像素级精确报告和生成式商业智能(BI)),从而从数据中获取洞察。这一切都是在受控且自动化的模式下进行的。
数据产品
使用共享元数据将相关资产打包为以业务为导向的数据产品。提升发现效率,统一访问请求,降低管理开销,同时使治理团队能够跟踪产品层面的使用情况。
客户
Natera, Inc.
“通过将 Amazon QuickSight 与 Amazon SageMaker 集成,我们的实验室运营团队和科学家们现在可以实时监控所有站点的临床测试表现。我们开发了统一的控制面板,汇总显示吞吐量、质量控制指标和周转时间,从而实现详细的趋势分析和持续的性能优化。科学家们现在可以在单一的集成环境中进行全面的数据分析,从探索性审查到模型开发均可。”
Natera, Inc 软件工程副总裁 Mirko Buholzer
Cisco
“您想要发现、共享和管理您的数据。无论您将其称为数据网格还是数据编织架构,数据都分散在彼此孤立的多个部门中,而您需要想个办法将其整合起来。Amazon SageMaker Catalog 会在数据生产者与使用者之间建立连接,使生产者能够通过内置控件和数据合同共享数据,同时允许使用者使用其选择的工具访问数据”
Cisco 人工智能/机器学习高级总监Shaja Arul Selvamani
NatWest
“我们的数据平台工程团队一直在为数据工程、机器学习、SQL 和生成式人工智能任务部署多种终端用户工具。我们希望简化整个银行的流程,因此一直在考虑简化用户身份验证和数据访问授权。Amazon SageMaker 可提供现成的用户体验,帮助我们在整个组织内部署单一环境,将数据用户访问新工具所需的时间减少约 50%。”
Zachery Anderson,NatWest Group 首席数据和分析官
开始使用 Amazon SageMaker Catalog
找到今天要查找的内容了吗?
请提供您的意见,以便我们改进网页内容的质量。