跳至主要内容

Amazon SageMaker Catalog

Amazon SageMaker Catalog

安全地发现、治理和协作处理数据和人工智能

概览

Amazon SageMaker Catalog 简化了结构化和非结构化数据、人工智能模型、商业智能控制面板和应用程序中数据和人工智能的发现、治理和协作流程。您可以使用生成式人工智能创建的元数据进行语义搜索,安全地发现和访问已获批准的数据和模型,也可以直接使用自然语言询问 Amazon Q 开发者版来查找数据。用户可以在 Amazon SageMaker 融通式合作开发工作室中集中使用具有精细访问控制的单一权限模型,以一致地定义和强制执行访问策略。通过轻松发布和订阅工作流程,无缝共享和协作处理数据和人工智能资产。通过数据质量监控、数据分类以及数据和人工智能资产的端到端自动化列级沿袭,让整个组织安心无忧。

优势

使用基于 Amazon Datazone 构建的 SageMaker Catalog,大规模发现您的数据和人工智能资产。使用生成式人工智能增强数据发现,以便通过业务背景来自动丰富您的数据和元数据,让所有用户都能更轻松地查找、理解和使用数据。通过按表和列名称或业务术语表术语进行筛选,共享数据、人工智能模型、提示和生成式人工智能资产。自动为每个数据集推荐有价值的列和相关的分析应用程序,确保能够使用正确的数据快速构建正确的模型。通过项目在单项体验中发布和订阅工作流程,使用无缝数据和人工智能共享,支持集中式和分散式治理模型。

通过实时查看 SageMaker 中的数据质量和数据,以及机器学习任务流水线,安心无忧。自动进行数据分析和数据质量建议,监控数据质量规则,并接收警报。使用基于规则和机器学习的方法协调实体,解决难以发现的数据质量挑战,以便您可以交付高质量的数据,从而做出自信的业务决策。使用内置的模型监控,以检测偏差或报告功能如何影响模型预测,从而提高数据管道和人工智能项目的透明度。

使用精细访问控制、数据分类和护栏,确保正确使用数据、分析和人工智能模型,从而在 SageMaker 中集中管理数据和人工智能安全。只需定义一次权限,即可在数据和模型中强制执行权限。通过原生集成的 Amazon Bedrock,客户可以在生成式人工智能应用程序中利用 Amazon Bedrock 护栏,屏蔽有害内容、过滤幻觉以及启用可自定义的隐私、安全和准确性保护措施。使用 Amazon Comprehend 自动识别管道中的敏感信息。

通过数据使用与模型日志记录和监控,满足审计和监管合规要求。通过基于项目的隔离,支持在整个企业中合理使用分析和人工智能资产。了解整个湖仓的数据和模型使用情况,以增强安全性。使用 Amazon SageMaker Clarify 监控模型的偏差、准确性和稳健性,使之符合负责任的人工智能标准。将成本与业务计划保持一致,并提供清晰的业务投资视图。

功能

数据和人工智能目录

通过单一目录,对结构化数据、非结构化数据、人工智能模型、商业智能控制面板以及应用程序进行发现、治理与协作。 

Missing alt text value

商业词汇表

使用共享的业务定义和可自定义的元数据表单对术语进行标准化。支持限制性分类术语,以实施对敏感数据进行一致的标记,并支持下游的治理工作流。

Missing alt text value

数据血统

跟踪数据在不同系统之间的移动和变化情况。与 OpenLineage 兼容的沿袭有助于用户了解数据的来源、转换过程以及使用模式,从而增强信任度、便于调试以及实现治理。

Missing alt text value

数据质量监控

查看来自 AWS 和第三方工具的数据质量指标。使用者在搜索过程中能够获得信任感和相关背景信息,而数据团队则可以通过 API 将外部质量指标整合到一个统一的门户中。

Missing alt text value

数据发现

通过业务背景信息来丰富技术元数据,以便用户能够快速找到、理解并信任他们所使用的数据。

Missing alt text value

自动推荐元数据

利用 LLM 驱动的自动化技术来生成有利于业务发展的名称和描述,从而提升技术资产的上下文、一致性和清晰度。

Missing alt text value

语义搜索

使用自然语言查询查找数据和模型。语义搜索能够理解用户的意图、上下文以及各种关联关系(而不仅仅是关键词),从而返回更相关的结果。

Missing alt text value

商业智能控制面板

通过将数据整合到 SageMaker 中,并利用 Amazon Quick Suite 功能(如交互式控制面板、像素级精确报告和生成式商业智能(BI)),从而从数据中获取洞察。这一切都是在受控且自动化的模式下进行的。 

Missing alt text value

数据产品

使用共享元数据将相关资产打包为以业务为导向的数据产品。提升发现效率,统一访问请求,降低管理开销,同时使治理团队能够跟踪产品层面的使用情况。

Missing alt text value

客户

Natera, Inc.

“通过将 Amazon QuickSight 与 Amazon SageMaker 集成,我们的实验室运营团队和科学家们现在可以实时监控所有站点的临床测试表现。我们开发了统一的控制面板,汇总显示吞吐量、质量控制指标和周转时间,从而实现详细的趋势分析和持续的性能优化。科学家们现在可以在单一的集成环境中进行全面的数据分析,从探索性审查到模型开发均可。”

Natera, Inc 软件工程副总裁 Mirko Buholzer

Natera 如何使用 Amazon SageMaker 目录扩展基因组学

Cisco

“您想要发现、共享和管理您的数据。无论您将其称为数据网格还是数据编织架构,数据都分散在彼此孤立的多个部门中,而您需要想个办法将其整合起来。Amazon SageMaker Catalog 会在数据生产者与使用者之间建立连接,使生产者能够通过内置控件和数据合同共享数据,同时允许使用者使用其选择的工具访问数据”

Cisco 人工智能/机器学习高级总监Shaja Arul Selvamani

The Cisco logo featuring the company's name in blue with a stylized bridge design above it.

NatWest

“我们的数据平台工程团队一直在为数据工程、机器学习、SQL 和生成式人工智能任务部署多种终端用户工具。我们希望简化整个银行的流程,因此一直在考虑简化用户身份验证和数据访问授权。Amazon SageMaker 可提供现成的用户体验,帮助我们在整个组织内部署单一环境,将数据用户访问新工具所需的时间减少约 50%。”

Zachery Anderson,NatWest Group 首席数据和分析官

Missing alt text value

找到今天要查找的内容了吗?

请提供您的意见,以便我们改进网页内容的质量。