Amazon SageMaker 数据和人工智能治理常见问题

Page topics

数据和人工智能治理

数据和人工智能治理

Open all

Amazon SageMaker 中的数据和人工智能治理是什么？

下一代 Amazon SageMaker 可简化湖仓、人工智能模型和应用程序中数据和人工智能的发现、治理和协作。借助基于 Amazon DataZone 构建的 Amazon SageMaker Catalog，用户可以使用生成式人工智能创建的元数据进行语义搜索，安全地发现和访问已获批准的数据和模型，也可以直接使用自然语言询问 Q 开发者版来查找数据。用户可以在 SageMaker Unified Studio（预览版）中集中使用具有精细访问控制的单一权限模型，以一致地定义和强制执行访问策略。通过轻松发布和订阅工作流程，无缝共享和协作处理数据和人工智能资产。借助 Amazon SageMaker，您可以使用 Amazon Bedrock 防护机制保护您的 AI 模型，并实施负责任的人工智能策略。通过数据质量监控和自动化、敏感数据检测以及数据和机器学习任务流水线，让整个组织安心无忧。

如何与 Amazon SageMaker Catalog 进行交互？

您可以通过 Amazon SageMaker Unified Studio（预览版）访问 SageMaker Catalog，前者是用于数据和人工智能开发的单一环境。为了以编程方式设置、配置或集成现有流程，SageMaker Catalog 发布了 API，并附有如何使用现有 Amazon DataZone API 的指南。

解决的主要挑战是什么？

难以跨团队查找和共享数据：数据生产者和消费者难以在整个组织内快速查找和共享相关数据集。这种低效率导致浪费时间搜索数据并限制协作。
对数据质量和人工智能模型输出缺乏信任：由于缺乏对数据来源、质量和访问模式的可见性，组织难以信任其数据质量和人工智能模型输出的准确性。
不一致的数据访问和隐私侵犯行为：组织难以执行一致的数据访问策略，从而可能导致对敏感信息的未经授权的访问。
难以遵守法规和内部政策：由于缺乏全面的审计和监控工具，组织发现难以维持监管合规性和遵守内部政策。

主要优势有哪些？

Amazon SageMaker 中的数据和人工智能治理可帮助数据团队：

更快地发现数据和进行协作：用户可以在组织内快速查找和共享相关数据，从而减少搜索信息所花费的时间，促进团队合作。
通过任务流水线和质量增强信任：跟踪数据来源，提高数据质量，增强对数据驱动型决策和人工智能模型输出的信心。
增强数据和人工智能模型的安全性：确保数据和模型只能通过项目访问，从而确保仅获授权用户才能查看项目中的资产，维护安全和隐私标准。
降低业务风险和提高监管合规性：记录活动有助于组织遵守行业法规和内部政策，从而帮助降低组织风险。

主要使用案例有哪些？

通过资产搜索和发现提高业务生产力：搜索和发现数据和人工智能资产，以增强团队能力，减少查找关键资产所花费的时间，推动更快的数据驱动型决策。
集中式数据访问策略管理：从单点定义和管理数据访问规则，从而在各种 AWS 服务和第三方环境中实现一致的应用程序。
通过业务背景和分类丰富数据：向数据集添加元数据和分类，确保用户更容易了解数据与特定业务需求的相关性和适用性。
记录用户和系统活动：监控和记录与数据和人工智能系统的交互，提供对使用模式和潜在安全问题的可见性。
人工智能/机器学习数据治理实施：将数据治理原则扩展到人工智能和机器学习流程，确保只有经过批准的数据才能用于模型训练，并确保人工智能系统遵守规定的权限和道德准则。

Amazon SageMaker Catalog 和 Amazon DataZone 之间有什么关系？

Amazon SageMaker Catalog 基于 Amazon DataZone 构建，以统一的用户体验提供相同的治理功能。Amazon DataZone 体验保持不变，以便现有 Amazon DataZone 客户在需要时继续使用熟悉的界面。

Amazon SageMaker 数据和人工智能治理的定价模式是什么？

有关定价详情，请访问：https://thinkwithwp.com/datazone/pricing/。