Amazon Bedrock 知识库现在支持 RAG 评测（预览版）

发布于: 2024年12月1日

今天，我们在 Amazon Bedrock 知识库中宣布支持 RAG 评测。通过此功能，您可以评测基于 Amazon Bedrock 知识库构建的检索增强生成 (RAG) 应用程序。您可以评测信息检索或检索加内容生成。评测由 LLM-as-a-judge 技术提供支持，有多种判断模型可供客户选择。对于检索评测，您可以从上下文相关性和覆盖范围等指标中进行选择。对于检索加生成评测，您可以从正确性、完整性和忠诚度（幻觉检测）等质量指标中进行选择，也可以选择响应式 AI 指标，例如危害性、拒绝答案和陈规定型观念。您还可以比较各个评测作业，以便将知识库与不同设置（例如分块策略或向量长度）或不同的内容生成模型进行比较。

评测 RAG 应用程序可能很困难，因为检索和生成中有许多组件需要优化。现在，通过 Amazon Bedrock 知识库的 RAG 评测工具，客户可以在数据和 LLM 已经存在的位置方便快捷地评测其知识库支持的应用程序。此外，您还可以将 Amazon Bedrock 防护机制直接纳入您的评测中，以进行更全面的测试。与完全离线人工评测相比，使用 Amazon Bedrock 上的这些 RAG 评测工具可以节省成本和数周时间，从而使您可以更快、更轻松地改进应用程序。

要了解更多信息（包括区域可用性），请阅读 AWS 新闻博客并访问 Amazon Bedrock 评测页面。要开始使用，请登录 Amazon Bedrock 控制台或使用 Amazon Bedrock API。

Amazon Bedrock 知识库现在支持 RAG 评测（预览版）

终止对 Internet Explorer 的支持