Amazon Bedrock 现在支持 Rerank API 以提高 RAG 应用程序的准确性

发布于: 2024年12月1日

Amazon Bedrock 宣布通过 Rerank API 支持重排器模型,使开发人员能够提高检索增强生成 (RAG) 应用程序中响应的相关性。重排器模型根据一组检索到的文档与用户查询的相关性对文档进行排名,这有助于确定最相关内容的优先顺序,以传递给基础模型 (FM) 来生成响应。Amazon Bedrock 知识库提供完全托管式端到端 RAG 工作流程,通过整合来自各种数据来源的上下文信息来创建自定义生成式 AI 应用程序。对于 Amazon Bedrock 知识库用户,可通过 Retrieve RetrieveAndGenerate API 中提供的设置来启用重排器。

RAG 系统中的语义搜索可以提高文档检索的相关性,但可能难以应对复杂或模糊的查询。例如,当客户服务聊天机器人被问及在线购物的退货问题时,可能会检索有关退货政策和配送指南的文档。如果没有适当的排名,生成的响应可能会侧重于配送而不是退货,从而忽略了用户的意图。现在,Amazon Bedrock 提供了对重新排序模型的访问权限,该模型将根据检索到的文档与用户查询的相关性对文档进行重新排序,从而解决这个问题。这样可以确保将最有用的信息发送到基础模型以生成响应,从而优化上下文窗口的使用并降低成本。

Rerank API 支持 Amazon Rerank 1.0 和 Cohere Rerank 3.5 模型。这些模型现已在以下区域推出:美国西部(俄勒冈州)、加拿大(中部)、欧洲地区(法兰克福)和亚太地区(东京)。

请访问 Amazon Bedrock 产品文档。有关定价的详细信息,请参阅定价页面