[SEO 副标题]
本指南演示了如何通过结合 Amazon Kendra 和 Amazon Bedrock(提供高性能基础模型的全面托管服务)的大型语言模型(LLM),为您的环境、社会和治理(ESG)或可持续性知识库使用检索增强生成(RAG)服务。
RAG 流程可快速给出见解,对企业报告、监管文件和行业标准等各种 ESG 信息来源进行高效浏览和汇总。它可以让您快速分析大量文本数据,提取关键见解,并得出明智的结论,以支持组织的 ESG 报告需求。
请注意:[免责声明]
架构图
[架构图描述]
第 1 步
用户通过各种前端集成选项提出问题并获得生成的回复。例如,用于对话聊天机器人的 Amazon Lex,用于自定义前端 Web 应用程序的 AWS Amplify,以及用于借助后端服务处理用户请求的 Amazon API Gateway。
第 2 步
AWS Lambda 充当后端响应编排工具。
第 3 步
Lambda 将所有输入的问题和生成的回复作为对话存储内容存储到 Amazon DynamoDB 中,以方便未来的用户请求。
第 4 步
Amazon Kendra 对您的可持续性知识库进行语义搜索。这包括与可持续性框架相关的对象,例如欧盟企业可持续发展报告指令(CSRD)和国际可持续发展标准委员会(ISSB),以及企业报告(如 CDP 调查问卷和 10-K 表)。
知识库可以存储在 Amazon Simple Storage Service(Amazon S3)或第三方存储库(例如 Dropbox 和 Confluence)中。另外,还可以使用 Amazon Kendra Web Crawler 通过 HTTPS 访问公共或内部网站。
第 5 步
Lambda 函数使用 Amazon Kendra Retrieve API 识别和提取相关段落,其针对检索增强生成(RAG)进行了优化。在查询 API 中指定文档元数据筛选器以帮助缩小结果范围(仅包括与用户问题相关的文档)。
第 6 步
用户的问题和相关上下文由 Lambda 函数传递给托管在 Amazon Bedrock(提供多种高性能基础模型(FM)选择的完全托管服务)上的大型语言模型(LLM)。诸如 Anthropic 的 Claude 或 Meta Llama 等 LLM 可以对可持续性知识库中的大量文本进行比较、分析和总结。
第 7 步
Amazon Bedrock 上的 LLM 生成的回复将返回给 Lambda 函数,该函数会更新 DynamoDB 中的对话存储内容,并通过您实施的前端集成将回复反馈给用户。
Well-Architected 支柱
当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
-
卓越运营
Amazon Bedrock 和 Lambda 提供无服务器计算能力,有助于消除虚拟机成像、操作系统升级和补丁修补等问题。 Amazon Kendra 提供了经过优化的 Retriever API(配有语义排名程序),专为搭配 Amazon Bedrock 的 RAG 量身定制。
这些服务共同实现了诸如 LLM 部署、代码执行、扩展和失效转移等关键环节的自动化。通过减少在操作过程中的人为干预以及加快响应速度,这些服务有助于最大限度地降低出错的可能性,并帮助实现一致、高效的操作。这使您能够利用生成式人工智能(AI)的强大功能,同时保持精简、低维护量的架构。
-
安全性
AWS Identity and Access Management(IAM)与 Lambda 集成,实现了无需在应用程序代码中存储长期凭证,即可跨 Amazon Kendra 和 Amazon Bedrock 等服务进行身份验证。
基于 IAM 身份的策略还能对 Amazon Kendra 资源的访问进行精细控制,例如禁止特定用户查询某些索引。IAM 执行最低权限原则,对所有相关服务的访问和允许的操作进行管理。这种强大的策略驱动型安全模型有助于确保本指南能够助您维持严格的访问控制。
-
可靠性
Amazon Bedrock、Lambda、Amazon Kendra 和 DynamoDB 是完全托管的无服务器产品,默认情况下跨多个可用区部署,无需手动配置即可提供固有冗余和容错能力。
通过避免长时间运行的计算或需要维护的数据库,可以减少潜在的故障点。由 AWS 全球基础设施支持的高可用性、高可靠的解决方案将为您助力。
-
性能效率
Amazon Bedrock 是一项完全托管的生成式人工智能服务,提供了一系列可通过统一 API 访问的基础模型。通过这一单个集成点,可以在不同提供商之间快速进行试验,并无缝采用最新的模型版本;而这些都只需修改最少量的代码即可实现。
使用多模型 API 可提供灵活性和可扩展性。您可以为每项任务高效利用合适的资源,并随着需求的变化进行无缝调整。
-
成本优化
Lambda、Amazon Bedrock 和 Amazon Kendra 是完全托管的服务,可根据需求自动扩展。这些服务还可以采用即用即付定价模式,确保您只需为正在处理请求的资源付费。例如,Amazon Bedrock 提供按需和批处理模式,可不受时长限制使用 FM。
此外,这些服务还能最大限度地减少基础设施管理和维护任务,降低相关成本,从而减轻 DevOps 团队的运营工作。通过最大限度地减少闲置资源的使用、采用高效的定价模型、降低维护开销和优化数据处理,Lambda、Amazon Bedrock 和 Amazon Kendra 可以降低运营成本,同时保持所需的性能水平。
-
可持续性
通过使用本指南中提供的托管服务,保持高利用率和优化的责任就转移给了 AWS。AWS 正在努力实现在 2025 年之前达到 100% 使用可再生能源供电的目标,并承诺到 2040 年实现碳净零排放。
此外,使用 Amazon Kendra 和 Amazon Bedrock 的 RAG 方法可从预定义数据集中检索和整合相关外部信息,从而有效增强 LLM 功能。这一策略旨在最大限度地减少使用新数据训练模型或从一开始就构建新模型所需的资源。
相关内容
免责声明
示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。
本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。