简化以数据为中心的多模态工作流程中的数据提取和流程自动化,包括智能文档处理(IDP)
本指南展示了 Amazon Bedrock 数据自动化如何通过统一的多模态推理 API,简化从文档、图像、音频和视频等非结构化多模态内容中生成有价值的洞察。Amazon Bedrock 数据自动化可帮助开发人员,快速且经济高效地构建生成式人工智能应用程序,或自动执行以数据为中心的多模态工作流程,例如 IDP、媒体分析或检索增强生成(RAG)。通过遵循本指南,您可以简化复杂的任务,例如文档拆分、分类、数据提取、输出格式标准化和数据验证,从而显著增强处理的可扩展性。
请注意:[免责声明]
架构图

-
智能文档处理
-
医疗索赔处理
-
智能文档处理
-
此架构图显示了如何使用金融服务公司的贷款发放处理示例进行文档分类和提取。
第 1 步
数据科学团队将示例文档上传到 Amazon Simple Storage Service(Amazon S3)存储桶。第 2 步
数据科学团队使用提供的蓝图为每个文档类别创建新的自定义蓝图:W2、工资单、驾驶执照、1099 和银行对账单。每个样本都经过处理,生成式人工智能会提示提取字段(例如名字和姓氏、总工资、资本收益和期末余额)。
第 3 步
蓝图已经过测试,而且进行了完善。添加了密钥标准化、转换和验证。
第 4 步
蓝图在 Amazon Bedrock 数据自动化功能中管理和存储。
第 5 步
使用“对象创建”事件,当文档上传到 Amazon S3 时,Amazon EventBridge 会触发 AWS Lambda 函数。然后,此 Lambda 函数使用 Amazon Bedrock 数据自动化功能来处理上传的文档。第 6 步
Amazon Bedrock 数据自动化功能中的处理工作流程包括基于逻辑边界的文档拆分,每个拆分最多包含 20 个页面。每个页面都分为特定的文档类型,并与相应的蓝图相匹配。
第 6 步(续)
然后为每个页面调用相应的蓝图,执行密钥标准化、转换和验证。整个过程异步运行,可以高效处理多个文档和大量数据。
第 7 步
Amazon Bedrock 数据自动化将结果存储在 Amazon S3 存储桶中以供日后处理并触发 EventBridge。
第 8 步
EventBridge 触发 Lambda 函数来处理 Amazon Bedrock 数据自动化的 JSON 结果。处理结果被发送到下游处理系统。
-
医疗索赔处理
-
该架构图显示了如何使用多模态输入数据和处理实现医疗索赔处理的自动化,进而提高效率和准确性。
第 1 步
提供商向 Amazon S3 提交索赔文档、图像和视频。
第 2 步
工作流程在 Amazon Bedrock 数据自动化中触发。
第 3 步
开发人员在 Amazon Bedrock 数据自动化中创建蓝图,进而提取相关数据。
第 4 步
Amazon Bedrock 数据自动化通过提取文本、表格、对象、笔录来处理文档、图像和视频;规范数据结构;标记低置信度项目以供审查。Amazon Bedrock 数据自动化将数据存储在 Amazon S3 中并触发 EventBridge。
第 5 步
EventBridge 会触发 Lambda,该函数从 S3 存储桶中检索 Amazon Bedrock 数据自动化输出。
第 6 步
Amazon Bedrock 代理使用 Lambda 函数从 Amazon Aurora 获取患者的保险计划详细信息。第 7 步
然后,Amazon Bedrock 代理在 Aurora 中更新索赔数据库。
第 8 步
裁定人验证重要领域,重点关注低置信度项目。
第 9 步
承保范围说明(EoC)文档、图像和视频存储在 Amazon S3 中。Amazon Bedrock 数据自动化使用单个 API 处理多模态数据并将其存储在 Amazon S3 中。然后对其进行处理、嵌入并存储在 Amazon Bedrock 知识库的向量集合中。第 10 步
Amazon Bedrock 代理使用提取的数据和索引信息来计算资格。
第 11 步
Amazon Bedrock 代理更新索赔数据库并通知裁定人。裁定人可以有效地审查、批准或调整索赔。
Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
-
卓越运营
Amazon S3、EventBridge 和 Lambda 通过安全存储为各种文档类型创建了无缝的自动化工作流程,用于文档处理和数据提取。 Amazon Bedrock 数据自动化简化了数据的提取和标准化,减少了手动工作并提高了准确性。 Amazon Bedrock 知识库对处理过的信息进行索引,使其易于搜索和访问,而 Amazon Bedrock 代理则利用这些结构化数据来做出明智的决策并有效地提出索赔。 Aurora 是一个强大的数据库,用于存储和检索关键信息。这些服务共同实现了高效、可扩展和可靠的系统,最大限度地减少了人为干预并最大限度地提高了生产力。
-
安全性
Amazon S3 提供加密存储,Lambda 在隔离的环境中执行代码,Amazon Bedrock 利用安全的 AWS 基础设施以及内置的加密和访问控制。Aurora 提供高级数据库安全功能。这些服务创建了一种全面的安全方法,可在数据的整个生命周期中保护数据,同时保持严格的访问控制并保留审计跟踪记录。借助集中管理安全策略以及利用持续的 AWS 安全更新和改进的能力,您能够保持强大的安全态势,同时专注于核心业务运营。
-
可靠性
Amazon S3 为文档提供耐用且高度可用的存储。EventBridge 通过可靠地触发 Lambda 函数来帮助确保一致的事件驱动处理,这些函数可以无缝扩展,无需停机即可处理各种工作负载。Aurora 是一个高度可用的数据库,提供自动备份和失效转移功能。这些服务提供了一个强大的容错系统,可以承受组件故障,自动扩展,并在高负载下保持稳定的性能,从而最大限度地减少停机时间和数据丢失风险。
-
性能效率
AWS 服务通过可扩展的高性能文档处理解决方案提高性能效率。Amazon S3 提供对存储文档的低延迟访问,而 EventBridge 支持实时事件处理。Lambda 提供快速的按需计算能力。Lambda 和 EventBridge 的无服务器性质消除了与服务器预置相关的瓶颈。此外,Amazon Bedrock 利用人工智能模型来高效处理复杂的数据分析任务。
-
成本优化
AWS 服务通过即用即付模式(即您只为使用的资源付费)和取消前期基础设施投资来促进成本优化。Amazon S3 提供分层存储选项,平衡性能和成本。EventBridge 和 Lambda 的无服务器性质意味着只需为实际使用的计算时间付费。Amazon Bedrock 无需昂贵的内部基础设施或专业知识即可提供人工智能功能,而 Aurora 的性能可与商业数据库相媲美,而成本只是商业数据库的一小部分。
-
可持续性
AWS 服务通过优化资源利用率和能源效率来促进可持续发展。Amazon S3 使用高效的存储技术,而 EventBridge 和 Lambda 则提供可最大限度减少空闲容量的无服务器架构。这些基于云的服务显著减少了本地基础设施,降低了能耗和碳排放。这些服务的可扩展性可确保最佳的资源使用,避免过度预置和浪费。
免责声明
示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。
本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指南是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。