亚马逊AWS官方博客
Category: Artificial Intelligence
企业智能之旅(5):人工智能基础模型的选择与评估
在数字经济时代,大数据和人工智能一体的数智技术成为企业转型和创新的战略制高点,数据、算力、算法的发展驱动了生成 […]
化繁为简:一键部署多模型网关,助力 Role-play 最佳实践
基于开源 LiteLLM 项目 CloudFormation 一键部署大模型流量调度网关,兼容 OpenAI,支持多模型、多区域、多账号调度和路由策略配置,Virtual Key 生成和使用追踪。
如何基于 Amazon Bedrock 构建电商评论分析(VOC)系统?
随着电商平台的快速发展,客户反馈(VOC)分析需求日益增加,传统数据分析方法难以高效处理海量非结构化数据。生成式人工智能技术能够自动理解和生成自然语言,高效处理海量非结构化文本,根据客户反馈生成智能洞察和个性化建议,大大提高了分析效率和洞察深度,为企业提供更精准的决策支持。这篇文章探讨了基于 Amazon Bedrock 实现 VOC 系统的业务价值、方案架构介绍和核心技术的实现与效果,以及利用该架构的生产优化建议。
结合 HSDP 及模型并行加速 Llama3 训练
本文分析模型并行库 SMPv2,其结合了PyTorch HSDP 和 Nvidia Transformer Engine,实现了基于张量并行的大型模型训练。SMPv2 在 SageMaker 体系上简化了繁琐的训练初始化配置,并支持与 PyTorch FSDP 的无缝集成,极大降低了开发复杂性。通过配置层次化分片、张量并行度等参数,SMPv2 可以在 Amazon P5 等高性能实例上实现高效的集群扩展性能,同时有效降低显存消耗,支持高效的大型基础模型训练。
借助开源大模型微调打造行业定制化专业翻译
在全球化的商业环境中,高质量的专业翻译对于企业出海和行业交流至关重要。然而,专业领域的翻译往往面临着术语精确性、行业特定风格表达和文化适应性等多重挑战。 本文将探讨如何利用开源大语言模型的微调技术来解决这些挑战。通过针对性的微调训练,我们可以显著提升模型在特定行业翻译任务中的表现。
完全基于 AWS 的视频内容搜索引擎 VideoSearch
随着企业数字化转型的加速,越来越多的企业上线了新的财务、供应链和销售管理系统。为了确保全球员工能够熟练掌握并高效使用这些新系统,企业通常会组织全面的线上培训。然而,随着培训规模的扩大和员工数量的增加,企业面临着诸多挑战。特别是在全球范围内,培训经理无法做到 24 小时不间断地为员工提供支持,导致问题解决的速度慢,影响了员工的学习效率。在这种背景下,企业迫切需要一种能够高效支持全球员工系统使用问题的解决方案,帮助他们快速定位并解决问题,同时评估培训效果,确保培训的有效性。
基于 Amazon SageMaker 和 LLaMA-Factory 打造一站式无代码模型微调部署平台 Model Hub
在当今人工智能技术迅猛发展的背景下,大型语言模型(Large Language Models, LLMs)已成为推动各类应用创新的重要驱动力。随着模型的复杂性和应用场景的多样化,如何高效地进行模型微调和部署,成为了开发者和研究人员面临的关键挑战。为此,结合 Amazon SageMaker 与 LLaMA-Factory 构建的一站式无代码模型微调部署平台应运而生。
在 screenshot-to-code 项目中应用 Amazon Bedrock:截图生成代码
将设计原型转化为可用前端代码的是软件开发中常见的需求,这种需求在电商、企业内部系统、游戏开发等多个领域都有广泛应用。例如,电商平台可以通过截图快速生成促销页面,游戏开发团队进行活动页和宣发页的开发,而企业IT部门则可以基于现有系统截图快速开发原型。开源项目 screenshot-to-code 为这一需求提供了创新解决方案,通过分析截图自动生成相应的前端代码。
基于 AWS CDK 部署 Dify 社区版的高可用方案
一、背景介绍 从趋势来看,AI Agent 工作流程正引领着人工智能的下一次革命,其潜力远超仅依赖基础模型的传 […]
使用 WebRTC 构建实时 AI 助手
本文将会介绍使用 WebRTC 构建实时 AI 助手的整体架构方案,并且以 LiveKit WebRTC 为例,介绍如何构建基于 WebRTC 的 AI 实时翻译助手(Agent)。