客户案例/软件和互联网/美国 

2024 年
Perplexity 徽标

Perplexity 在 Amazon Bedrock 中使用 Anthropic 的 Claude 3 构建高级搜索引擎

了解 Perplexity 基于人工智能的搜索引擎如何使用 Amazon Bedrock 和 Anthropic 的 Claude 3 为用户查询提供准确而全面的答案。

减少

机器学习基础设施的管理任务

提供

多个 LLM 选项给用户

简化

对开放和专有模型的访问

扩展

容纳其他模型

概览

Perplexity 希望为传统在线搜索引擎提供强大的替代方案,并为此创建了一个交互式搜索助手,以精心筛选的信息源为后盾,提供对话式的个性化答案。用户可以从多个高性能大型语言模型(LLM)中选择相关、准确和易于理解的信息。

为了简化对专有模型(如热门的领先 LLM – Anthropic 的 Claude)的访问,微调开源 LLM,Perplexity 需要为搜索引擎 Perplexity AI 提供强大的全球基础设施。该公司选择在 Amazon Web Services(AWS)上构建 Perplexity AI。AWS 的服务十分全面,可实现企业级安全和隐私,还可提供行业领先的基础模型(FM),以及由生成式人工智能(AI)支持的应用程序。除了在 AWS 上运行自己的模型外,Perplexity 还通过 Amazon Bedrock 为用户提供访问 Claude 的权限。Amazon Bedrock 是一项完全托管式服务,可通过单一 API 提供来自 AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI 和 Amazon 等领先人工智能公司的高性能 FM,还具备丰富功能,可以助力各公司在保障安全、隐私以及采用负责任人工智能的前提下,构建生成式人工智能应用程序。

AWS re:Invent 2023 – Perplexity 客户主题演讲| AWS 活动

机会 | 使用 AWS 构建对话式搜索引擎

Perplexity AI 于 2022 年 12 月推出,可以通过了解用户在一段时间内的兴趣和偏好来评估情境并进行个性化互动。用户还可以了解信息的可信度,因为每个搜索结果都附有来源清单。

Perplexity 自其公共 API 服务推出以来一直在使用 Amazon SageMaker。Amazon SageMaker 是一项完全托管式服务,汇集了众多几乎可用于所有使用场景的高性能、低成本机器学习(ML)工具。在评估了几家云提供商之后,Perplexity 选择了 AWS 对模型进行训练和推断,用以补充对 Amazon Bedrock 的使用。Perplexity 首席技术官 Denis Yarats 表示:“使用了 AWS,我们就用上了 GPU,也从积极主动的 AWS 团队展现的技术专业知识中受益匪浅。”该公司测试了 Amazon Elastic Compute Cloud(Amazon EC2)的实例类型。Amazon EC2 提供众多的计算选择、高达 3200 Gbps 的网络,以及专为优化机器学习项目的性价比而构建的存储服务。具体而言,Perplexity 使用由 NVIDIA A100 GPU 提供支持,并针对分布式训练进行了优化的 Amazon EC2 P4de 实例来微调开源 FM。

通过 Amazon Bedrock,Perplexity AI 用户可以从 AWS 合作伙伴 Anthropic 的 Claude 3 系列模型中选择所需模型。Claude 3 模型除了强大的性能,还具备专家知识、高准确性和情境理解能力。Perplexity 技术团队成员 William Zhang 表示:“使用 Amazon Bedrock 这样的高性能服务,意味着我们在利用 Anthropic 强大的模型时,可确保团队能够有效保持产品的高可靠性和低延迟。”

kr_quotemark

使用 Amazon Bedrock 这样的高性能服务,意味着我们在利用 Anthropic 强大的模型时,可确保团队能够有效保持产品的高可靠性和低延迟。”

William Zhang
Perplexity 技术团队成员

解决方案 | 使用 Amazon Bedrock 和 Anthropic 的 Claude 3 模型增强负责任且准确的搜索体验

由于 Claude 以简洁自然的语言提供信息,用户可以快速得到明确的答案。用户还可以快速上传并分析大型文档,因为 Claude 3 模型具有包含 20 万个令牌的情境窗口,相当于大约 15 万个单词或超过 500 页内容。Zhang 说:“在考虑将某些功能纳入我们的产品时,易用性是至关重要的因素。在 Amazon Bedrock 上使用 Claude 3 是卓越开发人员体验的一部分。”

Perplexity 旨在通过减少幻觉(LLM 的不准确输出),来确保每个搜索结果的准确性和实用性。Anthropic 的前代模型 Claude 2.1 已经将幻觉率降低了一半,而通过 Claude 3 系列(较之 Claude 2.1,准确性有了进一步提高),Anthropic 进一步减少了幻觉,并提高了准确性。在 Anthropic 努力将模型幻觉降至零的同时,Perplexity 也在使用人工注释者来进一步为用户提供准确、安全和可信的信息。此外,Anthropic 和 AWS 对负责任的人工智能的承诺也使 Perplexity 受益匪浅。Perplexity 的云基础设施工程师 Aarash Heydari 表示:“我们很感激 Amazon Bedrock 内置了内容过滤器,可以在人们尝试将我们的解决方案用于意外目的时提醒我们。”作为一家以安全和研究为核心的公司,Anthropic 在打击“越狱”(即企图生成有害响应或滥用模型)方面处于市场领导地位。

Perplexity 还继续在其由 AWS 提供支持的基础设施上微调其他模型。2023 年 8 月,Perplexity 成为 Amazon SageMaker HyperPod 早期测试版的测试者。该服务消除了构建和优化用于训练 FM 的机器学习基础设施时,所涉及的无差别繁重工作。Perplexity 的工程师与 AWS 解决方案架构师合作,创建了具有突破性的可扩展基础设施。该基础设施可自动将训练工作负载分配到加速的 Amazon EC2 P4de 实例中,然后对其并行处理。Amazon SageMaker HyperPod 预配置了 Amazon SageMaker 的分布式训练库,进一步提高了性能。Heydari 表示:“训练吞吐量的速度翻了一番。基础设施易于管理,与硬件相关的故障也显著减少。”

要进一步了解 Perplexity 如何使用 Amazon SageMaker HyperPod,来将基础模型训练速度加快了 40%,请参阅此案例研究

两个月后,Perplexity 发布了一个公共 API,这样用户就可以访问其专有的在线模型 Sonar Small 和 Sonar Medium。这两个模型托管在 AWS 上,使用 Mistral 7B 和 Mixtral 8x7B 进行了微调。在响应时间敏感的查询时,这些在线 LLM 会优先考虑来自互联网的知识而不是训练数据。Heydari 表示:“我们的模型训练和推理基础设施全部由 Amazon SageMaker HyperPod 提供支持,而该服务正是我们选择 AWS 的关键因素。Amazon SageMaker HyperPod 在推动我们的人工智能创新方面发挥了重要作用。”

Perplexity AI 可自动访问 Claude 的最新迭代版本,推动用户使用新功能,继续为用户提供一系列适合其需求的模型。

“在 AWS 上,我们拥有高度可靠的经验,可将所有基础设施都整合在一起,让我们的复杂产品正常运转。”Heydari 表示。“我们始终处于人工智能功能的最前沿,总是使用强大的模型,并对任何能够增强用户体验的事物持开放态度。”

关于 Perplexity

Perplexity AI 是一款基于人工智能的搜索引擎和聊天机器人,使用自然语言处理和 Amazon Bedrock 等先进技术,为来自 1000 多万月活用户的查询提供准确而全面的答案。

使用的 AWS 服务

Amazon Bedrock

Amazon Bedrock 是一项完全托管的服务,通过单个 API 提供来自 AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI 和 Amazon 等领先人工智能公司的高性能基础模型(FM),以及通过安全性、隐私性和负责任的人工智能构建生成式人工智能应用程序所需的一系列广泛功能。

了解更多 »

Amazon SageMaker HyperPod

AmazonSageMaker HyperPod 消除了为训练基础模型(FM)构建和优化机器学习(ML)基础设施所涉及的,千篇一律的繁重工作,最多可将训练时间缩短 40%。

了解更多 »

Amazon EC2

Amazon Elastic Compute Cloud(Amazon EC2)提供最广泛、最深入的计算平台,拥有超过 750 个实例,可选择最新的处理器、存储、网络、操作系统和购买模型,以帮助您最好地满足工作负载的需求。

了解更多 »

更多生成式人工智能客户案例

未找到任何项目 

1

行动起来

无论行业无论规模,每天都有各种机构在使用 AWS 实现自身业务转型、实现企业愿景。欢迎您联系我们的专家,立即踏上您的 AWS 之旅。