Anthropic 升级后的 Claude 3.5 Sonnet 模型和计算机使用现已在 Amazon Bedrock 中推出

发布于: 2024年10月22日

Anthropic 升级后的 Claude 3.5 Sonnet 模型现已在 Amazon Bedrock 中推出。据 Anthropic 称,该模型与其前身相比有了全面的改进,在编码方面取得了显著的进步 – 它在该领域已经处于领先地位。

升级后的 Claude 3.5 Sonnet 模型与行业基准相比有了全面的改进。据 Anthropic 称,在编码方面,该模型在 SWE-bench Verified 上的性能从 33% 提高到 49%,得分高于所有可公开获得的模型。它还将代理工具使用任务 TAU-bench 的性能,在零售领域从 62.6% 提高到 69.2%,在航空领域从 36.0% 提高到 46.0%。新的 Claude 3.5 Sonnet 以与其前身相同的价格提供了这些改进。此外,Claude 3.5 Sonnet 现在还以公开测试版的形式在 Amazon Bedrock 中提供计算机使用功能,从而使 Claude 能够感知计算机界面并与之交互。开发人员可以通过查看屏幕、移动光标、单击按钮和键入文本,指示 Claude 像人类一样使用计算机。鉴于这项技术尚处于早期阶段,建议开发人员先探索风险较低的任务。

升级后的 Claude 3.5 Sonnet 模型现已在美国西部(俄勒冈州)区域的 Amazon Bedrock 中推出。 计算机使用现已在公开测试版中可用。要了解更多信息,请参阅 AWS 新闻发布博客Amazon Bedrock 中的 Claude 产品页面文档。要开始使用 Claude,请访问 Amazon Bedrock 控制台