Amazon Bedrock 现在支持 Cohere Embed 的压缩嵌入
发布于:
2024年6月20日
Amazon Bedrock 现在支持 Cohere Embed 模型中的压缩嵌入(int8 和二进制),使开发人员和企业能够在不影响性能的情况下构建更高效的生成式人工智能应用程序。Cohere Embed 是一种领先的文本嵌入模型,最常用于支持检索增强生成 (RAG) 和语义搜索系统。
Cohere Embed 模型输出的文本嵌入必须存储在具有向量搜索功能的数据库中,存储成本与嵌入输出的维度数量以及数字格式精度直接相关。Cohere 的压缩感知模型训练方法让模型能够以二进制和 int8 精度格式输出嵌入,这些嵌入的大小比常用的 FP32 精度格式小得多,并且准确性下降幅度最小。这让您能够以更快的速度、更低廉的成本和更高的效率运行企业搜索应用程序。int8 和二进制嵌入对于大型多租户设置尤其有用,在这种设置中,能够在几毫秒内搜索数百万个嵌入是一项重要业务优势。利用 Cohere 的压缩嵌入,您可以构建足够高效的应用程序来大规模投入生产,同时加快您的人工智能战略,为员工和客户提供支持。
Cohere Embed int8 和二进制嵌入现已在提供 Cohere Embed 模型的所有 AWS 区域的 Amazon Bedrock 中推出。要了解更多信息,请阅读 Amazon Bedrock 中的 Cohere 产品页面、文档和 Cohere 发布博客。要开始在 Amazon Bedrock 中使用 Cohere 模型,请访问 Amazon Bedrock 控制台。