发布于: May 10, 2024
Amazon Relational Database Service (RDS) for PostgreSQL 现在支持 pgvector 0.7.0,它是 PostgreSQL 的开源扩展,用于在数据库中存储向量嵌入,让您能够在构建生成式人工智能应用程序时使用检索增强生成 (RAG)。此版本的 pgvector 包括用于增加可索引向量的维数、减小索引大小的功能,还包括对在距离计算中使用 CPU SIMD 的额外支持。
pgvector 0.7.0 增加了两种新的向量数据类型:halfvec(用于将维度存储为 2 字节浮点数)和 sparsevec(用于存储多达 1,000 个非零维度),现在支持使用 PostgreSQL 原生位类型索引二进制向量。这些新增类型允许您使用 PostgreSQL 表达式索引对向量数据类型使用标量和二进制量化,从而减小索引的存储大小并缩短索引构建时间。通过量化,您可增加可以索引的向量的最大维度:halfvec 为 4,000,二进制向量为 64,000。pgvector 0.7.0 还添加了用于计算二进制向量的汉明和杰卡德距离的函数。
pgvector 0.7.0 适用于所有适用 AWS 区域(包括 AWS GovCloud(美国)区域)内运行 PostgreSQL 16.3 及更高版本、15.7 及更高版本、14.12 及更高版本、13.15 及更高版本和 12.19 及更高版本的 Amazon RDS 中的数据库实例。
Amazon RDS for PostgreSQL 让您能够在云中轻松设置、运行和扩展 PostgreSQL 部署。有关定价详细信息和区域可用性,请参阅 Amazon RDS for PostgreSQL 定价。在 Amazon RDS 管理控制台中创建或更新完全托管式 Amazon RDS 数据库。