宣布在 Aurora PostgreSQL 中支持 pgvector 0.7.0

发布于: 2024年8月8日

Amazon Aurora PostgreSQL 兼容版现已支持 pgvector 0.7.0,这是 PostgreSQL 的一个开源扩展,用于在数据库中存储向量嵌入。pgvector 提供了向量相似性搜索功能,实现了在生成式人工智能 (AI) 应用程序中使用 Aurora 进行语义搜索和检索增强生成 (RAG)。

pgvector 0.7.0 增加了并行处理,以缩短 Aurora 中的分层可导航小世界 (HNSW) 索引构建时间。pgvector 0.7.0 增加了两种新的向量数据类型:halfvec(用于将维度存储为 2 字节浮点数)和 sparsevec(用于存储多达 1,000 个非零维度),并且现在支持使用 PostgreSQL 原生位类型索引二进制向量。利用这些新增类型,您可以使用 PostgreSQL 表达式索引对向量数据类型使用标量和二进制量化,从而减小索引存储大小并缩短索引构建时间。通过量化,您还可以增加可索引的向量的最大维度:halfvec 的最大维度为 4,000,二进制向量的最大维度为 64,000。

pgvector 0.7.0 适用于所有适用 AWS 区域(包括 AWS GovCloud(美国)区域,但中国区域除外)中运行 PostgreSQL 16.3、15.7、14.12、13.15 和 12.19 及更高版本的 Amazon Aurora 集群。您可以通过修改数据库集群来启动次要版本升级。要了解更多信息,请参阅 Aurora 文档

Amazon Aurora 具有全球规模的无与伦比的高性能和可用性,与 MySQL 和 PostgreSQL 完全兼容。它提供内置的安全性、连续的备份、无服务器计算、最多 15 个只读副本、自动多区域复制以及与其他 AWS 服务的集成。如要开始使用 Amazon Aurora,请访问我们的入门页面