投稿日: May 10, 2024
Amazon Relational Database Service (RDS) for PostgreSQL で pgvector 0.7.0 がサポートされるようになりました。これは、データベースにベクトル埋め込みを格納するための PostgreSQL 用のオープンソース拡張機能であり、これを使用することで生成 AI アプリケーションを構築するときに検索拡張生成 (RAG) を使用できます。このリリースの pgvector には、インデックス化できるベクトルのディメンション数を増やし、インデックスサイズを小さくする機能が含まれ、距離計算に CPU SIMD を使用するためのサポートも追加されています。
pgvector 0.7.0 では 2 つの新しいベクトルデータ型が追加されます。ディメンションを 2 バイトの浮動小数点として格納する halfvec と、ゼロ以外のディメンションを 1,000 個まで格納する sparsevec です。さらに、PostgreSQL 固有の bit 型を使用したバイナリベクトルのインデックスをサポートするようになりました。これらが追加されることで、PostgreSQL式インデックスを使用して、ベクトルデータ型に対してスカラおよびバイナリ量子化を使用できるようになります。これにより、インデックスのストレージサイズが小さくなり、インデックスの構築時間が短くなります。量子化により、インデックス化できるベクトルの最大ディメンションを増やすことができます。halfvec は 4,000、バイナリベクトルでは 64,000 です。pgvector 0.7.0 には、バイナリベクトルのハミング距離とジャカード距離の両方を計算する関数も追加されています。
pgvector 0.7.0 は、AWS GovCloud (米国) リージョンを含むすべての AWS リージョンにおいて、PostgreSQL 16.3 以降、15.7 以降、14.12 以降、13.15 以降、12.19 以降を実行している Amazon RDS のデータベースインスタンスで利用できます。
Amazon RDS for PostgreSQL を使用すると、クラウドにデプロイした PostgreSQL を簡単にセットアップ、運用、スケールできます。料金の詳細や利用できるリージョンについては、Amazon RDS for PostgreSQL の料金を参照してください。フルマネージド型 Amazon RDS データベースは、Amazon RDS マネジメントコンソールで作成または更新してください。