Publicado: May 10, 2024
Agora, o Amazon Relational Database Service (RDS) para PostgreSQL oferece suporte ao pgvector 0.7.0, uma extensão de código aberto do PostgreSQL que armazena incorporações vetoriais em bancos de dados para permitir o uso de geração aumentada de recuperação (RAG) na criação de aplicações de IA generativa. Esta versão do pgvector inclui recursos que aumentam o número de dimensões de vetores que você pode indexar, reduzem o tamanho do índice e oferece suporte adicional para usar CPU SIMD em cálculos de distância.
O pgvector 0.7.0 adiciona dois novos tipos de dados vetoriais: halfvec, para armazenar dimensões como números flutuantes de 2 bytes, e sparsevec, para armazenar até 1.000 dimensões diferentes de zero. Além disso, já oferece suporte à indexação de vetores binários usando o tipo de dados bit nativo do PostgreSQL. Essas adições permitem que você utilize quantização escalar e binária para o tipo de dados vetoriais usando índices de expressão do PostgreSQL, o que reduz o tamanho de armazenamento do índice e acelera sua criação. A quantização permite aumentar as dimensões máximas dos vetores que você pode indexar: 4.000 para halfvec e 64.000 para vetores binários. O pgvector 0.7.0 também adiciona funções para calcular as distâncias de Hamming e Jaccard para vetores binários.
O pgvector 0.7.0 está disponível em todas as instâncias de banco de dados no Amazon RDS que executam o PostgreSQL 16.3 e superior, 15.7 e superior, 14.12 e superior, 13.15 e superior, e 12.19 e superior em todas as regiões da AWS, incluindo as regiões AWS GovCloud (EUA).
O Amazon RDS para PostgreSQL simplifica a configuração, a operação e o ajuste de escala de implantações do PostgreSQL na nuvem. Para obter detalhes de preços e disponibilidade regional, consulte os Preços do Amazon RDS para PostgreSQL. Crie ou atualize um banco de dados do Amazon RDS totalmente gerenciado no Console de gerenciamento do Amazon RDS.