Veröffentlicht am: May 10, 2024
Amazon Relational Database Service (RDS) für PostgreSQL unterstützt jetzt pgvector 0.7.0, eine Open-Source-Erweiterung für PostgreSQL zum Speichern von Vektoreinbettungen in Ihrer Datenbank, sodass Sie beim Erstellen Ihrer generativen KI-Anwendungen Retrieval-Augmented Generation (RAG) verwenden können. Diese Version von pgvector enthält Funktionen, die die Anzahl der Dimensionen von Vektoren, die Sie indizieren können, erhöhen, die Indexgröße reduzieren und zusätzliche Unterstützung für die Verwendung von CPU-SIMD bei Abstandsberechnungen bieten.
Mit pgvector 0.7.0 halten zwei neue Vektordatentypen Einzug: halfvec zum Speichern von Dimensionen als 2-Byte-Floats und sparsevec zum Speichern von bis zu 1.000 Non-Zero-Dimensionen. Außerdem wird jetzt die Indizierung binärer Vektoren mit dem PostgreSQL-nativen Bittyp unterstützt. Mit diesen Ergänzungen können Sie skalare und binäre Quantisierung für den Vektordatentyp mithilfe von PostgreSQL-Ausdrucksindizes verwenden, wodurch die Speichergröße des Indexes reduziert und die Indexerstellungszeit verkürzt wird. Mit der Quantisierung können Sie die maximalen Dimensionen von Vektoren erhöhen, die Sie indizieren können: 4.000 für halfvec und 64.000 für binäre Vektoren. pgvector 0.7.0 fügt zudem Funktionen hinzu, um sowohl den Hamming- als auch den Jaccard-Abstand für binäre Vektoren zu berechnen.
pgvector 0.7.0 ist auf allen Datenbank-Instances in Amazon RDS verfügbar, auf denen PostgreSQL 16.3 und höher, 15.7 und höher, 14.12 und höher, 13.15 und höher sowie 12.19 und höher ausgeführt wird, in allen AWS-Regionen, einschließlich der Regionen AWS GovCloud (USA).
Amazon RDS für PostgreSQL erleichtert die Einrichtung, den Betrieb und die Skalierung von PostgreSQL-Bereitstellungen in der Cloud. Unter Amazon RDS for PostgreSQL – Preise findest du Informationen zu Preisen und zur regionalen Verfügbarkeit. Erstellen oder aktualisieren Sie eine vollständig verwaltete Amazon-RDS-Datenbank in der Amazon RDS-Managementkonsole.