Publié le: Oct 2, 2020
Amazon Redshift lance la prise en charge du stockage natif et du traitement des sketches HyperLogLog (HLL). HyperLogLog est un nouvel algorithme qui estime efficacement le nombre approximatif de valeur distinctes dans un ensemble de données. Le croquis HLL est une construction qui englobe l'information sur les valeurs distinctes d'un ensemble de données. Vous pouvez utiliser les sketches HLL afin de parvenir à des profits significatifs en terme de performance pour des requêtes qui calculent la cardinalité approximative de larges ensembles de données, avec un taux moyen d'erreur entre 0,01-0,6%.
Redshift fournit une première classe de type de données HLLSKETCH et fonctions SQL afférentes afin de générer, conserver et combiner les sketches HyperLogLog. La fonctionnalité HyperLogLog d'Amazon Redshift utilise des techniques de correction du biais et offre une haute précision avec une faible empreinte mémoire. Le type de donnée HLLSKETCH d'Amazon Redshift peut être utilisé pour stocker des valeurs de sketch HLL dans un tableau. De plus, Amazon Redshift prend en charge les opérations qui peuvent être appliquées aux valeurs HLLSKETCH qui utilisent des fonctions d'agrégation et scalaires. Vous pouvez utiliser ces fonctions pour créer des sketches HLL, extraire la cardinalité d'un sketch HLL, ou combiner plusieurs valeurs de sketch.
La prise en charge des sketches HLL dans Redshift est incluse dans la version 1.0.19097 et les versions ultérieures. Cette fonctionnalité est disponible sans frais supplémentaires pour les nouveaux clients et les clients existants. Pour en savoir plus et faire vos premiers pas, consultez notre documentation. Consultez le tableau des régions AWS pour connaître la disponibilité d'Amazon Redshift.