Publié le: Nov 17, 2021
La transformation ML FindMatches de AWS Glue intègre désormais une option permettant de générer des scores de correspondance, indicant le degré de correspondance entre chaque groupe d'enregistrements. La transformation FindMatches vous permet d'identifier les doublons ou les enregistrements concordants dans votre jeu de données, même lorsque ces enregistrements n'ont pas d'identifiant unique en commun et qu'aucun champ ne correspond exactement. FindMatches permet d'automatiser les tâches complexes de nettoyage et de déduplication des données.
AWS Glue FindMatches automatise le processus d'identification des enregistrements partiellement correspondants pour des cas d'utilisation tels que la liaison d'enregistrements de clients, la déduplication de catalogues de produits et la détection de fraude. Utilisez la mesure des scores de correspondance dans FindMatches pour comprendre vos modèles FindMatches, déterminer s'ils sont entraînés conformément à vos attentes et décider des enregistrements à fusionner.
Cette fonction est disponible dans les mêmes régions AWS qu'AWS Glue.
Pour en savoir plus, veuillez consulter notre documentation et lisez l'article de blog FindMatches.