Publicado: Nov 17, 2021
A transformação de ML do FindMatches no AWS Glue agora inclui uma opção para gerar pontuações de correspondência, o que indica o quão similar cada agrupamento de registros é um do outro. A transformação do FindMatches permite a identificação de registros duplicados ou correspondentes no seu conjunto de dados, mesmo quando os registros não possuem um identificador único comum e nenhum campo com correspondência exata. O FindMatches ajuda a automatizar tarefas de deduplicação e limpeza de dados complexa.
O FindMatches do AWS Glue automatiza o processo de identificação de registros parcialmente correspondentes para casos de uso, incluindo a vinculação de registros do cliente, a deduplicação de catálogos de produtos e a detecção de fraude. Use a pontuação de correspondência no FindMatches para entender seus modelos do FindMatches, decidir se eles estão treinados de forma satisfatória e determinar quais registros mesclar.
Esse recurso está disponível nas mesmas regiões da AWS do AWS Glue.
Para saber mais, consulte nossa documentação e leia a postagem do blog do FindMatches.