Publicado en: Nov 17, 2021
Ahora con el proceso de transformación de ML de FindMatches en AWS Glue, puede generar puntuaciones coincidentes, que indican en qué medida se corresponde cada grupo de registros entre sí. La transformación de FindMatches le permite identificar registros coincidentes o duplicados en su conjunto de datos, incluso si los registros no tienen un identificador común único ni hay campos que concuerden de manera exacta. FindMatches le permite automatizar las tareas de limpieza y deduplicación de datos complejos.
FindMatches de AWS Glue automatiza el proceso de identificación de registros parcialmente coincidentes para casos de uso que incluyen la vinculación de registros de clientes, la deduplicación de catálogos de productos y la detección de fraude. Utilice puntuaciones coincidentes en FindMatches para comprender los modelos de FindMatches, decidir si su entrenamiento es el que desea y elegir qué registros fusionar.
Esta característica está disponible en las mismas regiones de AWS que AWS Glue.
Para obtener más información, consulte nuestra documentación y lea la publicación en el blog de FindMatches.