Veröffentlicht am: Nov 17, 2021
Die FindMatches ML-Transformation in AWS Glue enthält jetzt eine Option zur Ausgabe von Übereinstimmungswerten, die angeben, wie eng die einzelnen Datensatzgruppen miteinander übereinstimmen. Mit der FindMatches-Transformation können Sie doppelte oder übereinstimmende Datensätze in Ihrem Datensatz identifizieren, auch wenn die Datensätze keinen gemeinsamen eindeutigen Identifikator haben und keine Felder genau übereinstimmen. FindMatches hilft bei der Automatisierung von komplexen Datenbereinigungs- und Deduplizierungsaufgaben.
AWS Glue FindMatches automatisiert den Prozess der Identifizierung von teilweise übereinstimmenden Datensätzen z. B. bei der Verknüpfung von Kundendatensätzen, der Deduplizierung von Produktkatalogen oder der Betrugserkennung. Verwenden Sie das Match-Scoring in FindMatches, um Ihre FindMatches-Modelle zu verstehen, um zu entscheiden, ob sie zu Ihrer Zufriedenheit trainiert sind, und um zu entscheiden, welche Datensätze zusammengeführt werden sollen.
Diese Funktion ist unter denselben AWS-Regionen verfügbar wie AWS Glue.
Weitere Informationen finden Sie in der Dokumentation und im FindMatches Blogbeitrag.