Veröffentlicht am: Mar 30, 2022
AWS Glue Version 2.0 unterstützt jetzt die Machine-Learning-Transformation AWS Glue FindMatches. AWS Glue FindMatches automatisiert den Prozess der Identifizierung von teilweise übereinstimmenden Datensätzen z. B. bei der Verknüpfung von Kundendatensätzen, der Deduplizierung von Produktkatalogen oder der Betrugserkennung. Mit Glue 2.0 starten ETL-Aufträge, die Fuzzy Matching mit FindMatches durchführen, in weniger als einer Minute und haben eine Mindestabrechnungszeit von 1 Minute.
Verwenden Sie die FindMatches-Transformation, um zusammengehörige Datensätze in Ihren Datenssätzen zu identifizieren und dann zusammenzuführen oder zu deduplizieren. So kann es beispielsweise erkennen, dass Datensätze trotz unterschiedlicher Schreibweise und Formatierung übereinstimmen, z. B. „John Doe“ vs. „Jhn Doe“, „JOHN_DOE@ANYCOMPANY.COM“ vs. „johndoe@anycompany.com“ oder „555-010-0000“ vs. „+1-555-010-0000“.
Diese Funktion ist in denselben AWS-Regionen verfügbar wie AWS Glue.
Weitere Informationen finden Sie in der Dokumentation und im FindMatches-Blogbeitrag.