게시된 날짜: Nov 17, 2021
AWS Glue의 FindMatches ML 변환은 이제 각 레코드 일치 항목이 서로 얼마나 밀접하게 일치하는지 나타내는 일치 항목 점수를 출력하는 옵션이 포함됩니다. FindMatches 변환을 사용하면 레코드에 공통 고유 식별자가 없고 정확히 일치하는 필드가 없는 경우에도 데이터 집합에서 중복되거나 일치하는 레코드를 식별할 수 있습니다. FindMatches를 사용하면 복잡한 데이터 정리 및 중복 제거 작업을 자동화할 수 있습니다.
AWS Glue FindMatches는 고객 레코드 연결, 제품 카탈로그 중복 제거, 사기 탐지와 같은 사용 사례에서 부분적으로 일치하는 레코드의 식별 과정을 자동화합니다. FindMatches에서 일치 항목 점수를 사용하여 FindMatches 모델을 이해하고 만족할 정도로 훈련되었는지 결정하고 병합할 레코드를 결정하세요.
이 기능은 AWS Glue와 동일한 AWS 리전에서 이용할 수 있습니다.