Amazon Web Services 한국 블로그
Amazon Fraud Detector – 온라인 사기 탐지 서비스 정식 출시
Amazon Fraud Detector가 정식 출시되었습니다! 지난 2019 re:Invent 주간에 발표를 놓치셨다면 Amazon Fraud Detector는 원래 2019년 12월 3일 평가판 모드로 공개되었다는 것을 알려드립니다. 하지만 오늘은 고객 여러분이 직접 사용할 수 있도록 정식 출시되었습니다.
Amazon Fraud Detector는 온라인 결제 사기와 같은 잠재적 온라인 사기 행위 및 허위 계정 생성을 쉽게 식별하도록 지원하는 완전관리형 서비스입니다. 매년 전 세계적으로 온라인 사기로 인한 피해 금액이 수백억 달러에 달한다는 사실을 알고 계시나요?
온라인 비즈니스를 운영하는 회사는 허위 계정과 도난당한 신용카드 결제와 같은 사기 행위를 지속적으로 감시해야 합니다. 사기범을 찾아내는 한 가지 방법은 사기 탐지 앱을 사용하는 것입니다. 이러한 앱 중 일부는 기계 학습(ML)을 사용합니다.
Amazon Fraud Detector를 만나보세요! 사용자 데이터와 ML, 그리고 20년이 넘는 Amazon의 사기 탐지 전문 지식을 활용하여 잠재적 온라인 사기 행위를 자동으로 식별하므로, 더 빠르게 사기 행위를 찾아낼 수 있습니다. Fraud Detector는 모든 어려운 ML 작업을 자동으로 처리하므로 ML에 대한 사전 경험이 없어도 몇 번의 클릭으로 사기 탐지 모델을 생성할 수 있습니다.
“작동 원리”가 궁금하실 것입니다. 다음 5개 기본 단계로 요약할 수 있습니다. ???
- 1단계: 사기 여부를 평가하려는 이벤트를 정의합니다.
- 2단계: Amazon S3에 과거 이벤트 데이터 세트를 업로드하고 사기 탐지 모델 유형을 선택합니다.
- 3단계: Amazon Fraud Detector는 과거 데이터를 입력으로 사용하여 사용자 지정 모델을 구축합니다. 서비스는 자동으로 데이터를 검사하고 보강한 후, 특성 엔지니어링을 수행하고, 알고리즘을 선택해 모델을 훈련 및 조정하며, 모델을 호스팅합니다.
- 4단계: 모델 예측에 따라 수락, 검토 또는 더 자세한 정보 수집을 수행하도록 규칙을 생성합니다.
- 5단계: 온라인 애플리케이션에서 Amazon Fraud Detector API를 호출하여 실시간으로 사기 예측을 수신하고 구성된 탐지 규칙에 따라 조치를 취합니다. (예: 전자 상거래 애플리케이션은 이메일 및 IP 주소를 전송하고 사기 점수와 함께 규칙의 출력(예: 검토)을 수신할 수 있습니다.)
Amazon Fraud Detoctor 시작하기
이 모든 단계가 어떻게 수행되는지 더 잘 이해할 수 있도록 데모를 살펴보겠습니다. 오늘 게시물에서는 Amazon Fraud Detector 모델 구축 및 실시간 사기 예측 생성과 같은 두 가지 기본 구성에 대해 알아보겠습니다.
파트 A: Amazon Fraud Detector 모델 구축
먼저 S3 버킷에 모의로 생성된 훈련 데이터를 업로드합니다. 실제로 사용 설명서에서는 사용할 수 있는 샘플 데이터 세트를 제공합니다. 이 CSV 파일을 다운로드하면 이 훈련 데이터를 S3 버킷에 넣어야 합니다.
또한 상황을 파악하기 위해 이 CSV 파일을 열고 파일 내용도 확인합니다…
??참고: Amazon Fraud Detector에서는 이메일과 IP 주소 외에도 최소 2개의 변수를 선택하여 모델을 훈련시킬 수 있습니다. (실제로 모델은 최대 100개의 입력을 지원합니다!)
계속해서 이벤트를 정의(생성)합니다. 이벤트는 기본적으로 특정 이벤트에 대한 속성 세트입니다. 사기 여부를 평가하려는 이벤트의 구조를 정의합니다. (Amazon Fraud Detector는 사기 여부를 확인하기 위해 ‘이벤트’를 평가합니다.)
새 엔터티를 생성해보겠습니다. 이 엔터티는 이벤트를 트리거하는 사용자나 행위를 말합니다.
이벤트 변수로 넘어가겠습니다. 이제 훈련 데이터 세트에서 변수를 선택합니다. 그러면 앞서 언급한 CSV 파일을 사용하여 헤더를 가져올 수 있습니다.
[IAM 역할(IAM role)] 섹션에서 새 역할을 생성합니다. 방금 생성한 버킷과 같은 이름을 사용하려고 합니다(예: ‘fraud-detector-training-data‘).
이제 앞서 언급한 CSV 파일을 업로드하여 헤더를 가져옵니다.
모델을 정의하려면 최소 2개의 레이블을 정의해야 합니다.
이벤트 생성을 마무리해보겠습니다!
모두 잘 진행되면 녹색 표시줄에서 이벤트가 생성되었음을 알립니다!
이제 모델을 생성합니다.
그리고 모델 세부 정보를 정의합니다. 이전에 생성한 이벤트 유형을 선택해야 합니다.
[훈련 구성(Configure training)] 단계로 넘어가 [사기(Fraud)] 레이블 및 [합법(Legitimate)] 레이블 아래에서 레이블을 선택해야 합니다. (그러면 분류를 구분할 수 있어서 모델이 이 두 레이블을 서로 구별하도록 학습할 수 있습니다.)
모델 훈련은 데이터 세트 크기에 따라 30~40분에서 최대 두 시간 정도 걸립니다. 이 데이터 세트 예제에서는 모델을 훈련하는 데 약 40분이 걸립니다.
이 블로그 게시물에서는 모델 훈련을 이미 마쳤다고 가정하고 이에 소요되는 40분을 건너뜁니다.
또한 모델의 성능 지표도 확인할 수 있습니다!
이제 계속해서 모델을 배포할 수 있습니다.
이 버전이 배포하려는 버전이 맞는지 확인하는 팝업 메시지가 나타납니다.
파트 B: 실시간 사기 예측 생성
이제 실시간 사기 예측을 생성해보겠습니다! 준비되셨나요?
현재 만족스러운 모델을 배포했고 이 모델을 사용하여 예측을 생성하려고 합니다.
그러기 위해 모델과 규칙의 컨테이너에 해당하는 탐지기를 구축해야 합니다. 그리고 이벤트를 평가하기 위해 탐지기 논리를 적용하려고 합니다.
계속해서 탐지기 세부 정보를 정의합니다.
또한 이전에 생성한 이벤트를 선택해야 합니다.
이제 모델을 선택합니다.
계속해서 몇 가지 임계값 규칙을 설정합니다.
규칙은 모델의 출력을 해석합니다. 그리고 탐지기의 출력도 확인합니다.
규칙 2개를 더 설정합니다.
high_fraud_risk 레이블 외에도, low_fraud_risk 및 medium_fraud_risk 레이블을 추가하려고 합니다.
단, 이러한 규칙 임계값은 예제 목적으로만 사용됩니다. 탐지기에 대한 규칙을 생성하는 경우 사용자 모델, 데이터 및 비즈니스를 기반으로 적절한 값을 사용해야 합니다.
현재 이 게시물의 예제에 나오는 이 특정 임계값 규칙은 절대로 동시에 일치하지 않습니다.
즉, 현재 예제에서는 어떤 [규칙 실행 모드(Rule Execution modes)]를 사용해도 좋습니다.
잘했습니다! 탐지기를 생성했습니다.
이제 [규칙(Rules)] 탭을 클릭합니다.
또한 [모델(Models)] 탭 아래에서 원하는 모델을 확인할 수도 있습니다.
[개요(Overview)] 탭으로 돌아가면 빠른 테스트도 실행할 수 있습니다! 테스트를 실행하여 탐지기의 출력을 샘플링할 수 있습니다.
준비가 되면 이 탐지기 버전을 게시하여 활성 버전으로 설정할 수 있습니다. 각 탐지기에서는 한 번에 하나의 활성 버전만 보유할 수 있습니다.
이 버전을 게시할 준비가 되었는지 확인하는 팝업 메시지가 나타납니다.
다음 단계는, 실시간 예측을 실행하는 것입니다! Amazon SageMaker 노트북에서 일회용 예측 샘플을 통해 어떤 내용인지 살펴보겠습니다.
Amazon SageMaker 콘솔로 가서 [노트북 인스턴스(Notebook instances)]로 이동합니다.
현재 이미 [Jupyter 노트북(Jupyter Notebook)]이 준비되어 있습니다.
get_event_prediction 블록을 실행하려고 합니다. 이 블록은 기본 런타임 API로, 고객은 스크립트로 이 API를 호출하여 샘플 예측 배치를 실행할 수 있습니다. 또는 고객은 이 API를 고객 애플리케이션에 통합하여 실시간 예측을 생성하고 위험에 따라 동적으로 사용자 경험을 조정할 수 잇습니다.
다음은 이 블록을 실행한 후 얻은 모델 점수 결과입니다.
이 탐지기에는 1개 모델이 있고, 933점을 반환했습니다. 생성한 규칙에 따라, 이 트랜잭션이 high_fraud_risk로 반환될 수 있음을 의미합니다.
다시 Amazon Fraud Detector 콘솔로 돌아가서 탐지기에서 [규칙(Rules)]을 확인합니다.
탐지기의 규칙을 보면 위험 점수가 900을 초과하면 [결과(Outcome)]는 verify_customer임을 알 수 있습니다.
이것으로 단계를 모두 살펴보았습니다!
이제 실시간으로 이 탐지기를 호출하여 사기 예측을 가져올 수 있음을 확인했습니다.
Amazon Fraud Detector는 현재 정식 출시되어, Amazon CloudWatch, AWS CloudTrail, AWS PrivateLink 등 많은 AWS 서비스에 통합되었습니다. 더 자세한 내용은 웹 사이트 및 개발자 안내서를 참조하십시오.
감사합니다!
~Alejandra