亚马逊AWS官方博客
Amazon Fraud Detector 现已全面推出
公告的内容
Amazon Fraud Detector 现已全面推出! ?
如果您错过了 2019 re:Invent 周期间的公告,Amazon Fraud Detector 最初是在 2019 年 12 月 3 日以预览模式发布的。但今天,它已全面推出,供客户查看。
什么是 Amazon Fraud Detector?
Amazon Fraud Detector 是一项完全托管的服务,可用于轻松识别潜在的网络欺诈行为,例如在线支付欺诈和创建虚假账户。
你知道吗,每年全世界因网络欺诈造成的经济损失达数百亿美元?
开展网上业务的公司必须时刻警惕欺诈行为,比如伪造账户和用被盗信用卡进行支付。 他们识别欺诈者的一种方法是使用欺诈检测应用程序,其中一些应用程序使用了 Machine Learning (ML)。
进入 Amazon Fraud Detector! 这项服务使用您的数据、ML 并利用 Amazon 20 多年的欺诈检测专业知识自动识别潜在的网络欺诈行为,使您可以更快的抓获更多欺诈行为。您只需单击几下就可以创建一个欺诈检测模型,并且不需要任何 ML 经验,因为 Fraud Detector 可以为您处理所有繁重的 ML 工作。
工作原理…
“但它的工作原理是什么?”或许你会问。??♀️
非常高兴你提出这样的问题! 我们用 5 个主要步骤对它进行总结。???
- 步骤 1:定义您要评估是否具有欺诈性的事件。
- 步骤 2:上传您的历史事件数据集到 Amazon S3 中并选择一种欺诈检测模型类型。
- 步骤 3:Amazon Fraud Detector 将您的历史数据用作输入来构建自定义模型。该服务会自动检查和丰富数据,执行功能工程、选择算法、训练和调优您的模型并托管模型。
- 步骤 4:创建规则以基于模型预测接受、审查或收集更多信息。
- 步骤 5:从您的在线应用程序调用 Amazon Fraud Detector API,以接收实时欺诈预测并基于配置的检测规则采取措施。 (示例:电子商务应用程序可以发送电子邮件和 IP 地址,并从您的规则(例如审查)中接收欺诈评分以及输出)
我们来看一下演示…
我们来进行一下演示,以更好地了解它们是如何结合在一起的。在今天的博客文章中,我们将带您逐步了解两个主要组件:构建 Amazon Fraud Detector 模型和生成实时欺诈预测。
第 1 部分:构建 Amazon Fraud Detector 模型
我们首先将虚构生成的训练数据上传到 S3 存储桶中。事实上,用户指南中有示例数据集,我们可以使用。当我们下载该 CSV 文件后,我们需要将此训练数据放入 S3 存储桶中。
出于上下文考虑,我们也来打开这个 CSV 文件,看看里面有什么…
??注:使用 Amazon Fraud Detector,您最少能够选择 2 个变量来训练模型,而不仅仅是电子邮件和 IP 地址。(事实上,该模型最多支持 100 个输入!)
我们继续定义(创建)事件。事件本质上是特定事件的一组属性。我们对想要进行欺诈评估的事件的结构进行了定义。(Amazon Fraud Detector 评估“事件”是否存在欺诈。)
我们来创建一个新实体。此实体代表触发事件的人或物。
我们继续了解 Event Variables(事件变量)。我们将从训练数据集中选择变量。这样一来,我们可以使用之前提到的 CSV 文件并拉入标题中。
对于 IAM role(IAM 角色)部分,我们创建一个新角色。我将使用与我刚创建的存储桶相同的名称“fraud-detector-training-data”。
现在,我们可以上传之前提到的 CSV 文件,以拉入标题中。
由于我们将定义模型,我们必须至少定义两个标签。
最后,我们来创建事件!
如果一切顺利,我们将看到一个绿色的条,提醒我们事件已成功创建!
现在,是时候创建模型了。
我们来花点时间定义模型详细信息。我们确保选择以前创建的事件类型。
我们继续配置训练并确保选择 Fraud(欺诈)和 Legitimate(合法)标签下的标签。(这使我们可以将分类分开,以便模型可以学会区分这两个表。)
模型需要 30-40 分钟,最多需要数小时,具体取决于数据集大小。此示例数据集大约需要 40 分钟来训练模型。
在本篇博客文章中,我们假设已跳过 40 分钟训练已完成模型的时间。??
您还可以查看您的模型性能指标!
现在,我们可以继续部署模型。
弹出的模型要求我们确认这是我们想要部署的版本。
第 2 部分:生成实时欺诈预测
是时候生成实时欺诈预测了! 准备好了吗?
此时,您已经拥有了一个满意的已部署模型,并且想要将它用于获取预测。
我们必须构建检测器,检测器是您的模型和规则的容器,是您想要用于评估事件的检测逻辑。
我们继续来定义检测器详细信息。
我们还要确保选择以前创建的事件。
现在,我们选择模型。
我们继续来制定一些阈值规则。
这些规则可说明模型的输出。它们还决定了探测器的输出。
我们再来指定两个规则。
除了 high_fraud_risk 标签之外,我们还想添加 low_fraud_risk 和 medium_fraud_risk 标签。
请记住,这些规则阈值只是示例。当您为自己的检测器创建规则时,您应该基于您的模型、数据和业务使用适当的值。
现在,在本博文的示例中,这些特定阈值从来不会同时匹配。
这意味着,任一个规则执行模式都适合在我们当前的示例中使用。
哇! 我们已经创建好自己的检测器。
现在,我们来点击 Rules(规则)选项卡。
我们还可以在 Models(模型)选项卡下查看我们有哪些模型。
如果我们返回 Overview(概述)选项卡,我们甚至可以运行快速测试! 我们可以运行测试,以从检测器的输出中采样。
当我们准备就绪后,我们可以发布此版本的检测器使其成为活动版本。每个检测器一次都可以有一个活动版本。
弹出模型要求我们确认我们已准备好发布此版本。
下一步是运行实时预测! 我们来用 Amazon SageMaker 笔记本展示一次性示例预测,看看它会是什么样子。
我们移动到 Amazon SageMaker 控制台,并转到 Notebook(笔记本)实例。
在此情况下,您可以看到,我已经有一个 Jupyter 笔记本,已准备好运行。
我们将要运行 get_event_prediction 数据块。这是我们的主运行时 API,客户可以使用脚本来调用它,以运行一批示例预测。或者,客户还可以将此 API 集成到他们的应用程序中以生成实时预测,并根据风险动态调整用户体验。
运行此数据块之后,我们收到下面几个模型评分结果。
我们在此检测器中有 1 个模型,它返回的评分为 933。根据我们创建的规则,这意味着我们认为此交易返回的是 high_fraud_risk。
我们再回到 Amazon Fraud Detector 控制台并查看检测器中的规则。
从检测器规则中,我们可以看到,如果风险评分超过 900,则结果应为 verify_customer。
循环到此完成!
现在,我们确认,您可以实时调用此检测器并获得自己的欺诈预测。
? 最后…
Amazon Fraud Detector 现已向客户全面推出,可以与很多 AWS 服务集成,例如 Amazon CloudWatch、AWS CloudTrail、AWS PrivateLink 等。
要了解 Amazon Fraud Detector 的更多信息,请访问网站和开发人员指南。
感谢阅读!
~Alejandra ??♀️? y Canela ?