基于物联网移动支付风险的安全解决方案



    基于移动互联网的线下支付、保险、理财等新型金融服务发展迅速,互联网金融业不断取得

突破和创新。与此同时,潜伏在网络阴影下的黑产品势力也在不断升级,威胁着整个行业,其

中信息泄露导致的电子账户安全问题最为严重,而且趋势越来越糟糕。被黑客窃取的用户信息

包括社保号、地址、信用卡信息等。,而这些泄露的信息被用来试图登录盗取账户资金或盗取

银行卡,直接导致银行和第三方支付公司用户的大量经济损失。如何更好地利用海量交易数据

和有限样本识别迁移中的黑产方式,从而高效准确地识别交易风险,是人工智能和大数据在控

风场景下需要不断解决的技术问题。
 
 
 
在此背景下,此次竞赛希望聚焦信息泄露引发的账户安全威胁,收集最智能的行业安全解决方

案,引领互联网风险控制核心技术的发展。此次大赛将提供一段时间内有正反标识的支付行为

样本和无标识的支付行为样本组成的训练数据集,以及一段时间后一定时间范围内有正反标识

的支付行为样本组成的测试数据集,数据集已经过严格处理。竞争数据为支付宝交易数据,根

据历史交易(17.09-17.10)中的欺诈情况预测未来交易行为(18.02)的欺诈情况。评价指标是反欺

诈评价指标的覆盖率。
 
 
 
以下是此次大赛的原创特色,可以看出基本都来自设备信息。在这场大赛中,数据具有以下特

点,我们需要根据数据的特点提出有针对性的处理方案。从图中可以看出,数据样本的标识类

别极不均衡,缺失值也不均衡,欺诈率与缺失值的关系明显。无论是机器学习还是深度学习,

都需要有一个合适的应用场景。熟悉it中的业务知识可以更快或更好地制作模型。我们根据事

务的业务对字段进行排序和分类,然后从业务的角度在多个维度上构建特性。
 
 
从多个维度和角度思考特征,思考欺诈交易中通常出现的变化和异常。考虑到多维度,我们

做了以下特征作为基本特征、信息验证、用户行为、即时特征、设备特征、时间特征、IP属性

特征、收款人特征。其实可以看出成交量是周期性变化的。训练集中有两个完整月的数据,测

试集中有一个完整月的数据。为了充分利用数据,保证训练验证测试的一致性,我们每月将训

练集和测试集拆分在同一个结构中,分别制作off_val,然后分别对测试集进行预测,以便更好

地根据周期进行训练和预测。由于半决赛在线平台训练速度太慢,拆分预测也是一种更合理的

充分利用数据的方式。
分享: