关联规则挖掘在大数据中的应用非常广泛,很多分析工具擅长用关联规则算法来分析数据,最经典的案例就是能通过买奶粉的客户推算出有可能购买安全座椅来相关,数据分析中方方面面的因素有好多,像目前市场中关于母婴市场,汽车销售,医疗保健,WEB安全方面对于隐私保护的研究,我在这里跟大家讲解下算法的关联性以及未来防护隐私保护的重要性。
使用Apriori算法发现频繁项集。扫描数据集,得到所有出现的数据,作为候选人1项集。挖掘频繁k项集,扫描计算候选k项集的支持度,删除候选k项集中支持度低于最小支持度α的数据集,获得频繁k项集。如果频繁k项集为空,则返回频繁k-1项集作为算法结果,算法结束。基于频繁k项集,链接生成候选k+1项集。使用步骤2,迭代得到k=k+1集结果。
当前关联算法的应用场景。
1)互联网推荐。
个性化推荐:在界面上向用户推荐相关产品。
组合优惠券:向购买过的用户发放同时购买组合内商品的优惠券。
捆绑销售:将相关商品组合销售。
2)线下门店分析。
商品配置分析:哪些商品可以一起购买,如何展示/促销相关商品。
客户需求分析:分析客户的购买习惯/时间/地点等。
3)金融保险。
通过购物车分析,可以设计不同的服务组合来扩大利润;通过购物篮分析,可以发现可能不寻常的保险组合并进行预防。
4)风险控制领域。
同时分析行动账号,寻找有效的战略组合。