python营销骗局_python案例:金融营销活动中欺诈用户行为分析

首先,数据导入

1 importnumpy as np2 importpandas as pd3 from collections importCounter4 importmatplotlib.pyplot as plt5 from pymining importitemmining,assocrules,perftesting,seqmining6 importpyecharts as pe7 rt=pd.read_csv(r"E:\transaction_train_new.csv",sep=",")8 ro=pd.read_csv(r"E:\operation_train_new.csv",sep=",")9 rtt=pd.read_csv(r"E:\tag_train_new.csv",sep=",")

然后,数据预处理与简单统计

1 #数据处理与简单统计

2 rt=pd.merge(rt,rtt)3 ro=pd.merge(ro,rtt)#把标签与行为合并方便结合标签分析行为

4 z1=ro.day.astype(np.str)5 z2=rt.day.astype(np.str)#把day转为字符串

6 ro.time=pd.to_datetime("2018-01-"+z1+" "+ro.time)7 rt.time=pd.to_datetime("2018-01-"+z2+" "+rt.time)#把time下面单纯的小时改为标准模式的时间

8 #统计用户总数,羊毛党数量,交易行为数,操作行为数

9 print(len(rtt.UID.values),len(rtt[rtt.Tag==1].UID.values),len(rt),len(ro))

其次,欺诈用户的一般特征分析。

从两个方面1,羊毛党通常事务性操作很少,交易性操作较多。2、羊毛党,通常会多个用户共用银行账户、各种设备等信息

1、#行为时序分析

plt.plot(ro[ro.Tag==1].groupby("day").size())

plt.plot(ro[ro.Tag==0].groupby("day").size())#查看两类用户的事务性数据操作

1723087-20190623180950641-1711719939.png

图中,蓝色为“羊毛党”,黄色为“普通用户。可见,羊毛党的事务操作较少,而交易性操作较多,即以尽可能少的成本获取尽可能多的利益

plt.plot(rt[rt.Tag==1].groupby("day").size())

plt.plot(rt[rt.Tag==0].groupby("day").size())#查看两类用户的交易性操作

1723087-20190623181036469-1736325133.png

2、多账户羊毛党行为分析

1 #多账号羊毛,多个账号公用银行帐号、各种设备号、手机

2 defcl(x):3 returnset(x.UID.values)4 z2=rt[rt.acc_id2.notnull()].groupby("acc_id2").apply(cl)#统计各转出账号acc_id2下的用户

5 p2=Counter(z2.apply(len).values)#acc_id2用户数量类别的计数

6 plt.loglog(p2.keys(),p2.values(),"o")#近似为幂函数曲线,数据明显存在问题

1723087-20190623182318858-489972349.png

1 #记录各acc_id2下用户数大于3的用户ID,疑似为羊毛党ID

2 z4=set([])3 for i inz2.values:4 if len(i)>3:5 z4=z4|i6 z5=set(rt[rt.Tag==1].UID.values)7 print(len(z4),len(z5),len(z4&z5))#查看预测的羊毛党数量,实际的羊毛党数量,预测对的羊毛党数量

845 3993 725

1 #同理分析某一标签x0下的用户,>x1的为疑似羊毛党

2 defu1(x0,x1):3 defcl(x):4 returnset(x.UID.values)5 z2=rt.groupby(x0).apply(cl)6 p2=Counter(z2.apply(len).values)7 plt.loglog(p2.keys(),p2.values(),"o")8 z4=set([])9 for i inz2.values:10 if len(i)>x1:11 z4=z4|i12 return [z4,len(z4),len(z5),len(z4&z5)]

定义函数u1(x0,x1)分析x0标签下,疑似为用户共用情况,共用用户数>x1则认为是羊毛党

在"acc_id1"”acc_id2“"acc_id3""device_code1""device_code2"下分析羊毛党行为

1 y1=u1("acc_id1",3)#以ip作为分析指标

2 y1[1:4]3 [845, 3993, 725]4 y2=u1("acc_id2",2)5 y2[1:4]6 [333, 3993, 322]7 y3=u1("acc_id3",3)#以ip作为分析指标

8 y3[1:4]9 [298, 3993, 287]10 de1=u1("device_code1",4)#以同-设备号上有>4个用户,疑似为羊毛党

11 de1[1:4]12 [1338, 3993, 809]13 de2=u1("device_code2",4)#手机品牌标签下的羊毛党分析

14 de2[1:4]15 [1023, 3993, 805]

最后,汇总分析这5个指标的筛选结果

1 w=y1[0]|y2[0]|y3[0]|de1[0]|de2[0]2 print(len(w),len(z5),len(w&z5))3 f0=len(w&z5)/len(w)4 f1=len(w&z5)/len(z5)5 f2=f0*f1*2/(f0+f1)6 print(f0,f1,f2)#仅仅用简单的条件就能达到0.4以上1967 3993 1282

0.6517539400101677 0.3210618582519409 0.4302013422818792

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/266534.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

你真的会数钱吗?

本文已迁移至:http://thinkinside.tk/2013/01/01/money.html 快年底了,假如你们公司的美国总部给每个人发了一笔201212.21美元的特别奖金,作为程序员的你, 该如何把这笔钱收入囊中? Table of Contents 1 美元&#xff…

Maven 系统环境变量配置

Download http://maven.apache.org/download.cgi http://mirrors.shu.edu.cn/apache/maven/maven-3/3.5.4/binaries/apache-maven-3.5.4-bin.zip 环境变量 1.添加 MAVEN_HOME: 变量名:MAVEN_HOME  变量值:C:\Program\apache-maven-3.5.4 注…

eclipse中文乱码解决_解决git status显示中文文件名乱码问题

使用 git status 查看本地有改动但未提交的中文文件名时,发现会显示为一串数字,没有显示中文的文件名。具体如下所示:$ git status# 位于分支 master# 尚未暂存以备提交的变更:# (使用 "git add ..." 更新要提交的内容)# (使用 &qu…

MongoDB 3.X 用户权限控制

摘要: MongoDB 3.0 安全权限访问控制,在添加用户上面3.0版本和之前的版本有很大的区别,这里就说明下3.0的添加用户的方法。 环境、测试: 在安装MongoDB之后,先关闭auth认证,进入查看数据库,只有…

java enum 变量_java枚举使用详解

package com.ljq.test;/*** 枚举用法详解** author jiqinlin**/public class TestEnum {/*** 普通枚举** author jiqinlin**/public enum ColorEnum {red, green, yellow, blue;}/*** 枚举像普通的类一样可以添加属性和方法,可以为它添加静态和非静态的属性或方法**…

c#小游戏_C#小游戏—钢铁侠VS太空侵略者

身为漫威迷,最近又把《钢铁侠》和《复仇者联盟》系列又重温了一遍,真的是印证了那句话:“读书百遍,其意自现”。看电影一个道理,每看一遍,都有不懂的感受~ 不知道大伙是不是也有同样的感受,对于…

VMware Workstation 虚拟机性能优化指南

我们经常使用虚拟机来体验各种新系统,做各类新鲜应用的测试,由于VMware Workstation虚拟机功能强大,又适用于最新的 Windows / linux /Sun等平台,而且操作方便,所以其普及率很高!而 VMware Workstation 本身…

pytorch已经安装成功了为什么不能使用import_使用auto keras的过程

成功安装的总结:1、创建环境名为mykeras、python版本为3.6的独立环境conda create --name mykeras python3.62、用pip安装 torch0.4.1(一定要指定版本,否者安装auto keras时报错)# Python 3.6 pip install https://download.pytor…

mysql可能锁的表命令_mysql 默许是表级锁一些不太常用命令

mysql 默认是表级锁一些不太常用命令1,mysql默认的是表级锁。如果是启用InnoDB存储引擎那么该数据库支持行级锁。2,查看数据库是否支持innodb的命令SHOW variables like "have_%";另一条命令SHOW ENGINES;更为准确。查看mysql数据库的详细信息…

python制作二级菜单_Python_简单三级菜单制作

一:制作要求 1.三级菜单  2.可依次选择进入各子菜单  3.所需新知识点:字典,列表 *本文通过三种方法完成,第一种:只使用循环,第二种:使用列表,第三种:使用字典 二:FlowChart流程图与上图对应,实现方式图解:while用来判断输入的数据和允许输入数据中的哪一项匹配,if来进行判断…

html5 js

2019独角兽企业重金招聘Python工程师标准>>> http://labs.hyperandroid.com/mathmayhem 转载于:https://my.oschina.net/u/201125/blog/100934

python画图如何调整图例位置_Python-如何将图例排除在情节之外

小编典典 有很多方法可以做你想要的。要添加inalis和Navi所说的内容,可以使用bbox_to_anchor关键字参数将图例部分地放置在轴外and/or 减小字体大小。 在考虑减小字体大小(这会使阅读起来非常困难)之前,请尝试将图例放在不同的位置…

Haproxy 与 Cookie

1 什么是cookie ? 参考 cookie http://baike.baidu.com/view/835.htm Cookie,有时也用其复数形式Cookies,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)。定义于RFC2109&#xff0…

python绘制三维地形_【学习笔记】Python科学计算三维可视化(黄天羽、嵩天)(学习中。。)|python基础教程|python入门|python教程...

0 导学 目的:掌握利用三维效果表达科学和工程数据的能力 传播一种思想:可视化技术是数据之眼内容组织: 流体数据的标量可视化、矢量可视化实例 三维扫描数据(模型/地形)可视化实例 三维地球场景可视化实例 曲线UI交互控…

在高科技产业当中,有时候你的产品出现了问题,你反过来可以把这个问题称为你的特点...

为什么80%的码农都做不了架构师?>>> 在高科技产业当中,有时候你的产品出现了问题,你反过来可以把这个问题称为你的特点。刚才讲的这种“大加小”的搭配就是属于这样的例子。by高通CEO保罗雅各布 看到这句话,深有感触…

-9 逆序输出一个整数的各位数字_【每日算法】基础算法——归并排序[求逆序对的数量](四)(思想很经典)...

题目内容给定一个长度为n的整数数列&#xff0c;请你计算数列中的逆序对的数量。逆序对的定义如下&#xff1a;对于数列的第 i 个和第 j 个元素&#xff0c;如果满足 i < j 且 a[i] > a[j]&#xff0c;则其为一个逆序对&#xff1b;否则不是。输入格式第一行包含整数n&am…

Raphael学习笔记(2)--绘图(基本图形)

为什么80%的码农都做不了架构师&#xff1f;>>> 1、图形简介 与html5不同&#xff0c;Raphael提供了以下基本图形&#xff1a;矩形、圆形、椭圆形&#xff08;html5只有矩形&#xff09;。 Paper.rect(x,y,width,height,r)&#xff1a;绘制矩形&#xff1b; 参…

java基础57 css样式、选择器和css定位(网页知识)

本文知识点&#xff08;目录&#xff09;&#xff1a; 1、CSS样式 2、选择器 3、CSS定位 1、CSS样式 1.html 在一个网页中负责的是一个页面的结构 2.css(层叠样式表)在一个页面中负责了一个页面的样式. css文档&#xff08;教程&#xff09;&#xff1a;http://www.w3…

电子计算机场地通用规范_最全的视频监控系统施工规范要求

前言&#xff1a;今天我们一起来看下监控施工详细规范步骤。可以参考一下&#xff0c;有些东西可能不符合你的项目要求&#xff0c;但是都可以做删减正文&#xff1a;一、工程设计、验收标准《城市道路设计规范》 CJJ37-90《城市道路交通规划设计规范》GB50220-95 《道路交通标…

Intent的一些用法

2019独角兽企业重金招聘Python工程师标准>>> Intent用法实例 1.无参数Activity跳转 Java代码 Intent it new Intent(Activity.Main.this, Activity2.class); startActivity(it); 2.向下一个Activity传递数据&#xff08;使用Bundle和Intent.putExtras&#x…