2024全国大学生数据统计与分析竞赛B题【电信银行卡诈骗的数据分析】思路详解

电信诈骗是指通过电话、网络和短信方式,编造虚假信息,设置骗局,对受害人实施远程、非接触式诈骗,诱使受害人打款或转账的犯罪行为,通常以冒充他人及仿冒、伪造各种合法外衣和形式的方式达到欺骗的目的,如冒充公检法、商家公司厂家、诈骗。国家机关工作人员、银行工作人员等各类机构工作人员,伪造和冒充招工、婚恋、贷款、中奖、手机定位和招嫖等形式进行。近年来,在党和国家的领导下,公安部门聚焦人民群众深恶痛绝的电信网络诈骗,全面加强“四专两合力”建设,组织全国的公安机关深入推进打防管控各项工作,有效遏制了案件快速上升势头,有力维护了人民群众合法权益。
当前,电信网络诈骗犯罪形势依然严峻,刷单返利、虚假网络投资理财、虚假网络贷款、冒充电商物流客服、冒充公检法、虚假征信等 10 种常见诈骗类型发案占比近 80%,其中刷单返利类诈骗发案率最高,占发案的三分之一左右,虚假网络投资理财类诈骗造成损失的金额最大,占造成损失金额的三分之一左右。附件中提供了 100 万条使用电信银行卡交易的相关数据。
请你们团队使用附件中的相关数据,进行数据统计与分析,回答下列问题:
问题一:请绘制附件中“有无发生电信银行卡诈骗”比例的扇形图,并绘制发生电信银行卡诈骗的案例中,“线上”和“线下”发生电信诈骗数量的柱状图。

精力有限,以下只是简略的图文版初步思路,更详细的视频版完整讲解请移步:

2024全国大学生数据统计与分析竞赛选题建议及详细思路!_哔哩哔哩_bilibili

问题一:

1. 绘制“有无发生电信银行卡诈骗”比例的扇形图

步骤

§ 读取数据集,提取“Fraud”列。

§ 计算“Fraud”列中1和0的比例。

§ 使用饼图绘制诈骗比例。

代码编写:

完整思路讲解:

数模陪跑:2024全国数据统计与分析竞赛更新汇总贴1 赞同 · 0 评论文章

2. 绘制“线上”和“线下”发生电信诈骗数量的柱状图

步骤

§ 筛选出Fraud列为1的数据,分别统计Online列中1和0的数量。

§ 使用柱状图绘制线上和线下的诈骗数量。

代码编写:

问题二:请通过数据分析发生电信诈骗的案例中,“是否使用银行卡在设备上进行转账交易”和“是否使用银行卡的 pin 号码进行转账交易”的指标,判断哪种情况更容易发生电信诈骗?使用银行卡的pin 号码是否可以减少被骗概率?
问题三:请分析所有发生电信诈骗的案例中,哪些指标与是否发生电信诈骗有较强的相关性?“银行卡转账交易是否发生在同一银行”和“是否是线上的银行卡转账交易”是否与电信银行卡诈骗有显著的关联性?

问题二:

1. 分析“是否使用银行卡在设备上进行转账交易”和“是否使用银行卡的pin号码进行转账交易”与电信诈骗的关联性

步骤

§ 提取数据中Card和Pin列,结合Fraud列,统计不同情况下的诈骗比例。

§ 比较两种情况下的诈骗比例,判断哪种情况更容易发生电信诈骗。

问题三:

1. 分析哪些指标与是否发生电信诈骗有较强的相关性

步骤

§ 计算所有指标与Fraud列之间的相关系数。

§ 选择相关系数较大的指标进行分析。

2. 分析“银行卡转账交易是否发生在同一银行”和“是否是线上的银行卡转账交易”与电信诈骗的关联性

步骤

§ 分别计算Repeat和Online与Fraud的相关性。

代码编写:

问题四:请分析附件中所有的指标数据,选取合适的指标,建立“电信银行卡诈骗的预测模型”,并选取合适的训练集和测试集,计算预测模型的准确率。为了降低电信诈骗的概率,保护人们的财产安全,请基于你们团队数据分析的结果,分别给公安部门、银行和市民们提出你们的建议。

问题四:

1. 建立“电信银行卡诈骗的预测模型”

步骤

§ 数据预处理:处理缺失值、标准化数据等。

§ 特征选择:选择相关性较高的特征。

§ 划分训练集和测试集。

§ 选择模型:如逻辑回归、决策树等。

§ 训练模型并评估准确率。

OK,上述思路的文档领取、视频讲解以及后续的完整成品论文预定请点击我的下方个人卡片查看↓:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/24668.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C# 异步方法async / await 任务超时处理

一、需求 如果调用一个异步方法后,一直不给返回值结果怎么办呢?这就涉及到怎么取消任务了。 二、Task取消任务 static CancellationTokenSource source new CancellationTokenSource();static void Main(string[] args){Task.Run(() >{for (int i …

Responder工具

简介 Responder是一种网络安全工具,用于嗅探和抓取网络流量中的凭证信息(如用户名、密码等)。它可以在本地网络中创建一个伪造的服务(如HTTP、SMB等),并捕获客户端与该服务的通信中的凭证信息。 Responder工…

路由器作为网络扩展器——设置桥接、路由模式

下面提到的路由器都是家用路由器 一、有线桥接(交换模式) 1.连接示意图 (副路由器只看交换模式部分) 副路由器充当交换机的角色 二、无线桥接(与有线类似) (副路由器的无线信号 连接 主路由器的无线信号) 三、路由模式 1.连接示意图 (副路由器只看…

扩散模型条件生成——Classifier Guidance和Classifier-free Guidance原理解析

1、前言 从讲扩散模型到现在。我们很少讲过条件生成(Stable DIffusion曾提到过一点),所以本篇内容。我们就来具体讲一下条件生成。这一部分的内容我就不给原论文了,因为那些论文并不只讲了条件生成,还有一些调参什么的…

【时序约束】一些关于io输入输出时序约束的实际的参考示例1

在FPGA设计中,I/O输入输出时序约束是确保信号完整性和时序准确性的重要步骤。以下是一些实际的参考示例,展示了如何使用set_input_delay和set_output_delay命令,并提供了如何确定具体约束值的方法。 示例 示例1:输入时序约束 假…

Java数据结构与算法(最大子数组和动态规划)

前言 动态规划主要用于解决具有重叠子问题和最优子结构性质的问题。它通过将问题分解为子问题来解决复杂问题,每个子问题仅解决一次,并将其结果存储,以供后续使用,从而避免了重复计算。 对应leetcode. - 力扣(LeetCo…

Linux统计目录和文件数目

当在终端执行 ls | wc 命令时,ls 命令列出了当前目录中的文件和目录,然后通过管道 | 将输出传递给 wc 命令进行计数。 wc 命令的默认输出包括三列: 行数(lines):这通常是文件和目录的总数,但注…

【python】python电影评论数据抓取分析可视化(源码+数据+课程论文)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉公众号👈:测试开发自动化【获取源码商业合作】 👉荣__誉👈:阿里云博客专家博主、5…

PVc是k8s的什么?

**PVC(PersistentVolumeClaim)是Kubernetes(k8s)中的持久化存储卷声明**。它是用户对存储的请求,类似于Pod消耗节点资源的方式,PVC则消耗PV(Persistent Volume,持久化卷)…

探索教研在线平台的系统架构

教研在线平台作为一家致力于教育技术领域的企业,其系统架构扮演着至关重要的角色。本文将深入探讨教研在线平台的系统架构,从技术架构、数据架构和安全架构等方面进行分析,以期帮助读者更好地理解这一教育科技平台的运作模式。 技术架构是教研…

银河麒麟操作系统通过首批软件供应链安全能力认证

麒麟软件产品供应链安全能力获双重肯定!5月30日,经北京赛迪认证中心评估,银河麒麟高级服务器操作系统V10和银河麒麟桌面操作系统V10成为首批获得软件供应链安全能力认证产品,并在操作系统类产品中名列前茅。 软件供应链安全能力评…

常用的国内外公共DNS服务

DNS介绍 DNS(全称:Domain Name Service,域名系统),是互联网的核心服务之一,将便于记忆的网址(域名)和不便记忆的IP地址相互对应,方便普通用户更便捷地访问互联网。 通常…

MP4文件格式

ISO 协议族 ISO/IEC-14496:MPEG-4 协议族,包括 ISO 容器格式、MPEG-4(H.264)视频压缩标准等。ISO/IEC-23008:MPEG-H 协议族,包括 H.265(HEVC)视频压缩标准等。字段类型含义ISO/IEC-14496-1SystemMPEG-4 的复用、同步等系统级特性ISO/IEC-14496-2Video视频压缩标准ISO/I…

一些JVM面试题

Java垃圾回收器的原理 有三对常见的垃圾回收器: 在JDK1.8之前,有三种常见的垃圾回收器, serial serialOld 串行化的垃圾回收 PS PO 多线程并行回收,可以动态调整堆内存的大小,关注系统的吞吐量 ParNew CMS Par…

getifaddrs 函数详解

getifaddrs 函数用于获取系统中所有网络接口的信息。它返回一个链表,链表中的每个节点包含一个 struct ifaddrs 结构,该结构定义在 ifaddrs.h 头文件中。下面是关于 getifaddrs 函数和 struct ifaddrs 结构的详细解析: 1. getifaddrs 函数 …

Github 2024-06-07开源项目日报 Top10

根据Github Trendings的统计,今日(2024-06-07统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Python项目3C++项目3JavaScript项目2Jupyter Notebook项目1TypeScript项目1Vue项目1比特币核心:开源比特币软件 创建周期:4919 天开发语言:C…

09-spring的bean创建流程(一)

文章目录 spring中bean的创建流程finishBeanFactoryInitialization(beanFactory)beanFactory.preInstantiateSingletons();getMergedLocalBeanDefinition(beanName);流程实现FactoryBean接口,里面的对象实例化过程 spring中bean的创建流程 finishBeanFactoryInitialization(be…

HPUX系统Oracle RAC如何添加ASM磁盘

前言 HPUX简介 HP-UX (Hewlett-Packard Unix) 是惠普公司开发的类 Unix 操作系统。自 1980 年代问世以来,HP-UX 在技术和功能上不断发展,适应了多种硬件平台和企业计算需求。以下是 HP-UX 的发展历史概述: 1980 年代:起源与早期…

webflux 拦截器验证token

在WebFlux中,我们可以使用拦截器(Interceptor)来验证Token。以下是一个简单的示例: 1. 首先,创建一个名为TokenInterceptor的类,实现HandlerInterceptor接口: java import org.springframewor…

【Unity UGUI】Screen.safeArea获取异形屏数据失败

Screen.safeArea获取不到异形屏的尺寸位置等数据 检查AndroidManifest.xml文件是否有设置:android:theme"style/UnityThemeSelector",没有加上即可 android:theme"style/UnityThemeSelector"