woe分析_Python数据分析—apply函数

在对海量数据进行分析的过程中,我们可能要把文本型的数据处理成数值型的数据,方便放到模型中进行使用。也可能需要把数值型的数据分段进行处理,比如变量的woe化。而这些操作都可以借助python中的apply函数进行处理。

今天介绍数据分析的第四课,教大家如何在python中用apply函数对数据框进行一些复杂一点的操作。

本文目录
  1. 把字符型的数据处理成数值型

  2. 把数值型的数据分段处理

注意:本文沿用数据分析第一课【Python数据分析—数据建立】里的数据框date_frame:

6c742f7bbb2d78ef98cb705acd171432.png

 1   把字符型的数据处理成数值型

假设要在原数据框中把性别这一列,”男“字符替换成1、“女”字符替换成0,并生成一个新列。首先,可以自定义一个替换函数。具体语句如下:
def replace_gender_to_num(val):    if val=='男':        return 1    else:        return 0
然后用apply函数调用该函数,具体语句如下:
date_frame.gender.apply(replace_gender_to_num)
得到结果如下:

89bd60f8531a53dc378735d2304ada42.png

至此,原gender列中“男”字符替换成1,“女”字符替换成0。把该列加入到原数据框中去,具体语句如下:
date_frame['new_gender'] = date_frame.gender.apply(replace_gender_to_num)
得到结果如下:

d048454ed8cf7d165eeaf3281c409296.png

可以发现性别为男,在new_gender中对应值为1,性别为女在new_gender中对应值为0。

 2   把数值型的数据分段处理

在建模过程中,要把不同分段的值转化成对应的woe,需要用到apply函数进行处理。类似的,在这个实例中假设要把身高高于1.8的同学当成第一类,身高高于1.65的当成第二类,其余的同学当成第三类。可以定义一个如下转换函数:
def height_to_class(val):    if val>=1.8:        return 1    elif val>=1.65:        return 2    else:        return 3
然后用apply函数调用该函数,并把得到的结果值保存到原数据框中去,具体语句如下:
date_frame['heigth_class'] = date_frame.height.apply(height_to_class)
得到结果如下:

1b77e5e70173a4c3aab90561d70e3cbc.png

至此,在python中应用apply函数进行数据处理已介绍完毕,大家可以动手练习一下,思考一下apply函数还有没有别的用途660dcafd34542d90fb46a38c176fb1af.png

往期回顾:3D星空图3D星空图V2版520表白代码合集用python绘制皮卡丘

娱乐圈排行榜动态条形图绘制

ab52ac883aa808591e1213104d91911c.png

b49520195b9d74203ac6cac3cb87902e.png

扫一扫关注我

19967879837

投稿微信

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/380971.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

树莓派3b安装ubuntu mate(在有显示器前提下看)

树莓派安装: 准备材料 tf卡(建议16G)数据线树莓派win32烧录软件 ,百度云链接:链接:https://pan.baidu.com/s/16Dq2XrqeJScUO_DxHRIz_g 提取码:kfkbubtuntu mate系统(建议不要下ubu…

打包mac应用_把网址链接打包成电脑软件的制作方法

前言:学习一下把web页面打包成运行在桌面的应用, 并支持win / mac / linux 等平台, 记一下使用过程, 有需要的大(同)佬(学)可以玩玩~第一步 – 安装 node.jsnode.js下载地址:http://nodejs.cn/download/下载 Windows 安装包 (.msi) 和 Windows 二进制文件…

对多个WCF服务进行统一的连接测试

先看下面的代码&#xff1a;代码代码 BasicHttpBinding myBinding newBasicHttpBinding(); EndpointAddress myEndpoint newEndpointAddress(endAddress); ChannelFactory<IMyService>myChannelFactory newChannelFactory<IMyService>(myBinding,my…

宜昌宝塔河项目_宜昌城区首个垃圾分类定时定点投放点启用 厨余垃圾破袋投放...

伍家岗区宝联社区黄龙小区的垃圾分类定时定点投放点启用。(市环境卫生管理处供图)(记者郑璐、通讯员陈赞)1月1日&#xff0c;宜昌城区首个垃圾分类定时定点投放点在伍家岗区宝塔河街办宝联社区黄龙小区正式启用。该投放点每天开放5小时&#xff0c;上午7&#xff1a;00-9:30&am…

装配图位置偏转怎么调整_物理微课|匀变速直线运动、电容器动态分析及磁偏转技巧、方法、模型...

匀变速直线运动三大推论是什么&#xff1f;如何利用它们快速解题&#xff1f;电容器动态分析的重点是什么&#xff1f;磁偏转问题有什么严谨好用的技巧和方法&#xff1f;物理侯老师为您详细解答以上问题。高一匀变速直线运动三大推论 匀变速直线运动是我们高中学的第一个变速…

Cooki模拟登陆(人人网)

我们在爬取网上一些数据时&#xff0c;必须登陆才能爬取到数据&#xff0c;这是我们就需要Cookie了&#xff0c;Cookie简单说就是服务器返回给我们的一些数据&#xff0c;保存到客户端&#xff0c;下次登陆时&#xff0c;服务器会识别这些数据&#xff0c;可以返回我们上次的数…

基本图形怎么改字体_PPT做得慢怎么办?掌握这6个技巧,你也能快速做出精美的PPT...

相信很多人做PPT的速度都比较慢&#xff0c;从新建一个空白PPT开始&#xff0c;再到排版设计&#xff0c;需要耗费大量的时间&#xff0c;下面就来教你这6个技巧&#xff0c;你也能快速做出精美的PPT。01.一键禁止动画最近&#xff0c;有很多小伙伴向我求助&#xff0c;问我怎样…

三菱880彩铅和uni的区别_孟祥雷丨清华美院毕业,彩铅界的“冷军”(附彩铅教程哦!)...

今天要分享的是妥妥的一个高冷帅气、又有才华的艺术家&#xff0c;毕业于清华大学美术学院。有20多年的绘画经验&#xff0c;设计、绘画等艺术多面手&#xff0c;彩铅是他最出名的作品之一。人物篇(逆光)(麻花辫)用彩铅画肖像人物的人很多&#xff0c;但能把人物塑造得维妙维俏…

substring()分解字符串

substring解决了如何在指定位置将一个字符串划分为子串 单参数形式&#xff1a;返回从起始位置到结尾之间的子串**&#xff08;起始索引从0开始&#xff09;** public class SubStringReview {public static void main(String[] args) {String s "Java is great";…

11g oracle xe启动_详解Oracle等待事件的分类、发现及优化

一、等待事件由来大家可能有些奇怪&#xff0c;为什么说等待事件&#xff0c;先谈到了指标体系。其实&#xff0c;正是因为指标体系的发展&#xff0c;才导致等待事件的引入。总结一下&#xff0c;Oracle的指标体系&#xff0c;大致经历了下面三个阶段&#xff1a;以命中率为主…

StringTokenizer将一个字符串分解为单词或者标记

原理&#xff1a;StringTokenizer方法实现了Iterator的设计模式&#xff0c;也直接实现了枚举接口&#xff0c;通常情况下StringTotkenizer对象根据欧洲语言的单词分割将对字符串分解为若干单词&#xff0c;例如&#xff1a; public class StringTokenizerReview {public stat…

hystrix 单独使用_Hystrix学习

学习主题&#xff1a;Hystrix解决灾难性雪崩效应-服务熔断-服务熔断处理熔断参数circuitBreaker.enabled的作用是什么&#xff1f;熔断参数circuitBreaker.requestVolumeThreshold的作用是什么&#xff1f;熔断参数circuitBreaker.sleepWindowInMiliseconds的作用是什么&#x…

WebClient与WebRequest差异

WebRequst的使用 WebClient和HttpWebRequst是用来获取数据的2种方式&#xff0c;在我的这篇数据访问(2)中主要是讲的WebClient的使用&#xff0c;一般而言&#xff0c;WebClient更倾向于“按需下载”&#xff0c;事实上掌握它也是相对容易的&#xff0c;而HttpWebRequst则允许你…

连接字符串

方式一&#xff1a;可以使用运算符**“”**来连接字符串 public class StringBufferReview {/*** 方式一&#xff1a;使用连接* param args*/public static void main(String[] args) {String s1 "hello";String s2 "Java";String s3 s1s2;System.out.…

的使用_面部精华使用方法和使用步骤;

核心提示&#xff1a;精华液&#xff0c;是护肤品中之极品&#xff0c;成分精致、功效强大、效果显著&#xff0c;始终保持着它拥有的高贵和神秘。精华液中的基质是水&#xff0c;含有硅树脂&#xff0c;有利于渗透进皮肤和推开&#xff0c;其它添加成分&#xff0c;则带有治疗…

处理字符串中的单个字符CharAt()

1、解决方法&#xff1a;采用循环以及String类的charAt()方法 charAt()方法将返回String对象中索引值**&#xff08;从0开始&#xff09;**位置的字符。所以&#xff0c;我们只需要执行从0到String.length()-1的循环&#xff0c;就能够依次处理字符串中的所有字符。 注意&#…

Acer Travelmate T3290笔记本拆机指南

中午闲来无事&#xff0c;把永哥的笔记本拆了&#xff08;Acer Travelmate某款&#xff0c;很老的机器了&#xff09;。整个过程有惊无险&#xff0c;也没拍照片&#xff0c;大体说下拆机流程吧&#xff0c;如果有人要拆该系笔记本可以参考。 先卸电池。拿掉诸如读卡器盖&#…

解决VS2013中出现类似于error C4996: 'scanf': This function or variable may be unsafe的安全检查错误

禁用安全检查&#xff0c;一步到位&#xff01; 参考URL&#xff1a;https://blog.csdn.net/dan15188387481/article/details/49622783

横向全屏滑动插件_【案例】JQuery横向手风琴图片轮播切换代码

点击上方[我分享我快乐]→[...]右上角→[设为星标⭐]即可第一时间获取最新设计资源哈喽大家好&#xff0c;又到了每周二经典案例环节啦~同学们还想了解哪些网页知识今天段老师给同学们带来的是JQuery横向手风琴图片轮播切换代码。01脚本简介jQuery实现水平手风琴图片轮播切换特…

将字符串全部转为大写或者小写

1、全部转大写&#xff0c;使用toUpperCase()方法&#xff1b;全部转小写&#xff0c;使用toLowerCase()方法 public class StringUpperAndLowerReview {public static void main(String[] args) {String s "Hello jaVa";System.out.println(s.toUpperCase());Syst…