python改变列的数据类型_python – Pandas:更改列的数据类型

您可以使用

pd.to_numeric(在版本0.17中引入)将列或Series转换为数字类型。该函数还可以使用apply应用于DataFrame的多个列。

重要的是,该函数还接受一个错误关键字参数,它允许您强制非数字值为NaN,或者简单地忽略包含这些值的列。

示例使用如下所示。

单列/系列

这里有一个使用一系列字符串的例子,它有一个对象dtype:

>>> s = pd.Series(['1', '2', '4.7', 'pandas', '10'])

>>> s

0 1

1 2

2 4.7

3 pandas

4 10

dtype: object

该函数的默认行为是,如果它不能转换一个值。在这种情况下,它不能处理字符串’熊猫’:

>>> pd.to_numeric(s) # or pd.to_numeric(s, errors='raise')

ValueError: Unable to parse string

而不是失败,我们可能想要“熊猫”被认为是一个缺失/坏值。我们可以强制无效值到NaN,如下所示:

>>> pd.to_numeric(s, errors='coerce')

0 1.0

1 2.0

2 4.7

3 NaN

4 10.0

dtype: float64

第三个选项只是在遇到无效值时忽略操作:

>>> pd.to_numeric(s, errors='ignore')

# the original Series is returned untouched

多列/整个DataFrames

我们可能希望将此操作应用于多个列。依次处理每一列是乏味的,所以我们可以使用DataFrame.apply使该函数对每一列起作用。

借用DataFrame的问题:

>>> a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']]

>>> df = pd.DataFrame(a, columns=['col1','col2','col3'])

>>> df

col1 col2 col3

0 a 1.2 4.2

1 b 70 0.03

2 x 5 0

然后我们可以写:

df[['col2','col3']] = df[['col2','col3']].apply(pd.to_numeric)

现在“col2”和“col3”根据需要具有dtype float64。

但是,我们可能不知道哪些列可以可靠地转换为数字类型。在这种情况下,我们可以写:

df.apply(lambda x: pd.to_numeric(x, errors='ignore'))

然后该函数将应用于整个DataFrame。可以转换为数字类型的列将被转换,而不能(例如,它们包含非数字字符串或日期)的列将被单独保留。

还有用于转换为日期和时间戳的pd.to_datetime和pd.to_timedelta。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/543088.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux纯内核直接用吗,Linux:为啥内核有的变量没有初始化就敢直接使用?

一、问题为啥内核有的变量没有初始化就敢直接使用?二、分析看上图,其中的5747行的变量nid的确没有定义,就直接使用了,这么做没有问题吗?其实大家仔细看一下,5765行是一个宏,到内核源码去找该宏的…

mysql主从复制实践之单数据库多实例

1.主从复制数据库实战环境准备MySQL主从复制实践对环境的要求比较简单,可以是单机单数据库多实例的环境,也可以是两台服务器之间,每台服务器都部署一个独立的数据库的环境。本文以单机数据库多实例的环境进行实践。2.主从复制服务器角色定义序…

sdr 软件_【火腿专题】购买软件定义无线电(SDR)还是传统无线电台?追求欲望无止境...

软件定义无线电与传统无线电选择作者:Onno VK6FLAB有一段时间,我一直在解释软件无线电(SDR)的一些内部工作方式是如何运作的,以便深入了解原因和方法的细节。这种探索是在一个新世界的背景下进行的,在这个世界里,有无数…

linux文本运行层次,Linux基础知识之---文件系统层级结构

#Linux基础知识之---文件系统层级结构(Linux系统)[基础知识,文件系统,层级结构,FHS]一切皆文件: 在Linux中,无论是目录、配置、cpu、内存、键盘、鼠标、或者运行中的系统及内核、甚至临时缓存也都有对应的文件。“一切…

python的format函数如何理解_python format函数的使用

转载自:http://www.cnblogs.com/kaituorensheng/p/5709970.htmlpython自2.6后,新增了一种格式化字符串函数str.format(),威力十足,可以替换掉原来的%注:以下操作版本是python2.7映射示例语法通过{} 和 : 替换 %通过位…

Linux查询root环境变量,linux环境变量和查看方法

linux环境变量和查看方法1. 显示环境变量HOME[rootlocalhost ~]# echo $HOME/root2. 设置一个新的环境变量hello[rootlocalhost ~]# export HELLO"hello world"[rootlocalhost ~]# echo $HELLOhello world附:修改已存在的环境变量[rootlocalhost ~]# HELL…

服务器搭建-Linux基础知识

服务器搭建还是需要一些Linux知识的,这节就聊点基础的。 文件权限操作 查看权限 Linux中每个文件对每个用户来说都有对应的权限,在任一路径中输入ll就可以查看这些信息: rootip-*** /usr/local # ll total 32K drwxr-xr-x 2 root root 4.0K J…

seo从入门到精通_从入门到精通,新人必看的3本书SEO书籍

SEO入门书本引荐:从入门到通晓,新人必看的3本书在这个网上学习泛滥的年代,很多人都习气在网络上找教程学习,无论上视频教程,学习论坛,或是网上课堂等等。但也有些人仍是更习气看书学习的,很多人…

linux firefox 脚本,linux下调整firefox的有用设置(高分辨率下需要)

注:自己一般比较喜欢opensuse,所以以下所说皆是在opensuse下的做法,在其他发行版下应该也差不多firefox69 默认禁用了userchrome.css,需要把about:config 中的选项toolkit.legacyUserProfileCustomizations.stylesheets设置为true界面字体大小…

读懂python代码_Python面试|一文让你读懂if __name__==’__main__’的含义

程序入口对于很多编程语言来说,程序都必须要有一个入口,比如 C,C,以及完全面向对象的编程语言 Java,C# 等。如果你接触过这些语言,对于程序入口这个概念应该很好理解,C 和 C 都需要有一个 main …

C语言程序设计第三节课作业

1 指针是一个存储计算机内存地址的变量。从指针指向的内存读取数据称作指针的取值。指针可以指向某些具体类型的变量地址,例如int、long和double。指针也可以是void类型、NULL指针和未初始化指针。根据出现的位置不同,操作符 * 既可以用来声明一个指针变…

linux netcat测试udp端口,使用nc(netcat)测试udp协议与端口连通性

[v1.10]connect to somewhere: netcat [-options] hostname port[s] [ports] …listen for inbound: netcat -l -p port [-options] [hostname] [port]options:-g gateway source-routing hop point[s], up to 8-G num source-routing pointer: 4, 8, 12, …-h this cruft-i se…

Hession矩阵与牛顿迭代法

1、求解方程。 并不是所有的方程都有求根公式,或者求根公式很复杂,导致求解困难。利用牛顿法,可以迭代求解。 原理是利用泰勒公式,在x0处展开,且展开到一阶,即f(x) f(x0)(x-x0)f(x0) 求解方程f…

抽象工厂模式_设计模式——抽象工厂模式

阅读目录使用频率:★★★★★一、什么是抽象工厂模式二、补充说明三、角色四、例子使用频率:★★★★★一、什么是抽象工厂模式就是对一组具有相同主题的工厂进行封装(维基百科解释的很到位);例如:生产一台PC机,使用工…

Linux启动和退出系统的方法,实验二 Linux的启动与关闭

实验二 Linux的启动与关闭一、实验目的(1)掌握linux操作系统正确的启动与关闭方法;(2)理解系统运行级的概念,掌握查看和设置的方法;(3)理解系统运行级服务的概念,掌握查看、开启和关闭的方法;(4)理解LILO和GRUB的原理&…

linux需要什么基础,学linux需要什么基础?

近几年来,随着计算机网络的发展,越来越多的人学习 linux。对于想要从事运维工作或者从事智能开发方面的同学来说,学习 linux 是必要的。linux 的学习并不简单,那么这篇文章 w3cschool 小编来告诉你,学 linux 需要什么基…

python arima模型_Python时间序列处理之ARIMA模型的使用讲解

ARIMA模型ARIMA模型的全称是自回归移动平均模型,是用来预测时间序列的一种常用的统计模型,一般记作ARIMA(p,d,q)。ARIMA的适应情况ARIMA模型相对来说比较简单易用。在应用ARIMA模型时,要保证以下几点:时间序列数据是相对稳定的&am…

windows(win7,win8,xp)hosts文件找不到原因分析及解决方法

2019独角兽企业重金招聘Python工程师标准>>> 一般情况hosts文件是保存在C:\windows\System32\Drivers\Etc 文件夹上,由于安装是win7系统,在这个路径上就能找到这个hosts文件。如果你在该路径下没有找到这个文件的话,一般是以下几种…

linux虚拟化cpu的绑定,为虚拟机vCPU绑定物理CPU

使用taskset命令将vCPU线程绑定到指定的物理CPU。例如,某虚拟机的qemu进程及两个vCPU线程如下: ​[rootkelvin ~]# ps -eLo ruser,pid,ppid,lwp,psr,args | grep qemu | grep -v greproot 4706 3629 4706 1 qemu-system-x86_64 -m 2G -smp 2 /var/lib/li…

sql 显示百分比_轻松搞定数据分析之SQL——简单查询

每天早起或者睡前听一首温柔而美好的音乐,是一件很幸福的事情,无论你是否懂音乐,它都能带你发现生活中的隐藏的那些美好,今天我们先来一起欣赏Mindy Gledhill的单曲《California》California (网易云音乐),每次我听到这首歌&#…