python如何读取csv文件某几行某几列_关于python:读取.csv文件时,我似乎无法指定列dtypes...

本问题已经有最佳答案,请猛点这里访问。

一个菜鸟问题(修订):我读了一个.csv文件,并尝试按以下方式指定dtypes:

1

2

3

4

5

6

7

8

9

10

11

12

13

14import csv

import pandas as pd

cdc = pd.read_csv('myFile.csv',

dtype = {

'Phenotype': str,

'State': str,

'EventType': str,

'EventYear': str,

'AgeCategory': str,

'NumberTested' : str,

'NumberResistant': str,

'PercentResistant': str

})

但是在读取df文件后,我得到:

1

2

3

4

5

6

7

8

9

10df.dtypes

Phenotype object

State object

EventType object

EventYear object

AgeCategory object

NumberResistant object

PercentResistant object

dtype: object

我以为我会为每列获取字符串的dtypes。

我希望将每一列都读为字符串,因为有些列包含数字和字符串的混合,正如您将在.csv示例文件中看到的那样。读完文件后,我就可以开始操纵该死的东西了!

底线:我想清理数据行,并用NaN或零代替" None Tested"和" Not Defined"。无论如何,我无法通过"对象"做到这一点。

仅供参考,我已将.csv作为df读入,但没有'dtype'参数,但遇到了同样的问题。读取没有指定dtypes的文件后,我尝试从现有列创建一个新的整数列,但是'object'dtype似乎也妨碍了这种情况。

我被卡住了。我环顾四周,似乎无法自己弄清楚。

此处的示例输入.csv文件:(行之间没有多余的行,我只是试图使行更具可读性)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19Phenotype,State,EventType,EventYear,AgeCategory,NumberTested,NumberResistant,PercentResistant

Acinetobacter,AK,All HAIs,2011, 1-18,2,1,0.5

Acinetobacter,AK,CAUTI,2011, 1-18,0,None Tested,Not Defined

Acinetobacter,AK,CLABSI,2011, 1-18,0,None Tested,Not Defined

Acinetobacter,AK,SSI,2011, 1-18,0,None Tested,Not Defined

Acinetobacter,AK,All HAIs,2011,<1,2,2,1.0

Acinetobacter,AK,CAUTI,2011,<1,0,None Tested,Not Defined

Acinetobacter,AK,CLABSI,2011,<1,0,None Tested,Not Defined

Acinetobacter,AK,SSI,2011,<1,0,None Tested,Not Defined

Acinetobacter,AK,All HAIs,2011,19-64,(1-19),Insufficient Data,Insufficient Data

显示您的.csv。

您在这些列中有NaN个值

同样,字符串将作为对象存储,因为字符串没有固定的长度。

将类型保留在引号中,例如:dtype = { State: str, NumberTested : int, PercentResistant: float})

" ...字符串将作为对象存储,因为字符串没有固定的长度"这很有用,我会一直沿这些线看,但是我不喜欢尝试将对象转换为int。它似乎可以在线运行,但是一旦我退出该代码块,该值就会返回给对象!

我尝试用单引号将类型括起来,例如str建议,但没有运气。,谢谢!

我的确在列中有NaN,所以现在我试图将它们作为字符串读取并在代码中转换为int,float等。但是一旦执行df [somecolumn] = df [somecolumn] .astype(int)之类的操作,我就会遇到对象恢复为对象的问题

@ALollz我对您的评论进行了一些研究:" ...字符串将作为对象存储,因为字符串没有固定的长度。"我的理解是字符串是不可变的...它们是固定的(长度也是如此)并且不能更改。但是,可以对它们进行操作,即将它们复制并附加到其他字符串实例中,但是原始值不能更改。

@AZBlue我的意思是存储数据的基础字节的长度,这很重要,因为pandas是基于NumPy构建的。例如,每个int32占用相同数量的字节,无论您的数据帧的值是1还是1523。因此,即使字符串hello固定为5个字符,pandas也没有固定的字符串类型(这意味着所有条目都将据我所知,这就是为什么一切都成为对象的原因。

您还经常在具有NaN值的整数列中遇到此对象类型,因为numpy当前不支持NaN整数表示形式

我想在使用df.dtypes时看到返回的" str",好吧,.dtypes是一个numpy函数,除数字表示形式以外的任何内容都将作为"对象"返回。 因此,我的值确实是作为字符串读取的。 h 我在这里找到了答案:无法在python数据框中将列类型从对象转换为str

此链接对像我这样的新手也很有帮助:如何使用单个命令[Python-Pandas]获取所有列的数据类型?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/567684.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python-week5

1、现在有如下流程&#xff1a;A->B->C->D->E->F&#xff0c;要求根据输入的参数从制定的流程执行下去 """ File: 01流程执行.py Author: chde_wang Date: 2020-08-16 18&#xff1a;51&#xff1a;35 Description:将输入存储到列表中&#xf…

python-week6

1.如下示例, 请用面向对象的形式优化以下代码 def exc1(host,port,db,charset):connconnect(host,port,db,charset)conn.execute(sql)return xxxdef exc2(host,port,db,charset,proc_name)connconnect(host,port,db,charset)conn.call_proc(sql)return xxx # 每次调用都需要重复…

python定义空数组_在numpy数组中设置空值

如何根据条件使numpy数组中的某些值为空&#xff1f; 我不明白为什么我最终得到的是0&#xff0c;而不是不满足条件的null或空值。。。b是用0和1值填充的numpy数组&#xff0c;c是另一个完全填充的numpy数组。所有阵列均为71x71x166a np.empty(((71,71,166))) d np.empty(((7…

excel学习1-查看一列数值是否在另一列中存在

出现次数用COUNTIF 是否出现使用 IFCOUNTIF 加入$的作用是将需要比对的列固定范围。写好一个函数后&#xff0c;使用右下角号&#xff0c;直接下拉就可以。 参考自https://blog.csdn.net/gywtzh0889/article/details/72910377

fx5u以太网通讯设置_操作示例 | 实现S7300和FX5U的数据交换

北辰BCNet-S7300Plus(以下简称BCNet)&#xff0c;在BCNet-S7300的基础上&#xff0c;以太网口增加了支持与西门子带网口PLC(S7-200SMART 、S7-1200、S7-1500、S7300PN)之间的通讯功能。这些通讯功能包括基于S7TCP协议的数据交换、ModbusTCP服务器功能、ModbusTCP客户机功能&…

excel基础-固定某一列的输入内容

Office&#xff1a;需要固定的单元格-点击数据-数据有效性-点击&#xff0c;选择有效性条件 允许为&#xff1a;序列&#xff0c;然后需要下拉框内容&#xff0c;并选择下拉框。即可 切记&#xff1a;开源中的逗号为英文逗号。 最后效果如下&#xff1a; 参考自https://jingya…

为什么多个线程不可能同时抢到一把锁_HFL Redis_12_redis分布式锁的3种实现方式...

HotFrameLearning(简称 HFL) Redis_12_redis分布式锁的3种实现方式-一、大致介绍1、昨天介绍完redis的数据结构后&#xff0c;有小伙伴让本人讲讲redis的分布式锁&#xff0c;因此才有了此篇的由来&#xff0c;只是把我的节奏提前了而已&#xff1b;2、接下来我就通过几种方式介…

linux下mysql5.7修改密码

开始修改MySQL用户密码 ① 输入use mysql回车&#xff1b; ② 输入update user set password password(“147258”)where user’root’; “147258”为你自己设置的密码&#xff1b; 执行第二步后如果报错&#xff1a; 执行后报错  ERROR 1…

react项目中的参数解构_重构复杂的React组件:编写高效且可读组件的5个最佳实践...

随着 React.js 的不断进化&#xff0c;现在的它已经成为 Web 组件中最受欢迎的视图库之一。但是你手中的它&#xff0c;是否真的能够正常工作呢&#xff1f;本文将主要描述 5 个关于React 组件的最佳实践&#xff0c;希望对正在关注 React 组件的你有所帮助。我自己是一名从事了…

robotFramework-ride使用1-关键字驱动与数据类型

RF项目结构 项目文件夹&#xff08;new project&#xff09; 用例集&#xff08;test suit&#xff09; 测试用例&#xff08;test case&#xff09; RF基本功能-设置区介绍 项目 --》settings----》Document&#xff1a;添加用例说明 suit setup&#xff1a;执行此测试套件…

opencv threshold_基于深度学习OpenCV与python进行字符识别

点击上方“小白学视觉”&#xff0c;选择加"星标"或“置顶”重磅干货&#xff0c;第一时间送达当我们在处理图像数据集时&#xff0c;总是会想有没有什么办法以简单的文本格式检索图像中的这些字符呢&#xff1f;今天我们就一起看看有没有什么简单的办法可以实现这一…

python3 robotframework+pycharm框架搭建

1.安装python3 框架组成&#xff1a;自动化基础库&#xff08;robotframework&#xff09;图形界面&#xff08;robotframework-ride&#xff09; 2.安装RF框架 安装robotframework。pip install robotframework -i https://pypi.doubanio.com/simple 安装robotframework-r…

delphi if多个条件_判断(if)语句

判断&#xff08;if&#xff09;语句目标开发中的应用场景if 语句体验if 语句进阶综合应用01. 开发中的应用场景生活中的判断几乎是无所不在的&#xff0c;我们每天都在做各种各样的选择&#xff0c;如果这样&#xff1f;如果那样&#xff1f;……程序中的判断if 今天发工资: ​…

excel sheet限制_Python 处理Excel内的数据(案例介绍*3)

点击上方“蓝字”关注我们了解更多精彩案例一介绍现在有一批电商产品跟当日销量的数据&#xff0c;如下&#xff0c;总共有上万笔的数据&#xff0c;现在需要统计每个品牌当日的销售量&#xff0c;比如美宝莲今天总共卖出了多少的商品&#xff0c;另外需要统计每个品牌下面的每…

robotFramework-ride使用2-分支与循环

1条件运算 Run keyword if 如果条件为True&#xff0c;则执行关键字 ELSE IF ELSE IF使用案例1&#xff1a; 2循环 在使用append to list前&#xff0c;添加Collections库 列表元素添加与删除 列表元素求和-循环 :FOR ${i} IN 1 2 3 4 5 :FOR ${i} IN RANGE 1 5FOR里面…

项目案例:在线拍卖系统_冀拓公司在张家口开展尾矿库在线监测监控系统 建设项目...

近日&#xff0c;受张家口弘锦矿业有限责任公司委托&#xff0c;冀拓公司在弘锦矿业大东沟尾矿库开展了安全风险智能在线监测监控系统施工安装服务。由于该库为“头顶库”&#xff0c;按照省应急管理厅要求“头顶库”必须在6月底之前完成联网&#xff0c;在6月24日接到项目任务…

linux内存管理之RSS和VSZ的区别

[译] linux内存管理之RSS和VSZ的区别 阅读 724 收藏 0 2019-08-25 原文链接&#xff1a; pengrl.com RSS是Resident Set Size&#xff08;常驻内存大小&#xff09;的缩写&#xff0c;用于表示进程使用了多少内存&#xff08;RAM中的物理内存&#xff09;&#xff0c;RSS不…

cad和python哪个好学_对纯外行人来说,学习PS和Python哪个更容易?

果真是高手大隐隐于市&#xff0c;我如此隐藏都被你看出来了&#xff0c;谢邀回答&#xff01;然后你看出了吧&#xff01;答案在我这里很明显&#xff0c;当然是学习ps更容易一点&#xff0c;至于Python我的天分实在是太渣&#xff0c;所以&#xff0c;至今我敢不敢承认我学过…

Linux 两台服务器之间传输文件和文件夹

今天处理一个项目要迁移的问题&#xff0c;突然发现这么多图片怎么移过去&#xff0c;可能第一时间想到的是先从这台服务器下载下来&#xff0c;然后再上传到另外一台服务器上面去&#xff0c;这个方法确实是可行&#xff0c;但是实在是太费时间了&#xff0c;今天我就教大家怎…

arm汇编指令集_1. 从0开始学ARM安装Keil MDK uVision集成开发环境

关于ARM的一些基本概念&#xff0c;大家可以参考我之前的文章&#xff1a;《0.到底什么是Cortex、ARMv8、arm架构、ARM指令集、soc&#xff1f;一文帮你梳理基础概念【科普】》0. 如何学习arm&#xff1f;ARM的知识点很多很杂&#xff0c;很多同学都遇到过类似的问题&#xff0…