python按列读取txt文件_如何使用pandas读取txt文件中指定的列(有无标题)

最近在倒腾一个txt文件,因为文件太大,所以给切割成了好几个小的文件,只有第一个文件有标题,从第二个开始就没有标题了。

我的需求是取出指定的列的数据,踩了些坑给研究出来了。

import pandas as pd

# 我们的需求是 取出所有的姓名

# test1的内容

'''

id name score

1 张三 100

2 李四 99

3 王五 98

'''

test1 = pd.read_table("test1.txt") # 这个是带有标题的文件

names = test1["name"] # 根据标题来取值

print(names)

'''

张三

李四

王五

'''

# test2的内容

'''

4 Allen 100

5 Bob 99

6 Candy 98

'''

test2 = pd.read_table("test2.txt", header=None) # 这个是没有标题的文件

names = test2[1] # 根据index来取值

print(names)

'''

Allen

Bob

Candy

'''

20200305170611.jpg

补充知识:关于python中pandas读取txt文件注意事项

语法:pandas.read_table()

参数:

filepath_or_buffer 文件路径或者输入对象

sep 分隔符,默认为制表符

names 读取哪些列以及读取列的顺序,默认按顺序读取所有列

engine 文件路径包含中文的时候,需要设置engine = ‘python'

encoding 文件编码,默认使用计算机操作系统的文字编码

na_values 指定空值,例如可指定null,NULL,NA,None等为空值

常见错误:设置不全

import pandas

data = pandas.read_table(‘D/anaconda/数据分析/文本.txt',

engine=‘python')

print(data)

输出结果:

20200305170815.jpg

补全代码:

import pandas

data = pandas.read_table(‘D/anadondas/数据分析/文本.txt',

sep = ‘,' ,#指定分隔符‘,',默认为制表符

names = [‘names',‘age'],#设置列名,默认将第一行数据作为列名

engine = ‘python',

encoding = ‘utf8'#指定编码格式)

print(data)

输出结果:

20200305170821.jpg

以上这篇如何使用pandas读取txt文件中指定的列(有无标题)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持python博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/505352.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jpa多表关联查询_Spring Boot 整合mybatis如何自定义 mapper 实现多表关联查询

上一篇文章已经介绍了自定义 mapper 实现自定义的方法,其实实现了通过自定义的mapper就可以做多表关联等复杂查询。但是很多朋友还是反馈说没有实现多表关联查询,所以,今天把文章又重新修改了,增加了多表关联的实现步骤。Mybatis …

spark on yarn 完全分布式_「大数据」(七十一)Spark之架构介绍

【导读:数据是二十一世纪的石油,蕴含巨大价值,这是情报通大数据技术系列第[71]篇文章,欢迎阅读和收藏】1 基本概念Spark 架构采用了分布式计算中的 Master-Slave 模型。 Master 是对应集群中的含有 Master 进程的节点,…

计算机网络数据链路层 --- 停止等待协议

停止等待协议的意义 除了比特出差错,底层信道还会出现丢包问题。为了实现流量控制。 停止等待协议的前提 虽然现在常用全双工通信方式,但为了讨论问题方便,仅考虑一方发送数据(发送方),一方接收数据&…

python import如何使用_python之import引用

关于python的import引用的最大关键是init.py文件的作用,这个文件对于import的方法使用至关重要。这个是我在搭建自动化框架过程中用到的import的方法使用。 比如说,我现在login.py想引用bottom底下的log.py的时候,这个时候,我们如…

计算机网络数据链路层 --- 后退n帧协议(GBN)

滑动窗口 发送窗口 发送方维持一组连续的允许发送的帧的序号 接收窗口 接收方维持一组连续的允许接收帧的序号 发送过程 如图,假如发送方的发送窗口大小是6,首先发送0号帧,并建立0号帧的副本,防止帧丢失,然后发送…

简要描述内部连接和外部连接之间的区别_创新性的M12推拉式连接器推拉标准—跨制造商自动化技术的里程碑...

“八家知名制造商 – 菲尼克斯,浩亭,莫仕,穆尔电子,宾德,康耐,艾查和魏德米勒因建立M12推拉式连接器的推拉锁紧机制而在市场上确立了地位。我们共同追求一个目标,即确保各个制造商之间的兼容性。…

计算机网络数据链路层 --- 选择重传协议(SR)

引言 GBN协议的弊端 累计确认,从而导致某一帧错误后会批量重传。 可行的解决方案 可以只重传出错的帧,设置单个确认,同时加大接收窗口,设置接收缓存,缓存乱序到达的帧。这也就是选择重传协议SR。 SR中的滑动窗口 …

requests 返回的cookies为空_爬虫学习(2)(requests库)

POST请求import requestsdata {name: cxc, age: 18} r requests.post("http://httpbin.org/post", datadata) print(r.text)POST请求这样就成功地获得了返回结果,form部分就是提交的数据,证明POST请求成功发送了。响应之前我们使用了text和c…

计算机网络 --- 数据链路层介质访问控制

引言 传输数据使用的两种链路: 点对点链路:两个相邻的节点通过一个链路相连,没有第三者。应用:PPP协议,常用于广域网。广播式链路:所有主机共享通信介质。应用:早期的总线以太网,无…

6-7 使用函数输出水仙花数_学习C语言居然对printf函数不理解???

对于C语言的printf函数,可以说是我们学习C语言第一个接触到的函数了。printf命令的作用是格式化输出函数,一般用于向标准输出设备按规定格式输出信息。printf()函数的调用格式为:printf("", )。printf()是C语言标准库函数&#xff…

matplotlib 子图超过4个_Matplotlib从入门到精通

Matplotlib从入门到精通​mp.weixin.qq.comMatplotlib是基于Python语言的开源项目,旨在为Python提供一个数据绘图包。它提供了一整套和 matlab 相似的命令 API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入 GUI 应用程序…

c++求n的几次方_14.八年级数学:若a+b+c=1,怎么求 a+b+c的值?分式培优拓展

欢迎您来到方老师数学课堂,请点击上方蓝色字体,关注方老师数学课堂。所有的视频内容,全部免费,请大家放心关注,放心订阅。八年级数学:若abc1,怎么求 abc的值?分式培优拓展。这道题&a…

计算机网络 --- 数据链路层CSMA/CD协议

CSMA/CD协议 全称为载波监听多点接入/碰撞检测CSMA/CD(carrier sense multiple access with collision detection) CSMA/CD协议 - CS: CS指的是载波侦听/监听,每一个站点再发送数据之前以及发送数据时都要检测一下总线上是否有其他计算机在…

map insert异常失败_处理dubbo反序列化失败的坑

前言今天下午,当我经过一个小时的奋”键“疾”码“,准备好好的审查一下(摸鱼)自己写的代码,经过一段时间审查(摸的差不多了,该下班了),得出一个结论我写的代码很优雅、精简。所以大手一挥提交代码,并在 API…

class会不会回收?用不到的class怎么回收_牛X的java程序员必备的GC基础知识, 面试肯定用的到...

1. GC回收哪些内存区域呢?堆内存对象数组方法区该类所有的额实例都已经被回收, 也就是java堆中不存在该类的任何实例加载该类的ClassLoader已经被回收该类对应的java.lang.Class对象在任何地方没有被引用, 也无法通过反射访问该类方法。垃圾回…

c++读取utf8文件_Node.js 进阶之 fs 文件模块学习

前言文件操作是开发过程中并不可少的一部分。Node.js 中的 fs 模块是文件操作的封装,它提供了文件读取、写入、更名、删除、遍历目录、链接等 POSIX 文件系统操作。与其它模块不同的是,fs 模块中所有的操作都提供了异步和同步的两个版本,具有 sync 后缀的…

计算机网络 --- 数据链路层中局域网和广域网

局域网 简称LAN(Local Area Network):是指在某一区域内由多台计算机互联成的计算机组,使用广播信道。 局域网的特点 覆盖的地理范围较小,只在一个相对独立的局部范围内联,如一座或集中的建筑群内。使用专…

python制作中文词云_Python如何生成词云(详解)

前言 今天教大家用wrodcloud模块来生成词云,我读取了一篇小说并生成了词云,先看一下效果图: 效果图一:效果图二:根据效果图分析的还是比较准确的,小说中的主人公就是“程理”,所以出现次数最多。…

计算机网络 --- 局域网中的以太网

以太网概述 以太网是应用最广泛的局域网,包括标准以太网(10Mbps),快速以太网(1000Mbps),千兆以太网(1000Mbps)和10G以太网,他们都符合IEEE802.3系列标准规范…

高度为5的3阶b树含有的关键字个数_数据结构要考得好,你心里要有B树

01知识框架02知识点详解1B树①定义与性质B树也叫B-树。B树是一种平衡的多分树,通常我们说m阶的B树,是二叉排序树的一种扩展,它必须满足如下条件:01每个结点最多只有m-1个关键字。02根结点最少可以只有1个关键字。03非根结点至少有…