python按索引删除字符串,基于特定的索引字符串值选择记录,然后通过python删除后续字段...

I have a .csv file named file01.csv that contains many records. Some records are required and some are not. I find that the required records has a string variable “Mi”, but it is not exist into the unnecessary records. So, I want to select the required records based on string value “Mi” in the field for every records.

Finally I want to delete the subsequent fields of each record from the field that contains value “Mi”. Any suggestion and advice is appreciated.

Optional:

In addition, I want to delete the first column.

Split column BB into two column named as a_id, and c_id. Separate the value by _ (underscore) and left side will go to a_id, and right side will go to c_id.

My fileO.csv is as follows:

AA BB CC DD EE FF GG

1 1_1.csv (=0 =10" 27" =57 "Mi"

0.97 0.9 0.8 NaN 0.9 od 0.2

2 1_3.csv (=0 =10" 27" "Mi" 0.5

0.97 0.5 0.8 NaN 0.9 od 0.4

3 1_6.csv (=0 =10" "Mi" =53 cnt

0.97 0.9 0.8 NaN 0.9 od 0.6

4 2_6.csv No Bi 000 000 000 000

5 2_8.csv No Bi 000 000 000 000

6 6_9.csv less 000 000 000 000

7 7_9.csv s(=0 =26" =46" "Mi" 121

My Expected results files (outFile.csv):

a_id b_id CC DD EE FF GG

1 1 0 10 27 57

1 3 0 10 27

1 6 0 10

7 9 0 26 46

解决方案

The following approach should work fine using Python csv module:

import csv

import re

import string

output_header = ['a_id', 'b_id', 'CC', 'DD', 'EE', 'FF', 'GG']

sanitise_table = string.maketrans("","")

nodigits_table = sanitise_table.translate(sanitise_table, string.digits)

def find_mi(row):

for index, col in enumerate(row):

if col.find('Mi') != -1:

return index

return -1

def sanitise_cell(cell):

return cell.translate(sanitise_table, nodigits_table) # Keep digits

f_input = open('fileO.csv', 'rb')

f_output = open('outFile.csv', 'wb')

csv_input = csv.reader(f_input)

csv_output = csv.writer(f_output)

input_header = next(f_input)

csv_output.writerow(output_header)

for row in csv_input:

#print '%2d %s' % (len(row), row)

if len(row) >= 2:

bb = re.match(r'(\d+)__(\d+).0\.csv', row[1])

mi = find_mi(row)

if bb and mi != -1:

row[:] = row[:mi] + [''] * (len(row) - mi)

row[:] = [sanitise_cell(col) for col in row]

row[0] = bb.group(1)

row[1] = bb.group(2)

csv_output.writerow(row)

f_input.close()

f_output.close()

outFile.csv will contain the following:

a_id,b_id,CC,DD,EE,FF,GG

1,1,0,10,27,57,

1,3,0,10,27,,

1,6,0,10,,,

7,9,0,26,46,,

Tested using Python 2.6.6

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/472794.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

我们并没有觉得MapReduce速度慢,直到Spark出现

learn from 从0开始学大数据(极客时间) Spark 拥有更快的执行速度 更友好的编程接口 迅速抢占 MapReduce 的市场份额,成为主流的大数据计算框架 val textFile sc.textFile("hdfs://...") // 根据 HDFS 路径生成一个输入数据 RDD v…

python远程调用摄像头_Python设置Socket代理及实现远程摄像头控制的例子

为python设置socket代理首先,你得下载SocksiPy这个.解压出来之后里面会有一个socks.py文件.然后你可以把这个文件复制到python安装目录里面的Lib\site-packages中.或者把这个文件复制到程序所在的目录中. 然后就可以再程序中使用socket代理来编写程序了. 下面是示例代码 import…

基于ArcEngine与C#的鹰眼地图实现

鹰眼图是对全局地图的一种概略表达,具有与全局地图的空间参考和空间范围。为了更好起到空间提示和导航作用,有些还具备全局地图中重要地理要素,如主要河流、道路等的概略表达。通过两个axMapControl控件,主控件axMapControl 1和鹰…

LeetCode 1178. 猜字谜(状态压缩+枚举二进制子集+哈希)

文章目录1. 题目2. 解题1. 题目 外国友人仿照中国字谜设计了一个英文版猜字谜小游戏,请你来猜猜看吧。 字谜的迷面 puzzle 按字符串形式给出,如果一个单词 word 符合下面两个条件,那么它就可以算作谜底: 单词 word 中包含谜面 …

elasticsearch 工作原理_【154期】面试官:你能说说 Elasticsearch 查询数据的工作原理是什么吗?...

点击上方“Java面试题精选”,关注公众号面试刷图,查缺补漏>>号外:往期面试题,10篇为一个单位归置到本公众号菜单栏->面试题,有需要的欢迎翻阅阶段汇总集合:一百期面试题汇总面试题ES 写入数据的工…

php另类上传图片的方法(PHP用Socket上传图片)

服务器端&#xff1a; 。 代码如下:<?phpset_time_limit(10);//* 设置不显示任何错误 *///error_reporting(0); function varinfo($str) {echo "<PRe>";var_dump($str);echo "<pre>";} $commonProtocol getprotobyname("tcp");…

java会被淘汰吗_Java不会被淘汰的12个原因

如今&#xff0c;面对曾经在程序员中被各种新技术掩盖直至堙灭的技术值得怀念。犹如COBOL这当年被老程序员们尊为神器的语言如今也基本没有价值。而Java作为现代程序员的中坚力量在这点上或许会成为下一个COBOL。有关JAVA的技术卖出多少本书已经是一个很久远的记忆了。现处中年…

Java 关于类的专题

文章目录1. Object 类2. 内部类3. 覆写 Object 类的 equals 方法4. 接口对象实例化5. this() 调用无参构造方法6. static 属性所有对象共享一份7. static 方法不能调用 非static 属性8. 静态代码块9. final 关键字10. instanceof 关键字1. Object 类 所有的类都是继承于 Objec…

pythonmain是什么意思_Python中if __name__ == __main__详细解释

想必很多初次接触python都会见到这样一个语句&#xff0c;if __name__ "__main__"&#xff1a; 那么这个语句到底是做什么用的呢&#xff1f;在解释之前&#xff0c;首先要声明的是&#xff0c;不管你是多么小白&#xff0c;你一定要知道的是&#xff1a; 1.python文…

java操作redis的操作_Java操作redis简单示例

第一&#xff1a;安装Redis首先我们要安装Redis&#xff0c;就像我们操作数据库一样&#xff0c;在操作之前肯定要先创建好数据库的环境。Redis的下载可以百度一下&#xff0c;或者打开下面的下载链接&#xff1a;https://github.com/MSOpenTech/redis也可以从我的百度网盘下载…

myeclipse启动报JVM terminated. Exit code=1

报错信息如图&#xff1a; 解决办法&#xff1a; 删除当前workspaces下文件夹&#xff0c;路径为&#xff1a;%Workspaces%/.metadata/.plugins/org.eclipse.core.runtime转载于:https://www.cnblogs.com/tancp/p/4102866.html

Java 常用类库

文章目录1. String、StringBuffer2. 基本数据类3. System 类4. Runtime 类5. Date、Calendar、DateFormat 类6. Math、Random 类7. hashCode() 方法8. 对象克隆1. String、StringBuffer public class testString {public static void main(String [] args){String s "Mi…

git如何选择性合并_小姐姐用 10 张动图,教会你 Git 命令使用

优质文章&#xff0c;第一时间送达&#xff01;来源&#xff1a;机器之心git merge、git rebase、git reset、git revert、git fetch、git pull、git reflog……你知道这些 git 命令执行的究竟是什么任务吗&#xff1f;如果你还有些分不清楚&#xff0c;那千万不能错过这篇文章…

传智播客java测试题_传智播客Java基础综合测试题

传智播客Java基础综合测试题传智播客Java基础综合测试题第一关1.动手完成 Java 开发包的安装&#xff0c;并设置环境变量 Path 。2.编写一个程序&#xff0c;要求程序运行后在屏幕上输出&#xff1a;***************************This is my first java program!***************…

为何Spark更高效?

learn from 从0开始学大数据&#xff08;极客时间&#xff09; Spark 的计算阶段 Hadoop MapReduce 简单粗暴地根据 shuffle 将大数据计算分成 Map 和 Reduce 两个阶段&#xff0c;然后就算完事了。 而 Spark 更细腻一点&#xff0c;将前一个的 Reduce 和后一个的 Map 连接起来…

iphone个系列尺寸_最值得入手的4款iPhone,都是内行人的最爱,拿出去有面子

现如今手机市场里最受大众欢迎的手机应该就是iPhone了&#xff0c;虽然iPhone的价格都普遍偏高&#xff0c;但是大家依然还是非常青睐于它&#xff0c;主要是因为iPhone的配置和性能确实是比其他机型要好&#xff0c;搭载的A系列仿生芯片和iOS系统都提升了它的性能&#xff0c;…

protocol(协议) 和 delegate(委托)也叫(代理)---辨析

protocol和delegate完全不是一回事。协议(protocol)&#xff0c;&#xff08;名词&#xff09;要求。就是使用了这个协议后就要按照这个协议来办事&#xff0c;协议要求实现的方法就一定要实现。委托(delegate)&#xff0c;&#xff08;动词&#xff09;助手。顾名思义就是委托…

redis 计数 java_redission计数器实现,redisTemplate计数器

在redission 2.9.0版本之前是有BUG&#xff0c;在实现下面代码时&#xff0c;第一次是成功的&#xff0c;但是在第二次就会失败&#xff1a;RedissonClient client;//client参考别的demoRMapCache mapCache client.getMapCache("nameSpace");mapCache.putIfAbsent(&…

天池 在线编程 能否转换

文章目录1. 题目2. 解题1. 题目 给两个字符串 S 和 T, 判断 S 能不能通过删除一些字母(包括0个)变成 T. 样例1 输入: S "lintcode" 和 T "lint" 输出: true样例2 输入: S "lintcode" 和 T "ide" 输出: true样例3 输入: S "…

java对象持久化技术_Java对象持久化技术Hibernate 一

Hibernate是Java应用和关系数据库之间的桥梁&#xff0c;它负责Java对象和关系数据之间的映射。Hibernate内部封装了通过JDBC访问数据库的操作&#xff0c;向上层应用提供了面向对象的数据访问API。在Java应用中使用Hibernate包含以下步骤。(1)创建Hibernate的配置文件。(2)创建…