Python脚本删除文本文件中的重复行

Python脚本删除文本文件中的重复行

news/2025/4/4 22:27:59/文章来源:https://blog.csdn.net/m0_62872215/article/details/136384028

实例：需要用Python删除文本文件a.txt中的重复行.

Case1:仅需要删除文件中的重复行：

rFile = open('a.txt', 'r')
wFile = open('b.txt', 'w')
allLine = rFile.readlines()
rFile.close()
s = set()
for i in allLine:s.add(i)
for i in s:wFile.write(i)
open('b.txt', 'w').write(''.join(set(open('a.txt').readlines())))

Case2:删除文件中的重复行并保持原来的顺序：

rFile = open("a.txt", "r")
wFile = open("b.txt", "w")
allLine = rFile.readlines()
rFile.close()
h = {}
for i in allLine:if not h.has_key(i):h[i]=1wFile.write(i)
wFile.close()
lines, sorted = open('a.txt', 'r').readlines(), lambda a, cmp: a.sort(cmp=cmp) or a
open('b.txt', 'w').write(''.join([i[0] for i in sorted([(j, lines.index(j)) for j in set(lines)], lambda a,b: a[1]-b[1] )]))
h,r,w ={}, file('a.txt'), file('b.txt','w')
w.write(reduce(lambda x,y:x+y, [i for i in r if h.get(i)==None and h.setdefault(i, True)]))
s = []
[ s.append(k) for k in open('a.txt') if k not in s ]
open('b.txt', 'w').write(''.join(s))

上述两种方法均可以实现删除重复行的目的，感兴趣的可以再考虑其他方法。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/722217.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

洛谷：P3068 [USACO13JAN] Party Invitations S（枚举、前缀和）

洛谷：P3068 [USACO13JAN] Party Invitations S（枚举、前缀和）

这题我们数据范围太大，用二维肯定是不行的，我们可以采用一维线性存储。如题意，我们可以将每组奶牛编号都存在一维数组里面，只需记录每组的头尾指针就可以了。如题中样例我们就可以存储成1 3 3 4 1 2 3 4 5 6 7 4 3 2 1 然后第…

阅读更多...

[LeetBook]【学习日记】寻找和为指定数字的连续数字

[LeetBook]【学习日记】寻找和为指定数字的连续数字

题目文件组合待传输文件被切分成多个部分，按照原排列顺序，每部分文件编号均为一个正整数（至少含有两个文件）。传输要求为：连续文件编号总和为接收方指定数字 target 的所有文件。请返回所有符合该要求的文件传输组…

阅读更多...

【kubernetes】关于k8s集群的存储卷

【kubernetes】关于k8s集群的存储卷

目录一、存储卷的分类二、empty存储卷以及特点三、hostpath存储卷以及特点四、nfs存储卷以及特点五、pvc存储卷查看pv的定义查看pvc的定义实操：静态创建pv的方式实现pvc存储卷步骤一：先完成nfs的目录共享，需要准备不同的目…

阅读更多...

C# 中 TryParse 将字符串转换为特定类型的方法

C# 中 TryParse 将字符串转换为特定类型的方法

在 C# 中，TryParse 是一个用于将字符串转换为特定类型的方法。它用于尝试解析字符串并将其转换为指定类型的值，而不会引发异常。如果解析成功，它将返回 true 并将解析结果存储在输出参数中；如果解析失败，它将返回 fals…

阅读更多...

redis10 应用问题（穿透、击穿、雪崩、分布式锁）

redis10 应用问题（穿透、击穿、雪崩、分布式锁）

思维草图缓存穿透查询不存在的数据，穿透redis缓存，请求直接攻击后端db。问题当系统中引入redis缓存后，一个请求进来后，会先从redis缓存中查询，缓存有就直接返回（相当于一道隔离闸，保护db…

阅读更多...

vue设计原理-带你重走vue诞生路程

vue设计原理-带你重走vue诞生路程

我们首先看下面这个小demo demo源码: <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" conten…

阅读更多...

JAVA如何利用接口实现多继承问题

JAVA如何利用接口实现多继承问题

hello，上文带大家学习了java中类的继承，我们可以创建一个父类，将类中的共性抽取出来，通过子类继承的方式来实现代码的复用。今天带大家学习不同类之间的另外几种关系，即多态抽象类和接口。多态的概念多态&#xff0c…

阅读更多...

Vue 3的Composition API和vue2的不同之处

Vue 3的Composition API和vue2的不同之处

Vue 3的Composition API是Vue.js框架的一个重要更新，它提供了一种新的组件逻辑组织和复用方式。在Vue 2中，我们通常使用Options API（data、methods、computed等）来组织组件的逻辑，但这种组织方式在处理复杂组件时可能会…

阅读更多...

实体店好做还是电商平台好做？哪个发展前景较高？

实体店好做还是电商平台好做？哪个发展前景较高？

我是电商珠珠大部分人面对新的一年都会比较迷茫，想要创业会自己增加收入，却在开店和线上做电商这两者之间犹豫不决。不知道哪个更加合适自己，换句话来说，就是不知道哪个赔付率低一点。现在这个行情，按照网友的说法…

阅读更多...

嵌入式学习记录——信号量

嵌入式学习记录——信号量

信号量的基本内容: 信号量是一种资源,可以被初始化、申请、释放、销毁 P操作:申请资源 V操作:释放资源 1.无名信号量： 1.sem_init int sem_init(sem_t *sem, int pshared, unsigned int value); 功能: 初始化信号量参数: sem:信号量空间首地…

阅读更多...

C++ string类详解及模拟实现

C++ string类详解及模拟实现

目录【本节目标】 1. 为什么学习string类？ 1.1 C语言中的字符串 1.2 面试题(暂不做讲解) 2. 标准库中的string类 2.1 string类(了解) 2.2 string类的常用接口说明（注意下面我只讲解最常用的接口） 3. string类的模拟实现 3.1string类常用…

阅读更多...

SpringCloud知多少

SpringCloud知多少

引言： Spring cloud 流应用程序启动器是基于 Spring Boot 的 Spring 集成应用程序，提供与外部系统的集成。Spring cloud Task，一个生命周期短暂的微服务框架，用于快速构建执行有限数据处理的应用程序。如何定义微服务&#x…

阅读更多...

Express学习（一）

Express学习（一）

Express Express简介什么是Express 官方给出的概念：Express是基于Node.js平台，快速、开放、极简的web开发框架。通俗的理解：Express的作用和Node.js内置的http模块类似，是专门用来创建Web服务器的。进一步理解Express 不使用E…

阅读更多...

【软件使用】Markdown编辑器第一次使用介绍

【软件使用】Markdown编辑器第一次使用介绍

【软件使用】Markdown编辑器第一次使用介绍 markdown格式支持的软件有：VS Code 和 Typora，CSDN写网页博文也是用的.md，CSDN能支持导入的文件也是以.md格式结尾的文件名。欢迎使用Markdown编辑器你好！ 这是你第一次使用 Markd…

阅读更多...

C语言——结构体（位段）、联合体、枚举

C语言——结构体（位段）、联合体、枚举

hello，大家好！我是柚子，今天给大家分享的内容是C语言中的自定义类型结构体、联合体以及枚举，有什么疑问或建议可以在评论区留言，会顺评论区回访哦~ 一、结构体 struct a.结构体声明不同于数组的是，结构…

阅读更多...

【CSP试题回顾】202212-2-训练计划

【CSP试题回顾】202212-2-训练计划

CSP-202212-2-训练计划解题思路输入和初始化： 首先，代码从输入中获取项目的截止日期和项目数量。然后，它初始化一个项目列表，每个项目都有其依赖项、被依赖的项目集合、完成时间、总完成时间（包括依赖链&#xff09…

阅读更多...

【JavaSE】面向对象——多态性

【JavaSE】面向对象——多态性

多态性多态性的概念所谓多态性，理解为一个事物的多种形态。具体点就是去完成某个动作时，不同的对象会产生不同的状态。多态性的好处多态在Java中指的是父类的引用指向子类的对象，或者可以说是子类的对象赋给父类的引用。这样在我们的…

阅读更多...

SpringBoot实现分页模糊查询

SpringBoot实现分页模糊查询

1. Navicat查询数据 Navicat中查询所有数据 SELECT * FROM sys_user;Navicat中查询前两条数据（俩种方式） SELECT * FROM sys_user LIMIT 2; //从0开始，第一个参数是起始位置即(pageNum-1)*pageSize，第二个参数是步长 SELECT * …

阅读更多...

项目部署后通过公网IP访问不到的问题解决

项目部署后通过公网IP访问不到的问题解决

目录 1.检查项目是否在运行(第二行命令) 2.检查所用服务器防火墙是否打开 3.检查linux系统防火墙有没有打开问题如图: 首先确保项目已经成功部署 1.检查项目是否在运行(第二行命令) 第一行命令是监听58080端口,我的项目是使用该端口 2.检查所用云服务器防火墙是否打开我…

阅读更多...

分享77个Html杂七杂八模板，总有一款适合您

分享77个Html杂七杂八模板，总有一款适合您

分享77个Html杂七杂八模板，总有一款适合您 77个Html杂七杂八模板下载链接：https://pan.baidu.com/s/1-RyIKaxdCu3dbnlMFMwviw?pwd8888 提取码：8888 学习知识费力气，收集整理更不易。知识付费甚欢喜，为咱码农谋福…

阅读更多...

最新文章