python删除重复文字_python如何删除文件中重复的字段

本文实例为大家分享了python如何删除文件中重复字段的具体代码,供大家参考,具体内容如下

原文件内容放在list中,新文件内容按行查找,如果没有出现在list中则写入第三个文件中。

import csv

filetxt1 = 'E:/gg/log/log1.txt'

filecsv1 = 'E:/gg/log/log1.csv'

filecsv2 = 'E:/gg/log/log2.csv'

filecsv3 = 'E:/gg/log/log3.csv'

class operFileCsv():

def __init__(self, filename=None):

self.filename = filename

def readCsvFile(self):

readCsvHandler = open(self.filename, 'r')

filelines = csv.reader(readCsvHandler, dialect='excel')

for fileline in filelines:

print(fileline)

readCsvHandler.close

def writeCsvFile(self, writeline):

writeCsvHandler = open(self.filename, 'a', newline='')

csvWrite = csv.writer(writeCsvHandler, dialect='excel', )

csvWrite.writerow(writeline)

writeCsvHandler.close()

class getLogBuffFromFile():

def __init__(self):

self.logBuff1 = []

def getLog1Buff(self, filename):

with open(filename) as filehandler:

while True:

logOneLine = filehandler.readline().strip()

if not logOneLine:

break

self.logBuff1.append(logOneLine)

# print('TRACE: The log1 has ', len(self.logBuff1), ' lines.')

return self.logBuff1

def getLog2Buff(self, logOneLine):

pass

class deleteIterantLog():

def __init__(self):

self.logBuff1List = None

self.logBuff2OneLine = None

def deleteProcedure(self, oldlog, newlog, createlog):

self.logBuff1List = getLogBuffFromFile().getLog1Buff(oldlog)

self.dealProcedure(newlog, createlog)

def dealProcedure(self, file1name, file2name):

with open(file1name, 'r') as readCsvHandler:

filelines = csv.reader(readCsvHandler, dialect='excel')

for fileline in filelines:

if fileline[1] not in self.logBuff1List:

operFileCsv(file2name).writeCsvFile(fileline)

if __name__ == '__main__':

deleteIterantLog().deleteProcedure(filetxt1, filecsv2, filecsv3)

小编再为大家分享一段Python用集合把文本中重复的字去掉的方法:

import os,sys,datetime

import codecs

with open('aaaaa.txt', 'r') as f: #读入文本中的文件

l = f.readlines() # txt中所有字符串读入data

x=set(l[0])

for i in range(1,len(l)):

x.update(l[i])

s="".join(list(x))

print(s)

with open('result.txt','wb') as f1: #把结果写到文件result中

b=bytes(s,encoding="utf-8")

f1.write(b)

更多关于python安装教程的文章请参考《python各版本安装教程》

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/334063.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

css 深度选择器 ,CSS的coped私有作用域和深度选择器

大家都知道当 编译前:.example {color: red;}编译后:.example[data-v-f3f3eg9] {color: red;}看完你肯定就会明白了,其实是在你写的组件的样式,添加了一个属性而已,这样就实现了所谓的私有作用域。但是也会有弊端&…

关于压缩工具 7z(7-zip) 的选项 -u(更新压缩档案中的文件)的解读

文章目录一、选项介绍(一)参量说明二、示例一、选项介绍 更新选项 -u 指定压缩档案中文件的更新及创建的方式。可以和此选项结合使用的命令:a (添加), d (删除), u (更新) 。 语法格式:-u[-][action_set]…

营销自动化权威指南_免费电子书:自动化根本原因分析的完整指南

营销自动化权威指南自动化根本原因分析入门指南。 我们在OverOps过夜,梦想着拥有一个自动化的世界。 看起来似乎有些怪异,但是您能想象您和您的团队会比那些不眠之夜和无休止的日子在日志文件中筛选以找出问题出在哪里的快乐多了吗? 这些乏…

光立方原理讲解_90%人不理解什么是防眩光射灯 防昡晕 防炫光,。怎么选项led防眩灯...

关于LED射灯“防眩光(防炫光)”实在想和各位朋友讲解一下防眩光原理 ,因为我们碰到90%以上装修朋友,总是把眩光理解为简单的不刺眼的光。我可以负责的告诉大家 ,市面上没有不刺眼的射灯,不管是LED芯片直接射出来的光,还…

打印机设置虚拟服务器,虚拟机打印机服务器设置

虚拟机打印机服务器设置 内容精选换一换迁移前,您需要设置目的端服务器。该目的端用来接收源端的数据,同时您也可以使用该目的端进行迁移测试和启动目的端。只有“迁移阶段”为“已就绪”时才可设置目的端。或单击“操作”列的“更多 > 设置目的端”&…

关于压缩工具 7z(7-zip) 的选项 -w(设置工作目录)的解读

文章目录一、选项介绍二、语法格式三、选项示例一、选项介绍 选项 -w 为文件压缩设置临时的工作目录。可以和此选项结合使用的命令:a (添加), d (删除), u (更新) 。 默认情况下,7-Zip 新建一个压缩档案时,会临时在当…

nginx fastcgi python_Nginx + webpy 和FastCGI搭建webpy环境

web.py 是一个轻量级Python web框架,它简单而且功能大。web.py是一个开源项目。1、所需要的软件:Nginx nginx-1.4.7.tar.gz (需要包含fastcgi和rewrite模块)。Webpy 0.32Spawn-fcgi 1.6.2Flup注意:Flup是最常见的忘记装的软件,需要…

datastore_使用Spring Session和JDBC DataStore进行会话管理

datastore在Web应用程序中,用户会话管理对于管理用户状态至关重要。 在本文中,我们将学习在集群环境中管理用户会话所采用的方法,以及如何使用Spring Session以更简单和可扩展的方式实现该方法。 通常在生产环境中,我们将有多个服…

关于压缩工具 7z(7-zip) 的选项 -x(排除文件)的解读

文章目录一、选项介绍二、选项语法三、选项示例一、选项介绍 选项 -x 用来指定某一文件或某一类文件从操作中排除,此选项可同时排除多个类型。可以和此选项结合使用的命令:a (添加), d (删除), e (释放), l (列表)&am…

华为服务器芯片总在pc,服务器芯片 华为

弹性云服务器 ECS弹性云服务器(Elastic Cloud Server)是一种可随时自助获取、可弹性伸缩的云服务器,帮助用户打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率三年低至5折,多种配置可选了解详情Linux云服…

python figure函数 gui_python 在一个GUI内创建了2个figure,为什么只能显示第二个图?...

建议你把代码格式化一下,编辑框上有代码块选项,选中代码再点击如下图标就可以格式化。说说这段代码的问题。因为tk我没怎么用过,说明如果有错,帮忙指正。def figure(self):f1Figure((4,3))self.f11f1.add_subplot(111)self.canvas…

java 哈希算法_选择Java密码算法第1部分-哈希

java 哈希算法抽象 这是涵盖Java加密算法的三部分博客系列文章的第1部分。 该系列涵盖如何实现以下功能: 使用SHA–512散列 使用AES–256的单密钥对称加密 使用RSA–4096的公钥/私钥非对称加密 第一篇文章详细介绍了如何实现SHA–512哈希。 让我们开始吧。 免责…

在 Linux 下打包命令 tar 和压缩命令 7z 的配合使用示例

文章目录一、压缩命令(结合 tar 命令)二、解压命令(结合 tar 命令)一、压缩命令(结合 tar 命令) tar cf – /home/test | 7z a -si test.tar.7z上面命令将 /home/test 文件夹压缩为 test.tar.7z 文件。实际…

上传书籍进度信息到服务器...,使用HttpWebRequest实现大文件上传资料.pdf

Twilight Software Development Studio © 2011使用HttpWebRequest 实现大文件上传Author:xuzhihongCreate Date:2011-06-03Descriptions: WinForm 程序使用HttpWebRequest 实现大文件上传Url: /blog/static/2673158720115991432899/概述:通常在WinForm 程序中都…

做一个公众号大概要多少钱_公众号流量主一个月可以赚多少钱?

我是小郁儿,点击上方“关注”,每天为你分享自媒体运营与个人精进干货。细心的读者会发现,阅读我文章的时候,最下面不再出现广告卡片了,因为我前几天已经把流量主功能关掉。起初是因为我在看自己发的视频时,…

Linux 命令之 7za -- 文件压缩命令

文章目录一、命令介绍二、7za 和 7z 的区别三、常用选项四、命令示例(一)压缩指定目录下的内容(二)解压缩指定的压缩包到指定的目录下一、命令介绍 7za 一种文件压缩命令,7z格式具有高压缩比率,它采用了多…

从Speedment 3.0.17或更高版本的事务轻松返回值

交易次数 在我以前的文章中,我写了关于如何使用Speedment轻松使用事务的方法,其中我们原子地更新了两个银行帐户。 众所周知,事务是一种将多个数据库操作组合到一个原子执行的单个操作中的方法。 但是事务不仅与更新数据库有关,而…

华为路由设置虚拟服务器命令,华为路由器配置ip命令

基本命令  en 进入特权模式conf 进入全局配置模式in s0 进入 serial 0 端口配置ip add xxx.xxx.xxx.xxx xxx.xxx.xxx.xxx 添加ip 地址和掩码,电信分配enca hdlc/ppp 捆绑链路协议 hdlc 或者  ip unn e0  exit 回到全局配置模式in e0 进入以太接口配置ip add x…

分布式锁的三种实现方式_分布式锁的多种实现方式

目前几乎很多大型网站及应用都是分布式部署的,分布式场景中的数据一致性问题一直是一个比较重要的话题。分布式的CAP理论告诉我们“任何一个分布式系统都无法同时满足一致性(Consistency)、可用性(Availability)和分区…

apache ignite_使用Apache Ignite优化Spark作业性能(第1部分)

apache ignite来看看他们是如何工作的! 本文的某些部分摘自我的书《 Apache Ignite的高性能内存计算》 。 如果您对这篇文章感兴趣,请查看本书的其余部分,以获取更多有用的信息。 Apache Ignite提供了多种方法来提高Spark作业的性能&#xf…