python 剪切一行内容到另一个文件

自己做机器学习项目,手动打标签,完成后剪切一行数据到文件

参考内容:https://www.cnblogs.com/Dreamer-qiao/p/7390469.html

# 剪切一行数据到另外一个文件
# 用途:自己做机器学习数据,打标签,标记source第一行数据的label后,剪切追加到 target 最后
source = "train_data.txt"
target0 = "train_data_0.txt"
target1 = "train_data_1.txt"def del_line_from(file, del_line):  # del_line 行号从1开始with open(file, 'r', encoding="utf-8") as old_file:with open(file, 'r+', encoding="utf-8") as new_file:current_line = 0# 定位到需要删除的行while current_line < (del_line - 1):old_file.readline()current_line += 1# 当前光标在被删除行的行首,记录该位置seek_point = old_file.tell()# 设置光标位置new_file.seek(seek_point, 0)# 读需要删除的行,光标移到下一行行首del_line_content = old_file.readline()# 被删除行的下一行读给 next_linenext_line = old_file.readline()# 连续覆盖剩余行,后面所有行上移一行while next_line:new_file.write(next_line)next_line = old_file.readline()# 写完最后一行后截断文件,因为删除操作,文件整体少了一行,原文件最后一行需要去掉new_file.truncate()return del_line_content # 剪切的行的内容import sys
while True:label = ""try:label = input()except:passwith open(target0, 'a', encoding='utf-8') as f0:with open(target1, 'a', encoding='utf-8') as f1:data = del_line_from(source, 1)if data == "":continueif label == "":if data[-2] == "0":f0.write(data) # 将剪切的行,追加写入目标文件else:f1.write(data)elif label == "1":if data[-2] == "0":data = data[:-2]+"1\n"f1.write(data)elif label == "0":if data[-2] == "1":data = data[:-2]+"0\n"f0.write(data)else:print("------输入有误-------")print(data)

另外,可以用 sublime text 安装 Auto Refresh 插件,自动刷新文档显示
在 cmd 窗口输入 python ***.py 就可以标注了:

直接回车,接受原来的标签
输入 0, 或者 1 标注当前数据标签

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/472175.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[整理]详记被忽略的Get与Post

[事发]使用了近5年的项目&#xff0c;来了一个最最基本的bug画面输入号&#xff0c;跳转至后画面&#xff0c;号变成了空格&#xff01;[原因]画面使用url(get)方法传参数&#xff0c;并且没有进行url转码&#xff01;恐怖的是&#xff0c;几乎所有页面都是如此...[解决办法]1.…

【机器学习-数据科学】第二节:ipython开发环境搭建以及pandas快速入门

ipython开发环境搭建以及pandas快速入门0.开发环境搭建技巧网页版ipython&#xff1a;ipython notebooknumpy1.pandas 快速入门一导入创建对象2. pandas 快速入门二空数据处理apply的用法count和mode函数数据合并3. pandas 快速入门三数据整形数据透视时间序列数据可视化数据载…

pytorch图像和张量的相互转换_Day107:Pytorch张量类型的构建与相互转换

张量的作用Pytorch的数据类型为各式各样的Tensor&#xff0c;Tensor可以理解为高维矩阵(与Numpy中的Array类似)通过使用Type函数可以查看变量类型。一CPU张量类型Pytorch中的tensor包括七种CPU张量类型和八种GPU张量类型&#xff0c;这里我们就只讲解一下CPU中的&#xff0c;GP…

漂亮的html页面源码_爬虫数据分析之html

1、 htmlhtml 不是一种编程语言&#xff0c;而是一种标记语言&#xff0c;是制作网页所必须的&#xff0c;你在浏览器里看到的每一个页面&#xff0c;不论简单还是复杂&#xff0c;都是用html编写的&#xff0c;包括你现在看到的这篇文章。用html写一个简单的页面&#xff0c;是…

【leetcode刷题笔记】Excel Sheet Column Number

Related to question Excel Sheet Column Title Given a column title as appear in an Excel sheet, return its corresponding column number. For example: A -> 1B -> 2C -> 3...Z -> 26AA -> 27AB -> 28 题解&#xff1a;其实就是一个26进制数转换成十…

LeetCode 1864. 构成交替字符串需要的最小交换次数

文章目录1. 题目2. 解题1. 题目 给你一个二进制字符串 s &#xff0c;现需要将其转化为一个 交替字符串 。 请你计算并返回转化所需的 最小 字符交换次数&#xff0c;如果无法完成转化&#xff0c;返回 -1 。 交替字符串 是指&#xff1a;相邻字符之间不存在相等情况的字符串…

【机器学习-数据科学】第三节:数据分析实例 分析MovieLens电影数据

数据分析实例 分析MovieLens电影数据导入数据数据合并按性别查看各个电影的平均评分活跃电影排行榜电影投票数据 grouplens.org/datasets/movielens 把文件放到这个路径下 导入数据 数据合并 按性别查看各个电影的平均评分 查看男女评分差别最大的 按照diff去排序 找出分歧…

vue路由切换组件没有加载_Vue面试题: 如何实现路由懒加载?

非懒加载import List from /components/list.vue const router new VueRouter({routes: [{ path: /list, component: List }] })方案一(常用)const List () > import(/components/list.vue) const router new VueRouter({routes: [{ path: /list, component: List }] })方…

python2d 平滑插值处理_python中平滑的、通用的2D线性插值

我已经设法写了一个符合我的目的的函数。它通过沿网格线插值&#xff0c;然后在x和y方向插值平面&#xff0c;并取两者的平均值&#xff0c;从坐标网格中插值(填充)平面。在通过将坐标重塑为一维矢量&#xff0c;一次性插值平面&#xff0c;然后再重新塑造为二维&#xff0c;应…

LeetCode 1865. 找出和为指定值的下标对(哈希)

文章目录1. 题目2. 解题1. 题目 给你两个整数数组 nums1 和 nums2 &#xff0c;请你实现一个支持下述两类查询的数据结构&#xff1a; 累加 &#xff0c;将一个正整数加到 nums2 中指定下标对应元素上。计数 &#xff0c;统计满足 nums1[i] nums2[j] 等于指定值的下标对 (i,…

聚类算法 距离矩阵_快速且不需要超参的无监督聚类方法

论文&#xff1a; Efficient Parameter-free Clustering Using First Neighbor RelationsEfficient Parameter-free Clustering Using First Neighbor Relations​arxiv.org代码&#xff1a;https://github.com/ssarfraz/FINCH-Clustering​github.com此文是CVPR2019的oral文章…

服务器不知别内存_图文版 许迎果第63期 选购和使用内存需要注意的点

其实要说清楚内存的方方面面还是要颇费一番功夫的.内存的起源和发展历程估计要讲一期,内存厂商,颗粒,品牌也需要单独讲一期,内存超频也要单独讲一期.内存看似简单,但要说的内容却是很多的.所以为了节省各位小伙伴的时间,我会尽量精简,只讲对大多数人都比较实用的部分.本期大体上…

LeetCode 1877. 数组中最大数对和的最小值(贪心)

文章目录1. 题目2. 解题1. 题目 一个数对 (a,b) 的 数对和 等于 a b 。最大数对和 是一个数对数组中最大的 数对和 。 比方说&#xff0c;如果我们有数对 (1,5) &#xff0c;(2,3) 和 (4,4)&#xff0c;最大数对和 为 max(15, 23, 44) max(6, 5, 8) 8 。 给你一个长度为 偶…

5个经典的javascript面试问题

问题1&#xff1a;Scope作用范围 考虑下面的代码&#xff1a; (function() { var a b 5;})();console.log(b); 什么会被打印在控制台上&#xff1f; 回答 上面的代码会打印 5。这个问题的诀窍是&#xff0c;这里有两个变量声明&#xff0c;但 a 使用关键字var声明的。代表它…

python查看字符编码_python如何查看字符集

python查看字符集的方法&#xff1a;可以利用第三方库chardet来进行判断。通过在命令行下执行【pip install chatdet】命令来安装chardet。使用方法如&#xff1a;【chardet.detect(bHello, world!)】。Python利用第三方库chardet判断字符集。如果安装了Anaconda&#xff0c;ch…

小程序多个echars_小程序界面与逻辑

主要内容数据绑定、渲染、界面层数据渲染和事件处理。一、数据绑定1.1 渲染层和逻辑层小程序宿主环境我们称微信客户端给小程序所提供的环境为宿主环境。小程序借助宿主环境提供的能力&#xff0c;可以完成许多普通网页无法完成的功能。小程序开发框架的目标是通过尽可能简单、…

Bootloader启动过程

1、作用 嵌入式系统的引导加载程序&#xff0c;系统上电后运行的第一段程序。在完成对系统的初始化任务后&#xff0c;它会将非易失性存储器&#xff08;通常是FLASH&#xff09;中的Linux内核拷贝到RAM中&#xff0c;然后跳转到内核的第一条指令处继续执行&#xff0c;从而启动…

LeetCode 1876. 长度为三且各字符不同的子字符串

文章目录1. 题目2. 解题1. 题目 如果一个字符串不含有任何重复字符&#xff0c;我们称这个字符串为 好 字符串。 给你一个字符串 s &#xff0c;请你返回 s 中长度为 3 的 好子字符串 的数量。 注意&#xff0c;如果相同的好子字符串出现多次&#xff0c;每一次都应该被记入…

python官方的扩展索引_Python列表操作与深浅拷贝(6)——列表索引、查询、修改、扩展...

列表list定义L1 []L2 [1,2,‘abc‘]L3list()L4 list(range(5))L5 [1,‘abc‘,True,None,[4,5,‘abc‘],str]isinstance(L5,list)True列表索引访问L6 list(range(5,10))L6[5, 6, 7, 8, 9]正索引&#xff1a;从下边界至上边界&#xff0c;从0开始&#xff0c;为列表中每一个元素…

numpy维度交换_数据分析-gt;基本操作numpy(1)

1.Numpy介绍与安装Numpy是什么&#xff1f;Numpy(Numerical Python)是目前Python数值计算中最为重要的基础包。大多数计算包都提供了基于Numpy的科学函数功能&#xff0c;将Numpy的数组对象作为数据交换的通用语。Numpy特点提供高效多维数组提供了基于数组的便捷算术操作以及广…