零代码编程:用ChatGPT将SRT字幕文件批量转为Word文本文档

一个文件夹中有多个srt视频字幕文件,srt文件里面有很多时间轴:

现在想将其批量转为word文档,去掉里面与字符无关的时间轴,在ChatGPT中输入提示词:

你是一个Python编程专家,要完成一个批量将SRT字幕文件转为Word文本文档的任务,具体步骤如下:

打开文件夹:F:\儿童学习教育\Abadas.适合2岁以上.BBC儿童学习单词的动画;

读取里面所有的srt字幕文件;

将srt字幕文件里面的时间和数字序号全部去掉,只保留字幕文本,另存为word文档;

比如,原有的srt字幕文件内容为:

1

00:00:20,560 --> 00:00:22,760

'Hey, Abadas!'

2

00:00:22,760 --> 00:00:26,120

ALL: Hello, Ben! Come and play with us!

3

00:00:26,120 --> 00:00:30,000

And... # We'll have a...

转换后的word文档内容为:

'Hey, Abadas!'

ALL: Hello, Ben! Come and play with us!

And... # We'll have a...

注意:每一步都要输出相关信息

每一行代码都要给出详细的注释

ChatGPT的回复:

以下是一个使用 python-docx 和 re(正则表达式模块)将 SRT 字幕文件转为 Word 文档的 Python 脚本。请先安装 python-docx 库,可以通过 pip install python-docx 来安装。

import os

import re

from docx import Document

# 设置源文件夹路径

source_dir = 'F:/儿童学习教育/Abadas.适合2岁以上.BBC儿童学习单词的动画'

# 遍历源文件夹中的所有字幕文件

for file_name in os.listdir(source_dir):

# 确保是 SRT 文件

if file_name.endswith('.srt'):

file_path = os.path.join(source_dir, file_name)

print(f'正在处理字幕文件: {file_path}')

with open(file_path, 'r', encoding='utf-8') as f:

content = f.read()

# 使用正则表达式将时间和数字序号去掉

pattern = re.compile(r'\d+\n\d{2}:\d{2}:\d{2},\d+ --> \d{2}:\d{2}:\d{2},\d+\n')

text_only = re.sub(pattern, '', content)

# 创建一个 Word 文档,并将处理后的文本添加到文档中

doc = Document()

doc.add_paragraph(text_only)

# 将 Word 文档保存为一个新文件

word_file_path = file_path.replace('.srt', '.docx')

doc.save(word_file_path)

print(f'已将字幕文件保存为 Word 文档: {word_file_path}')

注意:此脚本假设所有的 SRT 文件都使用 UTF-8 编码。如果你的 SRT 文件使用其他编码,你可能需要修改 open() 函数中的 encoding 参数。此外,脚本假设 SRT 文件的时间戳和文本之间没有额外的空行。如果有额外的空行,你可能需要修改或添加正则表达式来处理它们。最后,这个脚本会直接修改你的文件系统,因此在运行之前请确保你已经备份了原始数据,或者在一个安全的环境下运行这个脚本。在运行这个脚本之前,请确保你的Python环境有足够的权限来读取和写入文件。以上代码未进行错误处理,实际使用时应考虑加入错误处理机制。

转换后的word文档如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/155706.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

js 数组中使用 push 报错

文章目录 问题分析 问题 代码如下,但报错如上,请分析上述代码错误原因 let arr [[160, 20], [179, 10], [-170, -20]]; let temp arr.unshift([1,1]); let tt temp.push([0,0])console.log(tt); // 输出新生成的数组分析 这段代码有几个错误&#x…

opencv-形态学处理

通过阈值化分割可以得到二值图,但往往会出现图像中物体形态不完整,变的残缺,可以通过形态学处理,使其变得丰满,或者去除掉多余的像素。常用的形态学处理算法包括:腐蚀,膨胀,开运算&a…

【设计模式】结构型设计模式

结构型设计模式 文章目录 结构型设计模式一、概述二、适配器模式(Adapter Pattern)2.1 类适配器模式2.2 对象适配器模式2.3 接口适配器模式2.4 小结 三、桥接模式(Bridge Pattern)四、装饰器模式(Decorator Pattern&am…

基于ubuntu20.04安装ros系统搭配使用工业相机

基于ubuntu20.04安装ros系统搭配使用工业相机 1. ROS系统安装部署1.1更新镜像源1.1.1 备份源文件1.1.2 更新阿里源1.1.3 更新软件源 1.2 ros系统安装1.2.1 添加ros软件源1.2.2 添加秘钥1.2.3 更新软件源1.2.4 配置及更换最佳软件源1.2.5 ROS安装1.2.6 初始化rosdep1.2.7 设置环…

datagrip只导出表结构

话不多说,直接上教程。 datagrip版本:2022.3 第一步,连接数据库 第二步,右击数据库,复制即可

【20年扬大真题】编写对数组求逆的递归算法

【20年扬大真题】 编写对数组求逆的递归算法 void swap(int* a, int* b) {int tmp *b;*b *a;*a tmp; } void Ni(int arr[],int left,int right) {if (left > right) {return;}swap(&arr[left], &arr[right]);Ni(arr, left 1, right - 1); } int main() {int ar…

详解Python安装requests库的实例代码

文章目录 前言基本用法基本的get请求带参数的GET请求解析json关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包项目源码合集①Python工具包②Python实战案例③Python小游戏源码五、面试资料六、Python兼职渠道 前…

“茶叶创新:爆改营销策略,三个月狂销2300万“

我的朋友去年制作了一款白茶,并在短短三个月内将其销售量推到了2300万的高峰。你相信吗? 这位朋友并没有任何茶叶方面的经验,他只是一个有着冒险精神的企业家。他先找到了一家代工厂,帮助他把他的茶叶理念转化为现实。 当他把茶叶…

win11,安装python,pip,和opencv

1,安装python 在应用商店,输入python,下载安装 2,安装pip 在cmd中,输入pip install SomePackage,安装某一个版本的pip 3,安装opencv 在cmd中,输入 pip3 install opencv-contrib-python -i https://pyp…

【Python】153是一个非常特殊的数,它等于它的每位数字的立方和,即153=1*1*1+5*5*5+3*3*3。编程求所有满足这种条件的三位十进制数。

问题描述 153是一个非常特殊的数,它等于它的每位数字的立方和,即1531*1*15*5*53*3*3。编程求所有满足这种条件的三位十进制数。 输出格式 按从小到大的顺序输出满足条件的三位十进制数,每个数占一行。 方法一: for i in range(10…

私域运营如何提高收益?

一旦建立了私域之后,企业需要不断地进行数据统计与分析,以寻找提高收益的方法。通过收集和分析用户的信息,了解他们的购物行为、心理需求等,从而制定更符合顾客口味的促销计划和产品服务。只有持续对数据进行监控,才能…

深度学习之基于Pytorch的昆虫分类识别系统

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介系统架构技术亮点 二、功能三、系统四. 总结 一项目简介 # 深度学习基于 Pytorch 的昆虫分类识别系统介绍 深度学习在图像分类领域取得了显著的成就&#…

ArcGIS Pro 优化的热点分析【Optimized Hot Spot Analysis】

ArcGIS Pro 优化的热点分析【Optimized Hot Spot Analysis】Optimized Hot Spot Analysis 优化的热点分析https://mp.weixin.qq.com/s/lfoIls8exW5G6PPJ9gtDew em,先给大家推荐一个空间统计分析的学习资源网站 https://spatialstats-analysis-1.hub.arcgis.com/ .…

策略选股辅助工具(八)

8-策略选股辅助工具 文章目录 8-策略选股辅助工具一. 查询某个股票日常分析数据的信息二. 查询可以做T的股票的策略信息三. 查询股票K线类型四. 查询策略因子筛选股票信息五. 查询日K数据 处理成 Pdf图信息六. 根据股票的编码和日期获取那段时间的所有的数据信息 一. 查询某个股…

[oeasy]python001_先跑起来_python_三大系统选择_windows_mac_linux

先跑起来 🥊 Python 什么是 Python? Python [ˈpaɪθɑ:n]是 一门 适合初学者 的编程语言 类库 众多 几行代码 就能 出 很好效果 应用场景丰富 在 各个应用领域 都有 行内人制作的 python 工具类库 非常专业、 好用 特别是 人工智能领域 pytho…

渲染器——双端Diff算法

简单 Diff 算法利用虚拟节点的 key 属性,尽可能地复用 DOM 元素,并通过移动 DOM 的方式来完成更新,从而减少不断地创建和销毁DOM 元素带来的性能开销。但是,简单 Diff 算法仍然存在很多缺陷,这些缺陷可以通过双端 Diff…

【阿里云】图像识别 摄像模块 语音模块

USB 摄像头模块测试及配置 一、首先将 USB 摄像头插入到 Orange Pi 开发板的 USB 接口中二、然后通过 lsmod 命令可以看到内核自动加载了下面的模块三、通过 v4l2-ctl 命令可以看到 USB 摄像头的设备节点信息为 /dev/video0四、使用 fswebcam 测试 USB 摄像头五、使用 motion …

chrome内置路径合集

设置黑夜模式: 输入网址:chrome://flags/ 搜索dark 改为enable 实验项目路径 chrome://flags/ 可用来启用或者关闭某些 Chrome 的实验功能 chrome://settings 将快速打开 Chrome 浏览器的设置页面,页面的内容分类划分为基础和高级设置选项 …

以太网_底层

【实物图】 【网线接口】 MAC(媒体访问控制器):控制数据的收发和管理,和用户层打交到;通过MII/RMII、SMI接口和PHY进行通信。 PHY(以太网物理层收发器):中间体,负责收发信号的转换 常见PHY芯片有:LAN8720…