推荐几个免费提取音视频文案的工具(SRT格式、通义千问、飞书妙记、VideoCaptioner、AsrTools)

文章目录

  • 1. 前言
  • 2. SRT格式
    • 2.1 SRT 格式的特点
    • 2.2 SRT 文件的组成
    • 2.3 SRT 文件示例
  • 3. 通义千问
    • 3.1 官网
    • 3.2 上传音视频文件
    • 3.3 导出文案
  • 4. 飞书妙记
    • 4.1 官网
    • 4.2 上传音视频文件
    • 4.3 导出文案
    • 4.4 缺点
  • 5. VideoCaptioner
    • 5.1 GitHub地址
    • 5.2 下载
      • 5.2.1 通过GitHub下载
      • 5.2.2 通过作者提供的地址下载
    • 5.3 安装
    • 5.4 上传音视频文件
    • 5.5 导出文案
    • 5.6 可能遇到的问题
      • 5.6.1 问题呈现
      • 5.6.2 问题产生的原因
      • 5.6.3 解决方法
    • 5.7 进阶使用教程
  • 6. AsrTools
    • 6.1 GitHub地址
    • 6.2 下载
    • 6.3 安装
    • 6.4 上传音视频文件
    • 6.5 导出文案

1. 前言

网上有一些大聪明提供了奇奇怪怪的提取音视频文案的方法,例如打开输入法的语音输入后,播放音视频,就可以自动将音视频转换成文字了,乍一看方法没什么问题,但如果音视频的非常长,使用这种方法分分钟崩溃

其实很多剪辑软件都有自动生成字幕的功能,例如剪映就有这个功能,生成字幕后还可以将字幕导出为SRT格式的文件。当然,这么好用的功能大概率都是需要付费的︿( ̄︶ ̄)︿

下面为大家介绍几个免费提取音视频文案的工具,这些工具大部分都是需要上传视频文件的,如果平台没有开放视频的下载权限,可以参考我的另一篇博文:推荐几个可以免费下载视频的软件(Neat Download Manager、蜗牛下载助手、bilidown)

2. SRT格式

SRT:SubRip Text,字幕文件

SRT 格式是一种简单的字幕文件格式,用于存储视频的字幕信息

2.1 SRT 格式的特点

  • 简单易懂: SRT 文件是纯文本文件,结构清晰,易于阅读和编辑
  • 广泛支持: 大多数视频播放器和字幕编辑软件都支持 SRT 格式
  • 跨平台: SRT 文件可以在不同的操作系统和设备上使用

2.2 SRT 文件的组成

SRT 文件由多个字幕块组成,每个字幕块包含以下信息:

  1. 序号: 字幕块的序号,从 1 开始递增
  2. 时间码: 字幕的出现和消失时间,格式为 小时:分钟:秒,毫秒 --> 小时:分钟:秒,毫秒
  3. 字幕文本: 字幕的文本内容,可以包含多行
  4. 空行: 用于分隔不同的字幕块

2.3 SRT 文件示例

通俗地说,SRT文件的作用就是告诉视频剪辑软件哪句字幕该在哪个时间段出现在视频上

1
00:00:20,000 --> 00:00:24,400
Hello, welcome to this video.2
00:00:25,000 --> 00:00:28,000
This is an example of SRT subtitles.3
00:00:29,000 --> 00:00:32,000
They are widely used and supported.

将SRT文件导入剪映等剪辑软件中,为视频添加字幕的工作可以在几秒内完成

3. 通义千问

3.1 官网

官网地址:https://www.tongyi.com/discover

https://www.tongyi.com/discover

点击发现

在这里插入图片描述

接着点击音视频速读

在这里插入图片描述

3.2 上传音视频文件

根据需求选择音视频语言、是否翻译、是否区分发言人等选项

在这里插入图片描述

上传完音视频文件之后点击确认

在这里插入图片描述

点击右上角的任务列表图标或下方的查看全部可以查看处理进度

在这里插入图片描述

3.3 导出文案

任务完成之后,点击右上角的导出按钮,可以选择导出的文档格式,也可以选择是否包含发言人和时间戳信息

最后点击导出按钮,就可以得到完整的文案了

在这里插入图片描述

通义千问还提供了脑图功能和笔记功能,感兴趣的同学可以摸索一下

4. 飞书妙记

4.1 官网

官网地址:https://www.feishu.cn/product/minutes

https://www.feishu.cn/product/minutes

进入到飞书妙记的官网后,点击登录按钮

在这里插入图片描述

登录成功后点击开启妙记按钮

在这里插入图片描述

4.2 上传音视频文件

在这里插入图片描述

选择语言后点击提交按钮

在这里插入图片描述

在这里插入图片描述

4.3 导出文案

处理完成后点击任务,在新的标签页打开

在这里插入图片描述

点击文字记录,接着点击右上角的三个点,最后导出文字记录

在这里插入图片描述

有三个可选项:

  • 导出的文件格式(有飞书文档、TXT、SRT三种格式)
  • 是否包含说话人
  • 是否包含时间戳

选择完成后点击导出按钮,就可以得到包含文案的文件了

在这里插入图片描述

4.4 缺点

每个月只有300分钟的免费时长

在这里插入图片描述

5. VideoCaptioner

5.1 GitHub地址

GitHub地址:https://github.com/WEIFENG2333/VideoCaptioner

https://github.com/WEIFENG2333/VideoCaptioner

在这里插入图片描述

项目是用Python编写的,感兴趣的同学可以把源码下载到本地,在自己的机器上跑一下


值得一提的是,项目的开发者是一个大学生

在这里插入图片描述

5.2 下载

作者贴心地为Windows用户准备了安装包

5.2.1 通过GitHub下载

下载地址:https://github.com/WEIFENG2333/VideoCaptioner/releases/tag/v1.3.3

https://github.com/WEIFENG2333/VideoCaptioner/releases/tag/v1.3.3

在这里插入图片描述

5.2.2 通过作者提供的地址下载

下载地址:https://wwwm.lanzoue.com/ii14G2pdsbej

在这里插入图片描述

5.3 安装

双击VideoCaptioner-Setup-win64-v1.3.3.exe安装包,一路点击下一步就可以了(记得更改软件的安装目录)

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

5.4 上传音视频文件

可以点击选择文件按钮上传,也可以直接拖动文件到窗口

在这里插入图片描述

5.5 导出文案

上传音视频文件后点击开始处理按钮

在这里插入图片描述

转录后的字幕文件默认存放在工作目录下,点击打开文件夹可以定位到字幕文件的所在位置。如果不想要SRT文件,只想要纯文字,可以使用本文介绍的AsrTools工具

在这里插入图片描述

语音转录后默认会合成视频与字幕,如果不需要该功能,可以在设置中关闭

合成后的视频默认存放在原视频所在的目录下

在这里插入图片描述

在这里插入图片描述

5.6 可能遇到的问题

5.6.1 问题呈现

在使用VideoCaptioner提取音视频的文案时,可能会遇到以下错误


转录失败 [WinError 3] 系统找不到指定的路径。:'F:VideoCaptionerlVideoCaptioner\lwork-di\檀东东_【进阶教
程】一套连招,彻底释放A!的写作能力 #AI助手 #豆包,AI #豆包电脑版 #AI文本创作\subtitle

在这里插入图片描述

5.6.2 问题产生的原因

一般产生这个问题是因为视频文件的命名中含有某些特殊字符,导致软件在创建目录时遇到了问题

5.6.3 解决方法

有两个解决方法:

  • 第一个方法是重命名视频文件,确保视频文件的命名没有特殊字母
  • 第二个方法时点击转录失败按钮,软件会重新转录一次。点击转录失败按钮重新转录,导出的文案默认存放在视频文件所在的目录下

在这里插入图片描述

点击打开文件夹也能查看字幕文件的所在位置

在这里插入图片描述

5.7 进阶使用教程

本文只演示了VideoCaptioner的基础用法,除了提取音视频的文案之外,VideoCaptioner还可以直接给视频添加字幕,无需借助剪辑软件


VideoCaptioner的更多进阶用法可以观看以下视频:

  • 第52集 | 免费无广!VideoCaptioner,一键视频字幕翻译 #ai #人工智能 #AI工具 #AI在抖音 #字幕
  • 第159集 | 基于LLM的智能字幕助手,完全免费,开盖即用! 最近在github上非常非常火爆的项目——卡卡字幕助手 | VideoCaptioner
  • 开源免费!一键生成字幕并翻译,中日英多语言支持!- 字幕生成、断句、优化、翻译全流程处理#ai #字幕 #软件#教程

6. AsrTools

AsrTools和VideoCaptioner由同一个作者开发,AsrTools可以看做是VideoCaptioner的前身

6.1 GitHub地址

GitHub地址:https://github.com/WEIFENG2333/AsrTools

在这里插入图片描述

项目是用Python编写的,感兴趣的同学可以把源码下载到本地,在自己的机器上跑一下

6.2 下载

下载地址:https://github.com/WEIFENG2333/AsrTools/releases/tag/v1.1.0

https://github.com/WEIFENG2333/AsrTools/releases/tag/v1.1.0

在这里插入图片描述

6.3 安装

无需安装,双击AsrTools.exe文件就可以直接运行软件了

在这里插入图片描述

6.4 上传音视频文件

可以点击选择文件按钮上传,也可以直接拖动文件到窗口

在这里插入图片描述

6.5 导出文案

上传音视频文件后点击开始处理,有SRT、TXT、ASS三种导出格式

在这里插入图片描述

运行过程中会出现一个黑窗,不要手动关闭黑窗,处理结束后会黑窗会自动关闭

在这里插入图片描述

导出的文案默认存放在视频文件所在的目录下,而且目录中会出现一个与视频文件同名的MP3文件,因为提取文案只需要音频,软件对视频的音频做了分离

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/77293.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux深度探索:进程管理与系统架构

1.冯诺依曼体系结构 我们常见的计算机,如笔记本。我们不常见的计算机,如服务器,大部分都遵守冯诺依曼体系。 截至目前,我们所认识的计算机,都是由⼀个个的硬件组件组成。 输入设备:键盘,鼠标…

观察者模式 (Observer Pattern)

观察者模式(Observer Pattern)是一种行为型设计模式。它定义了一种一对多的依赖关系,让多个观察者对象同时监听某一个主题对象。当主题对象的状态发生变化时,会自动通知所有观察者对象,使它们能够自动更新自己的状态。 一、基础 1. 意图 核心目的:定义对象间的一种一对…

Network.framework 的引入,不是为了取代 URLSession

Network.framework 的引入,不是为了取代 URLSession 如果你感觉 Network.framework 的引入, 可能是为了取代 URLSession, 那你就大错特错了!这里需要非常准确地区分一下: 🔵 Network.framework 不是为了取代 URLSession。 &…

Redis 数据分片三大方案深度解析与 Java 实战

Redis 数据分片是将数据分散存储在多个 Redis 实例上的技术,以解决单个 Redis 实例在存储容量、性能和可用性上的限制。常见的 Redis 数据分片方案包括客户端分片、代理分片和Redis Cluster(集群分片),以下为你详细介绍&#xff1…

FreeBSD可以不经过windows服务器访问windows机器上的共享文件吗?

答案是:当然可以! 使用sharity-light 软件 可以使用sharity-light 软件,直接不用安装samba等软件,直接访问windows机器上的共享文件。 但是可惜的是,sharity-light在FreeBSD的ports里弃用了。看来是从FreeBSD 8 就开…

主流 LLM 部署框架

主流 LLM 部署框架 框架主要特点适用场景vLLM- 超快推理(高吞吐) - 动态批处理 - 支持 HuggingFace Transformer - 支持 PagedAttention高并发、低延迟在线推理TGI (Text Generation Inference)- Huggingface官方出品 - 多模型管理 - 支持动态量化 - 支持…

在 Vue 3 setup() 函数中使用 TypeScript 处理 null 和 undefined 的最佳实践

在 Vue 3 中使用 setup() 函数和 TypeScript 时,null 和 undefined 是两个需要特别关注的类型。虽然它们看起来都表示“没有值”,但它们在 JavaScript 和 TypeScript 中有着不同的含义和使用场景。如果不小心处理它们,可能会导致潜在的 bug 或…

在 UniApp 中获取当前页面地址

在 UniApp 中获取当前页面地址,可以通过以下步骤实现: 方法说明: 获取当前页面实例:使用 getCurrentPages() 获取页面栈数组,最后一个元素即为当前页面实例。 提取页面路径和参数:从页面实例的 route 属性…

【华为】防火墙双击热备-之-主备模式-单外网线路-分享

FW1和FW2的业务接口都工作在三层,上行连接二层交换机。上行交换机连接运营商的接入点,运营商为企业分配的IP地址为100.100.100.2。现在希望FW1和FW2以主备备份方式工作。正常情况下,流量通过FW1转发;当FW1出现故障时,流…

crossOriginLoading使用说明

1. 说明 此配置用于控制 Webpack 动态加载的代码块&#xff08;chunk&#xff09;&#xff08;例如代码分割或懒加载的模块&#xff09;在跨域&#xff08;不同域名&#xff09;加载时的行为。它通过为动态生成的 <script>标签添加 crossorigin 属性&#xff0c;确保符合…

windows中安装VMware Workstation Pro虚拟机和ubuntu

目录 一、安装 VMware Workstation Pro 虚拟机 1、官网下载VMware Workstation Pro 1.1 选中 "VMware Workstation Pro for PC" 的 "DOWNLOAD NOW" 1.2 跳转到broadcom登录页面 1.3 注册账号 1.4 输入给邮箱收到的验证码信息&#xff0c;然后点击”Verify…

如何快速轻松地恢复未保存的 Word 文档:简短指南

文字处理器已经存在了几十年&#xff0c;其中许多已经变得非常擅长防止问题。丢失未保存的数据是一个常见问题&#xff0c;因此办公软件通常带有恢复文件的方法。在本文中&#xff0c;我们将介绍如何恢复 Word 文档&#xff0c;即使您尚未保存它。 确保数据安全的最佳方法是保…

JavaScript原生实现简单虚拟列表(列表不定高)

本文首发在我的个人博客上&#xff1a;JavaScript原生实现简单虚拟列表(列表不定高)https://www.brandhuang.com/article/1745637125513 前言 之前实现了一个定高版本的虚拟列表&#xff0c;今天在定高版本的基础上稍作调整&#xff0c;来实现不定高版本&#xff0c;之前的版本…

redis数据类型-位域bitfield

redis数据类型-位域bitfield 文档 redis单机安装redis常用的五种数据类型redis数据类型-位图bitmapredis数据类型-基数统计HyperLogLogredis数据类型-地理空间GEOredis数据类型-流Stream 官方文档 官网操作命令指南页面&#xff1a;https://redis.io/docs/latest/commands/…

pandas读取MySQL中的数据

使用pandas读取MySQL中的数据 1、导入库 pip install pandas pip install sqlalchemy2、示例代码 # -*- coding: utf-8 -*-import pandas as pd import re from sqlalchemy import create_engine# 清洗文本 def clean_text(text):text

MyBatis缓存配置的完整示例,包含一级缓存、二级缓存、自定义缓存策略等核心场景,并附详细注释和总结表格

以下是MyBatis缓存配置的完整示例&#xff0c;包含一级缓存、二级缓存、自定义缓存策略等核心场景&#xff0c;并附详细注释和总结表格&#xff1a; 1. 一级缓存&#xff08;默认开启&#xff09; // 使用同一SqlSession执行两次查询&#xff0c;自动命中一级缓存 try (SqlSe…

深入解析 C++17 中的std::variant与std::visit:从原理到实践

引言 什么是std::variant 在 C17 之前&#xff0c;如果你想在一个变量中存储多种可能的类型&#xff0c;通常会使用 union 或 void* 指针。然而&#xff0c;这些方法都有明显的缺点。 使用 union 时&#xff0c;类型信息会丢失&#xff0c;使得代码容易出错。 void* 指针则需…

Dijkstra算法对比图神经网络(GNN)

什么是AI模型? AI模型(人工智能模型)是一类模仿人类智能行为的数学模型或算法。它们通过从大量数据中学习,识别模式、做出预测或决策。常见的AI模型包括机器学习模型(如决策树、神经网络、支持向量机)和深度学习模型(如卷积神经网络CNN、循环神经网络RNN)。简单来说,…

Yarn 安装与使用教程

Yarn 安装与使用教程 Yarn 是一个由 Facebook 开发的 JavaScript 包管理工具&#xff0c;它比传统的 npm 更加高效、可靠&#xff0c;并且在性能上有所提升。Yarn 主要解决了 npm 安装速度慢、并发性差、缓存机制不完善等问题&#xff0c;它提供了更快的安装速度、更稳定的依赖…

Spring Boot 的配置加载顺序

Spring Boot 的配置加载顺序是“后来居上”——优先级高的配置源会覆盖优先级低的配置源中的同名配置 覆盖规则如下&#xff1a; 后加载的配置具有更高的优先级&#xff0c;会覆盖先加载的配置。如果多个配置源中存在同名配置项&#xff0c;最终生效的是具有最高优先级的那个…