python-录音文件转换成文字

大多数语音转文字工具都是要收费的,免费的很少,而且质量也不太高,python有自己的语音识别库,因此尝试使用一下。

先安装库:

pip install pydub speechrecognition
pip install pydub

安装 ffmpeg

brew install ffmpeg

录音格式要转换成wav 

# 定义音频文件路径
audio_file_path = "path_to_your_audio_file.m4a"
wav_file_path = "path_to_your_audio_file.wav"# 将M4A文件转换为WAV格式
audio = pydub.AudioSegment.from_file('a1.m4a', format="m4a")
audio.export(wav_file_path, format="wav")
import pydub
import speech_recognition as sr# 定义音频文件路径
audio_file_path = "path_to_your_audio_file.m4a"
wav_file_path = "path_to_your_audio_file.wav"# 将M4A文件转换为WAV格式
audio = pydub.AudioSegment.from_file('a1.m4a', format="m4a")
audio.export(wav_file_path, format="wav")# 初始化识别器
recognizer = sr.Recognizer()# 使用识别器识别音频文件中的语音
with sr.AudioFile(wav_file_path) as source:audio_data = recognizer.record(source)try:# 使用Google Web Speech API识别语音text = recognizer.recognize_google(audio_data, language="zh-CN")print("识别的文本:", text)except sr.UnknownValueError:print("无法识别音频中的语音")except sr.RequestError as e:print("无法处理音频请求; {0}".format(e))

运行:

python voice.py

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/31717.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024.6.23周报

目录 摘要 ABSTRACT 一、文献阅读 一、题目 二、摘要 三、网络架构 四、创新点 五、文章解读 1、Introduction 2、Method 3、实验 4、结论 二、代码实验 总结 摘要 本周阅读了一篇题目为NAS-PINN: NEURAL ARCHITECTURE SEARCH-GUIDED PHYSICS-INFORMED NEURAL N…

解决电脑关机难题:电脑关不了机的原因以及方法

在使用电脑的日常生活中,有时会遇到一些烦人的问题,其中之一就是电脑关不了机。当您尝试关闭电脑时,它可能会停留在某个界面,或者根本不响应关机指令。这种情况不仅令人困惑,还可能导致数据丢失或系统损坏。 在本文中…

DS:堆的应用——两种算法和TOP-K问题

欢迎来到Harper.Lee的学习世界!博主主页传送门:Harper.Lee的博客主页想要一起进步的uu可以来后台找我哦! 一、堆的排序 1.1 向上调整——建小堆 1.1.1 代码实现 //时间复杂度:O(N*logN) //空间复杂度:O(logN) for (…

计算机网络知识点汇总

计算机网络知识点汇总 第1章计算机网络体系结构 1.1 计算机网络概述 1.1.1 计算机网络的概念 ​ 计算机网络是由若干个结点(node)和连接这些结点的链路(link)组成。网络中的结点可以是就三级、集线器、交换机、或者路由器等,网络之间通过路由器进行互联&#xf…

Nodejs 第七十九章(Kafka进阶)

kafka前置知识在上一章讲过了 不再复述 kafka进阶 1. server.properties配置文件 server.properties是Kafka服务器的配置文件,它用于配置Kafka服务的各个方面,包括网络设置、日志存储、消息保留策略、安全认证 #broker的全局唯一编号,不能…

MySQL数据库初体验+数据库管理(其一)

【1】 操作系统介绍: Linux操作系统有 RedHat CentOS Debian Ubuntu OpenSUSE 信创标准 国产系统 : 华为(欧拉) 阿里(龙蜥) 腾讯 (tencentOS) 麒麟&#xf…

【日记】梦到兄长要给鳄鱼换牙齿……(421 字)

正文 今天中午睡了一个小时多一点,做了一个很奇怪的梦。梦见兄长要给一条鳄鱼换牙齿,还说早上不好操作,要三天之后的中午或晚上,颇有一种翻黄历寻个良辰吉日之感。但我没那样大的耐性,便捏住鳄鱼的嘴,左摔右…

实战18:基于tkinter+jupyter notebook开发的情感分析系统

项目演示: 完整代码: import pandas as pd import numpy as np from collections import Counter import re import jieba from tqdm import tqdm from sklearn.metrics import roc_curve, auc import joblib import gensim from sklearn.svm import SVC from gensim.mode…

STM32小项目———感应垃圾桶

文章目录 前言一、超声波测距1.超声波简介2.超声波测距原理2.超声波测距步骤 二、舵机的控制三、硬件搭建及功能展示总结 前言 一个学习STM32的小白~ 有问题请评论区或私信指出 提示:以下是本篇文章正文内容,下面案例可供参考 一、超声波测距 1.超声波…

Studying-代码随想录训练营day16| 513找到左下角的值、112.路径总和、106从中序与后序遍历序列构造二叉树

第十六天,二叉树part03💪💪💪,编程语言:C 目录 513找到左下角的值 112.路径总和 113.路径总和II 106从中序与后序遍历序列构造二叉树 105.从前序与中序遍历序列构造二叉树 总结 513找到左下角的值…

[240621] Anthropic 发布了 Claude 3.5 Sonnet AI 助手 | Socket.IO 拒绝服务漏洞

目录 Anthropic 发布 Claude 3.5 Sonnet AI 助手Scoket.IO 拒绝服务漏洞(CVE-2024-38355) Anthropic 发布 Claude 3.5 Sonnet AI 助手 Claude 3.5 Sonnet: 更智能、更快速、更安全的 AI 助手 一、 引言 Anthropic 发布了 Claude 3.5 Sonnet&#xff0…

docker +tmux 远程本地gdb调试

文章目录 远程调试docker pull失败docker上容器运行程序失败宿主机远程调试docker中运行的程序环境准备调试步骤 本地调试bugpwngdbtmuxpwngdb和tmux优化~~感觉用了大佬的镜像后宿主机来做pwn题都不香了~~ 远程调试 但目前不知道如何实现可以边跟着脚本运行调试的方法 docker…

前端刻度条

前端刻度条可以通过CSS和JavaScript实现。以下是一个简单的示例&#xff1a; HTML: <div class"progress-bar"><div class"progress"></div> </div>CSS: .progress-bar {width: 200px;height: 20px;border: 1px solid #ccc;bac…

三维渲染中物体与背景间的自然过渡

在三维渲染中&#xff0c;实现物体与背景间的自然过渡是提升渲染图像真实感和美观度的关键环节。以下是几种实现这一自然过渡的主要技术和方法&#xff1a; 1. 景深效果 景深&#xff08;Depth of Field, DoF&#xff09;模拟真实相机的特性&#xff0c;使得焦点之外的物体模…

sqlalchemy使用on_duplicate_key_update在尝试插入重复键的数据时更新记录

sqlalchemy使用on_duplicate_key_update在尝试插入重复键的数据时更新记录 在SQLAlchemy中&#xff0c;在尝试插入重复键的数据时更新记录&#xff0c;可以使用on_duplicate_key_update方法。这个方法是在SQLAlchemy 1.4版本中引入的&#xff0c;它允许你定义在发生键重复时&a…

慢阻肺患者为何容易营养不良?朗格力教你轻松改善

#肺科营养#朗格力#班古营养#复合营养素#肺部营养#肺部健康# 慢阻肺是我国常见的、高患病率的慢性呼吸系统疾病,会对肺结构和功能产生影响,从而引起各种不良反应,其中营养不良是常见并发症之一。慢阻肺为什么会发生营养不良?营养不良又是怎么伤害慢阻肺的呢?为什么像班古精准…

安卓逆向案例——XX电影网

安卓app逆向——XX电影网 请求数据 GET /user/qk_login?requestyiSK6f7UI8TdTk5tmbx6sl3qCEL8Mn38S6h9c%2BeVxcs%3D HTTP/1.1 pid: 236 ver: 100/152/2016020901 Did: b70efb1db740444f osv: 33 devicemodel: Xiaomi/Mi 10 osvr: 13 key: 88b517dde01a39730e28f8de8678fb6d …

鸿蒙开发:【进程模型概述】

进程模型概述 系统的进程模型如下图所示&#xff1a; 应用中&#xff08;同一包名&#xff09;的所有PageAbility、ServiceAbility、DataAbility、FormAbility运行在同一个独立进程中&#xff0c;即图中绿色部分的“Main Process”。 WebView拥有独立的渲染进程&#xff0c;即…

什么是光子带隙光纤?

长期以来,光纤通信的发展受到纤芯材料特性的限制,特别是损耗特性。二氧化硅在可见光至近红外波长范围内损耗低,与激光器工作波长相匹配,因此成为长途电信应用中光纤纤芯的首选材料。 这类光纤的纤芯是实心的,传输原理是基于全内反射(Total Internal Reflection, TIR),其…

ServBay 下一代Web开发环境

ServBay是一个集成式、图形化的本地化Web开发环境。开发者通过ServBay几分钟就能部署一个本地化的开发环境。解决了Web开发者&#xff08;比如PHP、Nodejs&#xff09;、测试工程师、小型团队安装和维护开发测试环境的问题&#xff0c;同时可以快速的进行环境的升级以及维护。S…