调用百度api实现语音识别(python)

该代码实现了一个企业级的语音识别解决方案,通过调用百度语音识别API,实现实时录音识别和对已有音频语音识别功能。

百度智能云:请自行访问百度智能云,开通免费的语音识别功能,获取API_KEY和SECRET_KEY。操作按照百度流程即可,可免费申请。

首先,配置下百度API和描述下错误代码信息。以下是音频相关具体参数:

采样率16000 Hz符合语音识别最佳实践
缓冲区大小1024样本/块平衡延迟与稳定性
最大录音时长60秒API限制
文件大小限制10MB内存安全阈值
线程超时1000ms防止僵尸线程
状态刷新频率500ms用户体验优化
# 百度API配置(替换为您自己的API信息)
API_KEY = "你的API_KEY"
SECRET_KEY = "你的SECRET_KEY"
AUTH_URL = "https://aip.baidubce.com/oauth/2.0/token"
ASR_URL = "https://vop.baidubce.com/pro_api"# 错误代码映射
ERROR_CODES = {3300: '输入参数不正确',3301: '音频质量过差',3302: '音频鉴权失败',3303: '服务端请求失败',3304: '音频过长(超过60秒)',3305: '音频数据错误',3307: '识别结果解密失败',3308: '语音服务器系统错误',3309: '上传的音频没有有效数据',3310: '输入的音频文件过大',3311: '采样率参数错误',3312: '音频格式参数错误',3313: '语音服务器忙',
}

下面,进行‌窗口配置‌,设置窗口标题为 "百度语音识别工具",定义窗口初始大小为 800x500 像素
‌状态初始化‌:is_recording: 录音状态标志(False 表示未在录音);access_token: 存储百度API的访问令牌(初始为None);audio: PyAudio实例,用于音频输入输出控制;recording_thread: 录音线程(用于后台录音);temp_files: 临时录音文件存储列表。
‌音频参数‌:”FORMAT- 音频格式为16位PCM(pyaudio.paInt16);CHANNELS- 单声道录音(1声道);RATE- 采样率16000Hz(符合百度API要求);CHUNK: 每次读取的音频块大小(1024样本) 。

def __init__(self, root):self.root = rootroot.title("百度语音识别工具")root.geometry("800x500")# 初始化状态self.is_recording = Falseself.access_token = Noneself.audio = pyaudio.PyAudio()self.recording_thread = Noneself.temp_files = []# 音频参数self.FORMAT = pyaudio.paInt16self.CHANNELS = 1self.RATE = 16000self.CHUNK = 1024# 创建界面self.setup_ui()# 获取访问令牌self.get_access_token()

下面进行界面布局,使用 ttk.Frame 作为容器,标题为 "文件操作",文本输入框 (ttk.Entry): 显示选择的文件路径,"浏览..." 按钮: 调用 select_file 方法打开文件对话框,"开始识别" 按钮: 调用 process_selected_file 处理文件。‌录音控制区‌:单个按钮 (record_btn),初始文本为 "▶ 开始录音"
点击触发 toggle_recording 方法切换录音状态;‌结果展示区‌:tk.Text 组件支持文本换行 ,附加垂直滚动条 (ttk.Scrollbar),与文本框联动。使用 StringVar 动态更新状态文本。

def setup_ui(self):"""设置界面布局"""main_frame = ttk.Frame(self.root, padding=10)main_frame.pack(fill=tk.BOTH, expand=True)# 文件选择区域file_frame = ttk.LabelFrame(main_frame, text="文件操作", padding=10)file_frame.pack(fill=tk.X, pady=5)self.file_entry = ttk.Entry(file_frame, width=50)self.file_entry.pack(side=tk.LEFT, padx=5)ttk.Button(file_frame, text="浏览...", command=self.select_file).pack(side=tk.LEFT, padx=5)ttk.Button(file_frame, text="开始识别", command=self.process_selected_file).pack(side=tk.LEFT, padx=5)# 录音控制区域record_frame = ttk.LabelFrame(main_frame, text="实时录音", padding=10)record_frame.pack(fill=tk.X, pady=5)self.record_btn = ttk.Button(record_frame, text="▶ 开始录音",command=self.toggle_recording)self.record_btn.pack(pady=5)# 结果显示区域result_frame = ttk.LabelFrame(main_frame, text="识别结果", padding=10)result_frame.pack(fill=tk.BOTH, expand=True)self.result_text = tk.Text(result_frame, wrap=tk.WORD)scrollbar = ttk.Scrollbar(result_frame, command=self.result_text.yview)self.result_text.configure(yscrollcommand=scrollbar.set)self.result_text.pack(side=tk.LEFT, fill=tk

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/74421.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

KRaft模式

目录标题 Kraft模式**1. 什么是Kraft模式?****2. 为什么引入Kraft模式?****3. 核心优势****4. 架构与工作原理****5. 部署与配置要点****6. 适用场景与最佳实践****总结**KIP-833: Mark KRaft as Production Ready除了Kraft模式,Kafka还有以下…

单片机电路中常见的英文术语及缩写

以下是单片机电路中常见的英文术语及缩写的解释及其作用说明,按功能分类整理,便于理解: 一、核心术语 MCU (Microcontroller Unit) • 中文:微控制器单元 • 作用:单片机的核心芯片,集成CPU、存储器、外设接…

常见框架漏洞之一:Thinkphp5x

ThinkPHP是为了简化企业级应⽤开发和敏捷WEB应⽤开发⽽诞⽣的,是⼀个快速、兼容⽽且简单的轻量级国产PHP开发框架,诞⽣于2006年初,原名FCS,2007年元旦正式更名为 ThinkPHP,遵循Apache2开源协议发布,从Stru…

2025年优化算法:龙卷风优化算法(Tornado optimizer with Coriolis force,TOC)

龙卷风优化算法(Tornado optimizer with Coriolis force)是发表在中科院二区期刊“ARTIFICIAL INTELLIGENCE REVIEW”(IF:11.7)的2025年智能优化算法 01.引言 当自然界的狂暴之力,化身数字世界的智慧引擎&…

面试中如何回答性能优化的问题

性能问题和Bug不同,后者的分析和解决思路更清晰,很多时候从应用日志(文中的应用指分布式服务下的单个节点)即可直接找到问题根源,而性能问题,其排查思路更为复杂一些。 对应用进行性能优化,是一个系统性的工程,对工程师的技术广度和技术深度都有所要求。一个简单的应用…

CMake 函数和宏

CMake 函数 CMake 函数定义语法如下, 其中 name 为函数名, <arg1> 为参数名, <commands> 为函数体. 函数定义后, 可以通过 name 调用函数. 函数名允许字母数字下划线, 不区分大小写. function(name [<arg1> ...])<commands> endfunction()如下的样例…

【QA】Qt有哪些迭代器模式的应用?

在 Qt/C 中&#xff0c;迭代器模式的设计主要分为 标准 C 风格 和 Qt 框架特有风格&#xff0c;以下结合代码详细说明两种实现方式的关键设计及其应用场景&#xff1a; 一、Qt 框架中的迭代器模式设计 Qt 提供了两种迭代器风格&#xff1a;Java 风格&#xff08;显式迭代器&am…

Mysql表的简单操作

&#x1f3dd;️专栏&#xff1a;Mysql_猫咪-9527的博客-CSDN博客 &#x1f305;主页&#xff1a;猫咪-9527-CSDN博客 “欲穷千里目&#xff0c;更上一层楼。会当凌绝顶&#xff0c;一览众山小。” 目录 3.1 创建表 3.2 查看表结构 3.3 修改表 1. 添加字段 2. 修改字段 3…

【云馨AI-大模型】自动化部署Dify 1.1.2,无需科学上网,Linux环境轻松实现,附Docker离线安装等

Dify介绍 官网&#xff1a;https://dify.ai/zh生成式 AI 应用创新引擎开源的 LLM 应用开发平台。提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力&#xff0c;轻松构建和运营生成式 AI 原生应用。 Dify安装脚本 目录创建 mkdir -p /data/yunxinai &&a…

WordPress上传图片时显示“未提供数据”错误

在WordPress中上传图片时显示“未提供数据”的错误&#xff0c;通常是由多种原因引起的&#xff0c;以下是一些常见的问题及其解决方法&#xff1a; 1. 文件权限问题 WordPress需要正确的文件和目录权限才能正常上传图片。如果权限设置不正确&#xff0c;可能会导致无法上传图…

python3面试题20个(python web篇)

更多内容请见: python3案例和总结-专栏介绍和目录 文章目录 1.python asyncio的原理?2.对Flask蓝图(Blueprint)的理解?3.Flask 和 Django 路由映射的区别?4.什么是wsgi,uwsgi,uWSGI?5.Django、Flask、Tornado的对比?6.CORS 和 CSRF的区别?7.Session,Cookie,JWT的理解8.简…

RedisTemplate和RedissonClient适用的场景有什么不同

在 Spring Boot 项目中&#xff0c;RedisTemplate 和 RedissonClient 分别针对不同的使用场景设计&#xff0c;以下是它们的核心区别和适用场景分析&#xff1a; 一、RedisTemplate&#xff08;Spring Data Redis&#xff09; 定位 Spring 官方提供的 Redis 操作工具&#xf…

人脸表情识别系统分享(基于深度学习+OpenCV+PyQt5)

最近终于把毕业大论文忙完了&#xff0c;众所周知硕士大论文需要有三个工作点&#xff0c;表情识别领域的第三个工作点一般是做一个表情识别系统出来&#xff0c;如下图所示。 这里分享一下这个表情识别系统&#xff1a; 采用 深度学习OpenCVPyQt5 构建&#xff0c;主要功能包…

GitHub供应链攻击事件:Coinbase遭袭,218个仓库暴露,CI/CD密钥泄露

此次供应链攻击涉及GitHub Action "tj-actions/changed-files"&#xff0c;最初是针对Coinbase的一个开源项目的高度定向攻击&#xff0c;随后演变为范围更广的威胁。 攻击过程与影响 Palo Alto Networks Unit 42在一份报告中指出&#xff1a;“攻击载荷主要针对其…

Redis 核心源码解析:从设计哲学到企业级应用实践

一、Redis 的核心设计哲学 Redis 的成功源于其 「用内存换时间」 的核心理念&#xff0c;围绕以下三个核心原则构建&#xff1a; 极简主义&#xff1a;单线程模型避免锁竞争&#xff0c;代码保持高度内聚。 性能至上&#xff1a;所有数据常驻内存&#xff0c;网络层采用事件驱…

GZCTF平台搭建及题目上传

前言 我用手里的Ubuntu虚拟机搭建的&#xff0c;大家根据自己的实际情况来吧 安装及部署 首先&#xff0c;你的虚拟机需要有Docker和Docker-Compose&#xff0c;前者可以看我之前的文章&#xff0c;另外一个可以输入下面的命令安装&#xff0c;注意先获取管理员权限&#xff…

Pycharm社区版创建Flask项目详解

一、创建工程项目 二、配置工程目录 新建的空项目下创建目录。 1、新建app.py文件 2、app.py代码如下&#xff1a; from flask import Flask, render_templateapp Flask(__name__)app.route("/") def root():"""主页:return: Index.html"&qu…

CentOS 7 64位安装Docker

以下是在已有的 CentOS 7 64 位虚拟机上安装 Docker 并配置华为镜像源的详细步骤&#xff1a; 1. 备份原有 Yum 源&#xff08;可选&#xff0c;建议操作&#xff09; # 备份原有仓库文件 sudo mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backu…

运动仿真——phased.Platform

在雷达仿真过程中&#xff0c;运动仿真的必要性&#xff0c;以及运动仿真可以实现哪些功能&#xff0c;在matlab对应的user guide中已经讲的很清楚了&#xff0c;这里不再赘述。 本文主要介绍phased.Platform的一些“坑”&#xff0c;和典型的用法。 第一坑&#xff1a;系统对…

缓存删除三级补偿方案:延迟队列+消息队列+定时任务兜底

问题背景: 在 Cache-Aside 模式中&#xff0c;更新数据库后删除缓存失败会导致数据不一致。本文提供工业级三级补偿方案&#xff0c;实现最终一致性保障。 整体架构: 更新操作触发 → 一级延迟队列 → 二级消息队列 → 三级定时任务方案实现: 一、第一级补偿&#xff1a;延迟队…