《QT实用小工具·五十七》基于QT的语音识别

1、概述
源码放在文章末尾

该文章实现了简单的语音识别功能,首先,语音识别要做三件事情 :
1.记录用户的语音文件到本地
2.将用户语音编码 使用flac或者speex进行编码
3.使用第三方语音识别API或者SDK进行分析识别语音 目前做的比较简单就是使用flac文件对wav音频文件进行编码 基于Mac OSX和Win 7平台的 win 7下使用flac.exe,具体exe帮助,读者可以使用flac.exe --help > help.txt 重定向到一个help文件中,方便查阅. mac osx下面安装flac.dmg的安装包即可使用flac命令 我们先看音频的录入 Qt集成了音频模块

项目部分代码如下所示:


/** Based on Qt Example* PCM2WAV is not mine, I found it in Google and modified it.*/#ifndef SPEECHINPUT
#define SPEECHINPUT#include <QPixmap>
#include <QWidget>
#include <QObject>
#include <QPushButton>
#include <QByteArray>
//#include <Phonon/AudioOutput>
#include <QtMultimedia>
#include <QIODevice>
#include <QFile>class WavPcmFile : public QFile {
public:WavPcmFile(const QString & name, const QAudioFormat & format, QObject *parent = 0);bool open();void close();private:void writeHeader();bool hasSupportedFormat();QAudioFormat format;
};class AudioInfo : public QIODevice
{Q_OBJECT
public:AudioInfo(const QAudioFormat &format, QObject *parent, const QString &filename = "./data/tmp/speechInput.wav");~AudioInfo();void start();void stop();qreal level() const { return m_level; }qint64 readData(char *data, qint64 maxlen);qint64 writeData(const char *data, qint64 len);private:const QAudioFormat m_format;quint16 m_maxAmplitude;qreal m_level; // 0.0 <= m_level <= 1.0WavPcmFile * m_file;signals:void update();
};class RenderArea : public QPushButton
{Q_OBJECTpublic:RenderArea(QWidget *parent = 0);void setLevel(qreal value);protected:void paintEvent(QPaintEvent *event);private:qreal m_level;QPixmap m_pixmap;
};#endif
/** Based on Qt Example* PCM2WAV is not mine, I found it in Google and modified it.*/#include "speechInput.h"#include <QtEndian>
#include <QDebug>
#include <QPainter>WavPcmFile::WavPcmFile(const QString & name, const QAudioFormat & format_, QObject *parent_): QFile(name, parent_), format(format_)
{
}bool WavPcmFile::hasSupportedFormat()
{return (format.sampleSize() == 8&& format.sampleType() == QAudioFormat::UnSignedInt)|| (format.sampleSize() > 8&& format.sampleType() == QAudioFormat::SignedInt&& format.byteOrder() == QAudioFormat::LittleEndian);
}bool WavPcmFile::open()
{if (!hasSupportedFormat()) {setErrorString("Wav PCM supports only 8-bit unsigned samples ""or 16-bit (or more) signed samples (in little endian)");return false;} else {if (!QFile::open(ReadWrite | Truncate))return false;writeHeader();return true;}
}void WavPcmFile::writeHeader()
{QDataStream out(this);out.setByteOrder(QDataStream::LittleEndian);// RIFF chunkout.writeRawData("RIFF", 4);out << quint32(0); // Placeholder for the RIFF chunk size (filled by close())out.writeRawData("WAVE", 4);// Format description chunkout.writeRawData("fmt ", 4);out << quint32(16); // "fmt " chunk size (always 16 for PCM)out << quint16(1);  // data format (1 => PCM)out << quint16(format.channelCount());out << quint32(format.sampleRate());out << quint32(format.sampleRate() * format.channelCount()* format.sampleSize() / 8 ); // bytes per secondout << quint16(format.channelCount() * format.sampleSize() / 8); // Block alignout << quint16(format.sampleSize()); // Significant Bits Per Sample// Data chunkout.writeRawData("data", 4);out << quint32(0);  // Placeholder for the data chunk size (filled by close())Q_ASSERT(pos() == 44); // Must be 44 for WAV PCM
}void WavPcmFile::close()
{// Fill the header size placeholdersquint32 fileSize = size();QDataStream out(this);// RIFF chunk sizeseek(4);out << quint32(fileSize - 8);// data chunk sizeseek(40);out << quint32(fileSize - 44);QFile::close();
}AudioInfo::AudioInfo(const QAudioFormat &format, QObject *parent, const QString &filename):   QIODevice(parent),   m_format(format),   m_maxAmplitude(0),   m_level(0.0){switch (m_format.sampleSize()) {case 8:switch (m_format.sampleType()) {case QAudioFormat::UnSignedInt:m_maxAmplitude = 255;break;case QAudioFormat::SignedInt:m_maxAmplitude = 127;break;default:break;}break;case 16:switch (m_format.sampleType()) {case QAudioFormat::UnSignedInt:m_maxAmplitude = 65535;break;case QAudioFormat::SignedInt:m_maxAmplitude = 32767;break;default:break;}break;default:break;}m_file = new WavPcmFile(filename,format,this);}AudioInfo::~AudioInfo()
{
}void AudioInfo::start()
{m_file->open();open(QIODevice::WriteOnly);
}void AudioInfo::stop()
{close();m_file->close();
}qint64 AudioInfo::readData(char *data, qint64 maxlen)
{Q_UNUSED(data)Q_UNUSED(maxlen)return 0;
}qint64 AudioInfo::writeData(const char *data, qint64 len)
{if (m_maxAmplitude) {Q_ASSERT(m_format.sampleSize() % 8 == 0);const int channelBytes = m_format.sampleSize() / 8;const int sampleBytes = m_format.channelCount() * channelBytes;Q_ASSERT(len % sampleBytes == 0);const int numSamples = len / sampleBytes;quint16 maxValue = 0;const unsigned char *ptr = reinterpret_cast<const unsigned char *>(data);for (int i = 0; i < numSamples; ++i) {for(int j = 0; j < m_format.channelCount(); ++j) {quint16 value = 0;if (m_format.sampleSize() == 8 && m_format.sampleType() == QAudioFormat::UnSignedInt) {value = *reinterpret_cast<const quint8*>(ptr);} else if (m_format.sampleSize() == 8 && m_format.sampleType() == QAudioFormat::SignedInt) {value = qAbs(*reinterpret_cast<const qint8*>(ptr));} else if (m_format.sampleSize() == 16 && m_format.sampleType() == QAudioFormat::UnSignedInt) {if (m_format.byteOrder() == QAudioFormat::LittleEndian)value = qFromLittleEndian<quint16>(ptr);elsevalue = qFromBigEndian<quint16>(ptr);} else if (m_format.sampleSize() == 16 && m_format.sampleType() == QAudioFormat::SignedInt) {if (m_format.byteOrder() == QAudioFormat::LittleEndian)value = qAbs(qFromLittleEndian<qint16>(ptr));elsevalue = qAbs(qFromBigEndian<qint16>(ptr));}maxValue = qMax(value, maxValue);ptr += channelBytes;}}maxValue = qMin(maxValue, m_maxAmplitude);m_level = qreal(maxValue) / m_maxAmplitude;}m_file->write(data,len);emit update();return len;
}RenderArea::RenderArea(QWidget *parent): QPushButton(parent)
{setBackgroundRole(QPalette::Base);setAutoFillBackground(true);m_level = 0;setMinimumHeight(30);setMinimumWidth(80);}void RenderArea::paintEvent(QPaintEvent * /* event */)
{QPainter painter(this);QPixmap pixmap = QPixmap(":/images/button_default.png").scaled(this->size());painter.drawPixmap(this->rect(), pixmap);//        painter.setPen(Qt::black);
//        painter.drawRect(QRect(painter.viewport().left(),
//                painter.viewport().top(),
//                painter.viewport().right()-20,
//                painter.viewport().bottom()-20));if (m_level == 0.0)return;painter.setPen(Qt::darkGray);int pos = ((painter.viewport().right()-20)-(painter.viewport().left()+11))*m_level;for (int i = 0; i < 10; ++i) {int x1 = painter.viewport().left()+11;int y1 = painter.viewport().top()+10+i;int x2 = painter.viewport().left()+20+pos;int y2 = painter.viewport().top()+10+i;if (x2 < painter.viewport().left()+10)x2 = painter.viewport().left()+10;painter.drawLine(QPoint(x1+10, y1+10),QPoint(x2+10, y2+10));}
}void RenderArea::setLevel(qreal value)
{m_level = value;repaint();
}

源码下载

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/7214.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Windows常用快捷键与CMD常用命令

1.win系列快捷键使用 WinD&#xff0c;快速进入桌面 WinE&#xff0c;打开我的电脑&#xff08;文件资源管理器&#xff09; WinI&#xff0c;打开设置界面 WinL&#xff0c;快速锁屏 WinM&#xff0c;最小化所有窗口 WinShiftM&#xff0c;还原最小化的窗口 WinV&#…

详细介绍Eclipse的安装过程

**Eclipse安装指南** 一、引言 Eclipse是一个广泛使用的集成开发环境&#xff08;IDE&#xff09;&#xff0c;主要用于Java语言的开发&#xff0c;但也支持其他多种编程语言。Eclipse以其强大的功能、灵活的插件系统和开源的特性&#xff0c;赢得了众多开发者的青睐。本文将…

android 启动优化方向跟踪

先简单带过framwork以上的流程&#xff0c;主要看framwrok里面的步骤 一 前期启动流程速览 1 kernel内核空间启动 负责启动 native层的init进程 具体可以参考linux内核&#xff08; Bootloader启动Kernel的swapper进程(pid0)&#xff0c;它是内核首个进程&#xff0c;用于初始…

为什么下载卡在idealTree:NodeJS: sill idealTree buildDeps

可能使用的是npm config set registry https://registry.npm.taobao.org而这个镜像文件已经过期了 解决方法如下&#xff1a; 先使用 npm cache clean --force 清除缓存 再切换镜像源 再使用npm config get registry 进行查看是否换源成功 再使用 npm install -g vue/cli 就…

【算法】滑动窗口——长度最小的子数组

本篇文章是用一个实例来介绍常用算法之一“滑动窗口”的相关概念&#xff0c;有需要借鉴即可。 目录 1.题目2.暴力求解2.1暴力求解思路&#xff1a;2.2时间复杂度是多少&#xff1f; 3.暴力求解的优化3.1固定left的情况下&#xff0c;优化right的次数。3.2sum求值优化3.3不同组…

商城数据库88张表结构完整示意图81~88及总览图(十六)

八十一&#xff1a; 八十二&#xff1a; 八十三&#xff1a; 八十四&#xff1a; 八十五&#xff1a; 八十六&#xff1a; 八十七&#xff1a; 八十八&#xff1a; 总览图&#xff1a;

Redis开源社区持续壮大,华为云为Valkey项目注入新的活力

背景 今年3月21日&#xff0c;Redis Labs宣布从Redis 7.4版本开始&#xff0c;将原先比较宽松的BSD源码使用协议修改为RSAv2和SSPLv1协议&#xff0c;意味着 Redis在OSI&#xff08;开放源代码促进会&#xff09;定义下不再是严格的开源产品。Redis官方表示&#xff0c;开发者…

websevere服务器从零搭建到上线(四)|muduo网络库的基本原理和使用

文章目录 muduo源码编译安装muduo框架讲解muduo库编写服务器代码示例代码解析用户连接的创建和断开回调函数用户读写事件回调 使用vscode编译程序配置c_cpp_properties.json配置tasks.json配置launch.json编译 总结 muduo源码编译安装 muduo依赖Boost库&#xff0c;所以我们应…

webpack与vite

webpack 使用步骤&#xff1a; 初始化项目 pnpm init -y安装依赖webpack、webpack-cli在项目中创建src目录&#xff0c;然后编写代码&#xff08;index.js&#xff09;执行pnpm weboack来对代码进行打包&#xff08;打包后观察dist文件夹&#xff09; 配置古文件&#xff08;w…

使用ThemeRoller快速实现前端页面风格美化

使用ThemeRoller快速实现前端页面风格美化 文章目录 使用ThemeRoller快速实现前端页面风格美化一、ThemeRoller二、使用方法1.基本操作面板介绍2.直接用现成的配色风格——Gallery画廊3.自定义风格——Roll Your Own4.下载风格包并应用到页面 一、ThemeRoller ThemeRoller是jQ…

基于java的CRM客户关系管理系统的设计与实现(论文 + 源码 )

【免费】基于Java的CRM客户关系管理系统的设计和实现.zip资源-CSDN文库https://download.csdn.net/download/JW_559/89273409 基于Java的CRM客户关系管理系统的设计与实现 摘 要 随着互联网的高速发展&#xff0c;市场经济的信息化&#xff0c;让企业之间的竞争变得&#xff0…

纯血鸿蒙APP实战开发——页面间共享组件实例的案例

介绍 本示例提供组件实例在页面间共享的解决方案&#xff1a;通过Stack容器&#xff0c;下层放地图组件&#xff0c;上层放Navigation组件来管理页面&#xff0c;页面可以共享下层的地图组件&#xff0c;页面中需要显示地图的区域设置为透明&#xff0c;并参考触摸交互控制&am…

69、oak和华为atlas 200dk A2进行编解码测试

基本思想:将oak深度相机与atlas 200dk A2进行结合,测试其dvpp的编解码能力 cmakelist.txt cmake_minimum_required(VERSION 3.16) project(untitled10) set(CMAKE_CXX_FLAGS "-std=c++11") set(CMAKE_CXX_STANDARD 11) add_definitions(-DENABLE_DVPP_INTERFACE)…

秋招后端开发面试题 - MySQL事务

目录 MySQL事务前言面试题什么是数据库事务为什么要有事务呢&#xff1f;项目中遇到的事务事务的传播机制事务的特性&#xff1f;事务并发存在的问题四大隔离级别四大隔离级别&#xff0c;都会存在哪些并发问题呢数据库是如何保证事务的隔离性的呢&#xff1f;如何解决加锁后的…

各城市-人口就业和工资数据(1978-2022年)

这份数据收集了1978年至2022年间300多个地级市的人口、就业和工资等数据。涵盖的指标包括从业人员数量、平均工资水平、人口密度等&#xff0c;通过这些数据可以深入了解中国各地城市的人口结构、就业状况以及工资水平的变化趋势。这些数据对于研究城市发展、劳动力市场以及区域…

论文架构介绍

论文架构 背景&#xff1a;建议2段左右完成&#xff0c;字数控制在500左右为佳&#xff0c;对应子题目1过渡段&#xff1a;写150字左右的过渡段&#xff0c;承上启下&#xff0c;回答部分子题目2、3的要求正文实践部分&#xff1a;一般3-7个论点&#xff0c;根据题目的要求来看…

python基础--常用函数

常用函数 内建函数 在python里面可以直接使用的函数, 不需要使用import从其他文件里面导入 可以使用dir(__builtin__)进行查看 输入输出 print打印信息 print(*objects, sep , end\n, filesys.stdout, flushFalse)objects – 复数&#xff0c;表示可以一次输出多个对象。…

C++构造函数和析构函数的调用顺序

一般情况下&#xff0c;调用析构函数的次序正好与调用构造函数的次序相反&#xff0c;也就是最先被调用的构造函数&#xff0c;其对应的析构函数最后被调用&#xff0c;而最后被调用的构造函数&#xff0c;其对应的析构函数最先被调用。 当然对象的构造函数和析构函数调用时机和…

力扣100284. 有效单词(C++)

【题解】 (实际在力扣中运行的代码只需要把下方的check函数放到力扣作答区给的模板中就可以) #include <bits/stdc.h> #include <iostream> #include <vector> #include <string> #include <cctype> #include <cstring> #include <st…

融知财经:期货交易的规则和操作方法

期货交易是指在未来的某一特定时期&#xff0c;买卖双方通过签订合约的方式&#xff0c;约定以某种价格买卖一定数量的某种商品或资产的行为。期货交易的规则和操作方法如下&#xff1a; 期货交易的规则和操作方法 1、双向交易&#xff1a; 期货市场允许投资者进行多头&#xf…