语音合成与识别技术在C#中的应用 (转 )

语音合成与识别技术在C#中的应用 (转 )
我们要想实现中文发音或中文语音识别,必需先安装微软的Speech Application SDK(SASDK),它的最新版本是 SAPI 5.1 他能够识别中、日、英三种语言,你可以在这里下载:http://www.microsoft.com/speech/download/sdk51/,需要安装这两个文件Speech SDK 5.1和5.1 Language Pack,其中5.1 Language Pack可以选择安装支持的语言。  安装好以后,我们就可以开始进行语音程序的开发了。

下面我们设计一个能够朗读中英文混合语言的类: 

我们将用单例模式实现该类,类的代码如下,我们将详细解释: 

public class Speach 



  private static Speach _Instance = null ; 

  private SpeechLib.SpVoiceClass voice =null; 

  private Speach() 

  { 

BuildSpeach() ; 

  } 

public static Speach instance() 



  if (_Instance == null) 

_Instance = new Speach() ; 

return _Instance ; 



private void SetChinaVoice() 



  voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(0) ; 



private void SetEnglishVoice() 



  voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(1) ; 



private void SpeakChina(string strSpeak) 



  SetChinaVoice() ; 

  Speak(strSpeak) ; 



private void SpeakEnglishi(string strSpeak) 



  SetEnglishVoice() ; 

  Speak(strSpeak) ; 



public void AnalyseSpeak(string strSpeak) 



  int iCbeg = 0 ; 

  int iEbeg = 0 ; 

  bool IsChina = true ; 

  for(int i=0;i<strSpeak.Length;i++) 

  { 

char chr = strSpeak[i] ; 

if (IsChina) 



  if (chr<=122&&chr>=65) 

  { 

int iLen = i - iCbeg ; 

string strValue = strSpeak.Substring(iCbeg,iLen) ; 

SpeakChina(strValue) ; 

iEbeg = i ; 

IsChina = false ; 

  } 



else 



  if (chr>122||chr<65) 

  { 

int iLen = i - iEbeg ; 

string strValue = strSpeak.Substring(iEbeg,iLen) ; 

this.SpeakEnglishi(strValue) ; 

iCbeg = i ; 

IsChina = true ; 

  } 



  }//end for 

  if (IsChina) 

  { 

int iLen = strSpeak.Length - iCbeg ; 

string strValue = strSpeak.Substring(iCbeg,iLen) ; 

SpeakChina(strValue) ; 

  } 

  else 

  { 

int iLen = strSpeak.Length - iEbeg ; 

string strValue = strSpeak.Substring(iEbeg,iLen) ; 

SpeakEnglishi(strValue) ; 

  } 



private void BuildSpeach() 



  if (voice == null) 

voice = new SpVoiceClass() ; 



public int Volume 



  get 

  { 

return voice.Volume ; 

  } 

  set 

  { 

voice.SetVolume((ushort)(value)) ; 

  } 



public int Rate 



  get 

  { 

return voice.Rate ; 

  } 

  set 

  { 

voice.SetRate(value) ; 

  } 



private void Speak(string strSpeack) 



  try 

  { 

voice.Speak(strSpeack,SpeechVoiceSpeakFlags.SVSFlagsAsync) ; 

  } 

  catch(Exception err) 

  { 

throw(new Exception("发生一个错误:"+err.Message)) ; 

  } 



public void Stop() 



  voice.Speak(string.Empty,SpeechLib.SpeechVoiceSpeakFlags.SVSFPurgeBeforeSpeak) ; 



public void Pause() 



  voice.Pause() ; 



public void Continue() 



  voice.Resume() ; 



}//end class 

 

在 private SpeechLib.SpVoiceClass voice =null;这里,我们定义个一个用来发音的类,并且在第一次调用该类时,对它用BuildSpeach方法进行了初始化。 

我们还定义了两个属性Volume和Rate,能够设置音量和语速。 

我们知道,SpVoiceClass 有一个Speak方法,我们发音主要就是给他传递一个字符串,它负责读出该字符串,如下所示。 

private void Speak(string strSpeack) 



  try 

  { 

voice.Speak(strSpeack,SpeechVoiceSpeakFlags.SVSFlagsAsync) ; 

  } 

  catch(Exception err) 

  { 

throw(new Exception("发生一个错误:"+err.Message)) ; 

  } 



 

其中SpeechVoiceSpeakFlags.SVSFlagsAsync表示异步发音。

但是,这个方法本身并不知道你给的字符串是什么语言,
所以需要我们它这个字符串用什么语言读出。SpVoiceClass 类的Voice 属性就是用来设置语种的,
我们可以通过SpVoiceClass 的GetVoices方法得到所有的语种列表,然后在根据参数选择相应的语种,
比如设置语种为汉语如下所示:

private void SetChinaVoice() 



  voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(0) ; 


0表示是汉用,1234都表示英语,就是口音不同。 

这样,我们就设置了语种,如果结合发音方法,我们就可以设计出一个只发汉语语音的方法 


private void SpeakChina(string strSpeak)  

{  

  SetChinaVoice() ;  

  Speak(strSpeak) ;  

}   


只发英语语音的方法也是类似的,上面程序里有。 

对于一段中英文混合的语言,我们让程序读出混合语音的方法就是:编程把这段语言的中英文分开,对于中文调用SpeakChina方法,英文调用SpeakEnglishi方法;至于怎样判断一个字符是英文还是中文,我采用的是判断asc码的方法,具体的类方法是通过AnalyseSpeak实现的。 

这样,对于一段中英文混合文字,我们只需把它作为参数传递给AnalyseSpeak就可以了,他能够完成中英文的混合发音。 

当然,对于发音的暂定、继续、停止等操作,上面也给出了简单的方法调用,很容易明白。 

下面简单介绍一下中文语音识别的方法: 

先把该语音识别的类源代码贴在下面,然后再做说明:  


public class SpRecognition  

{  

  private static SpRecognition _Instance = null ;  

  private SpeechLib.ISpeechRecoGrammar isrg ;  

  private SpeechLib.SpSharedRecoContextClass ssrContex =null;  

  private System.Windows.Forms.Control cDisplay ;  

  private SpRecognition()  

  {  

ssrContex = new SpSharedRecoContextClass() ;  

isrg = ssrContex.CreateGrammar(1) ;  

SpeechLib._ISpeechRecoContextEvents_RecognitionEventHandler recHandle = new _ISpeechRecoContextEvents_RecognitionEventHandler(ContexRecognition) ;  

ssrContex.Recognition += recHandle ;  

  }  

  public void BeginRec(Control tbResult)  

  {  

isrg.DictationSetState(SpeechRuleState.SGDSActive) ;  

cDisplay = tbResult ;  

  }  

  public static SpRecognition instance()  

  {  

if (_Instance == null)  

  _Instance = new SpRecognition() ;  

  return _Instance ;  

  }  

  public void CloseRec()  

  {  

isrg.DictationSetState(SpeechRuleState.SGDSInactive) ;  

  }  

  private void ContexRecognition(int iIndex,object obj,SpeechLib.SpeechRecognitionType type,SpeechLib.ISpeechRecoResult result)  

  {  

cDisplay.Text += result.PhraseInfo.GetText(0,-1,true) ;  

  }  

}  

 
我们定义了ssrContex 和isrg为语音识别的上下文和语法,通过设置isrg的DictationSetState方法,我们可以开始或结束识别,在上面的程序中是BeginRec和CloseRec方法。cDisplay 是我们用来输出识别结果的地方,为了能够在大部分控件上都可以显示结果,我用了一个Control 类来定义它。当然,每次语音识别后都会触发ISpeechRecoContextEvents_RecognitionEventHandler 事件,我们定义了一个这样的方法ContexRecognition来响应事件,并且在这个方法里输出识别结果。  

转载于:https://www.cnblogs.com/yanbinboy/archive/2008/10/30/1322792.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/496614.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

left join 和join区别_sleep、yield、join方法简介与用法 sleep与wait区别 多线程中篇

Object中的wait、notify、notifyAll&#xff0c;可以用于线程间的通信&#xff0c;核心原理为借助于监视器的入口集与等待集逻辑通过这三个方法完成线程在指定锁&#xff08;监视器&#xff09;上的等待与唤醒&#xff0c;这三个方法是以锁&#xff08;监视器&#xff09;为中心…

深度干货!值得精读的2018自动驾驶行业发展报告

来源&#xff1a; 机器人大讲堂摘要随着科技革命的深入推进&#xff0c;人类社会进入万物互联、万物智能的智能化新时代。自动驾驶技术在人工智能和汽车行业的飞速发展下逐渐成为业界焦点。自动驾驶技术是汽车产业与高性能计算芯片、人工智能、物联网等新一代信息技术深度融合的…

TCP 连接状态

TCP十一种状态 全部11种状态 1. 客户端独有的&#xff1a;&#xff08;1&#xff09;SYN_SENT &#xff08;2&#xff09;FIN_WAIT1 &#xff08;3&#xff09;FIN_WAIT2 &#xff08;4&#xff09;CLOSING &#xff08;5&#xff09;TIME_WAIT 。 2. 服务器独有的&#xff1a…

Java加密与解密的艺术~MD算法实现

MD系列算法的实现是通过MessageDigest类来完成的&#xff0c;如果需要以流的处理方式完成消息摘要&#xff0c;则需要使用DigestInputStream和DigestOutputStream。 MD4 package org.zlex.chapter06_1_2;import java.security.MessageDigest; import java.security.Security;i…

密码学知识

文章目录密码学一、对称加密体系二、模式三、非对称加密体系四、数据完整性五、数字签名六、国密算法七、SSL协议八、CA密码学 提示&#xff1a;本文包括常见的对称加密和非对称加密算法&#xff0c;hash&#xff0c;数字签名 提示&#xff1a;以下是本篇文章正文内容&#xf…

德勒报告:2018年全球生命科学发展趋势

来源&#xff1a;新浪医药、战略前沿技术健康生命科学&#xff08;Health life sciences&#xff09;是指应用生物学和技术来促进健康护理&#xff0c;包括制药、医疗技术、基因组学、诊断学、数字医疗等等。这一板块产品种类繁多&#xff0c;包括药品、医疗技术、诊断和数字工…

Uber致人死亡或为自动驾驶肇事责任 没有判例可循

图&#xff1a;Uber自动驾驶测试车辆引发致人死亡交通事故凤凰网科技讯 据《福布斯》网站北京时间3月20日报道&#xff0c;美国当地时间本周日傍晚&#xff0c;一辆由Uber运营的自动驾驶汽车在亚利桑那州坦佩(Tempe)撞倒了一名女性并致其死亡。Uber周一表示&#xff0c;公司暂停…

28个Unix/Linux的命令行神器

From: http://os.51cto.com/art/201207/347414.htm 下面收集的Unix/Linux下的28个命令行下的工具&#xff0c;有一些是大家熟悉的&#xff0c;有一些是非常有用的&#xff0c;有一些是不为人知的。这些工具都非常不错&#xff0c;希望每个人都知道。本篇文章还在Hacker News上被…

Java加密与解密的艺术~SHA算法实现

MesssageDigest类也支持SHA算法&#xff0c;主要包含SHA-1、SHA-256、SHA-384和SHA-512四种算法。通过第三方加密组件包Bouncy Castle&#xff0c;可支持SHA-224算法。 SHA Java原始 /*** 2009-9-3*/ package org.zlex.chapter06_2_1;import java.security.MessageDigest; /**…

linux 无法打开.ttf_win7系统ttf文件打不开怎么办【解决方法】

我们都清楚ttf文件是windows系统当中的字体文件&#xff0c;能够直接通过这个文件进行字体的添加&#xff0c;不过最近有位win7系统用户却遇到了ttf文件无法打开的情况&#xff0c;系统提示“该文件没有与之关联的程序来执行该操作。请安装一个程序&#xff0c;或者&#xff0c…

全球20大智慧城市排行榜揭晓:无锡列中国第一,银川、杭州上榜!

来源&#xff1a;Juniper Research、物联网智库近日&#xff0c;英国市场调研机构Juniper Research发布了“全球智慧城市Top 20”的榜单&#xff0c;这份榜单从出行、医疗、公共安全和工作效率四个方面对城市的智能化程度进行综合评定&#xff0c;并揭示了这些城市在节省时间、…

Mono 2.0

Mono 2.0 Mono 2.0 发布有一段时间了,早就想体验一下,一直没时间,最近比效闲,非常闲,于是就尝试了一下Mono 2.0 操作系统 考虑到兼容问题,我没选择常用的Rad Hat,而是选择了openSUSE 11.0 , openSUSE 11.0 我也是第一次用, 在Virtual PC 2007上安装,每次到开始安装就黑屏,…

Java加密与解密的艺术~MAC算法实现

Java 原生 /*** 2009-9-10*/ package org.zlex.chapter06_3_1;import javax.crypto.KeyGenerator; import javax.crypto.Mac; import javax.crypto.SecretKey; import javax.crypto.spec.SecretKeySpec;/*** MAC加密组件* * author 梁栋* version 1.0* since 1.0*/ public abs…

mysql rpm 启动_MySQL安装(rpm)和启动配置

MySQL安装(rpm)和启动配置安装环境&#xff1a;OS&#xff1a;Oracle Linux 5.9安装步骤&#xff1a;1.解压MySql安装包[rootbakdbserver mysql]# tar -xf MySQL-5.5.24-1.rhel5.x86_64.tar[rootbakdbserver mysql]# ll总计 373920-rw-r--r-- 1 root root 191242240 2012-05-2…

量子计算陷入难解困境,未来发展何去何从?

来源&#xff1a;科研圈量子计算机在一些具体任务上的表现很快就能超越传统电子计算机&#xff0c;但是在量子计算真正实现其巨大潜力前&#xff0c;依然需要克服许多基础性的难题。在量子计算的可行性被质疑长达几十年后&#xff0c;全世界范围内忽然掀起了对于量子计算的追逐…

mysql 64位 8.0.11_mysql8.0.11 在windows64安装 步骤

环境&#xff1a;Windows 101一、安装1. 解压zip包到安装目录比如我的安装目录是&#xff1a;D:\Program\MySQL2.配置文件在Windows系统中&#xff0c;配置文件默认是安装目录下的 my.ini 文件&#xff0c;部分配置需要在初始安装时配置&#xff0c;大部分也可以在安装完成后进…

ProxyChains

proxychains-ng&#xff1a;https://github.com/rofl0r/proxychains-ng proxychains&#xff1a;https://github.com/haad/proxychains shadowsocks&#xff1a;https://github.com/shadowsocks/shadowsocks 安装了 shadowsocks 之后&#xff0c;只能网页出去逛逛&#xff0c;…

IDC发布对话式人工智能白皮书|附下载

来源&#xff1a;专知丨公众号近日&#xff0c;全球著名的信息技术、电信行业和消费科技咨询公司IDC&#xff08;国际数据公司&#xff0c; International Data Corporation&#xff09;发布了《对话式人工智能白皮书》&#xff08;下文简称《白皮书》&#xff09;。《白皮书》…

Java加密与解密的艺术~思维导图

#原图 System.out.println("https://www.processon.com/view/link/61a8323fe401fd49ed41cde0");

一场关于Google不作恶信条的辩论会

2008年11月18日&#xff0c;Intelligence Squared 在纽约 Rockefeller 大学召开了一次关于 Google 不作恶信条&#xff08;Dontt be evil Motto&#xff09;的辩论会&#xff0c;这场牛津式辩论会&#xff08;Oxford-style debate &#xff09;持续了近两个小时&#xff0c;《纽…