汉语语音基本特性

发音的生理基础和过程

人的发音生理机构如图 2.3.1所示,发音时由肺部收缩送出一股直流空气,经气管流至喉头声门处(声门即声带开口处),在发声之初,声门处的声带肌肉收缩,声带并拢间隙小于 1mm,这股直流空气冲过很小的缝隙,使声带得到横向和纵向的速度,此时,声带向两边运动,缝隙增大(成年男性开到最大时,截面积约为 20mm),声门处压力下降,弹性恢复力将声带拉回平衡位置并继续趋向闭合,即声带产生振动,而且具有一定的振动周期,如图 2.3.2所示。

在这里插入图片描述
一般把声门以上,经咽喉、口腔(舌、、腭、小舌)的这一管道称为主声道,成年男子的主声道长度约 17cm,而经小舌和鼻腔的这一管道称为鼻道。此外,经肺、支气管和气管的管道称为次声门系统。由声带振动激发声道中空气发生振动,并从口和鼻两处向外辐射产生声音。声道的口、鼻两个管道中,从鼻咽部到鼻孔的分支称为鼻道分支,只有在发鼻音时才打开,从声门到唇是主声道,它被舌面隆起点隔开,近视可看出咽腔(后腔)、小管、口腔(前腔)等几部分,当发一语音时,声道肌肉(包括舌面)运动到一个特定的部位,构成·一定声道的位形,形成该语音的特定音色。

语音按其激励形式的不同大致可以分成三类。当气流通过声门时,如果声带的张力刚好使声带产生张弛振荡式振动,产生一股准周期脉冲气流,这一气流激励声道就产生浊音(Voiced Speech)或称有声语音。如果声带不振动,而声道在某处收缩,迫使气流以高速通过这一收缩部分而产生湍流就产生清音(Unvoiced Speech)或摩擦音,或称无声语音。如果声道在完全闭合的情况下突然释放就产生爆破音(Plosive Speech)。

人的声道和鼻道都是非均匀的声道管,声道管的谐振频率称为共振峰频率,或简称为共振峰。它与发音器官的确切位置有很大的关系,即共振峰和声道的形状与大小有关。表2.3.1给出了普通话7个韵母的共振峰频率。从表中可以看到,各韵母音色上的差异可用前3个共振峰(F1,F2,F3)来表示,F1主要分布在290Hz-1kHz范围内,F2分布在500Hz-2.5kHz范围内,而F3分布在2.5kHz-4kHz范围内。
在这里插入图片描述
语音信号随时间而变化的谱特性可以利用语图仪(Spectrograph)用图形显示,此图有时也称为语谱图,是一种三维图形,纵轴对应于频率,横轴对应于时间,图像的黑白度正比于语音信号的能量

图2.3.3所示为普通话语音的语谱图。在汉语里,最小的语音单位是音素,是从音色的角度分出来的。一个音素单独存在或几个音素结合起来构成的单位叫音节。音节就是说话时自然的发音单位,可以从听觉上把它们分开。在物理上,以发音器官肌肉紧张度的增减为依据,每一次肌肉紧张度的增而变减就造成一个音节。汉语一般是一字一音节,少数例外的两音节一字和两字一音节(如“花儿”等)。

在这里插入图片描述

汉语语音基本特性

汉语的音节由声母、韵母和声调组成。一个音节起头的辅音是声母,声母后边都分是韵母:全音节的音高变化是声调(也称字调)。这是我国传统分类方法。而国际上流行的科学分类法是清音和浊音,清音在发音时声带不振动,类似于宽带噪声源的输出气流高速冲过某处收缩的声道而产生湍流得到的音:当气流通过声门时使声带发生振动产生准局期脉冲,这些空气脉冲激励声道而得到的音就是浊音,而这个准周期称为基音周期(Pitch).

元音是发音时气流不受阻碍,发音器官均衡地紧张,是气流较弱的音:辅音则反之,在发音时气流要经过不同的阻碍,且发音器官中阻碍部分较紧张,是气流较强的音。

口音是指发音时气流不流经鼻腔的音。鼻音在发音时,气流较弱,经过鼻腔。

元音和辅音

汉语语音的基础是汉语拼音,由10个元音和22个辅音组成,共21个声母和38个韵母。汉语的10个元音见表2.4.1。
在这里插入图片描述
不同的元音是由不同的口腔形状造成的,口腔形状实际上是指唇舌状态,可从三方面来分析:①口腔的开闭和舌头的升降;②舌头部位的前后:③唇的状态。由于口腔的开闭,舌头的高低前后,唇的平展圆敛等不同程度的变化,造成了不同式样的共鸣器,于是形成了各种元音特有的音色。表2.4.1已说明了10个元音的分类和状态特性。

汉语语音中的 22个辅音见表2.4.2。表中同时也示出了其发音部位和发音方法,般可根据其发音部位和发音方法来命名它,例如[b]为双唇不送气清塞音,[z]为不送气舌尖前清塞音。

在这里插入图片描述

声母和韵母

按照我国传统音素分类方法,汉语的一个字节可以看成由声母和韵母拼合而成。一般声母仅包含一个辅音音素,而韵母则由一个元音或几个元音或元音和辅音组合面成,有时又把声母和韵母称为子音和母音。

声母共21个(不含零声母),上述辅音表中除[ng]以外的21个辅音即声母,表 2.4.3列出声母及其读音。
在这里插入图片描述
韵母包括单韵母、复韵母和带声韵母共39个,带声韵母是指用声母[n]或[ng]收音的韵母,由于[n]、[ng]是纯鼻音,所以又称为鼻尾音韵母。韵母表见表 2.4.4,在表 2.4.4中未列人由元音[er]、i、i及[e]等组成的4个韵母。此外,在声母表中未列人半元音[w]与[y]。
在这里插入图片描述

“声母-韵母”和“元音-辅音”的关系

声母和韵母、元音和辅音是完全不同的两个概念,声母、韵母是以在音节中的位置而论的,元音、辅音是以发音方式而定的。但两者又是有联系的,声母一般都是辅音,但辅音不全是声母;所有的元音都是韵母,还有一部分韵母由元音加辅音构成,如图 2.4.1所示。例如[an]、[ang]、[en]、[eng]、[ong]等用鼻辅音作韵尾
在这里插入图片描述

音调

在这里插入图片描述
在这里插入图片描述

音节构成

在这里插入图片描述

汉语的波形特

在这里插入图片描述
在这里插入图片描述

元音的频谱特征

在这里插入图片描述

辅音的频谱特征

在这里插入图片描述
在这里插入图片描述

汉语的韵律特征

在这里插入图片描述

小节(个人理解,不是书中原文)

清音和浊音是按照声带是否震动来区分的。
元音和辅音是按照发声过程气流是否受到声道的阻碍来区分的,元音基本都是浊音。而辅音既有清音,又有浊音。
韵母和声母是按照在音节中的位置来区分的。声母在前,韵母在后。

后记

看了很多文章介绍元音、辅音等知识,总感觉不够系统严谨。还好看到某篇论文参考资料里有《实用语音识别基础—王炳锡》,找来电子版一看,果然是全面详细的语音知识介绍。
我用微信识别文字的功能提取了一部分,后面觉得麻烦,就直接贴图片了。这本书没有新的了,只能搜到 二手书。但是书中关于汉语的基本特征介绍还是不落伍的。

我将关键几节的内容贴出来,是为了帮助像我一样的语音领域门外汉,不要在网上只言片语的内容中浪费时间,要看就看经典的教材,全面又严谨。

参考资料

《实用语音识别基础—王炳锡》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/788093.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

事件队列事件循环(EventLoop) 宏任务 微任务详解 面试题

事件队列 事件循环 EventLoop 宏任务 微任务详解 一、概念二、宏任务(多个)、微任务(1个)三、Promise 的构造函数四、process.nextTick在事件循环中的处理五、vue nextTick原理 一、概念 event: 事件 loop: 循环,循环…

数据结构:链表的双指针技巧

文章目录 一、链表相交问题二、单链表判环问题三、回文链表四、重排链表结点 初学双指针的同学,请先弄懂删除链表的倒数第 N 个结点。 并且在学习这一节时,不要将思维固化,认为只能这样做,这里的做法只是技巧。 一、链表相交问题 …

[Linux]基础IO(中)---理解重定向与系统调用dup2的使用、缓冲区的意义

重定向理解 在Linux下,当打开一个文件时,进程会遍历文件描述符表,找到当前没有被使用的 最小的一个下标,作为新的文件描述符。 代码验证: ①:先关闭下标为0的文件,在打开一个文件,…

图神经网络GNN

图神经网络GNN B、C、D的特征在某种程度上可以代表A的特征 上面就是一次GCN的操作

整型之韵,数之舞:大小端与浮点数的内存之旅

✨✨欢迎👍👍点赞☕️☕️收藏✍✍评论 个人主页:秋邱’博客 所属栏目:人工智能 (感谢您的光临,您的光临蓬荜生辉) 1.0 整形提升 我们先来看看代码。 int main() {char a 3;char b 127;char …

浅谈iOS开发中的自动引用计数ARC

1.ARC是什么 我们知道,在C语言中,创建对象时必须手动分配和释放适量的内存。然而,在 Swift 中,当不再需要类实例时,ARC 会自动释放这些实例的内存。 Swift 使用 ARC 来跟踪和管理应用程序的内存,其主要是由…

[从0开始AIGC][Transformer相关]:Transformer中的激活函数:Relu、GELU、GLU、Swish

[从0开始AIGC][Transformer相关]:Transformer中的激活函数 文章目录 [从0开始AIGC][Transformer相关]:Transformer中的激活函数1. FFN 块 计算公式?2. GeLU 计算公式?3. Swish 计算公式?4. 使用 GLU 线性门控单元的 FF…

[Rust开发]用可视化案例讲Rust编程6.动态分发与最终封装

全系列合集 [Rust开发]用可视化案例讲Rust编程1.用Rust画个百度地图 [Rust开发]用可视化案例讲Rust编程2. 编码的核心组成:函数 [Rust开发]用可视化案例讲Rust编程3.函数分解与参数传递 [Rust开发]用可视化案例讲Rust编程4.用泛型和特性实现自适配shapefile的读取 […

YOLOv8全网独家改进: 小目标 |新颖的多尺度前馈网络(MSFN) | 2024年4月最新成果

💡💡💡本文独家改进:多尺度前馈网络(MSFN),通过提取不同尺度的特征来增强特征提取能力,2024年最新的改进思路 💡💡💡创新点:多尺度前馈网络创新十足,抢先使用 💡💡💡如何跟YOLOv8结合:1)放在backbone后增强对全局和局部特征的提取能力;2)放在detect…

C语言一维数组及二维数组详解

引言: 小伙伴们,我发现我正文更新的有些慢,但相信我,每一篇文章真的都很用心在写的,哈哈,在本篇博客当中我们将详细讲解一下C语言中的数组知识,方便大家后续的使用,有不会的也可以当…

公司只有一个测试,要怎么继续呆下去?

在面试的时候,面试官可能会问:小公司、小团队,岗位就你一个人,怎么做 ? 或者已经有的小伙伴已经在公司中面临只有一个测试的处境,这个时候我们应该怎么处理呢? 一 原因分析 公司只有一个测试人…

OSPF中配置静态路由实验简述

静态路由协议和OSPF(开放最短路径优先)协议是两种常见的路由协议,它们在路由选择和网络管理方面有一些区别。他们可以共存。 静态路由协议需要手动配置路由表,不会自动适应网络拓扑变化,适用于小型网络或者网络拓扑变化…

MySQL Innodb 引擎中预防 Update 操作上升为表锁

一、MySQL 如何预防 Update 上升为表锁 在 MySQL 中,进行任何数据的 修改 操作都会进行一定的锁操作,而锁的不同直接导致性能的差异。例如 MyISAM 引擎,更新时采用表锁,并发性较差。而 Innodb 引擎支持事务,更新时采用…

类和对象(下)--- 初始化列表、explicit、友元、static、匿名对象和内部类

本篇将会对类和对象的主要知识收尾,先会对构造函数进行补充,分别补充了构造函数体赋值、初始化列表、explicit 关键字,然后介绍 static 成员知识以及友元、内部类还有匿名对象等知识点,目录如下: 目录 1. 构造函数补充…

VUE3——生命周期

Vue3.0中可以继续使用Vue2.x中的生命周期钩子,但有有两个被更名: beforeDestroy改名为 beforeUnmountdestroyed改名为 unmounted Vue3.0也提供了 Composition API 形式的生命周期钩子,与Vue2.x中钩子对应关系如下: beforeCreate&g…

ISELED-演示项目代码

目录 一、main函数二、点灯函数一、main函数 int main(void) {/* Write your local variable definition here */iseledInitType.crcEnable = 1;iseledInitType.firstLedAdr = 1;iseledInitType.tempCmpEnable = 0;iseledInitType.voltSwing = 0;/*** End of Processor Expert…

HWOD:记录正负数

一、知识点 1、scanf()的返回值 scanf()返回值类型为int,返回转换成功的个数 有代码int temp; scanf("%d",&temp); 在屏幕输入一个数字,比如5,回车,scanf()返回1 在屏幕输入一个字符或字符串,比…

STM32 M3内核寄存器概念

内容主要来自<<M3内核权威指南>> 汇编程序中的最低有效位&#xff08;Least Significant Bit&#xff09;。LSB是二进制数中最右边的位&#xff0c;它代表了数值中的最小单位。在汇编程序中&#xff0c;LSB通常用于表示数据的最小精度或者作为标志位。 ---------…

人工智能|深度学习——基于Xception算法模型实现一个图像分类识别系统

一、Xception简介 在计算机视觉领域&#xff0c;图像识别是一个非常重要的任务&#xff0c;其应用涵盖了人脸识别、物体检测、场景理解等众多领域。随着深度学习技术的发展&#xff0c;深度卷积神经网络&#xff08;Convolutional Neural Networks&#xff0c;简称CNN&#xff…

测试人员前期参与设计方案时需要注意什么?

服务的健壮性跟系统设计有很大关系&#xff0c;前期设计时考虑多一些处理逻辑&#xff0c;可以避免后期出现问题带来的损失以及修复问题的成本。 在前期讨论设计方案时测试同学也需要参与&#xff0c;而不只是埋头设计用例和测试&#xff0c;开发同学可能因为思维局限或者思考…