0、文章结构
文章的行文逻辑如下,看官可以根据需要跳读,节省时间。
1、介绍underflow和overflow.
2、underflow问题起源
3、underflow问起探索
4、underflow和overflow的常见情形
5、处理一些溢出问题的小技巧
6、对其中的两种小技巧的优缺点比较
1、什么是underflow和overflow
在计算机中浮点数都是离散的,有限的。因此计算机无法用有限的浮点数来表示无限的实数。在用浮点数表示实数时,很多数都会存在近似误差。其中一种是下溢(underflow)。比如,一个非常接近于零的数值A(实际上A>0),计算机会直接把该数值判为零,虽然实际上它并不为零。另一种数值误差是上溢(overflow),通俗而言,当一个数值a非常接近某一计算机表示的数值b时(实际a<b),计算机用b表示a。
2、起源-算术编码(arithmetic coding)作业初识underflow
音频老师布置一个作业,要求写一段程序实现算术编码,被编码的字符串为:ALIALIBABA。
关于算术编码的原理详见:https://blog.csdn.net/qingkongyeyue/article/details/75216790?utm_source=blogxgwz8
这个很简单,很快就用matlab写出来了,最终和老师给的答案一样。
接着老师就布置了第二个算术编码的作业,实现对下方字符串的编码,包含空格。
DIGITAL AUDIO TECHNOLOGY AND APPLICATION
代码中输入该字符串,可是range输出值为0。
理论上来讲,range是一个非常非常小的值,但不等于零。
这时,突然意识到,老师上课时讲到的,程序在数值运算中出现underflow。
此时的溢出问题的代码:https://download.csdn.net/download/h763247747/10777261
3、关于underflow问题的探索
变量Range被计算机判为零,但是它实际上并不等于零。
那么在matlab中,数值小于多少会被计算机判为零呢?
EPS函数
EPS是MATLAB中的函数,表示浮点相对精度。 对双精度数值来说eps表示从 1.0 到下一个最大双精度数的距离。对单精度数值来说eps表示从 1.0 到下一个最大单精度数的距离。
在command window中输入:help eps
Matlab中变量默认为double类型,所以其判别值为2^(-52),相当于
所以当变量值小于2.22e(-16)时,计算机会直接判为零,这时就需要考虑underflow了。
4、常见数值误差的情形
由此引出另外一个问题:哪些情况会出现数值误差(underflow 或者overflow)?
下方部分内容来自于此论坛:http://www.ilovematlab.cn/thread-242321-1-1.html。
论坛里有非常多大佬的精彩留言,让人豁然开朗。
情形1-underflow
计算所得0.4的实际值小于0.4。
情形2-由underflow出现的错误
计算机中的计算值为3,并不等于4。
情形2-误差精度
控制台输出,可以发现误差越来越大。
对于情景2问题的分析
双精度浮点数在计算机中使用科学计数法存储,下图所示浮点数格式。
关于浮点数的更加详细信息:https://www.cnblogs.com/icmzn/p/5060195.html
两个浮点数相减时,会存在有效位数字的误差。
假如1.4-1在计算机中的表示为0.3999….9*e(0)(13个9)。
100000000.4-100000000=(1.000000004-1.00000000)*e(8)=0. 0000000039..9(5个9)*e(8)。
运算精度就变差了,误差也会增大。
情形3-overflow
情形4-由于overflow出现的错误
演示underflow和overflow使用的代码:https://download.csdn.net/download/h763247747/10777601
4、处理一些溢出问题的小技巧
4.1、判断两个数是否相等
可以使用如下公式:
abs(a-b) < eps(a) or eps(b)
如果不等式成立,则a,b相等。
4.2、解决underflow问题
比如floor((1.4-1)*10),matlab运行的结果为3,并不等于4。为了得到正确的代码,可以如下改写代码。overflow的问题也可以使用类似思路。
4.3、提高精度
a-b的结果小于eps(0)时,为了避免结果被计算机判为零,可以使用其它工具,比如advanpix提高精度,比如精确到小数点后200位。
4.4、移位
比如计算0.0000000000111-0.0000000000101时,可以先都乘以10^10,再相减,然后差值再除以10^10,这样可以提高计算精度。
5、提高精度和移位的比较
方法2可以更快的解决matlab中出现的溢出问题,但是方法3更加实用。因为在工程领域,很难找到类似advanpix的工具。比如老板要求在arm芯片上实现对音频的算术编码,这样只能用方法3了。
最后用方法4解决音频算术编码underflow问题的代码:https://download.csdn.net/download/h763247747/10777264