浮点数原理与BigDecimal
实践应用
问题引入:
浮点数
浮点数如何表示数字?
浮点数采用科学计数法表示一个数字,具体格式为:
V = ( − 1 ) S ∗ M ∗ R E V = (-1)^S * M * R^E V=(−1)S∗M∗RE
- S:符号位,取值 0 或 1,决定一个数字的符号,0 表示正,1 表示负
- M:尾数,用小数表示
- R:基数,表示二进制数 R 就是 2
- E:指数,用整数表示
如何使用以上方法表示:25.125(D)
?
- 转化为十进制
- 整数部分:
25(D) = 11001(B)
- 小数部分:
0.125(D) = 0.001(B)
- 整数部分:
- 用二进制科学计数法表示
25.125(D) = 11001.001(B) = 1.1001001 * 2 ^4(B)
假如填充到32bit中,且假定符号位S占1bit、指数E占10bit、尾数M占21bit,那么就是这样的:
0 0000000100 100100100000000000000
指数和尾数分配的位数不同,会产生以下情况:
- 指数位越多,尾数位则越少,其表示的范围越大,但精度就会变差,反之,指数位越少,尾数位则越多,表示的范围越小,但精度就会变好
- 一个数字的浮点数格式,会因为定义的规则不同,得到的结果也不同,表示的范围和精度也有差异
早期人们提出浮点数定义时,就是这样的情况,当时有很多计算机厂商,例如IBM、微软等,每个计算机厂商会定义自己的浮点数规则,不同厂商对同一个数表示出的浮点数是不一样的。
浮点数标准与标准浮点数的表示
1985年,IEEE 组织推出了浮点数标准,这个标准统一了浮点数的表示形式,并提供了 2 种浮点格式:
- 单精度浮点数
float
:32 位,符号位 S 占 1 bit,指数 E 占 8 bit,尾数 M 占 23 bit - 双精度浮点数
float
:64 位,符号位 S 占 1 bit,指数 E 占 11 bit,尾数 M 占 52 bit
为了使其表示的数字范围、精度最大化,浮点数标准还对指数和尾数进行了规定:
- 尾数 M 的第一位总是 1(因为 1 <= M < 2),因此这个 1 可以省略不写,它是个隐藏位,这样单精度 23 位尾数可以表示了 24 位有效数字,双精度 52 位尾数可以表示 53 位有效数字
- 指数 E 是个无符号整数,表示 float 时,一共占 8 bit,所以它的取值范围为 0 ~ 255。但因为指数可以是负的,所以规定在存入 E 时在它原本的值加上一个中间数 127,这样 E 的取值范围为 -127 ~ 128(实际为-126 ~ 127)。表示 double 时,一共占 11 bit,存入 E 时加上中间数 1023,这样取值范围为 -1023 ~ 1024。
除了规定尾数和指数位,还做了以下规定:
- 指数 E 非全 0 且非全 1:规格化数字,按上面的规则正常计算
- 指数 E 全 0,尾数非 0:非规格化数,尾数隐藏位不再是 1,而是
0(M = 0.xxxxx)
,这样可以表示 0 和很小的数 - 指数 E 全 1,尾数全 0:正无穷大/负无穷大(正负取决于 S 符号位)
- 指数 E 全 1,尾数非 0:
NaN
(Not a Number)
上述案例25.125转换为标准的float浮点数:
- 转化为十进制
- 整数部分:
25(D) = 11001(B)
- 小数部分:
0.125(D) = 0.001(B)
- 整数部分:
- 用二进制科学计数法表示
25.125(D) = 11001.001(B) = 1.1001001 * 2 ^4(B)
- 标准转换
- 尾数
M = 1.001001
,去掉1后为001001
- 指数
E = 4 + 127
(中间数) =131(D)
=10000011
- 尾数
0 10000011 00100100000000000000
浮点数为什么有精度丢失?
如果我们现在想用浮点数表示 0.2,它的结果会是多少呢?
0.2 转换为二进制数的过程为,不断乘以 2,直到不存在小数为止,在这个计算过程中,得到的整数部分从上到下排列就是二进制的结果。
0.2 * 2 = 0.4 -> 0
0.4 * 2 = 0.8 -> 0
0.8 * 2 = 1.6 -> 1
0.6 * 2 = 1.2 -> 1
0.2 * 2 = 0.4 -> 0(发生循环)
...
所以 0.2(D) = 0.00110…(B)
。
因为十进制的 0.2 无法精确转换成二进制小数,而计算机在表示一个数字时,宽度是有限的,无限循环的小数存储在计算机时,只能被截断,所以就会导致小数精度发生损失的情况。
浮点数的范围和精度有多大?
范围
float能表示的最大二进制为: + 1.111111...1 * 2^127
1.111111...1 ≈ 2
因此float能表示的最大数为2^128 = 3.4 * 10^38
,即 float 的表示范围为:-3.4 * 10^38 ~ 3.4 * 10 ^38
。
同样的方式算出来double的范围为: -1.79 * 10^308 ~ +1.79 * 10^308
精度
float
能表示的最小二进制数为 0.0000….1
(小数点后22个0,1个1),用十进制数表示就是 1/2^23 ≈ 1.19 * 10^-7
。
double
的最小精度为:0.0000…1
(51个0,1个1),用十进制表示就是 1/2^52 ≈ 2.22 * 10^-16
。
BigDecimal
BigDecimal
可以实现对浮点数的运算,不会造成精度丢失。
通常情况下,大部分需要浮点数精确运算结果的业务场景(比如涉及到钱的场景)都是通过 BigDecimal
来做的。
BigDecimal
原理简介
BigDecimal
类通过两个主要字段来表示一个数值:
int scale
:表示小数位的数量。BigInteger intVal
:一个BigInteger
对象,表示数值的非标度部分,即实际的数值(十进制)。
例如,数值 123.45
可以表示为:
intVal = 12345
scale = 2
使用BigDecimal
的常见的坑
坑1:创建BigDecimal
对象
常见的构造函数:
// 创建一个具有参数所指定整数值的对象
public BigDecimal(int) // 创建一个具有参数所指定双精度值的对象
public BigDecimal(double) // 创建一个具有参数所指定长整数值的对象
public BigDecimal(long) // 创建一个具有参数所指定以字符串表示的数值的对象
public BigDecimal(String)
使用实例:
BigDecimal bd1 = new BigDecimal(0.01);
BigDecimal bd2 = BigDecimal.valueOf(0.01);
BigDecimal bd3 = new BigDecimal("0.01");
BigDecimal bd4 = new BigDecimal(Double.toString(0.01));
System.out.println("bd1 = " + bd1);
System.out.println("bd2 = " + bd2);
System.out.println("bd3 = " + bd3);
System.out.println("bd4 = " + bd4);
输出结果:
bd1 = 0.01000000000000000020816681711721685132943093776702880859375
bd2 = 0.01
bd3 = 0.01
bd4 = 0.01
阿里巴巴java开发手册:
坑2:使用divide方法方法结果为无限循环小数
使用实例:
// 含税金额
BigDecimal inclusiveTaxAmount = new BigDecimal("1000");
// 税率
BigDecimal taxRate = new BigDecimal("0.13");
// 不含税金额 = 含税金额 / (1+税率)
BigDecimal exclusiveTaxAmount = inclusiveTaxAmount.divide(BigDecimal.ONE.add(taxRate));
System.out.println(exclusiveTaxAmount);
输出结果:
Exception in thread "main" java.lang.ArithmeticException: Non-terminating decimal expansion; no exact representable decimal result.
官网文档:
If the quotient has a nonterminating decimal expansion and the operation is specified to return an exact result, an ArithmeticException is thrown. Otherwise, the exact result of the division is returned, as done for other operations.大意是,如果除法的商的结果是一个无限小数但是我们期望返回精确的结果,那程序就会抛出异常。
解决方案:
// 不含税金额 = 含税金额 / (1+税率)
BigDecimal exclusiveTaxAmount = inclusiveTaxAmount.divide(BigDecimal.ONE.add(taxRate), 2, RoundingMode.HALF_UP);
坑3:保留小数位数
BigDecimal
保留小数位数,主要用setScale
方法:
public BigDecimal setScale(int newScale)public BigDecimal setScale(int newScale, RoundingMode roundingMode)
RoundingMode
参数说明:
ROUND_CEILING //向正无穷方向舍入
ROUND_DOWN //向零方向舍入
ROUND_FLOOR //向负无穷方向舍入
ROUND_HALF_DOWN //向(距离)最近的一边舍入,除非两边(的距离)是相等,如果是这样,向下舍入,例如1.55 保留一位小数结果为1.5
ROUND_HALF_EVEN //向(距离)最近的一边舍入,除非两边(的距离)是相等,如果是这样,如果保留位数是奇数,使用ROUND_HALF_UP,如果是偶数,使用ROUND_HALF_DOWN
ROUND_HALF_UP //向(距离)最近的一边舍入,除非两边(的距离)是相等,如果是这样,向上舍入, 1.55保留一位小数结果为1.6
ROUND_UNNECESSARY //计算结果是精确的,不需要舍入模式
ROUND_UP //向远离0的方向舍入
使用示例:
BigDecimal b = new BigDecimal("1.6666");
System.out.println("result b:" + b.setScale(2, BigDecimal.ROUND_HALF_UP));
System.out.println("result b:" + b.setScale(2));
输出结果:
result b:1.67
Exception in thread "main" java.lang.ArithmeticException: Rounding necessary
坑4:BigDecimal
等值比较
BigDecimal
提供了equals
、compareTo
两个方法可以进行比较;
使用示例:
BigDecimal bd1 = new BigDecimal("2.0");
BigDecimal bd2 = new BigDecimal("2.00");System.out.println(bd1.equals(bd2));
System.out.println(bd1.compareTo(bd2));
输出结果:
false
true
分析原因:
BigDecima
l中equals
方法的实现会比较两个数字的精度,而compareTo
方法则只会比较数值的大小。
阿里巴巴Java开发手册:
坑5:使用BigDecimal
进行除法计算时被除数不能为0
使用示例:
BigDecimal number1 = new BigDecimal("88.66");
BigDecimal number2 = BigDecimal.ZERO;BigDecimal number3 = number1.divide(number2);
System.out.println("number1 divide number2 = " + number3);
输出结果:
Exception in thread "main" java.lang.ArithmeticException: Division by zero
坑6: BigDecimal
不可变
BigDecimal
和String
一样具有对象不可变行,一旦赋值就不会再变,即便做加减乘除运算
BigDecimal count = new BigDecimal("3.1415");
count.add(new BigDecimal("0.1645"));System.out.println("count:" + count);
System.out.println("result:" + count.add(new BigDecimal("0.1645")));
输出结果:
count:3.1415
result:3.3060
坑7: 字符串输出
BigDecimal d = BigDecimal.valueOf(12334535345456700.12345634534534578901);
String out = d.toString();
System.out.println(out);
输出结果:
1.23345353454567E+16
BigDecimal
为转化为String
提供了三个方法:
// 有必要时使用科学计数法
String toString();
// 不使用科学计数法
String toPlainString();
// 工程计算中经常使用的记录数字的方法,与科学计数法类似,但要求10的幂必须是3的倍数
String toEngineeringString();
补充
小数转化为二进制的方法
将小数部分转化为二进制的方法是通过乘以2并记录每次乘法的整数部分,直到小数部分变为0或达到所需的精度。以下是具体步骤:
转换步骤
- 乘以2:将小数部分乘以2。
- 取整:记录乘以2后的整数部分(0或1),这就是二进制表示的下一位。
- 取小数:将乘以2后的结果减去整数部分,得到新的小数部分。
- 重复步骤:重复以上步骤,直到小数部分变为0或者达到所需的精度。
示例:将十进制小数0.625转换为二进制
- 初始值:
0.625
- 第一步:
0.625 × 2 = 1.25
- 整数部分:
1
- 小数部分:
0.25
- 第二步:
0.25 × 2 = 0.5
- 整数部分:
0
- 小数部分:
0.5
- 第三步:
0.5 × 2 = 1.0
- 整数部分:
1
- 小数部分:
0.0
(结束)
将记录的整数部分按顺序排列得到二进制表示:
- 625(D)= 0.101(B)
示例:将十进制小数0.1转换为二进制
- 初始值:
0.1
- 第一步:
0.1 × 2 = 0.2
- 整数部分:
0
- 小数部分:
0.2
- 第二步:
0.2 × 2 = 0.4
- 整数部分:
0
- 小数部分:
0.4
- 第三步:
0.4 × 2 = 0.8
- 整数部分:
0
- 小数部分:
0.8
- 第四步:
0.8 × 2 = 1.6
- 整数部分:
1
- 小数部分:
0.6
- 第五步:
0.6 × 2 = 1.2
- 整数部分:
1
- 小数部分:
0.2
- 第六步:
0.2 × 2 = 0.4
- 整数部分:
0
- 小数部分:
0.4
- …(重复上述步骤)
小数0.1的二进制表示是一个循环小数:
0.1(D)= 0.0001100110011...(B)
数学原理这里不再说明,若有疑问,请自行百度。