python语言浮点数可以不带小数部分吗_python 浮点数四舍五入需要注意的地方

本文主要分享基于python的数据分析三方库pandas,numpy的一次爬坑经历,发现并分析了python语言对于浮点数精度处理不准确的问题,并在最后给出合理的解决方案。如果你也在用python处理数据,建议看一下,毕竟0.1的误差都可能造成比较大的影响。

问题出现

早上到了公司,领导发了几个文件过来,说这两天测试环境跑出来的数据,与实际情况有所出入,看看哪出的问题,尽快解决···

开始排查

先对比数据,发现并不是所有的数据都出现问题,只有10%左右的数据有这个问题,说明应该不是逻辑上的问题,初步判断可能为个别情况需要特殊处理,考虑不周导致

检查梳理各个运算模块,用debug断点调试一波,确定了数据出现偏差的模块

通过单独测试这个单元模块最终确定,涉及到两数相除结果为0.5(浮点数)的地方有问题

预期结果:np.round(0.5)=1,实际运算结果:np.round(0.5)=0,于是我做了如下的试验

# 基于python3.7版本

>>> import numpy as np

# 先看看 0 < x < 1 这个范围的结果,发现有问题

>>> np.round(0.50)

0.0

>>> np.round(0.51)

1.0

>>> np.round(0.49)

0.0

# 我担心是不是只有小数点为.5的都会呈现这种问题,所以测试了 x > 1的结果,发现还是有问题

>>> np.round(1.5)

2.0

>>> np.round(2.5)

2.0

>>> np.round(3.5)

4.0

>>> np.round(4.5)

4.0

通过对比,发现确实涉及到.5的值会有些和预想的不同,看看啥原因

分析问题

确实发现了关于浮点数(.5出现了理解上的偏差),看看官方文档怎么解释这个现象

numpy.around(a, decimals=0, out=None)[source]

Evenly round to the given number of decimals.

# 对于恰好介于四舍五入的十进制值之间的中间值(.5),NumPy会四舍五入为最接近的偶数值。

# 因此1.5和2.5四舍五入为2.0,-0.5和0.5四舍五入为0.0,依此类推。

For values exactly halfway between rounded decimal values,

NumPy rounds to the nearest even value.

Thus 1.5 and 2.5 round to 2.0, -0.5 and 0.5 round to 0.0, etc.

# np.around使用快速但有时不精确的算法来舍入浮点数据类型。

# 对于正小数,它等效于np.true_divide(np.rint(a * 10 **小数),10 **小数),

# 由于IEEE浮点标准[1]和 十次方缩放时引入的错误

np.around uses a fast but sometimes inexact algorithm to round floating-point datatypes.

For positive decimals it is equivalent to np.true_divide(np.rint(a * 10**decimals), 10**decimals),

which has error due to the inexact representation of decimal fractions in the IEEE floating point standard [1]

and errors introduced when scaling by powers of ten

其实也就是说:对于带有.5这种刚好介于中间的值,返回的是相邻的偶数值

白话解释:如果一个数字带有浮点数(.5),整数部分为偶数,则返回这个偶数;整数部分奇数,则返回这个奇数+1的偶数

规律解释:如果整数部分能够整除2,则返回整数部分;如果整数部分不能整除2,则返回整数部分 +1

解决问题

先不做任何改动,看下数据误差的情形

# 我们为了先看下现象,构造如下案例

import pandas as pd

import numpy as np

df = pd.DataFrame({"num1": [1, 1, 1.5, 5, 7.5], "num2": [2, 3, 1, 6, 3]})

df["真实值"] = df["num1"] / df["num2"]

# 看下round函数过后的结果

df["偏差值"] = np.round(df["num1"] / df["num2"])

原始结果图片如下

不做处理,期望值和偏差值不等的情况出现

我的解决方案

我根据我的精度要求,构建精度范围所需要保留的小数点的最后一位,通过这个数字是否为5,判断是否需要向上取整

举例来说,本案例中我只需要保留整数部分的数据,那么我只需要确定小数点后第一位是否是数字5就可以了

上代码

import pandas as pd

import numpy as np

import math

df = pd.DataFrame({"除数": [1, 1, 1.5, 5, 7.5], "被除数": [2, 3, 1, 6, 3]})

# 记录真实值

df["真实值"] = df["除数"] / df["被除数"]

# 记录整数部分

df["辅助整数列"] = df["真实值"].apply(lambda x: math.modf(x)[1])

# 记录小数部分,因为我的最后结果精度为只保留整数部分,所以我只需要保留一个小数点位进行判断是否需要进位操作

df["辅助小数列"] = df["真实值"].apply(lambda x: str(math.modf(x)[0]).split(".")[1][0])

# 小数点后的第一位是为5,则向上取整,不是5则调用原np.round就行了

df["期望值修正"] = df.apply(lambda x: x.辅助整数列 + 1 if (x.辅助小数列 == "5") else np.round(x.真实值), axis=1)

结果如下所示

以上就是python 四舍五入需要注意的地方的详细内容,更多关于python 四舍五入的资料请关注我们其它相关文章!

本文标题: python 浮点数四舍五入需要注意的地方

本文地址: http://www.cppcns.com/jiaoben/python/335383.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/504254.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【LeetCode笔记】399. 除法求值(Java、图)

文章目录题目描述思路 && 代码题目描述 第二道图题&#xff0c;大概是hot100里唯二的图题了。。 思路 && 代码 邻接矩阵存储&#xff0c;g[i][j] 代表 i / j 的值通过已知的表达式&#xff0c;对矩阵进行维护&#xff08;包括间接得到的值&#xff0c;见注…

python 降维 聚类_比PCA降维更高级——(R/Python)t-SNE聚类算法实践指南

作者介绍&#xff1a;Saurabh.jaju2Saurabh是一名数据科学家和软件工程师&#xff0c;熟练分析各种数据集和开发智能应用程序。他目前正在加州大学伯克利分校攻读信息和数据科学硕士学位&#xff0c;热衷于开发基于数据科学的智能资源管理系统。介绍许多数据科学家经常面对的问…

【LeetCode笔记】406. 根据身高重建队列(Java、偏数学)

文章目录题目描述思路 && 代码二刷题目描述 老阅读题了 &#xff0c;第一遍看题的时候一脸懵逼但其实代码就6行&#xff08;嘿嘿&#xff09; 思路 && 代码 先按照身高降序排&#xff0c;再按照人数升序排&#xff08;套路题&#xff09; class Solution…

ssd内部是多个flash一起操作_一键自毁军工级SSD固态硬盘的技术亮点

通过短路方式实现&#xff0c;烧毁时可见明火及冒烟&#xff0c;5秒(时间可调整)防误触发功能&#xff0c;每2秒烧毁一片闪存芯片&#xff0c;独特的反馈电路实时反馈烧毁状态&#xff0c;确保所有闪存全部被烧毁。烧毁后电子盘彻底报废&#xff0c;无法通过任何手段恢复数据。…

【LeetCode笔记】309. 最佳买卖股票时机含冷冻期(Java、动态规划)

文章目录题目描述思路 && 代码二刷题目描述 股票系列&#xff01;这次加入了冷冻期要素&#xff0c;需要考虑更多的状态 思路 && 代码 每天&#xff0c;都有三个状态&#xff1a;开一个 dp int[n][3] 二维数组主要思路…就是理解几种状态&#xff0c;以及…

sun 些命令可以将服务器设置至ok模式_Python 高手之路:从零开始打造一个Web服务器...

文 | Ruslan Spivak 译 | EarlGrey 推荐 | 编程派公众号(ID&#xff1a;codingpy)有一天&#xff0c;一位女士散步时经过一个工地&#xff0c;看见有三个工人在干活。她问第一个人&#xff0c;“你在做什么&#xff1f;”第一个人有点不高兴&#xff0c;吼道“难道你看不出来我…

css 查看更多_在Scrapy中如何利用CSS选择器从网页中采集目标数据——详细教程(上篇)...

/前言/今天小编给大家介绍Scrapy中另外一种选择器&#xff0c;即大家经常听说的CSS选择器。/CSS基础/CSS选择器和Xpath选择器的功能是一致的&#xff0c;都是帮助我们去定位网页结构中的某一个具体的元素&#xff0c;但是在语法表达上有区别。Xpath选择器明明已经可以帮助我们提…

【LeetCode笔记】85. 最大矩形(Java、单调栈)

文章目录题目描述思路 && 代码二刷题目描述 其实是84. 柱状图中最大的矩形的兄弟题目&#xff0c;理解成多个84题&#xff0c;对结果取max即可。 思路 && 代码 一行抽象出一个【柱状图】&#xff0c;分别套到84题的函数里即可时空复杂度&#xff1a;O(n2n…

python常用字符串处理函数_Python第10课:常用的字符串处理函数

Python第10课&#xff1a;常用的字符串处理函数时间 2019-01-17上午10&#xff1a;00主讲 刘培富地点 四楼电教室1.字符的ascii码及其逆运算ord("x") 求ascii码chr(x) 还原字符例如&#xff0c;chr(10)表示回车2.求长度 len("xxx")3.替换 "abcd"…

c4d启动无反应_浙江无填料喷雾式冷却塔

浙江无填料喷雾式冷却塔大容量静压储能设备广泛运用在厂区全热力、城市交通和道路通行中&#xff0c;全循环泵吸式&#xff1a;由高效的系统循环和分区启动两个关键部件组成。其进、出口均采用橡胶隔墙为隔离设施&#xff1b;提供一个保证阀体抗剪力的安全及密封的良好环境&…

【LeetCode笔记】312. 戳气球(Java、动态规划)

文章目录题目描述思路 && 代码二刷题目描述 一眼动态规划&#xff0c;但思路确实不好想面试被问过&#xff0c;直接人没了 思路 && 代码 核心思路&#xff1a;关心【最后一个被爆的气球】&#xff0c;自底向上进行动态规划 class Solution {// 思路&…

python怎么绘制渐变图_用Python画colorbar渐变图+修改刻度大小+修改渐变颜色

Draw Gradient Color Map using pythongithub源码地址&#xff1a;欢迎关注我&#xff01;pratical_skills_toolsDraw Gradient Color MapDependenciespandasmatplotlibnumpyseabornYou can configure it using pip install XXX in terminal.Resultsfigure1:figure2:Using and …

selinux= 为 disabled_安德里茨为巴西KLabin Puma II 项目提供气化炉和生物质处理线

ANDRITZ to supply gasification plant and biomass handling line to Klabin’s Puma II project in Brazil.国际技术集团公司安德里茨收到KLabin的订单&#xff0c;为其位于巴西的Ortigueira浆厂提供一台完整的生物质气化炉和一条新的生物质处理线。International technology…

【LeetCode笔记】301. 删除无效的括号(Java、DFS、字符串)

文章目录题目描述思路 && 代码二刷题目描述 【所有可能结果】-> 【暴力DFS】 思路 && 代码 代码比较长&#xff0c;但是总体思路很清晰。剪枝&#xff1a;舍弃左括号、舍弃右括号两种情况&#xff08;见注释&#xff09;分情况&#xff1a;当前字符有【左…

python动态页面元素爬取_爬取动态网页python+Web kit

上一篇文章爬取动态网页pythonseleniumwebdriver介绍了爬取动态网站的一种模拟浏览器的方法&#xff0c;该方法的优劣也很明显优&#xff1a;可以模拟任何人的操作&#xff0c;输入账号密码&#xff0c;点击登录等等操作劣&#xff1a;1.每次执行都要打开桌面上的Chrome浏览器(…

css3宽度变大动画_动画演示流量计的工作原理

​流量计(Flowmeter)是工业生产的眼睛&#xff0c;与国民经济、国防建设、科学研究有着密切的关系&#xff0c;在国民经济中占据重要地位与作用&#xff0c;可用于气体、液体、蒸汽等介质流量的测量。为了更好的展示流量计测量原理&#xff0c;小编采用动画演示的方法来给大家介…

python导出csv有引号_python – csv中的双引号元素不能用pandas读取

我有一个输入文件,其中每个值都存储为一个字符串.它位于一个csv文件中,每个条目都在双引号内.示例文件&#xff1a;"column1","column2", "column3", "column4", "column5", "column6""AM", "07&q…

cfiledialog 保存 扩展名_儿童美术:油画棒 插画一组超萌的大饼脸小孩 保存了跟小朋友一起画吧...

儿童美术&#xff1a;油画棒 插画一组超萌的大饼脸小孩 保存了跟小朋友一起画吧今天继续带来Hannah Sun的“大饼脸”系列。画者使用的作画工具为油画棒&#xff0c;因其效果厚重的特点&#xff0c;与人物的笨拙特征相得益彰&#xff0c;从而让人过目不忘。01020304050607这些作…

【LeetCode笔记】253. 会议室 II(Java、偏数学)

文章目录题目描述思路 && 代码计划里 hot 100 剑指Offer 的题目中唯一一道会员题&#xff0c;同时也是最后一道没写的题&#xff0c;刚好今天 leetcode 发了一天会员可以写上…简直命运石之门的选择&#xff0c;感动&#xff01; 题目描述 转化成上下车问题&#xff…

先学python还是ros_ROS入门学习

ROS学习笔记ROS主要包含包括功能包、节点、话题、消息类型和服务;ROS功能包/软件包(Packages)ROS软件包是一组用于实现特定功能的相关文件的集合&#xff0c;包括可执行文件和其他支持文件。所有的 ROS 软件都是一个软件包或其他软件包的一部分。每个程序包由一个清单文件(文件…