我们应该搞清楚分支预测

分支预测的英文名字是「Branch Prediction

大家可以在Google上搜索这个关键字,可以看到关于分支预测的很多内容,不过要搞清楚分支预测如何工作的,才是问题的关键。

a5081a68d94124cecde979f2f4e4caea.png

分支预测对程序的影响

我们来看看下面的两段代码

代码1

#include <algorithm>
#include <ctime>
#include <iostream>
int main()
{// Generate dataconst unsigned arraySize = 32768;int data[arraySize];for (unsigned c = 0; c < arraySize; ++c)data[c] = std::rand() % 256;// !!! With this, the next loop runs faster.//std::sort(data, data + arraySize);// Testclock_t start = clock();long long sum = 0;for (unsigned i = 0; i < 100000; ++i) {for (unsigned c = 0; c < arraySize; ++c) { // Primary loopif (data[c] >= 128) sum += data[c];}}double elapsedTime = static_cast<double>(clock()-start) / CLOCKS_PER_SEC;std::cout << elapsedTime << '\n';std::cout << "sum = " << sum << '\n';
}

执行结果

@ubuntu:/data/study$ g++ fenzhi.cpp && ./a.out
21.6046
sum = 314931600000

代码2

#include <algorithm>
#include <ctime>
#include <iostream>
int main()
{// Generate dataconst unsigned arraySize = 32768;int data[arraySize];for (unsigned c = 0; c < arraySize; ++c)data[c] = std::rand() % 256;// !!! With this, the next loop runs faster.std::sort(data, data + arraySize);// Testclock_t start = clock();long long sum = 0;for (unsigned i = 0; i < 100000; ++i) {for (unsigned c = 0; c < arraySize; ++c) { // Primary loopif (data[c] >= 128) sum += data[c];}}double elapsedTime = static_cast<double>(clock()-start) / CLOCKS_PER_SEC;std::cout << elapsedTime << '\n';std::cout << "sum = " << sum << '\n';
}

执行结果:

@ubuntu:/data/study$ g++ fenzhi.cpp && ./a.out
8.52157
sum = 314931600000

第一段代码生成随机数组后,没有进行排序,第二段代码对随机的数组进行排序,执行的时间上发生了非常大的差异。

a30c5a80a7e057b14f939f30ccf1c672.png

所以,他们发生了什么事情呢?

导致他们结果不同的原因,就是分支预测,分支预测是CPU处理器对程序的一种预测,和CPU架构有关系,现在的很多处理器都有分支预测的功能。

CPU在执行这段代码的时候

if (data[c] >= 128) sum += data[c];

CPU会有一个提前预测机制,比如前面的执行结果都是true,那么下一次在判断if的时候,就会默认认为是true来处理,让下面的几条指令提前进入预装。

当然,这个判断不会影响实际的结果输出,这个判断只是为了让CPU并行执行代码。

CPU执行一条指令分为几个阶段

d8e8b1bd76663ca2e02e69b05d534352.png

既然是分阶段执行,也就是我们正常说的pipeline(流水线执行)。

流水线的工人只要完成自己负责的内容就好了,没有必要去关心其他的人处理。

那如果我有一段代码,如下:

int a = 0;
a += 1;
a += 2;
a += 3;

eada7f47a2a07631d7c3f7f1dd6c4c1c.png

ce865c4479d938b1fb14b0c95bbf9e94.png

从这个图上我们可以看到,我们认为是在执行 a = 0结束后,才会执行a+=1。

但是实际CPU是在执行a=0的第一条执行后,马上就去执行a+=1的第一条指令了。

也就因为这样,执行速度上得到了大幅度的提升。

但是对于if() 语言,在没有分支预测的时候,我们需要等待if()执行出现结果后才能继续执行下一个代码。

48d53667ca7f3aadaa3e792eda63222d.png

如果存在分支预测的情况

4db692c7779c4165865812ee1b665080.png

通过比较我们可以发现,如果存在分支预测的时候,就让执行速度变快了。

b678afc5ed27b3f34c79e35f439f0548.png

那如果预测失败,会不会就影响了执行的时间,答案是肯定的。

在前面的例子中,没有对数组排序的情况下,分支预测大部分都会是失败的,这个时候就会在执行结束后重新取指令执行,会严重影响执行效率。

而在排序后的例子中,分支预测一直处于成功的状态,CPU的执行速率得到大幅度的提升。

da765f745826969aedaa76225d44be97.png

如果解决分支预测引起的性能下降

分支预测一定会存在一定的能性下降,想让性能提升的方法就是不要使用这个该死的if语句。

比如,上面的代码,我们可以修改成这样

#include <algorithm>
#include <ctime>
#include <iostream>
int main()
{// Generate dataconst unsigned arraySize = 32768;int data[arraySize];for (unsigned c = 0; c < arraySize; ++c)data[c] = std::rand() % 256;// !!! With this, the next loop runs faster.//std::sort(data, data + arraySize);// Testclock_t start = clock();long long sum = 0;for (unsigned i = 0; i < 100000; ++i) {for (unsigned c = 0; c < arraySize; ++c) { // Primary loopint t = (data[c] - 128) >> 31;sum += ~t & data[c];}}double elapsedTime = static_cast<double>(clock()-start) / CLOCKS_PER_SEC;std::cout << elapsedTime << '\n';std::cout << "sum = " << sum << '\n';
}

比如,我们看到的绝对值代码,里面也用了这样的思想

/*** abs - return absolute value of an argument* @x: the value. If it is unsigned type, it is converted to signed type first.* char is treated as if it was signed (regardless of whether it really is)* but the macro's return type is preserved as char.** Return: an absolute value of x.*/
#define abs(x) __abs_choose_expr(x, long long, \__abs_choose_expr(x, long, \__abs_choose_expr(x, int, \__abs_choose_expr(x, short, \__abs_choose_expr(x, char, \__builtin_choose_expr( \__builtin_types_compatible_p(typeof(x), char), \(char)({ signed char __x = (x); __x<0?-__x:__x; }), \((void)0)))))))#define __abs_choose_expr(x, type, other) __builtin_choose_expr( \__builtin_types_compatible_p(typeof(x), signed type) || \__builtin_types_compatible_p(typeof(x), unsigned type), \({ signed type __x = (x); __x < 0 ? -__x : __x; }), other)

当然,你也可以这样写

int abs(int i){if(i<0)return ~(--i);return i;
}

所以说,计算机的尽头是数学

参考:

https://stackoverflow.com/questions/11227809/why-is-processing-a-sorted-array-faster-than-processing-an-unsorted-array/11227902#11227902

https://blog.csdn.net/loongshawn/article/details/118339009

https://blog.csdn.net/DBC_121/article/details/105360658

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/464537.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Intent介绍及Intent在Activity中的使用方法

1.Intent的实现过程   在Android中&#xff0c;Intent不仅可用于应用程序之间的交互&#xff0c;也可用于应用程序内部的Activity/Service之间的交互。   Intent负责对应用中一次操作进行描述&#xff0c;描述内容包括动作以及动作所涉及的数据&#xff0c;Android中的In…

java 程序中打开文件和文件夹

打开文件 //打开工具的路径及名字 String toolsPath "C:/WINDOWS/system32/notepad.exe "; //被打开文件的路径及名字 String fileName "test.txt"; try { Runtime.getRuntime().exec(toolsPathfileName); } catch (IOException e) { // TODO Aut…

php函数可变参数列表,PHP函数可变参数列表的具体实现方法介绍

也许对于PHP初级程序员来说&#xff0c;对于PHP函数并不能完全熟练的掌握。我们今天为大家介绍的PHP函数可变参数列表的实现方法主要是利用func_get_args()、 func_num_args()、func_get_arg()这三个系统函数来实现的&#xff0c;其中func_get_args()函数以数组的形式获得参数列…

程序结束后去哪儿了?

大家好&#xff0c;我是写代码的篮球球痴&#xff0c;转发一篇卓老师的文章&#xff0c;文章中的内容我之前做单片机的时候也有遇到过。推荐给大家看看~简 介&#xff1a; 对于嵌入式系统&#xff0c;如果没有运行RTOS&#xff0c;那么程序开发中的 主函数&#xff08;main()&a…

CodeSmith终极玩法

CodeSmith是一个模仿asp.net运行机制的代码生成器, 运行时分析模板(相当aspx文件)的预编译指令和主体内容, 生成一个继承自CodeSmith.Engine.CodeTemplate(相当于System.Web.UI.Page)或者一个在Inherites预编译指令指定的类(相当于CodeBehind类)的源码, 且把它编译. 然后把这个…

bom与dom

区别 BOM&#xff08;Browser Object Model&#xff09; BOM 即浏览器对象模型&#xff0c;BOM没有相关标准&#xff0c;BOM的最核心对象是window对象。window对象既为javascript访问浏览器提供API&#xff0c;同时在ECMAScript中充当Global对象。BOM和浏览器关系密切&#xff…

Service 的生命周期;两种启动方法和区别

1&#xff1a;startService Service的生命周期&#xff1a;onCreate() --> onStart() -> onDestroy() 停止服务&#xff1a;service.stopService() 2&#xff1a;bindService Service的生命周期 onCreate() --> onBind() --> onUnBind() --> onDestroy() 停止…

用反射简化 asp.net 报表的一点总结

有几个报表, 查询条件都一样&#xff0c;仅仅里面GridView中有几个列区别&#xff0c;以前图快&#xff0c;就把原来Report.aspx文件拷贝一份&#xff0c;改名为Report1.aspx&#xff0c;然后&#xff0c;修改里面的column&#xff0c;然后再由后台库查出数据&#xff0c;填充到…

超轻型的数据库sqlite

很多次看到别人提到这个东西&#xff0c;最近因项目需要看了看&#xff0c;确实好用。总共就两个文件&#xff0c;我想不能再简单了。还是开源的。开发rails也可以用&#xff0c;不错&#xff01;转载于:https://www.cnblogs.com/chenge/archive/2005/06/29/183508.html

有些事不用听别人的

今天在群里跟几个朋友聊天&#xff0c;然后说了自己的想法&#xff0c;最近很多人在说公众号不会有好的发展&#xff0c;写文章也是没有出路的。不过这个是事实。短视频才是可能是出路&#xff0c;短视频是个很大的蛋糕&#xff0c;从表达方式上来说&#xff0c;视频的表达方式…

php读取三维数组,php 读取多维数组方法_PHP教程

php 读取多维数组方法for($i0;$i{for($j0;$j{echo $array[$j][userid];}}因为它是个多维数组,一般用foreach ($arr as $key > $value) {echo "Key: $key; Value: $value\n";}Array ( [0] > Array ( [userid] > 1 [username] > 刘振鹏 [status] > 0 [u…

互斥锁mutex的使用方法

在线程实际运行过程中&#xff0c;我们经常需要多个线程保持同步。这时可以用互斥锁来完成任务&#xff1b;互斥锁的使用过程中&#xff0c;主要有pthread_mutex_init&#xff0c;pthread_mutex_destory&#xff0c;pthread_mutex_lock&#xff0c;pthread_mutex_unlock这几个函…

1000瓶药水,1瓶有毒药,几只小白鼠能够找出毒药

1000瓶药水&#xff0c;1瓶有毒药&#xff0c;服用后一小时毒发&#xff0c;毒药可以无限稀释&#xff0c;那么一小时内用几只小白鼠能够找出毒药&#xff1f; 假如是8瓶药水&#xff0c;3只小白鼠。 0000  0011  0102  0113  1004  1015  1106  1117 每位数表示…

25个优秀的设计机构网站设计案例

今天&#xff0c;我们一起来欣赏网站设计工作室自己的网站。设计公司的网站除了要能够吸引客户以外&#xff0c;还要通过他们自己的网站向客户展示他们的设计理念和风格。这里收集的25个优秀的设计机构网站既有清爽简洁风格的&#xff0c;也有色彩丰富&#xff0c;图文并茂的&a…

windows server 2003 出错提示请求的资源在使用中解决方案

1.杀毒软件造成IIS站点‘请求的资源在使用中’”的消息&#xff0c;如瑞星2005&#xff0c;服务器上使用单机版杀毒一般都不会稳定的。马上把瑞星卸载了&#xff0c;重启机器&#xff0c;一切正常。 2.IUSR_机器名和IWAM_机器名的账号不同步,这个在网上已经有解决方案了只要打开…

一个适用各类场合的Makefile模板

1.写在前面对于Windows下开发&#xff0c;很多IDE都集成了编译器&#xff0c;如Visual Studio&#xff0c;提供了“一键编译”&#xff0c;编码完成后只需一个操作即可完成编译、链接、生成目标文件。Linux开发与Windows不同&#xff0c;Linux下一般用的的gcc/g编译器&#xff…

matlab r2014a错误,MATLAB中的潜在错误使R2014a回归

MATLAB R2014a过去工作得很好w回归但是现在当变量很好并且排名满意时我得到一个错误。X rand([10 3])X 0.8407 0.3517 0.07590.2543 0.8308 0.05400.8143 0.5853 0.53080.2435 0.5497 0.77920.9293 0.9172 0.93400.3500 0.2858 0.12990.1966 0.7572 0.56880.2511 0.7537 0.469…

Android 如何退出整个应用程序?

转载文章&#xff1a;http://blog.csdn.net/sunnyfans/article/details/7688092 Android 怎么退出整个应用程序&#xff1f; 我们在写android应用程序时&#xff0c;经常会遇到想退出当前Acitivity&#xff0c;或者直接退出应用程序.我之前的一般操作是按返回键&#xff0c;或者…

excel拼接数据宏

将sheet2的A2 和 G2 加上 sheet5的A2和B2合一起生成新的sheet--就是将两个sheet的指定列前后拼接一起作为一个新的sheet Sub addwork() Sheets.Add after:Sheets(Sheets.Count) ActiveSheet.Name "临时合并数据" Dim s, sht, shts Dim arr, brr1, br…

关于我曾经做过的一个商业社区的ui框架

1.主页面default2.容器,中间页面process载入模板3.模板:BasePage4,BasePageprotected override void Render(System.Web.UI.HtmlTextWriter writer) {writer.WriteLine("Header");base.Render(writer);writer.WriteLine("Header");}转载于:https://www.cnb…