Cache 总结

这一文,让我们分析一下,《浅谈 Cache》 一文中的奇怪现象,事实上如今来看也并不奇怪了。
        在什么情况下 r1 和 r2 都为 0 呢?
        细致看代码,你会发现,两个线程分别被执行在不同的 CPU 核上,而且在线程開始的阶段还使用了一个随机数,是为了让两个线程能尽量同一时候执行。
        如果 CPU0 执行:
        x = 1;
        r1 = y;
        CPU1 执行:
        y = 1;
        r2 = x;
        假设以下的情况发生:
        x 在 CPU1 的 Cache 中。 y 在 CPU0 的 Cache 中。
        1. CPU0 运行 x = 1, cache miss, 发送 "read invalidate" 消息,并把 x 的值 1 存入 Store Buffer, 開始运行 r1 = y, Cache 命中,r1 为 0;
        2. CPU1 运行 y = 1,cache miss, 发送 "read invalidate" 消息,并把 y 的值 1 存入 Store Buffer, 開始运行 r2 = x,Cache 命中,r2 为 0;
        3. CPU0 和 CPU1 各自收到了对方的消息,并作出回应,x 和 y 的值均应用到 Cache 中,且都为 1;
        主函数收到信号,比較 r1 和 r2 的值,奇迹发生了。
        假设你知道我讲的这些细节,就会发现,事实上这并非奇怪了。那么假设解决问题呢?
        事实上答案就非常easy了,要么让两个线程执行在同一个核心上,要么在两个语句之间加上内存屏障,经验证,问题攻克了。
        题外篇:
        在不同 CPU 架构下,对内存的乱序訪问事实上是不同的,一般的内存乱序分为下面四种:
        LoadStore, LoadLoad, StoreStore, StoreLoad。而且 X86 下仅仅会出现 StoreLoad 乱序,也就是上面的样例,我的 CPU 是 X86 的,所以出现了这样的情况,由此可知,事实上 X86 内存乱序訪问的还不算太厉害。
        简单解释一下,x = 1,为 Store, 读取 y 的过程为 Load,所以 Load 指令在 X86 下同意在 Store 还未更新到 Cache 中之前被运行。
        走出一个误区,内存乱序訪问与 CPU 乱序运行(Out of Order,即 OOO)不同。
早期的处理器为有序处理器(In-order processors),有序处理器处理指令通常有下面几步:
        1. 指令获取

        2. 假设指令的输入操作对象(input operands)可用(比如已经在寄存器中了),则将此指令分发到适当的功能单元中。假设一个或者多个操作对象不可用(一般是因为须要从内存中获取),则处理器会等待直到它们可用;

        3. 指令被适当的功能单元运行

        4. 功能单元将结果写回寄存器堆(Register file,一个 CPU 中的一组寄存器)
 
        相比之下,乱序处理器(Out-of-order processors)处理指令通常有下面几步:
        1. 指令获取
        2. 指令被分发到指令队列
        3. 指令在指令队列中等待,直到输入操作对象可用(一旦输入操作对象可用,指令就能够离开队列,即便更早的指令未被运行)
        4. 指令被分配到适当的功能单元并运行
        5. 运行结果被放入队列(而不马上写入寄存器堆)
        仅仅有全部更早请求运行的指令的运行结果被写入寄存器堆后,指令运行的结果才被写入寄存器堆(运行结果重排序,让运行看起来是有序的)
        从上面的运行过程能够看出,乱序运行相比有序运行能够避免等待不可用的操作对象(有序运行的第二步)从而提高了效率。现代的机器上,处理器运行的速度比内存快非常多,有序处理器花在等待可用数据的时间里已经能够处理大量指令了。
        如今思考一下乱序处理器处理指令的过程,我们能得到几个结论:
        对于单个 CPU 指令获取是有序的(通过队列实现)
        对于单个 CPU 指令运行结果也是有序返回寄存器堆的(通过队列实现)
        由此可知,在单 CPU 上,不考虑编译器优化导致乱序的前提下,多线程运行不存在内存乱序訪问的问题
        CPU 尽管是乱序运行,可是是顺序流出结果,在我们看来,乱序运行对我们来讲是透明的,我们看到的结果和指令顺序是一样的。

转载于:https://www.cnblogs.com/gcczhongduan/p/4065365.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/376544.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c/c++常见类型转换错误

文章目录char转int 高位符号扩展有符号int与无符号int比较关于一个bit的位域变量的取值范围临时变量溢出size_t死循环char转int 高位符号扩展 int main() {char a 0x9A;int util;util (int)a;cout << a << endl;cout << util << endl;if (util >…

Javascript 装载和执行

一两个月前在淘宝内网里看到一个优化Javascript代码的竞赛&#xff0c;发现有不少的人对Javascript的执行和装载的基础并不懂&#xff0c;所以&#xff0c;从那天起我就想写一篇文章&#xff0c;但一直耽搁了。 首先&#xff0c;我想说一下Javascript的装载和执行。通常来说&am…

java sundry tips

1.关于Arrays 记得binarySearch方法返回的int 类型的数值的含义。 If the array contains multiple elements with the specified value, there is no guarantee which one will be found. 而且当查找数小于数组中任何一个数时返回-1 &#xff0c;当查找数大于数组中任何…

c++常见的10个类对象问题

文章目录1、对象的浅复制2、构造函数中的操作符重载3、拷贝构造函数不能模板化4、析构函数未捕获异常导致coredump5、构造函数抛出异常6、基类析构函数非虚导致内存泄漏7、删除void*指针引发内存泄露8、成员函数尾部缺失const9、使用memset初始化class10、对象向下转换失败1、对…

Ubuntu 14.10 -- 异次元软件世界

Ubuntu 14.10 中文桌面版/服务器正式版下载 - 华丽免费易于入门的 Linux 操作系统 [ 系统工具 - Linux // 2014-10-25 ]一说到 Linux&#xff0c;就不得不提目前最红火的 Ubuntu 发行版了&#xff01;它拥有绚丽的界面&#xff0c;甚至跟以时尚为卖点的 Mac OSX 相比也有过之而…

maven 概念

这里maven倡导约定优于配置&#xff0c;maven的约定就是以下目录结构src/main/java 下存放java类src/main/webapp 下存放页面文件(需要手动创建)src/main/resources 下存放资源文件src/test/java 下存放单元测试代码src/test/resources 下存放测试资源文件 Maven运行的生命周期…

System Design笔记:在线售票系统设计

文章目录何为在线售票系统&#xff1f;系统目标和要求1、功能要求2、非功能性需求3、设计注意事项4、容量估算5、系统API1.SearchMovies2.ReserveSeats6、数据库设计7、高级设计8、细节模块设计9、流程服务器如何跟踪所有尚未预订的active预订&#xff1f;服务器如何跟踪所有等…

Response.Write具体介绍

问题一&#xff1a; Response.Write 后连接Response.Redirect &#xff0c;则Response.Write无法显示&#xff0c;直接跳转入Response.Redirect 的页面。 解决方案&#xff1a; Response.Write("<script langugejavascript>alert(成功改动); window.location.hrefin…

SharePoint通过IP地址访问

问题&#xff1a;SP站点通过计算机名称可以访问&#xff0c;但不能通过IP地址访问 解决方案&#xff1a;打开SharePoint2010管理中心》应用程序管理》配置备用访问映射》编辑公用 URL 备用访问映射集&#xff1a;选择要映射的网站集 默认:http://计算机名 Intranet &#xff1a…

公有云与私有云的差别(转)

公有云与私有云的差别 发现每一个公司对私有云、公有云的定义都不一样&#xff0c;能够从公有云与私有云的差别上理解这个概念。下面转载网络上一个比較浅显的解释&#xff1a; 差别1&#xff1a;从云的建设地点划分&#xff0c;公有云——互联网上公布的云计算服务&#xff1b…

流媒体协议初探(MPEG2-TS、RTSP、RTP、RTCP、SDP、RTMP、HLS、HDS、HSS、MPEG-DASH)

目录一、综述需求分析协议定制二、MPEG2-TS协议三、RTSP协议、RTP、RTCP、SDPRTSPRTP、RTCP、SDP四、RTMP五、HLS、HDS、HSSHLSHDS和HSS六、MPEG-DASH协议具体内容应用七、流媒体服务器流媒体服务器的功能与挑战客户端支持协议支持应用场景应用特点扩展技术广告投放录屏其他一、…

eclipse偶尔会反映迟钝,直接无视其报错

比如&#xff0c;你在web.xml中配置了什么东西&#xff0c;在有的时候不一定就会立即被eclipse察觉到&#xff0c;即便你的配置正确了&#xff0c;甚至重启了几次服务器&#xff0c;它仍然给你报错 比如说&#xff0c;刚才我在web.xml中配置了一个taglib&#xff0c;并且tld文件…

Qos(Quality of Service)

QOS&#xff08;即Quality of Service&#xff0c;服务质量&#xff09;主要指网络环境下服务满足用户的程度&#xff0c;在视频服务的语境下也可认为是Quality of Streaming&#xff0c;即流媒体服务的质量。通常&#xff0c;QOS可以由一系列指标表达&#xff0c;如传输的速度…

Popline:帅气的浮动 HTML5 文本编辑器工具栏

Popline 是一个基于 HTML5 实现的富文本编辑器工具栏&#xff0c;设计灵感来自 PopClip &#xff0c;相比传统的文本编辑器工具&#xff0c;Popline 能够浮动在编辑的文本周围&#xff0c;操作起来十分方便。 您可能感兴趣的相关文章Metronic – 基于 Bootstrap 响应式后台管理…

C#反射Assembly 具体说明

1、对C#反射机制的理解 2、概念理解后&#xff0c;必须找到方法去完毕&#xff0c;给出管理的主要语法 3、终于给出有用的样例&#xff0c;反射出来dll中的方法 反射是一个程序集发现及执行的过程&#xff0c;通过反射能够得到*.exe或*.dll等程序集内部的信息。使用反射能够看到…

流媒体技术优化

文章目录1、下载策略优化CDN选择策略错误处理策略码率选择策略2、协议和架构优化HTTP2TCP变种拥塞控制QUIC架构流媒体协议的选择与分发体系架构的设计对优化起着关键作用。 HLS和DASH协议在点播和OTT直播服务中已逐渐占据主流&#xff0c;其思想主要是将视频转为不同码率并切为…

Android——android必看 各个控件属性(网上看到的文字,觉得挺好的,珍藏了)...

属性 值 说明 Android:orientation horizontal/vertical 设置布局水平还是垂直&#xff0c;默认是垂直 android:checked true/false 标记默认选中&#xff0c;如果是单选则选中最后一个 android:layout_gravity center/right/left/bottom/top 位置 android:gravity…

java中接口的定义与实现

1、定义接口 使用interface来定义一个接口。接口定义同类的定义类似&#xff0c;也是分为接口的声明和接口体&#xff0c;当中接口体由常量定义和方法定义两部分组成。定义接口的基本格式例如以下&#xff1a; [修饰符] interface 接口名 [extends 父接口名列表]{ [public] …

API设计笔记:pimpl技巧

pimpl pointer to implementation&#xff1a;指向实现的指针&#xff0c;使用该技巧可以避免在头文件暴露私有细节&#xff0c;可以促进API接口和实现保持完全分离。 Pimpl可以将类的数据成员定义为指向某个已经声明过的类型的指针&#xff0c;这里的类型仅仅作为名字引入&am…

C++必读书

C必读书 《Inside The C Object Model》 《Effective C》和《More Effective C》以及《Exceptional C》 《C面向对象高效编程(C Effective Object-Oriented Software Construction)》 《面向对象软件构造(Object-Oriented Software Construction)》 《设计模式(Design Patterns…