并行编程2——多核体系架构

1.1  多核处理器定义

多内核处理器架构是指:芯片设计工程师在单个处理器中集成两个或多个 “执行内核(即计算引擎)”。多内核处理器可直接插入到单一处理器基座中。但是,操作系统会把它的每个执行内核作为独立的逻辑处理器,为其分配相应的执行资源。要利用多核处理器的运算能力,需要改写操作系统和编译器,广泛使用的vista, vin7 等都能支持多核体系架构。

1.2  多核发展趋势

首先思考一个问题: 为什么微处理器要从单核转向多核?

答案是: 功耗问题限制了单核不断提高性能的发展途径.
有几个简单的公式可以说明这个问题:

1)    处理器性能 = 主频 * IPC , 主频是指每秒时钟周期数,比如1Ghz,是每秒10亿个时钟周期。IPC 是每个时钟周期可以执行的指令数。

2)    处理器功耗 正比 电流*电压^2*主频, 而主频正比电压,所以

处理器功耗 正比 主频^3 ,通过主频提升性能,要面临功耗以3次方的指数增长问题。所以主频发展到一定程度后,自然转到重点依靠提高ipc来提升性能,提升IPC可以通过提高指令的并行度实现,提高并行度,一是提高微处理器微架构的并行度,二是采用多核架构,(参考 : http://blogs.intel.com/china/2007/06/03/post_5/)前者已经发展了很多年,提升空间和投入产出比明显不如后者,所有多核处理器是未来的方向。

 下面两张图看出家庭版PC和手机核心数目也很快突破10个。目前最新的mac pro 已经配备12个核心

图1 : 目前最新的mac pro 已经配备12个核心

图2 三星也推出了8核手机处理器

虽然商用多核(multicore)和众核(many-core)系统越来越普遍,成本也越来越低,游戏设备、手机等移动设备也具备越来越多的核心,并发和并行越来越成为必要的技术手段,但多核程序的发展依然没有跟上硬件的发展,很多游戏引擎和网络引擎都还是单线程的。原因就是第一章提到的多核编程的难度。

1.3 一个多核处理器架构例子

这是基于共享缓存的多核体系架构的一个例子,一共有10个核心,不需要深入了解,这张图唯一的目的就是给大家一个概念,现代的处理器架构已经比几十年前的冯诺依曼体系复杂多了(各种box),里边稍微值得关注的是Cbox ,Bbox ,这两个组件是缓存控制器,负责非常核心的功能:缓存一致性。缓存一致性会在后续文章描述。

这张图是intel多核体系架构(双路)的缓存示意图,每个core拥有自己的L1和L2缓存,属于一个物理CPU的core共享L3缓存。不同cpu之间通过QPI交互L3数据。每个CPU有自己的内存控制器。对多核编程而言,缓存是非常重要的底层概念。

1.4 Linux 线程核绑定

这么多核具体到编程是如何使用的?

在linux平台提供了核亲和性机制,进程和线程都可以通过设置亲和性绑定到不同的核心上。

进程版本:

#include <sched.h>

void setProcessToCPU(int _cpuID)

{

    cpu_set_t mask;

    cpu_set_t get;

 

    CPU_ZERO(&mask);

    CPU_SET(_cpuID, &mask);

 

    if (sched_setaffinity(0, sizeof(mask), &mask) < 0) {

        cout << "set process affinity failed\n" << endl;

    }

    CPU_ZERO(&get);

    if (sched_getaffinity(0, sizeof(get), &get) < 0) {

        cout << "get process affinity failed\n" << endl;

    }

}

 

线程版本:

#include <pthread.h>

#include <sched.h>

void setThreadToCPU(int _cpuID)

{

    cpu_set_t mask;

    cpu_set_t get;

 

    CPU_ZERO(&mask);

    CPU_SET(_cpuID, &mask);

 

    if (pthread_setaffinity_np(pthread_self(), sizeof(mask), &mask) < 0) {

        cout << "set thread affinity failed\n" << endl;

    }

    CPU_ZERO(&get);

    if (pthread_getaffinity_np(pthread_self(), sizeof(get), &get) < 0) {

        cout << "get thread affinity failed\n" << endl;

    }

}

 

转载于:https://www.cnblogs.com/jiayy/p/3243842.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/259506.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[Node.js]get/post请求

摘要 在很多情况下&#xff0c;我们的web服务器都需要接受客户端浏览器传递的参数或者数据。最常见的是get和post请求。 获取get请求的内容 get请求传递的参数在url中&#xff0c;参数部分在?后面。因此可以手动解析后面的内容作为get请求的参数。node.js中url模块中的parse函…

MyEclipse10 Tomcat7 JDK1.7 配置

第一步.MyEclipse10 Tomcat7 JDK1.7下载 MyEclipse10http://downloads.myeclipseide.com/downloads/products/eworkbench/indigo/installers/myeclipse-10.0-offline-installer-windows.exe Tomcat http://tomcat.apache.org/ Java SE Development Kit 7 WINDOWS版 http://www…

跳過 Windows RT的UI

RT启动进入常规桌面 微软Surface RT发布的时间已经不短了&#xff0c;相信很多朋友都已经熟悉了这个全新的平板&#xff0c;并且已经上手。Surface RT开机默认进入的界面为Windows UI&#xff0c;这对于经常使用App的朋友来说并没有什么&#xff0c;但是对于那些经常使用Office…

Android知识点剖析系列:深入了解layout_weight属性

前言 Android中layout_weight这个属性对于经常捣鼓UI的我们来说&#xff0c;肯定不会陌生。但是我们在真正使用这个属性时&#xff0c;经常会出现一些莫名奇妙的布局效果&#xff1b;如果仅仅知其然而不知其所以然&#xff0c;一些意外的布局效果一定让我们颇为头疼。在本文中&…

oracle诊断,Oracle 诊断事件列表

Oracle 诊断事件列表(2013-03-26 18:05:26)标签&#xff1a;oracle诊断事件itORA-10000: controlfile debug event, name control_fileORA-10001: controlfile crash event1ORA-10002: controlfile crash event2ORA-10003: controlfile crash event3ORA-10004: controlfile cra…

Qt 独立运行时伴随CMD命令窗口

用Qt写了一个小软件&#xff0c;在把程序release后&#xff0c;打包分装后&#xff0c;发现程序运行的时候会伴随cmd命令窗口&#xff0c;可把我愁怀了 不过功夫不负有心人&#xff0c;在老师和我网友的帮助下&#xff0c;终于搞完了 CONFIG&#xff1a;指定工程配置和编译参数…

Ant简单工程的构建

1.在Ant的官方网站http://ant.apache.org/bindownload.cgi下载Ant最新版本&#xff08;我下载的是apache-ant-1.8.2-bin.zip&#xff09;&#xff0c;Ant无需安装&#xff0c;直接解压后设置环境变量即可。 2.测试Ant是否安装成功&#xff0c;在控制台运行ant命令&#xff0c;出…

如何让Latex公式字体变小

转载&#xff1a;http://blog.sina.com.cn/s/blog_5e16f1770100gdxh.html 第一种方法&#xff1a;用比较笨的方法&#xff0c;一个一个公式用 \begin{small} \begin{equation} \ldots \end{equation} \end{small} 第二种方法&#xff1a;定义新的变量环境 在开始 \newenvironme…

.NET重构(四):窗体继承+模板方法,完美实现组合查询

导读&#xff1a;在机房重构中&#xff0c;有好些个查询都是大同小异&#xff0c;最为显著的就是组合查询了。怎样给自己省事儿&#xff0c;相同的东西能不能重复利用&#xff0c;就成了一个现实的问题。第一遍做机房的时候&#xff0c;使用的更多的是&#xff1a;复制粘贴。学…

This task is currently locked by a running workflow and cannot be edited

转自&#xff1a;http://geek.hubkey.com/2007/09/locked-workflow.html 转自&#xff1a;http://blogs.code-counsel.net/Wouter/Lists/Posts/Post.aspx?Listc04a88a9%2Dd138%2D4ac3%2Da2bb%2Db95c9fdd114e&ID118 SPWorkflow.AlertTask()的时候出现“This task is curren…

Cydia源局域网化

2019独角兽企业重金招聘Python工程师标准>>> 步骤 在网址根目录创建文件夹cydia&#xff0c;把你的deb文件放到 cydia/debs/ 文件夹下。在终端cd进入cydia文件夹输入命令&#xff1a;dpkg-scanpackages debs /dev/null > Packages输入命令&#xff1a;tar zcvf P…

linux系统中 库分为静态库和,Linux系统静态库与共享库

8种机械键盘轴体对比本人程序员&#xff0c;要买一个写代码的键盘&#xff0c;请问红轴和茶轴怎么选&#xff1f;This article mainly introduces the statics library and shared library on Linux and has done some experiments for better comprehension.Static library&am…

redis windows下的环境搭建

先说下安装吧&#xff01;感觉这东西跟mongodb差不多&#xff0c;安装和布置挺简单&#xff0c;下载地址&#xff1a;https://github.com/dmajkic/redis/downloads 下载下来的包里有两个&#xff0c;一个是32位的&#xff0c;一个是64位的。根据自己的实情情况选择&#xff0c;…

jsp乱码

自从重装系统之后电脑运行程序总是容易出现一些微妙的乱码&#xff0c;一直都没有彻底解决&#xff0c;有时候在别的机器上运行无误的代码一到我的机器上就出现一些问题。 myeclipse编码方式怎么改都无效&#xff0c;每次只能再代码中加上几行转码的语句 今天终于找到罪魁祸首-…

如何使用Notepad++格式化XML文件

经常会从数据库中读到挤在一起的XML, 整理它们的格式需要使用一些工具. 比如笔者之前使用过online的tool. 后来经同事介绍, 改用VS2008的CtrlK, CtrlF来整理. 但是VS2008有点庞大, 开启起来还是有点慢, 用起来也远不如Notepad顺手. 于是笔者Google了一把. 找到了下面的步骤, 非…

联想u盘linux安装教程,联想笔记本用U盘安装 winXP系统教程

联想笔记本用U盘安装 winXP系统教程。联想笔记本是指联想集团生产的便携手提电脑。 联想集团成立于1984年&#xff0c;由中科院计算所投资20万元人民币、11名科技人员创办&#xff0c;到今天已经发展成为一家在信息产业内多元化发展的大型企业集团。今天小编将给大家介绍使用U盘…

为什么Docker是云计算必然的现在和未来

Docker所代表的Container技术&#xff0c;是对内核的Cgroups、namespace等内容的使用.Linux Containerlxc借助BootZdocker可以实现在Mac和Windows上运行CGroups限制容器的资源使用Namespace机制&#xff0c;实现荣期间的隔离chroot,文件系统的隔离Linux内核提供的限制&#xff…

linux桌面环境 mac os,在Windows或Linux桌面上使用Mac OS Dashboard Widget | MOS86

Windows Vista中引入了Gadgets&#xff0c;并在Windows 7中继续使用。它们允许您从最新的新闻更新到月球的各个阶段查看各种信息&#xff0c;并在桌面上使用一些有用的实用程序。我们以前写过一个程序&#xff0c;允许您在Windows XP中使用Windows 7风格的小工具和一些实用程序…

spark 笔记 16: BlockManager

spark 笔记 16&#xff1a; BlockManager 先看一下原理性的文章&#xff1a;http://jerryshao.me/architecture/2013/10/08/spark-storage-module-analysis/ &#xff0c;http://jerryshao.me/architecture/2013/10/08/spark-storage-module-analysis/ , 另外&#xff0c;spar…

C++ stringstream介绍,使用方法与例子

C引入了ostringstream、istringstream、stringstream这三个类&#xff0c;要使用他们创建对象就必须包含sstream.h头文件。   istringstream类用于执行C风格的串流的输入操作。 ostringstream类用于执行C风格的串流的输出操作。 strstream类同时可以支持C风格的串流的输入…