forkjoin_应用ForkJoin –从最佳到快速

forkjoin

到目前为止,JDK 7已很好地掌握在开发人员手中,并且大多数人都听说过ForkJoin,但是没有多少人有时间或机会去尝试它。

它引起了并且可能仍然引起一些混乱,与普通线程池有什么不同。 [1]

我在本文中的目标是通过一个代码示例来呈现一个更复杂但仍然简单的ForkJoin使用示例。

我计时并测量串行线程池ForkJoin方法的性能

这是github的前期内容: https : //github.com/fbunau/javaadvent-forkjoin

实际问题

想象一下,我们的系统中有某种组件可以在每毫秒时间内保持股票的最新价格。

这可以作为整数数组保存在内存中。 (如果我们以bps为单位)

该组件的客户进行如下查询:价格最低的是time1time2之间的时间点?

这可以是自动算法,也可以只是GUI中进行矩形选择的人。

stock_chart2

示例图像中有7个查询

让我们还想象一下,我们从一个Task中批处理的客户端中获得了许多这样的查询。

可以将它们分批处理,以减少网络流量和往返时间。
我们有组件可能获得的不同大小的任务,最多10个查询(带有GUI的人),最多100个,..最多1 000 0000个(某种自动化算法)。 我们的组件有很多这样的客户,每个客户都会产生不同大小的任务。 请参阅Task.TaskType

核心问题与解决方案

我们必须解决的核心问题是RMQ问题。 这是维基百科[2] :

“鉴于从一组有序集合(例如数字)中提取的对象数组,从ij的范围最小查询(或RMQ)要求最小元素在子数组A[i, j] ”。

“例如,当A = [0, 5, 2, 5, 4, 3, 1, 6, 3]时,则A[3, 8] = [2, 5, 4, 3, 1, 6]的范围最小查询的答案A[3, 8] = [2, 5, 4, 3, 1, 6]7 ,因为A[7] = 1

存在用于解决此问题的有效数据结构,称为“细分树”。

我不会对此进行详细介绍,因为这篇经典的Topcoder文章[3]对此进行了很好的介绍。 这本身对于这个ForkJoin示例并不重要,我之所以选择它是因为它比简单的总和更有趣,并且其本质是基于fork-join的精神。 它划分要计算的任务,然后将其加入结果!

数据结构具有O(n)初始化时间和O(log N)查询时间,其中N是每个时间单位值数组的价格中的元素数量。
因此,任务T包含M要进行的查询。

在学术计算机科学方法中,您只是说我们将使用这种高效的数据结构处理每个任务,而复杂性将是:

式
您再没有比这更有效率的了! 是的,在理论上是冯·诺依曼机器上的,但实际上可以。

一个容易引起混淆的是,因为O(n/4) == O(n) ,所以在编写程序时,常数因子不计算在内,但确实如此!
停下来想一想,等待10或40分钟/小时/年是否一样?

平行进行

因此,考虑要解决的问题,我们如何才能使其更快? 由于现在每个计算设备都有更多的计算核心,因此让我们充分利用它们并立即执行更多操作。
我们可以使用Fork Join框架轻松地做到这一点。

我最初很想尝试一下RMQ数据结构并并行执行它的操作。 我攻击了本来已经是log N的东西。但这是一个很大的失败,对于调度程序来说,管理如此短时间的逻辑开销太大。

答案是最终攻击的M_i常数因子。

线程池

在介绍如何应用ForkJoin解决方案之前,让我们想象一下如何应用线程池。 请参阅: TaskProcessorPool.java

图形2

我们可以有一个由4个工作人员组成的池,当我们有一个任务要做时,我们将其添加到队列中。 一旦有工作人员可用,它将从队列的开头检索待执行的任务,然后执行该任务。

虽然这对于具有相同大小的任务是很好的,并且大小相对中等且可预测,但是当要执行的任务大小不同时,就会遇到问题。 一名工人可能会因长期运行的任务而烦恼,而其他工人则无所事事。

在此图像中,如果不将更多任务添加到队列中,则线程池将在4个时间单位内完成16个可能的工作单位中的9个(效率为56%)

叉连接

当您位于问题域中时,可以将要解决的任务拆分为较小的任务,因此前叉联接很有用。

fork-join池的特殊之处在于它是一个窃取工作的线程池。

每个辅助线程都维护任务的本地出队。 在执行新任务时,可以执行以下任一操作:

  • 将任务拆分为较小的任务
  • 如果任务足够小,则执行任务

当一个线程的出队中没有本地线程时,它将“窃取”,从另一个随机线程的队列后面弹出任务,并将其放在自己的线程中。 此任务尚未拆分的可能性很高。 因此,他将有很多工作要做。

与线程池相比,它们可以将现有任务拆分为较小的线程,而不是等待其他线程等待某些新工作,并帮助另一个线程处理较大的任务。

图形1

这是Doug Lea的原始论文,提供了更详细的解释: http : //gee.cs.oswego.edu/dl/papers/fj.pdf

回到我们的示例中,可以将一大批操作分成几批较少数量的操作。 参见: TaskProcessorFJ.java

大多数问题具有像这样的线性操作序列,它不一定是特殊的并行问题,对此我们需要应用专门的并行算法来利用处理器上的核心。

你分多少钱? 您拆分任务,直到达到通常不再有意义的阈值为止。 例子:(拆分+获得工作的线程+上下文切换比实际执行任务要多)

对于大型XXL,我们必须执行1000000个查询操作。 我们可以将其分为2 500000个操作任务,并并行执行。 500000仍然很大吗? 是的,我们可以进一步拆分。 我选择了一组10000个操作作为阈值,在该阈值下没有任何拆分用途,我们可以在当前线程上执行它们。

Fork join并不会拆分所有任务,而是通过它进行工作。

绩效结果

在干净重启后,我对i5-2500 CPU @ 3.30GHz上具有4核/ 4线程的i5-2500 CPU的每个处理器实现进行了4次迭代。
结果如下:

Doing 4 runs for each of the 3 processors. Pls wait ...
TaskProcessorSimple: 7963
TaskProcessorSimple: 7757
TaskProcessorSimple: 7748
TaskProcessorSimple: 7744
TaskProcessorPool: 3933
TaskProcessorPool: 2906
TaskProcessorPool: 4477
TaskProcessorPool: 4160
TaskProcessorFJ: 2498
TaskProcessorFJ: 2498
TaskProcessorFJ: 2524
TaskProcessorFJ: 2511
Test completed.

结论

即使您选择了正确的最佳数据结构,它也不会很快,直到您使用所有的资源。 即利用所有核心

在某些问题域中,ForkJoin绝对是对线程池的改进,值得探索在哪里可以应用它,我们将看到越来越多的并行代码。
您今天可以购买这种处理器 ,即12核/ 24线程。 现在,我们只需要编写软件来利用我们拥有的,将在将来获得的出色硬件即可。

代码在这里: https : //github.com/fbunau/javaadvent-forkjoin如果您想使用它的话

感谢您的宝贵时间,如果发现任何错误或需要添加的内容,请留下一些评论。

参考: Java出现日历博客上的JCG合作伙伴 Attila Mihaly Balazs 从最佳到快速的应用ForkJoin 。

翻译自: https://www.javacodegeeks.com/2013/12/applying-forkjoin-from-optimal-to-fast.html

forkjoin

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/345934.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android usb触摸屏驱动 win10,Win10手机居然这样兼容安卓:直接运行apk!

摘要:“应用太少是硬伤!”这是WP粉吐槽微软简洁而有力的一句话。最新的Win10Mobile预览版中首次引入了微软的安卓子系统,这也是微软推行的ProjectAstoria的一部分。那么Win10手机究竟要如何兼容安卓应用呢?微软最新一份招聘启事似…

Java应用程序中的验证

我经常看到的项目几乎没有任何有意识的数据验证策略。 他们的团队在截止日期,明确要求的巨大压力下工作,只是没有足够的时间以适当且一致的方式进行验证。 因此,数据验证代码随处可见:JavaScript片段,Java屏幕控制器&a…

升级鸿蒙系统如何退出,华为鸿蒙2.0系统升级了怎么退回EMUI11系统-操作教程详解...

华为鸿蒙2.0系统升级了怎么退回EMUI11系统?很多用户升级了又不知道如何才能退回到原来的系统,下面就让老铁下载小编为大家带来,2.0系统升级退回EMUI11系统操作教程详解。这次开启华为鸿蒙2.0系统手机开发者beta版公测招募的机型有华为P40 、P…

OpenFlow和SDN的历史和原理介绍

OpenFlow相关的历史、新闻:http://blog.csdn.net/jincm13/article/details/7825754 起源与发展 【https://36kr.com/p/5035985】   OpenFlow起源于斯坦福大学的Clean Slate项目组 [1] 。CleanSlate项目的最终目的是要重新发明英特网,旨在改变设计已略…

小米miuiVS华为鸿蒙,华为鸿蒙2.0 vs 小米MIUI 12.5

原标题:华为鸿蒙2.0 vs 小米MIUI 12.5不久前有媒体在视频中展示了鸿蒙2.0和苹果IOS14两个操作系统下App的启动速度,结果是鸿蒙2.0完胜IOS14。此后不久,该媒体发布了华为鸿蒙2.0和小米MIUI 12.5对比视频。同上次一样,这次依然是选择…

具有MicroProfile配置的可配置JAX-RS ExceptionMapper

当您使用JAX-RS创建REST服务时,通常要么不返回任何内容(例如HTTP 201/2/4等),要么返回某些数据(可能采用JSON格式(因此HTTP 200),或者返回某些异常/错误(例如HTTP 4xx或5…

Ad-hoc

Ad-hoc这个词来源于拉丁语,在百度上解释为“for this purpose only”,在wiki上解释为“for this”,其中文在wiki上被解释成包含特设的、特定目的的(地)、即席的、临时的、将就的、专案的”这么多种含义。在wireless ne…

android5.0 v4a,【图】多图讲解V4A提高G5音效详细步骤(G5音效可以更棒的)

首先感谢论坛前辈,看着你们介绍的方法,我把G5应有的音效搞出来了,效果提升非常明显。(看清了,如果不是非常明显,我也不会费这么大劲在这儿做讲解)。特记录和总结过程如下:1. 安装一键ROOT。2. 安装虚拟按…

Multi-commodity Flow Problem

多物网络流问题(Multi-commodity Flow Problem)是多种物品(或货物)在网络中从不同的源点流向不同的汇点的网络流问题。 定义

信干噪比、信噪比

信干噪比 名词定义 信干噪比SINR(Signal to Interference plus Noise Ratio),指的是系统中信号与干扰和噪声之和的比。 信号是指来自设备外部需要通过设备进行处理的电子信号。 干扰是指系统本身以及异系统带来的干扰,如同频干扰…

矢量图标库如何引入html,Iconfont矢量图标库在网站中的使用方法

原标题:Iconfont矢量图标库在网站中的使用方法大家都知道现在移动端网站设计比较热门,由于移动端的网站页面的收缩性要求很高,必然在网页设计中,一些小点的图标,使用图片收缩性,以及美观上并不是很理想&…

弗林斯传输公式、天线温度

这是被称为弗林斯传输公式。这个等式关系 自由空间路径损耗,天线增益和波长 接收和发射功率。这是一个基本 在天线理论方程,应该记住的(以及 上述推导)。 弗林斯传输方程的另一种有用的形式是给定的公式[2]。自 波长和频率&#…

马尔可夫决策过程 Markov decision process MDP, 连续时间Markov chain, CMDP(全)

引言 在概率论及统计学中,马尔可夫过程(英语:Markov process)是一个具备了马尔可夫性质的随机过程,因为俄国数学家安德雷马尔可夫得名。马尔可夫过程是不具备记忆特质的(memorylessness)。换言…

Spring Boot完成示例

这篇文章提供了一个使用Spring Boot开发松耦合REST服务的完整示例。 使用spring boot,我们可以开发可独立运行的生产就绪Java应用程序,它是独立的应用程序,具有最小的依赖性,并且与其他应用程序的耦合较少。 大多数时候&#xff0…

最小生成树、最短路径树

一、最小生成树与最短路径树的区别 最小生成树能够保证整个拓扑图的所有路径之和最小,但不能保证任意两点之间是最短路径。 应用如网络部线,把所有的电脑(服务器?)都连起来用的网线(光纤?)最少&#xff0c…

卫星链路

卫星通信系统中,信息传输中,一条传输链路包括发端地球站、上行链路、卫星转发器、下行链路、收端地球站。按照空间分布可以分为星地链路和星间链路。影响其通信性能的因素主要有:发射端的发射功率与天线增益、传输过程中的损耗、传输过程中所…

计算机网络组成包括哪些内容,计算机网络系统的组成

互联网时代已经到来了,小编为你科普一下网络相关基础知识《计算机网络系统的组成》,让你更快融入互联网时代。计算机网络系统是通信子网和资源子网组成的。而网络软件系统和网络硬件系统是网络系统赖以存在的基础。在网络系统中,硬件对网络的…

正定和半正定

在众多的机器学习模型中,线性代数的身影无处不在,当然,我们也会时常碰到线性代数中的正定矩阵和半正定矩阵。例如,多元正态分布的协方差矩阵要求是半正定的。 ------------------------------------------ 1. 基本的定义 正定和…

HTML中button怎么填充GIF,css3给按钮添加背景渐变动画

css3给按钮添加背景渐变动画button {color:#FFF;font-size:16px;outline:none;width:300px;height:48px;background:#26A1D9;border:none;-webkit-border-radius:5px;border-radius:5px;}button:active{outline:none;background:#208FC1;/*执行动画*/-webkit-animation:showBtn…

导数,微分,偏导,全微分,方向导数,梯度

多元函数与一元函数有一个很大的区别在于定义域的不同:一元函数自变量就在x轴上,因此趋近的方向只有某点的左右两侧,因此,考察一元函数极限的时候,仅考虑左邻域和右邻域即可。但是多变量微分变得复杂,趋向方…