OpenCL用于计算机领域的13个经典案例

摘要:当使用加速器和OpenCL时,哪种类型的算法更加快速?来自弗吉尼亚理工大学的Wu Feng教授和他的团队例举了一份算法列表,分享了OpenCL常被用于计算机领域的13个经典案例。

哪种算法可以最好的映射GPU及矢量处理器呢?换句话说,当使用加速器和OpenCL时,哪种类型的算法更加快速?

来自弗吉尼亚理工大学的Wu Feng教授和他的团队例举了一份算法列表,分享了OpenCL常被用于计算机领域的13个经典案例。有人将其称之为OpenCL计算领域的13个“小巨人”。

一、Dense Linear Algebra(稠密线性代数)

经典的向量和矩阵运算,传统上可分为1级(矢量/矢量vector/vector),2级(矩阵/矢量),3级(矩阵/矩阵),应用范围极其广泛。

应用范围:

  • 线性代数:LAPACK, ATLAS。
  • Clustering algorithms (聚类算法)/ Data-mining(数据挖掘):StreamCluster, K-均值算法。
正常情况下执行循环,但大多数情况下可轻易在OpenCL进行并行计算。

二、Sparse Linear Algebra(稀疏线性代数)

乘法运算主要是由零矩阵组成。通过移动对角矩阵周围的非零元素,使计算更加高效。

应用范围:

  • 有限元素分析。
  • 偏微分方程式。

使用OpenCL有两种方法:通过一些列的操作行为解决该问题,这将导致很大一部分开销;第二种方法是使用一些列连续的逐次逼近法,将函数误差最小化。

三、Spectral Methods(光谱法)

各种结构的物质都具有自己的特征光谱,光谱分析法就是利用特征光谱研究物质结构或测定化学成分的方法。

光谱方法可用来解决常微分方程(ODEs),偏微分方程(PDEs)以及包含微分方程增值问题。

应用范围:

  • 流体动力学。
  • 量子力学。
  • 天气预测。

利用OpenCL针对每个硬件架构有各种FFT实施方法。诀窍是调优。

四、N-Body Methods

N-Body法是模拟粒子的动力学系统,通常在物理学的影响下如重力,计算方法有两种(A影响B,同样B也影响A),整个系统在每一轮之后都会再次更新。

基本算法是O(N^2)。对于大型系统的优化,可以通过neighbour-administration(相邻管理)和远离粒子计算,这里运行时方法是可取的。

应用范围:

  • 天文学:宇宙学(比如,星系的形成)。
  • 计算化学:分子动力学(比如蛋白质折叠),分子模拟。
  • 物理:流体动力学,等离子体物理学。

OpenCL可以实现每秒数以万计的粒子。

五、Structured Grids(结构化网格)

结构化网格是指网格区域内所有的内部点都具有相同的毗邻单元。在一个结构化或规则的网格中所有的元素具有相同的尺寸,比如方形模块。计算方法依赖于相邻的不规则网格。

应用范围:

  • 图形处理:Gaussian image blurring 高斯图像模糊。
  • Physics Simulations:transient thermal differential equation solver。
  • Finite Element Method(有限元素法)。

利用OpenCL,网格有规则,因此映射也相当容易。要解决的问题是如何做到相邻网格之间的连通性。

六、Unstructured Grids(非结构化网格)

所有的网格都无规则性,不同的元素有着不同的相邻数量。这一组有很多的重叠与回溯。网格中的每个元素都可以是二维的多边形或者三维多面体。每个元素之间没有隐含的连通性。

应用范围:

  • 计算流体动力学。
  • Belief propagation(置信传播)。

难点是在硬件上映射不规则网格。

七、Map-Reduce & Monte Carlo

每个进程可独立于其他进程运行,因此,在相邻的进程之间没有连通性。在庞大的数据集和计算密集型算法中,GPU可结合大数据解决方法,比如Hadoop。

应用范围:

  • Monte-Carlo(蒙特卡洛法):PI(圆周率)计算法,碰撞仿真,序列对比。
  • 分布式搜索。

由于节点之间的通信是最小的,这也是使用GPU最快的方法之一。

八、Combinational Logic(组合逻辑)

组合逻辑电路是一种逻辑电路,它的任一时刻的稳态输出,仅仅与该时刻的输入变量的取值有关,而与该时刻以前的输入变量取值无关。该算法中涉及大量的数据,可利用位级操作( bit-level )执行简单的操作。

应用范围:

  • Computing checksums。
  • 计算校验法,CRCs。
  • 加密和解密。
  • 散列。
  • Hamming weight。

并不是所有的硬件都适合这种类型的操作,因此,设备的选择是至关重要的。

九、Graph Traversal(图形追踪)

图形追踪是以特定的方式访问所有节点,更新/检查值。树形追踪是属于图形追踪一种特殊情况,有间接查找和微计算。

应用范围:

  • 搜索:深度优先搜索,广度优先搜索,找到所有节点中某个连接组件。
  • 排序:快速排序。
  • 序列化/反序列化。
  • Maze生成。
  • 碰撞检测。

使用OpenCL,最关键的是要保持核心程序处于繁忙状态。

十、Dynamic Programming(动态规划)

它是一种在数学、计算机科学和经济学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。

动态规划常适用于解决简单的重叠子问题和最优子结构性质的问题。许多动态编程问题操作通过在网格中填写具有代表性的问题领域,这个领域在网格中保留着最终答案。

应用范围:

  • 图形问题:Floyd’s AllPairs,最短路径, Bellman-Ford算法。
  • 序列对比:Needleman-Wunsch, Smith-Waterman。
“动态”应用,在运行时进行调优以达到最佳性能。

十一、Backtracking(回溯法)

回溯法(探索与回溯法)是一种选优搜索法,按选优条件向前搜索,以达到目标。但当探索到某一步时,发现原先选择并不优或达不到目标,就退回一步重新选择,这种走不通就退回再走的技术为回溯法,而满足回溯条件的某个状态的点称为“回溯点”。

这组通用的解决方法是分支定界(分而治之)。

应用范围:

  • 智力游戏:N-queens,填字游戏,九宫格游戏,Peg接龙。
  • Travelling salesman(旅行推销员)。
  • Knapsack,子集和问题以及分区问题。
  • 整数线性规划。
  • Boolean Satisfiability(布尔运算)。
  • Combinatorial Optimisation(组合优化)。

在OpenCL中最重要的就是避免大的分支。

十二、Probabilistic Graphical Models(概率图模型)

这个图形结合了不确定性(概率)和逻辑结构(独立约束)表示复杂的、现实世界的现象。

应用范围:

  • Bayesian(贝叶斯)网络:信念网络,概念网络,因果网络,知识地图。
  • Hidden Markov models(隐马尔可夫模型)。
  • Neural networks。

随着越来越多的进程需要更新相同的节点(原子学就是典型的案例),因此,需消耗大量的时间。

十三、Finite State Machines(有限状态机)

有限状态机是指有限个状态以及在这些状态之间的转移和动作等行为的数学模型。

其具有三个特征:状态总数(state)是有限的;任一时刻,只处在一种状态之中;某种条件下,会从一种状态转变(transition)到另一种状态。

数学计算模型常用于设计连接计算机程序和时序逻辑电路。它常被看作是一个抽象性的机器,可用在有限的数量状态下。

应用范围:

  • 视频解码,解析,压缩。
  • 数据挖掘。
  • 查找循环模式。
英文出自: Streamcomputing

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/448702.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

版本控制:集中式(SVN) vs 分布式(GIT)

Linus一直痛恨的CVS及SVN都是集中式的版本控制系统,而Git是分布式版本控制系统,集中式和分布式版本控制系统有什么区别呢? 先说集中式版本控制系统,版本库是集中存放在中央服务器的,而干活的时候,用的都是…

Knative 核心概念介绍:Build、Serving 和 Eventing 三大核心组件

为什么80%的码农都做不了架构师?>>> 作者| 阿里云智能事业群高级开发工程师 元毅 Knative 主要由 Build、Serving 和 Eventing 三大核心组件构成。Knative 正是依靠这三个核心组件,驱动着 Knative 这艘 Serverless 巨轮前行。下面让我们来分…

树莓派基金会来号召用键盘生物学家研究企鹅

伦敦动物学会(Zoological Society of London)于2014年,与伍兹霍尔海洋研究所和牛津大学等组织合作监控企鹅的计划Penguin Lifelines有了新进展,伦敦动物学会现与其他动物保护组织合作Penguin Watch项目,邀请民众在网上…

BlockingCollectionT 类实现 列队操作

官方文档 为实现 IProducerConsumerCollection<T> 的线程安全集合提供阻塞和限制功能。 通过 BlockingCollection<T> 实现列队调用函数 建立全局变量 BlockingCollection<string> blockingCollection new BlockingCollection<string>(); 建立调用函数…

Git 版本回退

现在&#xff0c;你已经学会了修改文件&#xff0c;然后把修改提交到Git版本库&#xff0c;现在&#xff0c;再练习一次&#xff0c;修改readme.txt文件如下&#xff1a; Git is a distributed version control system. Git is free software distributed under the GPL.然后尝…

AMD院士站台 异构计算与OpenCL编程师资培训首站清华开讲

摘要&#xff1a;2013年10月14日&#xff0c;“2013年异构计算与OpenCL编程师资培训”在清华大学召开。本活动邀请到AMD、Khronos Group及清华大学的多位并行计算领域专家&#xff0c;与参会者共同探讨OpenCL异构开发和优化技术。 2013年10月14日&#xff0c;由教育部科技发展…

【问题记录】RIDE-1.7.3.1控制台及日志中文乱码处理

RIDE-1.7.3.1运行结果界面展示: 解决方法参考链接&#xff1a; https://blog.csdn.net/panda62/article/details/88535376 转载于:https://www.cnblogs.com/quietCorner/p/11046656.html

GPU Saturday技术沙龙:OpenCL程序员眼中的下一代APU架构

摘要&#xff1a;GPU Saturday技术沙龙在北京3WCoffee成功举办。本次活动邀请AMD资深技术人员及清华大学项目研究员就AMD最新的GCN架构、GPU加速计算在挖掘比特币、典型图像算法、深度神经网络算法等领域的分析与应用展开深入讨论。 [CSDN报道] 9月5日&#xff0c;GPU Saturda…

直接取出 post 请求中的 json、得请求体参数、查看 post 请求参数

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程。 方法如下&#xff1a; try{ServletRequestAttributes requestAttributes (ServletRequestAttributes) RequestContextHolder.getReques…

SparkSQL调优

1、执行计划&#xff08;过往记忆https://www.iteblog.com/archives/2562.html&#xff09; df.explain(true)//显示逻辑计划和物理计划&#xff0c;不加true只显示物理计划 2、逻辑计划优化方法&#xff1a; 谓词下推&#xff0c;列裁剪&#xff0c;常量替换&#xff0c;常量累…

AMD发布APPML源码,构建clMath库

摘要&#xff1a;日前&#xff0c;AMD将加速并行处理数学库&#xff08;Accelerated Parallel Processing Math Library简称APPML&#xff09;开源&#xff0c;内容包含了BLAS和FFT的OpenCL实现&#xff0c;项目托管在GitHub上&#xff0c;命名为clMath&#xff0c;该项目基于A…

最简单的 post 请求发起方式、调用其它系统接口

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程。 调用其它系统接口&#xff0c;发起一个 post 请求&#xff0c;写法如下&#xff1a; import cn.com.infinitus.yunxiao.jira.vo.EpicV…

CSS基础学习 18.CSS多列

四种常见的浏览器内核&#xff1a; 转载于:https://www.cnblogs.com/songsongblue/p/11050210.html

BGP

BGP&#xff1a;border gateway protocol 边界网关路由协议 路由协议分类&#xff1a;内部网关路由协议IGP&#xff1a;rip ospf isis &#xff08;eigrp&#xff09;外部 网关路由协议EGP&#xff1a;EGP&#xff08;早期淘汰&#xff09; BGP BGP特点&#xff1a;1、针对大型…

OpenCL 2.0发布,带来更强悍的异构计算能力

摘要&#xff1a;Khronos Group本周一发布了OpenCL 2.0&#xff0c;可为显示芯片提供更好的独立性&#xff0c;以便能为通用软件计算出更大的力。该组织已经发布了2.0的临时标准&#xff0c;预计正式版本的发布要等到6个月以后。 Khronos小组于本周一&#xff08;7月22日&…

从一个OutOfMemoryError 学会了分析Java内存泄漏问题

从一个OutOfMemoryError 学会了分析Java内存泄漏问题 以前都是好好的&#xff0c;最近出现了 oom。 问题 开始是&#xff1a; java.lang.OutOfMemoryError: Java heap space 2019-06-14 11:02:41.678 ERROR 13789 --- [nio-8082-exec-3] c.e.p.s.c.c.core.ELDictionaryControll…

Ubuntu安装php7.2

1、使用ppa增加源apt-get install python-software-propertiesapt-get install software-properties-commonadd-apt-repository ppa:ondrej/php2、更新apt-get update3、查看源中PHP7.2版本apt list | grep php 列表中已经包含你想要的PHP版本了4、安装PHP7.2apt-get -y …

会出现 unreachable statement 的可能

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程。 java编译器把unreachable statement标记为运行时错误&#xff0c;一个unreachable statement就是编译器决定永远不会执行它。 下面的几…

Hadoop+GPU强强联手的性能探索

摘要&#xff1a;Hadoop并行处理可以成倍地提高性能&#xff0c;GPU也日益成为计算任务的重要分担者&#xff0c;Altoros Systems研发团队一直致力于探索HadoopGPU的可能性&#xff0c;以及在实际的大规模系统中的实现&#xff0c;这篇文章就是他们的部分研究成果。 Hadoop并行…

Vue Google浏览器插件 Vue Devtools无法使用的解决办法

1.插件安装不必多说 一定要用Vue.js 开发版 Vue.min.js 在控制面板就不会显示 2.本地调试 用的是file://协议 修改插件允许访问文件网址 打上对勾 转载于:https://www.cnblogs.com/116970u/p/11052987.html