Rapidmind计算库性能测试

   rapidmind.net提供了免费的计算库下载,目的是使用C++ metaprogramming将计算与硬件平台隔离开来,它提供一套运行库做底层的优化工作。为了测试其真正的性能,以便于在未来的渲染器中使用,我做了一个简单的性能测试程序,将一张1920x1080尺寸的TIF从RGB转换为CIE XYZ。
  测试平台为我的acer 5572ANWXCi笔记本,Core Duo T2250、945、1.5G DDR2、geforce 7300go 64bit 128M。

GPUCPUGPU*CPU*
Joky.tif1.80944428.30651036.92707512.229953
HDTV.tif7.248393179.199637465.021794173.764878

单位为毫秒millisecond,加“*”表示回读GPU数据到内存。Joky.tif大小为300x400,120000 pixels。HDTV.tif大小为1920x1080,2073600 pixels。

  测试结果表明,如果不回读,那么可以放心大胆的使用GPU计算。但是如果回读,那么速度将急剧下降。总线是一个原因,但估计更深层次的是GPU的工作机制以及设计。但是可以肯定的是,如果使用RM开发基于多核心的CPU比如CELL BE处理器的计算程序,那么带来的好处是及其明显的,避免了硬件编码优化工作,节省了人力物力,最重要的是可以获得相当不错的性能。
  测试代码如下,其中CPU部分没有优化,但是打开了VC71的SSE2开关。
#include <TCHAR.h>

#include 
<cstdio>
#include 
<rapidmind/platform.hpp>
#include 
<cximage/ximage.h>
#pragma comment(lib,
"rmplatform-vc7-md.lib")
#pragma comment(lib,
"cximagecrt.lib")

using namespace rapidmind;

int main()
{
    
float Time;
    CxImage Image(
"C:\\HDTV.tif",CXIMAGE_FORMAT_TIF);
    
long size = Image.GetWidth()*Image.GetHeight()*sizeof(BYTE)*4;
    BYTE
* DataPtr = NULL;
    
if!Image.Encode2RGBA(DataPtr,size) )
        printf(
"Shit!\n");

    rapidmind::init();

/**//*
const mat3 RGBtoCIEmat = mat3(0.412453, 0.212671, 0.019334,
                              0.357580, 0.715160, 0.119193,
                              0.180423, 0.072169, 0.950227);

*/

    Value3f C0(
0.412453f,0.357580f,0.180423f);
    Value3f C1(
0.212671f,0.715160f,0.072169f);
    Value3f C2(
0.019334f,0.119193f,0.950227f);

    Program Prog 
= RM_BEGIN_PROGRAM("stream"){
        In
<Value4ub> rgb;
        Out
<Value4ub> cie;
        cie(
0= dot(rgb(0,1,2),C0);
        cie(
1= dot(rgb(0,1,2),C1);
        cie(
2= dot(rgb(0,1,2),C2);
        cie(
3= 255;
    }
RM_END
    Array
<1,Value4ub> Input(Image.GetWidth()*Image.GetHeight());
    DataPtr 
= Input.write_data();
    Array
<1,Value4ub> Output;

    rapidmind::compile(Output,Prog(Input));
    Output 
= Prog(Input);

    DataPtr[
0= 255;
    rapidmind::Timer Start 
= rapidmind::Timer::now();
    Output 
= Prog(Input);
    rapidmind::finish();
     
    
//const BYTE* RMResultPtr = Output.read_data();

    rapidmind::Timer End 
= rapidmind::Timer::now();
    rapidmind::finish();
    Time 
= End.milliseconds() - Start.milliseconds();
    printf(
"Use RM : %f milliseconds\n",Time);

    
int Width = Image.GetWidth(),Height = Image.GetHeight();

    Start 
= rapidmind::Timer::now();
    
for(int i=0;i<Width*Height;i++){
        
float r = DataPtr[i*4+0],g=DataPtr[i*4+1],b=DataPtr[i*4+2];
        
float x = r*0.412453f + g*0.357580f + b*0.180423f;
        
float y = r*0.212671f + g*0.715160f + b*0.072169f;
        
float z = r*0.019334f + g*0.119193f + b*0.950227f;
        DataPtr[i
*4+0= x;
        DataPtr[i
*4+1= y;
        DataPtr[i
*4+2= z;
        DataPtr[i
*4+2= 255;
    }

    End 
= rapidmind::Timer::now();
    Time 
= End.milliseconds() - Start.milliseconds();
    printf(
"Use CPU: %f milliseconds\n",Time);


    system(
"PAUSE");
    
return 0;
}

转载于:https://www.cnblogs.com/Jedimaster/archive/2007/10/02/912882.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/263552.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VMware 怎么进入BIOS

2019独角兽企业重金招聘Python工程师标准>>> 虚拟机(Vmware)引导Linux虚拟机时&#xff0c;需要设置成光盘启动来引导系统&#xff0c;但是vmware默认是硬盘启动&#xff0c;所以会启动不了或者别的问题存在。所以要进bios里面设置成开机的启动顺序&#xff0c;要将…

LeetCode—208. 实现 Trie (前缀树)

208. 实现 Trie (前缀树) 题目描述&#xff1a;Trie&#xff08;发音类似 “try”&#xff09;或者说 前缀树 是一种树形数据结构&#xff0c;用于高效地存储和检索字符串数据集中的键。这一数据结构有相当多的应用情景&#xff0c;例如自动补完和拼写检查。 请你实现 Trie 类…

SQL入侵恢复XP_CMDSHLL与开3389

一,用SQL连接器恢复XP_CMDSHLLE的命令 &#xff08;1&#xff09;sp_addextendedproc xp_cmdshell,dllnamexplog70.dll &#xff08;2&#xff09;首先在SqlExec Sunx Version的Format选项里填上%s&#xff0c;在CMD选项里输入 sp_addextendedproc xp_cmdshell,xpsql70.dll 去除…

java中long类型转换为int类型

由int类型转换为long类型是向上转换&#xff0c;可以直接进行隐式转换&#xff0c;但由long类型转换为int类型是向下转换&#xff0c;可能会出现数据溢出情况&#xff1a; 主要以下几种转换方法&#xff0c;供参考&#xff1a;一、强制类型转换 [java] long ll 300000; in…

中国最好的电子商务平台,75商务网成功上线

中国B2B电子商务网站多年处于停滞不前&#xff0c;行业垄断现象&#xff0c;而且非常专注于B2B方向发展&#xff0c;没有其他业务范围可以拓展。http://www.755563.com/ “ 75商务网 ”看到其中亮点&#xff0c;在原有B2B基础上增加新型模式&#xff0c;变成B2B2C形式&#xff…

SVN钩子HOOK设置自动备份,服务本地可以看到所有更新内容。

可以实现SVN本机备份。或者其他备份。关键是可以保持有一份最新的SVN文件可以查看。 实现SVN与WEB同步,可以CO一个出来,也可以直接用自动更新web目录的方法&#xff0c;我们要在svn版本库中配置钩子来实现&#xff0c;就是创建一个post-commit的配置文件&#xff0c;对其进行简…

LeetCode—33. 搜索旋转排序数组

33. 搜索旋转排序数组 题目描述&#xff1a;整数数组 nums 按升序排列&#xff0c;数组中的值 互不相同 。 在传递给函数之前&#xff0c;nums 在预先未知的某个下标 k&#xff08;0 < k < nums.length&#xff09;上进行了 旋转&#xff0c;使数组变为 [nums[k], nums…

巧用脚本为木马“整容”

目的&#xff1a; 掌握基础的VBS脚本&#xff0c;“改变”木马后缀名不引起警觉&#xff0c;他点击木马后会先运行一段我们装备好的素材&#xff0c;音乐或图片&#xff0c;然后才执行木马 诱骗对方运行木马 前工作&#xff1a;根据需要准备一款木马&#xff0c;一个ICO图标文件…

重读STL

从第一次使用STL到现在也有四年了&#xff0c;说来惭愧&#xff0c;以前一直只是现用现查&#xff0c;还从来没有仔细地读一读STL的文档。前两天偶尔看到一个别人推荐的链接&#xff08;http://www.sgi.com/tech/stl/&#xff09;&#xff0c;才想起应该看看&#xff0c;一读之…

OSChina 周四乱弹 —— 熊孩子毁灭世界

2019独角兽企业重金招聘Python工程师标准>>> 小伙伴们赶快起床&#xff0c;开源中国要出大事啦~ 为方便大家搜索开源软件&#xff0c;开源中国决定整理 IT 公司开源软件。初步列表不一定完善&#xff0c;小伙伴们有什么意见可以向小小编或者红薯提出来~ 好啦好啦&am…

华为EC169 3G卡在Win7下的安装

最近换了机器&#xff0c;安装的是Win7。结果发现安装华为EC169 3G卡时&#xff0c;无法安装。&#xff08;注&#xff1a;我已更新为最新支持Win7的驱动。&#xff09; 折腾了近半天的时间&#xff0c;才发现是内码的问题。 由于工作需要&#xff0c;我将非Unicode的内码改为了…

小容量单片机生成pdf文件

工作上要求使用小容量单片机生成直接生成pdf文件。经过一段时间的摸索&#xff0c;其中参考了libharu&#xff0c;库太大&#xff0c;不适合在单片机上使用页参考了与非网上一位前辈的库&#xff0c;占用的RAM太大&#xff0c;不适合小容量单片机&#xff0c;主要资料是pdf1.7格…

LeetCode—209. 长度最小的子数组

209. 长度最小的子数组 题目描述&#xff1a;给定一个含有 n 个正整数的数组和一个正整数 target 。 找出该数组中满足其和 ≥ target 的长度最小的 连续子数组 [numsl, numsl1, …, numsr-1, numsr] &#xff0c;并返回其长度。如果不存在符合条件的子数组&#xff0c;返回 0…

Redis主备安装

2019独角兽企业重金招聘Python工程师标准>>> 采用主备部署方式&#xff0c;Master不做数据持久化操作&#xff0c;仅Slave做数据持久化操作&#xff0c;Slave采用AOF二进制日志文件作为持久化方案&#xff0c;默认每秒持久化一次。 安装 1. 下载源代码文件redis-2…

一位台湾校长的讲话。学习!!!

台湾有这么一所学校&#xff0c;学生年龄在15&#xff0d;18之间&#xff0c;每年三千多学生中&#xff0c;因违反校规校纪被校方开除的二、三百人。学校没有工人&#xff0c;没有保卫&#xff0c;没有大师傅&#xff0c;一切必要工种都由学生自己去做。学校实行学长制&#xf…

数据库设计三大范式【转载】

数据库设计范式 什么是范式&#xff1a;简言之就是&#xff0c;数据库设计对数据的存储性能&#xff0c;还有开发人员对数据的操作都有莫大的关系。所以建立科学的&#xff0c;规范的的数据库是需要满足一些 规范的来优化数据数据存储方式。在关系型数据库中这些规范就可以称为…

MVC2验证(自定义异常)

源码 /Files/zhangchao1/MVCValidationTest.rar 在contorllers内虽然简单&#xff0c;但有却有些不符合mvc 的设计理念&#xff0c;这里&#xff0c;我们将验证放到DLL部分 首先建立自定义的异常类 public class MyExcptions:Exception { //存放错误信息 List<string[]> …

LeetCode—210. 课程表 II

210. 课程表 II 题目描述&#xff1a;现在你总共有 numCourses 门课需要选&#xff0c;记为 0 到 numCourses - 1。给你一个数组 prerequisites &#xff0c;其中 prerequisites[i] [ai, bi] &#xff0c;表示在选修课程 ai 前 必须 先选修 bi 。 例如&#xff0c;想要学习课…

Visual C++2010的使用

Tools->Settings>Rest... 还原所有设置 运行程序&#xff1a;"D:\Program Files\VCExpress\Install\Microsoft Visual Studio 10.0\Common7\IDE\VCExpress.exe" 一、Visual C2010&#xff08;微软vc2010&#xff09;如何编写并运行C程序&#xff1f; 1、刚开始…

LeetCode—211. 添加与搜索单词 - 数据结构设计

211. 添加与搜索单词 - 数据结构设计 题目描述&#xff1a;请你设计一个数据结构&#xff0c;支持 添加新单词 和 查找字符串是否与任何先前添加的字符串匹配 。 实现词典类 WordDictionary &#xff1a; WordDictionary() 初始化词典对象 void addWord(word) 将 word 添加到…