Rapidmind计算库性能测试

   rapidmind.net提供了免费的计算库下载,目的是使用C++ metaprogramming将计算与硬件平台隔离开来,它提供一套运行库做底层的优化工作。为了测试其真正的性能,以便于在未来的渲染器中使用,我做了一个简单的性能测试程序,将一张1920x1080尺寸的TIF从RGB转换为CIE XYZ。
  测试平台为我的acer 5572ANWXCi笔记本,Core Duo T2250、945、1.5G DDR2、geforce 7300go 64bit 128M。

GPUCPUGPU*CPU*
Joky.tif1.80944428.30651036.92707512.229953
HDTV.tif7.248393179.199637465.021794173.764878

单位为毫秒millisecond,加“*”表示回读GPU数据到内存。Joky.tif大小为300x400,120000 pixels。HDTV.tif大小为1920x1080,2073600 pixels。

  测试结果表明,如果不回读,那么可以放心大胆的使用GPU计算。但是如果回读,那么速度将急剧下降。总线是一个原因,但估计更深层次的是GPU的工作机制以及设计。但是可以肯定的是,如果使用RM开发基于多核心的CPU比如CELL BE处理器的计算程序,那么带来的好处是及其明显的,避免了硬件编码优化工作,节省了人力物力,最重要的是可以获得相当不错的性能。
  测试代码如下,其中CPU部分没有优化,但是打开了VC71的SSE2开关。
#include <TCHAR.h>

#include 
<cstdio>
#include 
<rapidmind/platform.hpp>
#include 
<cximage/ximage.h>
#pragma comment(lib,
"rmplatform-vc7-md.lib")
#pragma comment(lib,
"cximagecrt.lib")

using namespace rapidmind;

int main()
{
    
float Time;
    CxImage Image(
"C:\\HDTV.tif",CXIMAGE_FORMAT_TIF);
    
long size = Image.GetWidth()*Image.GetHeight()*sizeof(BYTE)*4;
    BYTE
* DataPtr = NULL;
    
if!Image.Encode2RGBA(DataPtr,size) )
        printf(
"Shit!\n");

    rapidmind::init();

/**//*
const mat3 RGBtoCIEmat = mat3(0.412453, 0.212671, 0.019334,
                              0.357580, 0.715160, 0.119193,
                              0.180423, 0.072169, 0.950227);

*/

    Value3f C0(
0.412453f,0.357580f,0.180423f);
    Value3f C1(
0.212671f,0.715160f,0.072169f);
    Value3f C2(
0.019334f,0.119193f,0.950227f);

    Program Prog 
= RM_BEGIN_PROGRAM("stream"){
        In
<Value4ub> rgb;
        Out
<Value4ub> cie;
        cie(
0= dot(rgb(0,1,2),C0);
        cie(
1= dot(rgb(0,1,2),C1);
        cie(
2= dot(rgb(0,1,2),C2);
        cie(
3= 255;
    }
RM_END
    Array
<1,Value4ub> Input(Image.GetWidth()*Image.GetHeight());
    DataPtr 
= Input.write_data();
    Array
<1,Value4ub> Output;

    rapidmind::compile(Output,Prog(Input));
    Output 
= Prog(Input);

    DataPtr[
0= 255;
    rapidmind::Timer Start 
= rapidmind::Timer::now();
    Output 
= Prog(Input);
    rapidmind::finish();
     
    
//const BYTE* RMResultPtr = Output.read_data();

    rapidmind::Timer End 
= rapidmind::Timer::now();
    rapidmind::finish();
    Time 
= End.milliseconds() - Start.milliseconds();
    printf(
"Use RM : %f milliseconds\n",Time);

    
int Width = Image.GetWidth(),Height = Image.GetHeight();

    Start 
= rapidmind::Timer::now();
    
for(int i=0;i<Width*Height;i++){
        
float r = DataPtr[i*4+0],g=DataPtr[i*4+1],b=DataPtr[i*4+2];
        
float x = r*0.412453f + g*0.357580f + b*0.180423f;
        
float y = r*0.212671f + g*0.715160f + b*0.072169f;
        
float z = r*0.019334f + g*0.119193f + b*0.950227f;
        DataPtr[i
*4+0= x;
        DataPtr[i
*4+1= y;
        DataPtr[i
*4+2= z;
        DataPtr[i
*4+2= 255;
    }

    End 
= rapidmind::Timer::now();
    Time 
= End.milliseconds() - Start.milliseconds();
    printf(
"Use CPU: %f milliseconds\n",Time);


    system(
"PAUSE");
    
return 0;
}

转载于:https://www.cnblogs.com/Jedimaster/archive/2007/10/02/912882.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/263552.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VMware 怎么进入BIOS

2019独角兽企业重金招聘Python工程师标准>>> 虚拟机(Vmware)引导Linux虚拟机时&#xff0c;需要设置成光盘启动来引导系统&#xff0c;但是vmware默认是硬盘启动&#xff0c;所以会启动不了或者别的问题存在。所以要进bios里面设置成开机的启动顺序&#xff0c;要将…

SVN钩子HOOK设置自动备份,服务本地可以看到所有更新内容。

可以实现SVN本机备份。或者其他备份。关键是可以保持有一份最新的SVN文件可以查看。 实现SVN与WEB同步,可以CO一个出来,也可以直接用自动更新web目录的方法&#xff0c;我们要在svn版本库中配置钩子来实现&#xff0c;就是创建一个post-commit的配置文件&#xff0c;对其进行简…

OSChina 周四乱弹 —— 熊孩子毁灭世界

2019独角兽企业重金招聘Python工程师标准>>> 小伙伴们赶快起床&#xff0c;开源中国要出大事啦~ 为方便大家搜索开源软件&#xff0c;开源中国决定整理 IT 公司开源软件。初步列表不一定完善&#xff0c;小伙伴们有什么意见可以向小小编或者红薯提出来~ 好啦好啦&am…

Redis主备安装

2019独角兽企业重金招聘Python工程师标准>>> 采用主备部署方式&#xff0c;Master不做数据持久化操作&#xff0c;仅Slave做数据持久化操作&#xff0c;Slave采用AOF二进制日志文件作为持久化方案&#xff0c;默认每秒持久化一次。 安装 1. 下载源代码文件redis-2…

数据库设计三大范式【转载】

数据库设计范式 什么是范式&#xff1a;简言之就是&#xff0c;数据库设计对数据的存储性能&#xff0c;还有开发人员对数据的操作都有莫大的关系。所以建立科学的&#xff0c;规范的的数据库是需要满足一些 规范的来优化数据数据存储方式。在关系型数据库中这些规范就可以称为…

Visual C++2010的使用

Tools->Settings>Rest... 还原所有设置 运行程序&#xff1a;"D:\Program Files\VCExpress\Install\Microsoft Visual Studio 10.0\Common7\IDE\VCExpress.exe" 一、Visual C2010&#xff08;微软vc2010&#xff09;如何编写并运行C程序&#xff1f; 1、刚开始…

linux下时间同步的两种方法分享

为什么80%的码农都做不了架构师&#xff1f;>>> 方法1&#xff1a;与一个已知的时间服务器同步 ntpdate time.nist.gov 方法2&#xff1a;linux自动同步时间vi /etc/crontab 00 0 1 * * root rdate -s time.nist.gov 转载于:https://my.oschina.net/boltwu/blo…

.Net TCP/UDP 编程 【一】【原创】

命名空间&#xff1a; using System.Net;using System.Net.Sockets; 关键 &#xff1a; TCP /UDP连接 UDP UDP 与 tCP的主要区别在于 UDP 不一定提供可靠的数据传输。事实上&#xff0c;该协议不能保证数据准确无误地到达目的地。UDP 在许多方面非常有效。当某个程序的目标是尽…

maven配置_eclipse创建maven_maven插件配置

为什么80%的码农都做不了架构师&#xff1f;>>> 最近项目开发中需要使用maven。Maven这个东西是我2年前自学的。这2年之中基本没有使用过。现在项目需要&#xff0c;只有重新来一遍回锅肉。重新学习。经过一下午的斗争&#xff0c;一下午的各种问题各种解决&#x…

老生又长谈:HttpApplication,HttpModule,HttpContext及Asp.Net页生命周期

IIS在接到一个新的http请求后&#xff0c;最终会调用asp.net_isapi.dll的ISAPI扩展(特指IIS6.0环境&#xff0c;iis7.0的应用程序池默认为集成方式&#xff0c;相对有所变化)&#xff0c;然后传递到httpRuntime Pipe(http运行时管道)&#xff0c;Asp.Net这时才开始运行(即HttpR…

ByteBuffer常用方法详解

缓冲区(Buffer)就是在内存中预留指定大小的存储空间用来对输入/输出(I/O)的数据作临时存储&#xff0c;这部分预留的内存空间就叫做缓冲区&#xff1a; 使用缓冲区有这么两个好处&#xff1a; 1、减少实际的物理读写次数 2、缓冲区在创建时就被分配内存&#xff0c;这块内存区域…

LeetCode—221. 最大正方形

221. 最大正方形 题目描述&#xff1a; 在一个由 ‘0’ 和 ‘1’ 组成的二维矩阵内&#xff0c;找到只包含 ‘1’ 的最大正方形&#xff0c;并返回其面积。 考察重点&#xff1a;动态规划 方法概括&#xff1a;二维矩阵中查询最大矩形 dp[i][j] Min(dp[i-1][j],dp[i][j-1]…

Egret入门学习日记 --- 第二篇

第二篇&#xff08;学习篇&#xff09; 既然选好了Egret&#xff0c;那我就要想想怎么学了。 开始第一步&#xff0c;先加个Q群先&#xff0c;这不&#xff0c;拿到了一本《Egret HTML5游戏开发指南》&#xff0c;阅至三章&#xff0c;得到印象相对较深的好处和坏处&#xff1…

辨别文件的真实类型

2019独角兽企业重金招聘Python工程师标准>>> 参考博客http://blog.csdn.net/shixing_11/article/details/5708145 每个文件类型都对应着一个编码头部 下面这些是已知的文件头部[自定义的枚举类型] package org.masque.file; /*** * Description:文件对应的文件头,资…

ng build --prod --aot打包Angluar4项目报javaScript heap out of memory,内存溢出

这里 Allocation failed - JavaScript heap out of memory JavaScript堆内存不足&#xff0c;我们都知道 Node 是基于V8引擎&#xff0c;在一般的后端开发语言中&#xff0c;在基本的内存使用上没有什么限制&#xff0c;但是我去查阅了相关的资料才发现&#xff0c;在 Node 中通…

GARFIELD@12-02-2004

your BELLY is more ready to be convinced than your BRAIN 转载于:https://www.cnblogs.com/rexhost/archive/2004/12/02/72000.html

LeetCode—223. 矩形面积

223. 矩形面积 题目描述&#xff1a; 给你 二维 平面上两个 由直线构成且边与坐标轴平行/垂直 的矩形&#xff0c;请你计算并返回两个矩形覆盖的总面积。 每个矩形由其 左下 顶点和 右上 顶点坐标表示&#xff1a; 第一个矩形由其左下顶点 (ax1, ay1) 和右上顶点 (ax2, ay2)…

GARFIELD@01-31-2005

savage sandwich 转载于:https://www.cnblogs.com/rexhost/archive/2005/01/31/99836.html

【ABAP系列】SAP ABAP模块-任意report作为附件以邮件形式发送

公众号&#xff1a;SAP Technical本文作者&#xff1a;matinal原文出处&#xff1a;http://www.cnblogs.com/SAPmatinal/ 原文链接&#xff1a;【ABAP系列】SAP ABAP模块-任意report作为附件以邮件形式发送前言部分 大家可以关注我的公众号&#xff0c;公众号里的排版更好&…

[Mac]一些命令技巧

Git相关 mac下git默认不区分大小写&#xff0c;通过下面脚本可以改变 #!/bin/bash# 让git区分大小写 cd path-of-project git config core.ignorecase false git不会将空文件夹添加到版本控制中&#xff0c;下面脚本可以让空文件夹加到git # 将所有空文件夹添加到git cd path-o…