Arm平台下各种memcpy优化对比<二>

        因memcpy导致tda4vm上的h264解码占CPU较高而改弃,从网上找到各种memcpy的优化代码,在一起做了个运行速度对比,请查收;

#include <stdio.h>
#include <stdlib.h>     /* rand, srand */
#include <string.h>
#include <assert.h>
#include <sys/time.h>
#include <time.h>       /* time() *//* Nonzero if either X or Y is not aligned on a "long" boundary.  */
#define UNALIGNED(X, Y)    (((long)X & (sizeof(long) - 1)) | ((long)Y & (sizeof(long) - 1)))/* How many bytes are copied each iteration of the 4X unrolled loop.  */
#define BIGBLOCKSIZE    (sizeof(long) << 2)/* How many bytes are copied each iteration of the word copy loop.  */
#define LITTLEBLOCKSIZE (sizeof(long))/* Threshhold for punting to the byte copier.  */
#define TOO_SMALL(LEN)  ((LEN) < BIGBLOCKSIZE)char *memcopy_super(char* dest0, const char *src0, size_t len0)
{assert(dest0 && src0 && (len0 > 0));char *dest = dest0;const char *src = src0;long *aligned_dest;const long *aligned_src;/* If the size is small, or either SRC or DST is unaligned,then punt into the byte copy loop.  This should be rare.  */if (!TOO_SMALL(len0) && !UNALIGNED(src, dest)) {aligned_dest = (long *)dest;aligned_src = (long *)src;/* Copy 4X long words at a time if possible.  */while (len0 >= BIGBLOCKSIZE) {*aligned_dest++ = *aligned_src++;*aligned_dest++ = *aligned_src++;*aligned_dest++ = *aligned_src++;*aligned_dest++ = *aligned_src++;len0 -= BIGBLOCKSIZE;}/* Copy one long word at a time if possible.  */while (len0 >= LITTLEBLOCKSIZE) {*aligned_dest++ = *aligned_src++;len0 -= LITTLEBLOCKSIZE;}/* Pick up any residual with a byte copier.  */dest = (char *)aligned_dest;src = (char *)aligned_src;}while (len0--)*dest++ = *src++;return dest0;
}static void get_rand_bytes(unsigned char *data, int len)
{int i;srand((unsigned)time(NULL)); //种下随机种子for (i = 0; i < len; i++) {data[i] = rand() % 255; //取随机数,并保证数在0-255之间//printf("%02X ", data[i]);}  
}static int get_cur_time_us(void)
{struct timeval tv;gettimeofday(&tv, NULL);  //使用gettimeofday获取当前系统时间return (tv.tv_sec * 1000 * 1000 + tv.tv_usec); //利用struct timeval结构体将时间转换为ms
}#define ARRAY_SIZE(n)  sizeof(n) / sizeof(n[0])int main(void)
{int size_list[] = {1024 * 1024 * 10,  // 10MB1024 * 1024 * 1,  // 1MB1024 * 100, // 100KB1024 * 10, // 10KB1024 * 1, // 1KB};char *data1;char *data2;int t1;int t2;int i = 0;data1 = (char *)malloc(size_list[0]);data2 = (char *)malloc(size_list[0]);get_rand_bytes((unsigned char *)data1, size_list[0]);for (i = 0; i < ARRAY_SIZE(size_list); i++) {t1 = get_cur_time_us();memcpy(data2, data1, size_list[i]);t2 = get_cur_time_us();printf("copy %d bytes, memcpy   waste time %dus\n", size_list[i], t2 - t1);t1 = get_cur_time_us();memcopy_super(data2, data1, size_list[i]);t2 = get_cur_time_us();printf("copy %d bytes, memcopy_super  waste time %dus\n\n", size_list[i], t2 - t1);}free(data1);free(data2);return 0;
}

#if 0

copy 10485760 bytes, memcpy   waste time 6502us
copy 10485760 bytes, memcopy_super  waste time 12689us

copy 1048576 bytes, memcpy   waste time 659us
copy 1048576 bytes, memcopy_super  waste time 999us

copy 102400 bytes, memcpy   waste time 76us
copy 102400 bytes, memcopy_super  waste time 73us

copy 10240 bytes, memcpy   waste time 1us
copy 10240 bytes, memcopy_super  waste time 5us

copy 1024 bytes, memcpy   waste time 1us
copy 1024 bytes, memcopy_super  waste time 1us


#endif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/718218.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

智慧公厕:打造智慧城市的环卫明珠

在城市建设中&#xff0c;公共卫生设施的完善和智能化一直是重要环节。而智慧公厕作为智慧城市建设的重要组成部分&#xff0c;发挥着不可替代的作用。本文以智慧公厕源头实力厂家广州中期科技有限公司&#xff0c;大量精品案例现场实景实图&#xff0c;解读智慧公厕如何助力打…

【数据结构】B树

1 B树介绍 B树&#xff08;英语&#xff1a;B-tree&#xff09;&#xff0c;是一种在计算机科学自平衡的树&#xff0c;能够保持数据有序。这种数据结构能够让查找数据、顺序访问、插入数据及删除的动作&#xff0c;都在对数时间内完成。B树&#xff0c;概括来说是一个一般化的…

MySQL高可用性攻略:快速搭建MySQL主从复制集群 !

MySQL高可用性攻略&#xff1a;快速搭建MySQL主从复制集群 &#xff01; MySQL基础知识&#xff1a;介绍MySQL数据库的基本概念和常用命令&#xff0c;如何创建数据库、表、用户和权限管理等。 MySQL安装教程&#xff1a;Centos7 安装MySQL5.7.29详细安装手册 MySQL数据类型&…

【大厂AI课学习笔记NO.63】模型的维护

说是模型的维护&#xff0c;其实这堂课都是在讲“在工业环境中开发和部署机器学习模型的流程”。 上图来自于我的笔记思维脑图&#xff0c;已经上传&#xff0c;要链接的访问的主页查看资源。 一路走来&#xff0c;我们学习了数据管理、模型学习、模型验证、模型部署等重要的步…

arm板运行程序时寻找动态库的路径设置

问题&#xff1a;error while loading shared libraries: libQt5Widgets.so.5: cannot open shared object file&#xff1f; 第一种方法---- 解决&#xff1a; ①复制需要用到的arm库到板子上。 ②pwd指令获取该库的绝对路径&#xff0c;把路径复制到/etc/ld.so.conf文件 ③输…

Leetcoder Day37| 动态规划part04 背包问题

01背包理论基础 面试掌握01背包&#xff0c;完全背包和重背包就够用了。 背包问题的理论基础重中之重是01背包&#xff0c;一定要理解透&#xff01; 01 背包 有n件物品和一个最多能背重量为w 的背包。第i件物品的重量是weight[i]&#xff0c;得到的价值是value[i] 。每件物品…

隐式马尔科夫算法

隐式马尔科夫算法 隐式马尔科夫算法概述算法使用HMM 模型参数设置HMM 模型分类1. Gaussian HMM2. Multinomial HMM3. GMM HMM 其他机器学习算法&#xff1a;机器学习实战工具安装和使用 隐式马尔科夫算法概述 隐式马尔科夫算法是一种用于处理时序数据的强大工具&#xff0c;其…

css通过calc动态计算宽度

max-width: calc(100% - 40px) .m-mj-status-drawing-info-data{ display: inline-block; margin: 10px; min-width: 200px; padding: 10px;border-radius: 10px; background: #ddd;max-width: calc(100% - 40px);word-wrap: break-word;white-space: pre-line;}我开发的chatg…

计算机二级(Python)真题讲解每日一题:《字典字符查找》

描述‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬ 在右侧的答题模板中&#xf…

Crash 实例

1.spinlock原理 为了解决这个spinlock的不公平问题&#xff0c;linux 2.6.25内核以后&#xff0c;spinlock采用了一种"FIFO ticket-based"算法的spinlock机制&#xff0c;可以很好的实现先来先抢占的思想。具体的做法如下&#xff1a; (1)、spinlock的核心字段有ow…

C语言-柔性数组成员的使用

文章目录 摘要柔性数组成员基本使用细节探究 零长度数组-定长数组-变长数组 摘要 本文先介绍柔性数组成员(flexible array member)的基本使用&#xff0c;然后介绍其内存结构。最后&#xff0c;补充了一些数组相关的其他概念。 柔性数组成员 基本使用 参考: 【C语言内功修炼…

[项目设计] 从零实现的高并发内存池(一)

&#x1f308; 博客个人主页&#xff1a;Chris在Coding &#x1f3a5; 本文所属专栏&#xff1a;[高并发内存池] ❤️ 前置学习专栏&#xff1a;[Linux学习] ⏰ 我们仍在旅途 ​ 目录 前言 项目介绍 1.内存池 1.1 什么是内存池 池化技术 内存池 1.2 为什…

word使用bib添加参考文献

文章目录 安装TexLive安装bibtex4word使用在word中添加参考文献使用bibtex4word在word中添加参考文献设置参考文献格式为毕业论文格式 参考 安装TexLive 从下载地址下载镜像iso文件texlive2023.iso双击打开iso镜像文件运行 install-tl-windows.bat点击安装非常非常非常耐心地安…

Shell学习 - 2.20 Shell exit命令:退出当前进程

exit 是一个 Shell 内置命令&#xff0c;用来退出当前 Shell 进程&#xff0c;并返回一个退出状态&#xff1b;使用$?可以接收这个退出状态&#xff0c;这一点已在《Shell $?》中进行了讲解。 exit 命令可以接受一个整数值作为参数&#xff0c;代表退出状态。如果不指定&…

Linux命令-clock命令(用于调整 RTC 时间)

说明 clock命令用于调整 RTC 时间。 RTC 是电脑内建的硬件时间&#xff0c;执行这项指令可以显示现在时刻&#xff0c;调整硬件时钟的时间&#xff0c;将系统时间设成与硬件时钟之时间一致&#xff0c;或是把系统时间回存到硬件时钟。 语法 clock [--adjust][--debug][--dir…

客户端/服务器协议是啥意思?

客户端/服务器协议是指在网络通信中&#xff0c;客户端和服务器之间进行数据传输时所使用的规定。简单来说&#xff0c;客户端是用户使用的设备&#xff0c;如电脑或手机&#xff0c;而服务器则是提供数据或服务的远程计算机。当客户端需要获取数据或服务时&#xff0c;它会向服…

【RT-DETR有效改进】结合SOTA思想利用双主干网络改进RT-DETR(全网独家创新,重磅更新)

一、本文介绍 本文给大家带来的改进机制是结合目前SOTAYOLOv9的思想利用双主干网络来改进RT-DETR&#xff08;本专栏目前发布以来改进最大的内容&#xff0c;同时本文内容为我个人一手整理全网独家首发 | 就连V9官方不支持的模型宽度和深度修改我都均已提供&#xff0c;本文内…

【活动】金三银四,前端工程师如何把握求职黄金期

随着春意盎然的气息弥漫大地&#xff0c;程序员群体中也迎来了一年一度的“金三银四”求职热潮。这个时间段对于广大前端工程师而言&#xff0c;不仅象征着生机勃发的新起点&#xff0c;更是他们职业生涯中至关重要的转折点。众多知名公司在这一时期大规模开启招聘通道&#xf…

ChatGPT 4.0使用之论文阅读

文章目录 阅读环境准备打开AskYourPDF进入主站 粗读论文直接通过右侧边框进行提问选中文章内容翻译或概括插图的理解 总结 拥有了GPT4.0之后&#xff0c;最重要的就是学会如何充分发挥它的强大功能&#xff0c;不然一个月20美元的费用花费的可太心疼了&#xff08;家境贫寒&…

WP外贸营销型网站模板

WordPress外贸独立站主题 简洁实用的WordPress外贸独立站主题&#xff0c;适合时尚服装行业搭建wordpress企业官网使用。 零件配件WordPress外贸建站模板 汽车行业零配件WordPress外贸建站模板&#xff0c;卖配件、零件的外贸公司可以使用的WordPress主题。 https://www.jia…