STM32G474--Whetstone程序移植(单精度)笔记

1 准备基本工程代码

参考这篇笔记从我的仓库中选择合适的基本工程,进行程序移植。这里我用的是stm32g474的基本工程。
使用git clone一个指定文件或者目录

2 移植程序

2.1 修改Whetstone.c

主要修改原本变量定义的类型,以及函数接口全部更换为单精度类型。其次在计时方式上这里使用的是DWT的方式计时,比TM32G474–Whetstone程序移植(双精度)笔记的计时方式更好一些,但需要更加注意溢出的问题。

#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <math.h>// 添加头文件
#include "main.h"
#include <stdint.h>
#include "stm32g4xx_hal.h"//stm32G4的hal库头文件,若更换芯片型哈需要更改
#include "debug_PmuDwt.h"/* map the FORTRAN math functions, etc. to the C versions */
#define DSIN    sinf
#define DCOS    cosf
#define DATAN   atanf
#define DLOG    logf
#define DEXP    expf
#define DSQRT   sqrtf
#define IF      if/* function prototypes */
void POUT(long N, long J, long K, float X1, float X2, float X3, float X4);
void PA(float E[]);
void P0(void);
void P3(float X, float Y, float *Z);
#define USAGE   "usage: whetdc [-c] [loops]\n"//#define PRINTOUT 1float time_in_secs(uint64_t ticks);/*COMMON T,T1,T2,E1(4),J,K,L
*/
float T,T1,T2,E1[5];
int J,K,L;
int argc = 0;   //Mod for nucleo. Change in code below if you want non-default loop count//************************************
//**    Whetstone    64b-DP         **
//**        SUB                     **
//************************************
int Whetstone(void) // ------------ Metoda -----------
{printf("Beginning Whetstone benchmark at ");printf(" %d MHz ...\n\n", SystemCoreClock/1000000);/* used in the FORTRAN version */long I;long N1, N2, N3, N4, N6, N7, N8, N9, N10, N11;float X1,X2,X3,X4,X,Y,Z;long LOOP;int II, JJ;/* added for this version */long loopstart = 0;uint64_t startsec,finisec = 0;uint32_t delta=0;float KIPS;int continuous;loopstart = 40000;       /* 1000 see the note about LOOP below */continuous = 0;II = 1;     /* start at the first arg (temp use of II here) */LCONT:
/*
********************************************
*   Start benchmark timing at this point.
********************************************
*/startsec = 0;finisec = 0;delta = PMU_DWT_CounterCalibrate();startsec = PMU_DWT_CounterGet();/*
********************************************
*   The actual benchmark starts here.
********************************************
*/T  = .499975f;T1 = 0.50025f;T2 = 2.0f;
/*
********************************************
*   With loopcount LOOP=10, one million Whetstone instructions
*   will be executed in EACH MAJOR LOOP..A MAJOR LOOP IS EXECUTED
*   'II' TIMES TO INCREASE WALL-CLOCK TIMING ACCURACY.
*
*   LOOP = 1000;
*/LOOP = loopstart;II   = 1;JJ = 1;IILOOP:N1  = 0;N2  = 12 * LOOP;N3  = 14 * LOOP;N4  = 345 * LOOP;N6  = 210 * LOOP;N7  = 32 * LOOP;N8  = 899 * LOOP;N9  = 616 * LOOP;N10 = 0;N11 = 93 * LOOP;
/*
********************************************
*   Module 1: Simple identifiers
********************************************
*/X1  =  1.0f;X2  = -1.0f;X3  = -1.0f;X4  = -1.0f;for (I = 1; I <= N1; I++){X1 = (X1 + X2 + X3 - X4) * T;X2 = (X1 + X2 - X3 + X4) * T;X3 = (X1 - X2 + X3 + X4) * T;X4 = (-X1+ X2 + X3 + X4) * T;}
#ifdef PRINTOUTIF (JJ==II) POUT(N1,N1,N1,X1,X2,X3,X4);
#endif/*
********************************************
*   Module 2: Array elements
********************************************
*/E1[1] =  1.0f;E1[2] = -1.0f;E1[3] = -1.0f;E1[4] = -1.0f;for (I = 1; I <= N2; I++){E1[1] = ( E1[1] + E1[2] + E1[3] - E1[4]) * T;E1[2] = ( E1[1] + E1[2] - E1[3] + E1[4]) * T;E1[3] = ( E1[1] - E1[2] + E1[3] + E1[4]) * T;E1[4] = (-E1[1] + E1[2] + E1[3] + E1[4]) * T;}#ifdef PRINTOUTIF (JJ==II) POUT(N2,N3,N2,E1[1],E1[2],E1[3],E1[4]);
#endif/*
********************************************
*  Module 3: Array as parameter
********************************************
*/for (I = 1; I <= N3; I++){PA(E1);}
#ifdef PRINTOUTIF (JJ==II) POUT(N3,N2,N2,E1[1],E1[2],E1[3],E1[4]);
#endif/*
********************************************
*   Module 4: Conditional jumps
********************************************
*/J = 1;for (I = 1; I <= N4; I++){if (J == 1)J = 2;elseJ = 3;if (J > 2)J = 0;elseJ = 1;if (J < 1)J = 1;elseJ = 0;}#ifdef PRINTOUTIF (JJ==II) POUT(N4,J,J,X1,X2,X3,X4);
#endif/*
********************************************
*   Module 5: Omitted
*   Module 6: Integer arithmetic
********************************************
*/J = 1;K = 2;L = 3;for (I = 1; I <= N6; I++){J = J * (K-J) * (L-K);K = L * K - (L-J) * K;L = (L-K) * (K+J);E1[L-1] = J + K + L;E1[K-1] = J * K * L;}#ifdef PRINTOUTIF (JJ==II) POUT(N6,J,K,E1[1],E1[2],E1[3],E1[4]);
#endif/*
********************************************
*   Module 7: Trigonometric functions
********************************************
*/X = 0.5f;Y = 0.5f;for (I = 1; I <= N7; I++){X = T * DATAN(T2*DSIN(X)*DCOS(X)/(DCOS(X+Y)+DCOS(X-Y)-1.0f));Y = T * DATAN(T2*DSIN(Y)*DCOS(Y)/(DCOS(X+Y)+DCOS(X-Y)-1.0f));}#ifdef PRINTOUTIF (JJ==II)POUT(N7,J,K,X,X,Y,Y);
#endif/*
********************************************
*   Module 8: Procedure calls
********************************************
*/X = 1.0;Y = 1.0;Z = 1.0;for (I = 1; I <= N8; I++){P3(X,Y,&Z);}
#ifdef PRINTOUTIF (JJ==II)POUT(N8,J,K,X,Y,Z,Z);
#endif/*
********************************************
*   Module 9: Array references
********************************************
*/J = 1;K = 2;L = 3;E1[1] = 1.0;E1[2] = 2.0;E1[3] = 3.0;for (I = 1; I <= N9; I++){P0();}
#ifdef PRINTOUTIF (JJ==II) POUT(N9,J,K,E1[1],E1[2],E1[3],E1[4]);
#endif/*
********************************************
*   Module 10: Integer arithmetic
********************************************
*/J = 2;K = 3;for (I = 1; I <= N10; I++){J = J + K;K = J + K;J = K - J;K = K - J - J;}#ifdef PRINTOUTIF (JJ==II) POUT(N10,J,K,X1,X2,X3,X4);
#endif/*
********************************************
*   Module 11: Standard functions
********************************************
*/X = 0.75;for (I = 1; I <= N11; I++){X = DSQRT(DEXP(DLOG(X)/T1));}
#ifdef PRINTOUTIF (JJ==II) POUT(N11,J,K,X,X,X,X);
#endif/*
********************************************
*      THIS IS THE END OF THE MAJOR LOOP.
********************************************
*/if (++JJ <= II)goto IILOOP;/*
********************************************
*      Stop benchmark timing at this point.
********************************************
*/// finisec = time(0);finisec = PMU_DWT_CounterGet();//timer.reset();/*
*--------------------------------------------------------------------
*      Performance in Whetstone KIP's per second is given by
*
*   (100*LOOP*II)/TIME
*
*      where TIME is in seconds.
*--------------------------------------------------------------------
*/float vreme;vreme = time_in_secs(finisec - startsec - delta);if (vreme <= 0){printf("Insufficient duration- Increase the LOOP count \n");finisec = 0; startsec = 0;return 1;}printf("Loops: %ld , \t Iterations: %d, \t Duration: %.3f sec. \n",LOOP, II, vreme);KIPS = (100.0f * LOOP * II) / vreme ;if (KIPS >= 1000.0f)printf("C Converted Float Precision Whetstones: %.3f MIPS \n\n", KIPS / 1000);elseprintf("C Converted Float Precision Whetstones: %.3f KIPS \n\n", KIPS);if (continuous)goto LCONT;finisec = 0; startsec = 0;return 1;
}void PA(float E[])
{J = 0;L10:E[1] = ( E[1] + E[2] + E[3] - E[4]) * T;E[2] = ( E[1] + E[2] - E[3] + E[4]) * T;E[3] = ( E[1] - E[2] + E[3] + E[4]) * T;E[4] = (-E[1] + E[2] + E[3] + E[4]) / T2;J += 1;if (J < 6)goto L10;
}void P0(void)
{E1[J] = E1[K];E1[K] = E1[L];E1[L] = E1[J];
}void P3(float X, float Y, float *Z)
{float X1, Y1;X1 = X;Y1 = Y;X1 = T * (X1 + Y1);Y1 = T * (X1 + Y1);*Z  = (X1 + Y1) / T2;
}float time_in_secs(uint64_t ticks)
{// scale timer down to avoid uint64_t -> double conversion in RV32uint32_t scale = 170000000;float delta = (float)(ticks*(1.0f)) / scale;return delta;
}#ifdef PRINTOUT
void POUT(long N, long J, long K, float X1, float X2, float X3, float X4)
{printf("%7ld %7ld %7ld %12.4e %12.4e %12.4e %12.4e\n",N, J, K, X1, X2, X3, X4);
}
#endif

2.2 修改main.c

删除示例工程中测试基本功能的一小段函数,将以下这段函数放置在while前执行即可。

  printf("\nMy Benchmark example for Whetstones \n");printf("Whetstone ");PMU_DWT_Initialize();// 初始化DWTWhetstone();// 测试函数

2.3 修改main.h

和双精度的示例相同,需要添加测试函数的声明。

int Whetstone(void);

3 测试结果

在这里插入图片描述
暂时没有具体分析细节问题,只是跑通了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/69478.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【专题】2024-2025人工智能代理深度剖析:GenAI 前沿、LangChain 现状及演进影响与发展趋势报告汇总PDF洞察(附原数据表)

原文链接&#xff1a;https://tecdat.cn/?p39630 在科技飞速发展的当下&#xff0c;人工智能代理正经历着深刻的变革&#xff0c;其能力演变已然成为重塑各行业格局的关键力量。从早期简单的规则执行&#xff0c;到如今复杂的自主决策与多智能体协作&#xff0c;人工智能代理…

QT修仙之路1-1--遇见QT

文章目录 遇见QT二、QT概述2.1 定义与功能2.2 跨平台特性2.3 优点汇总 三、软件安装四、QT工具介绍(重要)4.1 Assistant4.2 Designer4.3 uic.exe4.4 moc.exe4.5 rcc.exe4.6 qmake4.7 QTcreater 五、QT工程项目解析(作业)5.1 配置文件&#xff08;.pro&#xff09;5.2 头文件&am…

Linux——基础命令1

$&#xff1a;普通用户 #&#xff1a;超级用户 cd 切换目录 cd 目录 &#xff08;进入目录&#xff09; cd ../ &#xff08;返回上一级目录&#xff09; cd ~ &#xff08;切换到当前用户的家目录&#xff09; cd - &#xff08;返回上次目录&#xff09; pwd 输出当前目录…

Office/WPS接入DeepSeek等多个AI工具,开启办公新模式!

在现代职场中&#xff0c;Office办公套件已成为工作和学习的必备工具&#xff0c;其功能强大但复杂&#xff0c;熟练掌握需要系统的学习。为了简化操作&#xff0c;使每个人都能轻松使用各种功能&#xff0c;市场上涌现出各类办公插件。这些插件不仅提升了用户体验&#xff0c;…

【提示词工程】探索大语言模型的参数设置:优化提示词交互的技巧

在与大语言模型(Large Language Model, LLM)进行交互时,提示词的设计和参数设置直接影响生成内容的质量和效果。无论是通过 API 调用还是直接使用模型,掌握模型的参数配置方法都至关重要。本文将为您详细解析常见的参数设置及其应用场景,帮助您更高效地利用大语言模型。 …

Ollama + AnythingLLM + Deepseek r1 实现本地知识库

1、Ollama&#xff1a;‌是一个开源的大型语言模型 (LLM)服务工具&#xff0c;旨在简化在本地运行大语言模型的过程&#xff0c;降低使用大语言模型的门槛‌。 2、AnythingLLM&#xff1a;是由Mintplex Labs Inc. 开发的一款全栈应用程序&#xff0c;旨在构建一个高效、可定制、…

伪分布式Spark3.4.4安装

参考&#xff1a;Spark2.1.0入门&#xff1a;Spark的安装和使用_厦大数据库实验室博客 我的版本&#xff1a; hadoop 3.1.3 hbase 2.2.2 java openjdk version "1.8.0_432" 问了chatgpt,建议下载Spark3.4.4&#xff0c;不适合下载Spark 2.1.0: step1 Spark下载…

从运输到植保:DeepSeek大模型探索无人机智能作业技术详解

DeepSeek&#xff0c;作为一家专注于深度学习与人工智能技术研究的企业&#xff0c;近年来在AI领域取得了显著成果&#xff0c;尤其在无人机智能作业技术方面展现了其大模型的强大能力。以下是从运输到植保领域&#xff0c;DeepSeek大模型探索无人机智能作业技术的详解&#xf…

免费windows pdf编辑工具Epdf

Epdf&#xff08;完全免费&#xff09; 作者&#xff1a;不染心 时间&#xff1a;2025/2/6 Github: https://github.com/dog-tired/Epdf Epdf Epdf 是一款使用 Rust 编写的 PDF 编辑器&#xff0c;目前仍在开发中。它提供了一系列实用的命令行选项&#xff0c;方便用户对 PDF …

基于深度学习的人工智能量化衰老模型构建与全流程应用研究

一、引言 1.1 研究背景与意义 1.1.1 人口老龄化现状与挑战 人口老龄化是当今全球面临的重要社会趋势之一,其发展态势迅猛且影响深远。根据联合国的相关数据,1980 年,全球 65 岁及以上人口数量仅为 2.6 亿,到 2021 年,这一数字已翻番,达到 7.61 亿,而预计到 2050 年,…

UnityShader学习笔记——深度与法线纹理

——内容源自唐老狮的shader课程 目录 1.概述 1.1.分别指什么 1.2.如何获取 1.2.1.对摄像机赋值 1.2.2.在Shader中声明 1.2.3.获取深度值 1.2.4.获取法线纹理 1.3.背后的原理 1.3.1.深度纹理中存储的是什么信息 1.3.2.法线纹理中存储的是什么信息 1.3.3.unity是如何…

基于STM32的智能鱼缸水质净化系统设计

&#x1f91e;&#x1f91e;大家好&#xff0c;这里是5132单片机毕设设计项目分享&#xff0c;今天给大家分享的是智能鱼缸水质净化系统。 目录 1、设计要求 2、系统功能 3、演示视频和实物 4、系统设计框图 5、软件设计流程图 6、原理图 7、主程序 8、总结 1、设计要求…

如何打造一个更友好的网站结构?

在SEO优化中&#xff0c;网站的结构往往被忽略&#xff0c;但它其实是决定谷歌爬虫抓取效率的关键因素之一。一个清晰、逻辑合理的网站结构&#xff0c;不仅能让用户更方便地找到他们需要的信息&#xff0c;还能提升搜索引擎的抓取效率 理想的网站结构应该像一棵树&#xff0c;…

尝试在Excel里调用硅基流动上的免费大语言模型

我个人觉得通过api而不是直接浏览器客户端聊天调用大语言模型是使用人工智能大模型的一个相对进阶的阶段。 于是就尝试了一下。我用的是老师木 袁进辉博士新创的硅基流动云上的免费的大模型。——虽然自己获赠了不少免费token&#xff0c;但测试阶段用不上。 具体步骤如下&am…

“公路养护新利器!公路 AI 智慧巡检系统

家人们&#xff0c;咱日常开车出行&#xff0c;最烦的就是遇到路面坑洼、道路破损的情况&#xff0c;不仅颠簸难受&#xff0c;还存在安全隐患。其实&#xff0c;这些问题都得靠公路养护人员及时发现并处理。但以往的公路巡检工作可不容易&#xff0c;现在好了&#xff0c;有了…

【算法】动态规划专题⑧ —— 分组背包问题 python

目录 前置知识进入正题实战演练总结 前置知识 【算法】动态规划专题⑤ —— 0-1背包问题 滚动数组优化 python 进入正题 分组背包问题的详细解析 1. 问题定义 在 分组背包问题 中&#xff0c;物品被划分为若干组&#xff0c;每组内的物品 互斥&#xff08;只能选择其中一个或…

LLM:DeepSeek 系列(二)

原文链接 3、DeepSeek-V2 DeepSeek-V2 发布于 2024 年 5 月&#xff0c;为多领域专家&#xff08;MoE&#xff09;语言模型&#xff0c;包含总共 2360 亿个参数&#xff0c;其中每个词元激活 210 亿个参数&#xff0c;并支持 12.8 万个词元的上下文长度。DeepSeek-V2 采用包括…

AtCoder Beginner Contest 391(A~E题题解)

A - Lucky Direction 思路&#xff1a;纯模拟的一个水题 #include <bits/stdc.h> using namespace std; #define int long long string s; signed main() { cin>>s;for(int i0;i<s.size();i){char cs[i];if(cN){cout<<"S";}else if(c…

redis中的hash结构

hash类型也叫散列&#xff0c;其中value是一个无序字典&#xff0c;不用像string类型中的value用jason结构去存储&#xff0c;他的value可以将对象中的每个字段独立存储&#xff0c;而且有个好处&#xff0c;方便修改value值 类似于这样 hash类型的常见命令&#xff1a;

USB子系统学习(四)使用libusb读取鼠标数据

文章目录 1、声明2、HID协议2.1、描述符2.2、鼠标数据格式 3、应用程序4、编译应用程序5、测试 1、声明 本文是在学习韦东山《驱动大全》USB子系统时&#xff0c;为梳理知识点和自己回看而记录&#xff0c;全部内容高度复制粘贴。 韦老师的《驱动大全》&#xff1a;商品详情 …