在vivado里用rtl描述_如何利用Vivado HLS处理许多位准确或任意精度数据类型

我们在设计硬件时,它往往是要求更精确的位宽。例如,一个filter的输入是12位和一个累加器的结果只需要一个最大范围为27位。然而对于硬件设计来说,使用标准的C数据类型会造成硬件成本的浪费。这就会造成我们要使用更多的LUT和寄存器,延迟甚至可能超过时钟周期和需要更多的周期来计算结果。这往往不是我们需要的结果。因此下面我将介绍如何利用Vivado HLS处理许多位准确或任意精度数据类型,以及允许使用任何(任意)宽度的模型变量。

C-base 数据类型

我们从硬件的角度来看数据类型,采用C/C++的数据类型都是以8bit为边界,即:

? char (8-bit)

? short (16-bit)

? int (32-bit)

? long long (64-bit)

? float (32-bit)

? double (64-bit)

? 确切的宽度的整数类型如int16_t (16-bit) 和 int32_t (32-bit)

注意:char16_t和char32_t在Vivado Hls 中是不支持的

从上面发现,C的数据位宽是比较死板的,然而描述RTL里面的位宽是任意的。

例如,采用C语言去描述一个18*18 bits的乘法器,那么就需要将输入数据都声明为32 bits(int),结果声明为64 bits(long long),这将会在FPGA中消耗4个DSP48E1,显然这是很浪费资源的。

任意精度数据类型 Language Integer Data Type Required Header

C   [u]int< W>(1024 bits)   .#include< ap_cint.h>

C++   ap_[u]int< W>(1024 bits)   .#include< ap_int.h>

C++   ap_[u]fixed< W,I,Q,O,N>   .#include< ap_fixed.h>

其优点有:1.更高的时钟频率 2.更好的数据吞吐率 3.消耗资源更少

因此,使用任意精度数据类型能以更少的资源,获得相同的精度,同时可以运行在更高的时钟频率下。

注意:在声明任意数据类型的时候,我们往往在头文件里面声明,这会使得我们在做debug的时候会非常有用。

C-base 数据类型project

Step1 创建和打开project

I.打开Vivado HLS Command Prompt,按照下图输入命令

II.输入vivado_hls -p window_fn_prj

Step2 Review Test Bench 和run C SimulaTIon

I.在Source打开window_fn_top.cpp

II.找到window_fn_top.h,按住Control键,并右击,打开window_fn_top.h(头文件)

在这里,我们可以看到,本设计所有数据类型的操作都是标准C/C++的浮点型。

III点击Run C SimulaTIon

Step3 Run C SimulaTIon 和 Review Results

I.点击Run C Synthesis

图中我们发现,顶层中的instances占用了大部分资源。

II.打开Interface Summary

III.点击Analysis,打开winfn_loop

这是浮点型乘法器(fmul),图中可以看出,第一个状态是读取内存操作(两个周期),然后是fmul操作(五个周期),最后的操作状态是一个写内存操作(一个周期)

III.退出Vivado Hls,并返回到command prompt

任意数据类型project

Step1 创建和仿真project

I.打开Vivado HLS Command Prompt,按照下图输入命令

II.输入vivado_hls -p window_fn_prj

III.在Source打开window_fn_top.cpp

IV.找到window_fn_top.h,按住Control键,并右击,打开window_fn_top.h(头文件)

这里的数据类型的操作是ap_fixed点类型,它类似于float和double(因为它们支持整数和分数位表示的类型),window_fn_top.h是唯一不同于上一个project的头文件。这些数据类型是在头文件中定义的ap_fixed。

注意:你可以通过修改C代码,将任意精度类型代替标准C类型,在这里必须做的更改是减少数据类型的大小。在这例子中,我们使用8位,24位,和18位,而不是32位浮点类型。通过较少的操作,减少面积,和更少的时钟周期就可以完成project。我们也可以改变更常见的C类型(如int,short,和char),例如,更改数据类型(18位int(32位))可以确保只要一个dsp48就可以执行任何乘法,但是你必须确认设计仍然执行正确的操作和它这样做所需的精度。由VIvado Hls提供的任意精度类型的好处是,可以仿真更新的C代码来确认其功能和准确性。

V.点击Run C SimulaTIon

控制台面板显示了C仿真的结果。随着数据类型的更新,结果不再跟预期结果相同,然而他们是在误差范围内。

Step2 Run C Synthesize和 Review Results

I.点击Run C Synthesis

注意:通过使用任意精度类型,已经减少了延迟和面积(50%和80%),并简化了RTL硬件的操作。由于memory中的总位小于1024 bit,所以现在是自动执行LUTs和FFS而不是模块RAM。

II.打开Interface Summary

注意:现在的数据端口是8 bits和24 bits

III.点击Analysis,打开winfn_loop

总结

本文介绍任意精度数据类型的处理方法。通过Vivado HLs中两个project的比较,得到结论,跟C-base 数据类型相比,使用任意精度数据类型能以更少的资源,获得相同的精度,同时可以运行在更高的时钟频率下。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/455081.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring4.0之四:Meta Annotation(元注解)

Spring框架自2.0开始添加注解的支持&#xff0c;之后的每个版本都增加了更多的注解支持。注解为依赖注入&#xff0c;AOP&#xff08;如事务&#xff09;提供了更强大和简便的方式。这也导致你要是用一个相同的注解到许多不同的类中去。这篇文章介绍meta annotation来解决这个问…

八皇后问题分析与Java实现

原文链接:传送门 八皇后问题 八皇后问题&#xff0c;是一个古老而著名的问题&#xff0c;是回溯算法的典型案例。该问题是国际西洋棋棋手马克斯贝瑟尔于1848年提出&#xff1a;在88格的国际象棋上摆放八个皇后&#xff0c;使其不能互相攻击&#xff0c;即&#xff1a;任意两个…

各种音视频编解码学习详解 h264 ,mpeg4 ,aac 等所有音视频格式

编解码学习笔记&#xff08;一&#xff09;&#xff1a;基本概念 媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起&#xff0c;在运营商和应用开发商中&#xff0c;媒体业务份量极重&#xff0c;其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最…

shell 脚本比较字符串相等_shell脚本--逻辑判断与字符串比较

涉及到比较和判断的时候&#xff0c;要注意整数比较使用-lt&#xff0c;-gt&#xff0c;ge等比较运算符&#xff0c;详情参考&#xff1a;整数比较文件测试使用 -d, -f, -x等运算发&#xff0c;详情参考&#xff1a;文件测试逻辑判断使用 &&(且)、||(或)、&#xff…

单例模式之恶汉模式(详解)

一.设计模式 概念&#xff1a;设计模式是一套被反复使用、多人知晓的、经过分类编目的、代码设计经验的总结。 目的&#xff1a;是用设计模式可以重用代码&#xff0c;让代码更容易被他人理解&#xff0c;保证代码的可靠性。 二.为什么要使用单例模式&#xff1f; 如果创造出多…

JSP中的:request.getScheme()+://+request.getServerName()+:+request.getServer

String path request.getContextPath(); String basePath request.getScheme()"://"request.getServerName()":"request.getServerPort()path"/"; <base href" <%basePath%>"> 这个语句是用来拼装当前网页的相对…

迷宫回溯问题分析和实现

原文链接:传送门 迷宫问题 说明: 小球得到的路径&#xff0c;和程序员设置的找路策略有关即&#xff1a;找路的上下左右的顺序相关再得到小球路径时&#xff0c;可以先使用(下右上左)&#xff0c;再改成(上右下左)&#xff0c;看看路径是不是有变化测试回溯现象思考: 如何求出…

canvas clear 指定属性的元素_好程序员web前端分享CSS属性组成及作用

好程序员web前端分享CSS属性组成及作用学习目标1、css属性和属性值的定义2、css文本属性3、css列表属性4、css背景属性5、css边框属性6、css浮动属性一、css属性和属性值的定义属性&#xff1a;属性是指定选择符所具有的属性&#xff0c;它是css的核心&#xff0c;css2共有150多…

mybatis大于小于等于

大于&#xff1a;<![CDATA[>]]> 小于&#xff1a;<![CDATA[<]]> 等于&#xff1a;<![CDATA[]]> 大于等于&#xff1a;<![CDATA[>]]> 小于等于&#xff1a;<![CDATA[<]]>转载于:https://www.cnblogs.com/YuanFan123/p/7234530.html

2017年秋招-广联达面试及思考

面试官提问&#xff1a; 自我介绍&#xff08;没有做充分的准备&#xff0c;总感觉说的不好&#xff09;为什么选择做前端&#xff1f;在前端方向&#xff0c;你认为自身有哪些优点&#xff1f;前端需要掌握哪些技术知识点&#xff1f;看过哪些比较好的网站&#xff1f;会不会使…

排序算法介绍和分类

原文链接:传送门 排序算法的介绍 排序也成排序算法 排序也称排序算法(Sort Algorithm)&#xff0c;排序是将一组数据&#xff0c;依指定的顺序进行排列的过程。 排序的分类&#xff1a; 1) 内部排序: 指将需要处理的所有数据都加载到**内部存储器(内存)**中进行排序。 2) 外…

认识高清视频编码(MPEG、H.264、WMV-HD、RMVB)

文章出处&#xff1a;www.net1980.com 原创 最近两年&#xff0c;“高清”这个词语非常火热&#xff0c;已经成为家电和IT行业的最新潮流了。高清视频和普通视频有什么区别呢&#xff1f;主要是分辨率上的区别&#xff0c;720P视频的分辨率为1280X720&#xff0c;1080P视频的分…

解读SPP / SPPF / SimSPPF / ASPP / RFB / SPPCSPC

SPP与SPPF 一、SPP的应用的背景 在卷积神经网络中我们经常看到固定输入的设计&#xff0c;但是如果我们输入的不能是固定尺寸的该怎么办呢&#xff1f; 通常来说&#xff0c;我们有以下几种方法&#xff1a; &#xff08;1&#xff09;对输入进行resize操作&#xff0c;让他们…

go mongodb排序查询_《MongoDB》day two

Mongodb的更新方式有&#xff1f;db.集合名.update() 函数:用于更新已存在的文档。语法格式&#xff1a;db.COLLECTION_NAME.update({查询条件},{更新内容},{更新参数(可选)}) 注&#xff1a;这种方式会覆盖原有的文档。使用更新操作符 使用 save()函数更新文档 Mongodb的updat…

【转】 JMeter学习(二十四)linux启动jmeter,执行./jmeter.sh报错解决方法

1.l-bash: ./jmeter.sh: Permission denied解决办法&#xff1a;jmeter.sh的执行权限改改&#xff0c;是权限不够chmod 777 jmeter.sh2.An error occurred:No X11 DISPLAY variable was set, but this program performed an operation which requires it.步骤一&#xff1a;Lin…

哈希表思路图解和代码实现

原文链接传送门 哈希表(散列)-Google上机题 看一个实际需求&#xff0c;google公司的一个上机题: 有一个公司,当有新的员工来报道时,要求将该员工的信息加入(id,性别,年龄,住址…),当输入该员工的id时,要求查找到该员工的 所有信息. 要求: 不使用数据库,尽量节省内存,速度越…

android开发学习——Mina框架

Apache Mina Server 是一个网络通信应用框架&#xff0c;对socket进行了封装。 http://www.cnblogs.com/moonandstar08/p/5475766.html http://blog.csdn.net/u010739551/article/details/47361365 http://www.cnblogs.com/yanghuiping/p/4108063.html &#xff08;mina 自定…

glibc交叉编译_TSN之linuxptp交叉编译

0 开发环境1 linuxptp是什么2 为什么要交叉编译linuxptp3 修改makefile4 修改源码5 交叉编译0 开发环境笔记本&#xff1a;ubuntu18.04.5&#xff0c;内核版本为5.3 开发板&#xff1a;imx8mp-evk内核版本&#xff1a;Linux5.4.24交叉编译工具链&#xff1a;fsl-imx-xwayland-g…

230. Kth Smallest Element in a BST

题目&#xff1a; Given a binary search tree, write a function kthSmallest to find the kth smallest element in it. Note: You may assume k is always valid, 1 ≤ k ≤ BSTs total elements. Follow up:What if the BST is modified (insert/delete operations) often …

声音编码

1.脉冲编码调制PCM文件格式简介 将音频数字化&#xff0c;其实就是将声音数字化。最常见的方式是透过脉冲编码调制PCM(Pulse Code Modulation) 。运作原理如下。首先我们考虑声音经过麦克风&#xff0c;转换成一连串电压变化的信号&#xff0c;如图一所示。这张图的横座标为秒&…