Vitis HLS 学习笔记--控制驱动任务示例

目录

1. 简介

2. 代码解析

2.1 kernel 代码回顾

2.2 功能分析

2.3 查看综合报告

2.4 查看 Schedule Viewer

2.5 查看 Dataflow Viewer

3. Vitis IDE的关键设置

3.1 加载数据文件

3.2 设置 Flow Target

3.3 配置 fifo 深度

4. 总结


1. 简介

本文对《Vitis HLS 学习笔记--抽象并行编程模型-控制驱动与数据驱动-CSDN博客》中控制驱动任务的示例进行了详细解析。

通过分析 kernel 代码,理解了 diamond 函数及其内部各功能模块(funcA、funcB、funcC、funcD)的实现方式和并行处理机制。

2. 代码解析

2.1 kernel 代码回顾

#include "diamond.h"void diamond(data_t vecIn[N], data_t vecOut[N]) {data_t c1[N], c2[N], c3[N], c4[N];
#pragma HLS dataflowfuncA(vecIn, c1, c2);funcB(c1, c3);funcC(c2, c4);funcD(c3, c4, vecOut);
}void funcA(data_t* in, data_t* out1, data_t* out2) {
#pragma HLS inline off
Loop0:for (int i = 0; i < N; i++) {
#pragma HLS pipelinedata_t t = in[i] * 3;out1[i] = t;out2[i] = t;}
}void funcB(data_t* in, data_t* out) {
#pragma HLS inline off
Loop0:for (int i = 0; i < N; i++) {
#pragma HLS pipelineout[i] = in[i] + 25;}
}void funcC(data_t* in, data_t* out) {
#pragma HLS inline off
Loop0:for (data_t i = 0; i < N; i++) {
#pragma HLS pipelineout[i] = in[i] * 2;}
}void funcD(data_t* in1, data_t* in2, data_t* out) {
#pragma HLS inline off
Loop0:for (int i = 0; i < N; i++) {
#pragma HLS pipelineout[i] = in1[i] + in2[i] * 2;}
}

2.2 功能分析

void diamond(data_t vecIn[100], data_t vecOut[100])

{

  data_t c1[100], c2[100], c3[100], c4[100];

#pragma HLS dataflow

  funcA(vecIn, c1, c2);

  funcB(c1, c3);

  funcC(c2, c4);

  funcD(c3, c4, vecOut);

}

2.3 查看综合报告

  • diamond 主函数中,Pipelined 一列的标志为:dataflow
+ Performance & Resource Estimates: PS: '+' for module; 'o' for loop; '*' for dataflow+--------------------------+------+------+---------+-----------+----------+---------+------+----------+--------+----+------------+-----------+-----+|          Modules         | Issue|      | Latency |  Latency  | Iteration|         | Trip |          |        |    |            |           |     ||          & Loops         | Type | Slack| (cycles)|    (ns)   |  Latency | Interval| Count| Pipelined|  BRAM  | DSP|     FF     |    LUT    | URAM|+--------------------------+------+------+---------+-----------+----------+---------+------+----------+--------+----+------------+-----------+-----+|+ diamond*                |     -|  0.00|      452|  4.520e+03|         -|      175|     -|  dataflow|  4 (1%)|   -|  1433 (~0%)|  3208 (2%)|    -|| + funcA                  |     -|  0.00|      174|  1.740e+03|         -|      174|     -|        no|       -|   -|   222 (~0%)|  652 (~0%)|    -||  + funcA_Pipeline_Loop0  |     -|  0.00|      103|  1.030e+03|         -|      103|     -|        no|       -|   -|    86 (~0%)|  123 (~0%)|    -||   o Loop0                |     -|  7.30|      101|  1.010e+03|         3|        1|   100|       yes|       -|   -|           -|          -|    -|| + funcB                  |     -|  5.18|      102|  1.020e+03|         -|      102|     -|        no|       -|   -|    17 (~0%)|   81 (~0%)|    -||  o Loop0                 |     -|  7.30|      100|  1.000e+03|         2|        1|   100|       yes|       -|   -|           -|          -|    -|| + funcC                  |     -|  5.95|      102|  1.020e+03|         -|      102|     -|        no|       -|   -|    17 (~0%)|   66 (~0%)|    -||  o Loop0                 |     -|  7.30|      100|  1.000e+03|         2|        1|   100|       yes|       -|   -|           -|          -|    -|| + entry_proc             |     -|  5.46|        0|      0.000|         -|        0|     -|        no|       -|   -|     2 (~0%)|   20 (~0%)|    -|| + funcD                  |     -|  0.00|      174|  1.740e+03|         -|      174|     -|        no|       -|   -|   183 (~0%)|  692 (~0%)|    -||  + funcD_Pipeline_Loop0  |     -|  0.00|      103|  1.030e+03|         -|      103|     -|        no|       -|   -|    47 (~0%)|  131 (~0%)|    -||   o Loop0                |     -|  7.30|      101|  1.010e+03|         3|        1|   100|       yes|       -|   -|           -|          -|    -|+--------------------------+------+------+---------+-----------+----------+---------+------+----------+--------+----+------------+-----------+-----+
  • vecIn、vecOut 的映射关系,可以观察到是 m_axi_gmem 接口。
  • vecInvecOut 非本地存储器,因此采用控制驱动 TLP 模型; 
* SW-to-HW Mapping
+----------+---------------+-----------+----------+------------------------------------+
| Argument | HW Interface  | HW Type   | HW Usage | HW Info                            |
+----------+---------------+-----------+----------+------------------------------------+
| vecIn    | m_axi_gmem    | interface |          |                                    |
| vecIn    | s_axi_control | register  | offset   | name=vecIn_1 offset=0x10 range=32  |
| vecIn    | s_axi_control | register  | offset   | name=vecIn_2 offset=0x14 range=32  |
| vecOut   | m_axi_gmem    | interface |          |                                    |
| vecOut   | s_axi_control | register  | offset   | name=vecOut_1 offset=0x1c range=32 |
| vecOut   | s_axi_control | register  | offset   | name=vecOut_2 offset=0x20 range=32 |
+----------+---------------+-----------+----------+------------------------------------+

2.4 查看 Schedule Viewer

可以看到 funcB 和 funcC 被并行执行。 

2.5 查看 Dataflow Viewer

可以看到 vecOut 被设置成 FIFO,而 c1、c2、c3、c4 被设置为 PIPO。

3. Vitis IDE的关键设置

3.1 加载数据文件

需要添加验证数据文件,直接将其放在导航树 Test Bench 分支之下即可。

3.2 设置 Flow Target

将 Flow Target 设置成 Vitis Kernel Flow Target

区分 Vitis Kernel 和 Vivado IP Flow Taget

Vivado IP 流程和 Vitis 内核流程是两种不同的开发流程,它们在设计目标、灵活性和接口要求方面有所区别:

  • Vivado IP 流程

设计灵活性:Vivado IP 流程提供了更大的设计灵活性。开发者可以自定义代码以实现广泛的接口标准,以满足特定的设计目标。
接口要求:几乎没有限制,可以根据需要选择不同的接口标准。
RTL开发:Vivado IP 流程专注于RTL开发,允许开发者使用Vivado工具直接编辑RTL代码,进行仿真验证,综合布局布线,以及时序分析。
IP封装:开发者可以将RTL代码封装为IP,以便在Vivado Design Suite中使用。

  • Vitis 内核流程

特定要求和限制:Vitis 内核 (.xo) 是一种特殊类型的Vivado IP,它具有特定的要求和限制,例如必须遵循Vitis内核流程的接口标准。
自动化:Vitis HLS工具可以自动执行代码修改操作,如为函数实参生成接口,以及对代码内的循环和函数执行流水线化。
应用加速:主要用于Vitis应用加速开发流程中,在可编程逻辑中实现和最优化C/C++代码,以实现低时延和高吞吐量。
接口推断:Vitis HLS的基本作用是通过推断所需的编译指示来为函数实参生成正确的接口。

  • Vitis Kernel Flow Target 的默认接口协议

Vitis 内核流程的默认执行模式为流水打拍执行,即启用内核的重叠执行以改善吞吐量。

  • Vivado IP Flow Target 的默认接口协议

对于以上表格中范例的细化解释:

3.3 配置 fifo 深度

查看 DATAFLOW fifo 的默认深度:

也可以通过编译器指令进行配置:

# Set any optimization directives
config_dataflow -default_channel fifo -fifo_depth 2

4. 总结

本文对《Vitis HLS 学习笔记--抽象并行编程模型-控制驱动与数据驱动-CSDN博客》中的控制驱动任务示例进行了详细解析,重点分析了 kernel 代码的并行处理机制及各模块的实现。通过查看综合报告、Schedule Viewer 和 Dataflow Viewer,确认了 funcB 和 funcC 的并行执行和 vecOut 的 FIFO 设置。并介绍了 Vitis IDE 的关键设置,包括数据文件加载、Flow Target 配置及 FIFO 深度调整。总结了 Vivado IP 流程与 Vitis 内核流程的区别,帮助理解两者在设计灵活性、接口要求及应用场景上的不同。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/14934.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【编译原理】词法分析器的设计与实现

一、实验目的 通过设计编制调试一个具体的词法分析程序&#xff0c;加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。 编制一个读单词过程&#xff0c;从输入的源程序中&#xff0c;识别出各个具有独立意义的单词&…

SQLmap学习以及题解运用

1.简介 SQLmap是一款开源的SQL注入工具&#xff0c;用于检测和利用Web应用程序的SQL注入漏洞。SQLmap支持多种数据库管理系统&#xff0c;包括MySQL、Oracle、PostgreSQL、Microsoft SQL Server、SQLite等&#xff0c;并支持各种不同的操作系统和平台。 这里主要分为四大部分…

深入了解 Python 生成器与协程机制

背景介绍 在 Python 中由于 GIL 锁的存在&#xff0c;多线程的并发效率不高。为了比较高效地实现并发&#xff0c;在 Python 中一般的方案是采用多进程 协程的方案。 协程也被称为纤线程&#xff0c;是一种程序级别的并发控制&#xff0c;多个协程会执行在同一线程中。协程的…

同余定理性质

在算法题中碰到的这个同余定理定理&#xff0c;记录一下性质

RabbitMQ01-liunx下安装及用户权限分配

ErLang安装 RabbitMQ是使用ELang语言编写&#xff0c;所以在Liunx下安装RabbitMQ时要先安装ErLong依赖。 安装步骤 下载&#xff1a;https://www.erlang.org/downloads安装依赖&#xff1a; yum -y install make gcc gcc-c kernel-devel m4 ncurses-devel openssl-devel unixOD…

机器学习之常用算法与数据处理

一、机器学习概念&#xff1a; 机器学习是一门多领域交叉学科&#xff0c;涉及概率论、统计学、计算机科学等多门学科。它的核心概念是通过算法让计算机从数据中学习&#xff0c;改善自身性能。机器学习专门研究计算机怎样模拟或实现人类的学习行为&#xff0c;以获取新的知识…

Android Low Storage机制之DeviceStorageMonitorService

一、Android 版本 Android 13 二、low storage简介(DeviceStorageMonitorService) 设备存储监视器服务是一个模块&#xff0c;主要用来&#xff1a; 1.监视设备存储&#xff08;“/ data”&#xff09;。 2.每60秒扫描一次免费存储空间(谷歌默认值) 3.当设备的存储空间不足…

亚信安慧AntDB:数字化转型的关键力量

在数字化浪潮的推动下&#xff0c;数据已成为推动经济发展的新动力。亚信安慧AntDB数据库凭借其卓越性能和灵活的应用能力&#xff0c;在满足我国IT系统与产业数据多样化需求的过程中发挥着重要作用。AntDB数据库承载着无限可能&#xff0c;随着国家数字化转型的不断深入&#…

【项目】教你手把手完成博客系统(三)显示用户信息 | 实现退出登录 | 实现发布博客

文章目录 教你手把手完成博客系统&#xff08;三&#xff09;7.实现显示用户信息1.约定前后端交互接口2.前端通过ajax发起请求3.服务器处理请求 8.实现退出登录1.约定前后端的接口2.前端发起请求3.服务器处理请求 9.实现发布博客1.约定前后端的交互接口2.前端构造请求3.服务器处…

回溯法的重要延展题目

留个坑&#xff01;&#xff01;&#xff01; 1.332重新安排行程 332. 重新安排行程 - 力扣&#xff08;LeetCode&#xff09; 2.51 N皇后问题 51. N 皇后 - 力扣&#xff08;LeetCode&#xff09; 思路&#xff1a; 印象中&#xff0c;对不同角度进行扫描&#xff0c;从…

web自动化-JavaScript操作

做UI自动化的时候&#xff0c;有些操作无法直接通过selenium自带方法操 作成功&#xff0c;那么就需要借助前端js操作实现。 比如浏览器的滚动条这种不是html页面的内容&#xff0c;无法直接通过selenium 控制到。需要借助JavaScript控制。比如有些点击操作无法通过普通点击鼠…

齐护K210系列教程(三十)_多任务切换

多任务切换 1&#xff0c;任务1的设定2&#xff0c;任务2的设定3&#xff0c;主程序4&#xff0c; 课程资源联系我们 在开发项目时&#xff0c;我们常会用到AIstart的多个任务来切换应用&#xff0c;比如当我识别到某种卡片时&#xff0c;要切换到别的任务&#xff0c;这样就要…

链游中的代币(Token)或加密货币(Cryptocurrency)是如何产生和使用的?

在区块链游戏&#xff08;链游&#xff09;中&#xff0c;代币和加密货币不仅是游戏经济的核心&#xff0c;也是连接现实世界与虚拟游戏世界的桥梁。这些数字货币不仅赋予了游戏内资产的真实价值&#xff0c;还为玩家提供了全新的互动和交易方式。下面&#xff0c;我们将深入探…

CentOS-7安装教程

目录 安装 修改主机名 配置静态IP 镜像下载地址 https://mirrors.aliyun.com/centos/7.9.2009/isos/x86_64/CentOS-7-x86_64-DVD-2009.iso VMware Workstation Pro下载 VMware Workstation Pro各版本下载&#xff08;2024.5.5之后&#xff09;(Windows与Linux安装包不限…

【okhttp】小问题记录合集

can’t create native thread 问题描述 OkHttpClient 每次使用都new创建&#xff0c;造成OOM&#xff0c;提示can’t create native thread… 问题分析 没有将OkHttpClient单例化. 每个client对象都有自己的线程池和连接池&#xff0c;如果为每个请求都创建一个client对象&a…

使用v-model完成数据的双向绑定

创作灵感 面试问道了&#xff0c;没答出来&#xff0c;呜呜呜~ v-model实现双向绑定的原理 首先我们要知道&#xff0c;v-model实现的双向绑定其实只是props与emit的简化版本。其中&#xff0c;props负责父组件向子组件传递值&#xff0c;emit负责子组件向父组件传递值。 在…

视频推拉流EasyDSS系统如何在清理缓存文件的同时不影响缓存读写?

视频推拉流EasyDSS视频直播点播平台可提供一站式的视频转码、点播、直播、视频推拉流、播放H.265视频等服务&#xff0c;搭配RTMP高清摄像头使用&#xff0c;可将无人机设备的实时流推送到平台上&#xff0c;实现无人机视频推流直播、巡检等应用。 有用户咨询&#xff0c;视频推…

Git 的安装和使用

一、Git 的下载和安装 目录 一、Git 的下载和安装 1. git 的下载 2. 安装 二、Git 的基本使用-操作本地仓库 1 初始化仓库 1&#xff09;创建一个空目录 2&#xff09;git init 2 把文件添加到版本库 1&#xff09;创建文件 2&#xff09;git add . 3&#xff09;g…

在SpringBoot自定义指标并集成Prometheus和Grafana监控

前沿 写这篇文章的目的是发现自己整天埋头写业务代码但忽略了主动发现问题的能力&#xff0c;这里指的是监控和报警。结合工作中发现Prometheus和Grafana还是主流一些。本文介绍如何使用自定义指标&#xff0c;并使用Prometheus进行监控并报警&#xff0c;同时在 Grafana 进行…