Vitis HLS 学习笔记--循环边界包含变量

目录

1. 简介

2. 分析与详解

2.1 未优化

2.2 LOOP_TRIPCOUNT 优化指令

2.3 重写变量循环边界

3. 总结


1. 简介

在硬件设计中,循环的迭代次数通常需要是固定的,因为这有助于资源的预分配和时序分析。

循环边界包含变量意味着循环的迭代次数不是固定的,而是由程序运行时的某个变量值决定。这种情况下,编译器无法预先知道循环的确切迭代次数,从而影响代码的优化和性能分析。

当循环包含变量边界时,将禁止执行 Vitis HLS 可应用的某些最优化操作。

int example(int A[32], int n) {...for (i = 0; i < n; i++) {out_accum += A[i];}
...
}

其中,循环边界由顶层输入驱动的变量 n 来判定。在此情况下,循环被视为包含变量边界,因为 Vitis HLS 无从知晓循环将何时完成。

本文探讨如何解决这种问题。

2. 分析与详解

2.1 未优化

Vitis HLS 工具会尝试循环进行进行最优化,并且最终的报告包含变量循环边界造成的问题。

#include "ap_int.h"ap_int<13> example(ap_int<8> A[32], ap_uint<5> n) {ap_int<13> out_accum = 0;ap_uint<5> i;LOOP:for (i = 0; i < n; i++) {out_accum += A[i];}return out_accum;
}

变量循环边界的第一个问题是阻止 Vitis HLS 判定循环时延。

Vitis HLS 可判定完成一次循环迭代所需的时延,但由于它无法静态判定精确的变量宽度值 n,因此无从知晓执行的迭代次数,因而无法报告循环时延(即完全执行循环的所有迭代的周期数)。

存在变量循环边界时,Vitis HLS 会将时延报告为问号 (?) 而不是使用精确值。以下显示了示例的综合后的结果: 

* Loop: 
+----------+---------+---------+----------+-----------+-----------+------+----------+
|          |  Latency (cycles) | Iteration|  Initiation Interval  | Trip |          |
| Loop Name|   min   |   max   |  Latency |  achieved |   target  | Count| Pipelined|
+----------+---------+---------+----------+-----------+-----------+------+----------+
|- LOOP    |        ?|        ?|         2|          1|          1|     ?|       yes|
+----------+---------+---------+----------+-----------+-----------+------+----------+

2.2 LOOP_TRIPCOUNT 优化指令

loop_tripcount 语法

#pragma HLS loop_tripcount min=<int> max=<int> avg=<int>

克服此问题的方法是使用 LOOP_TRIPCOUNT 指令来为循环指定最小和/或最大迭代计数。 

#include "ap_int.h"ap_int<13> example(ap_int<8> A[32], ap_uint<5> n) {ap_int<13> out_accum = 0;ap_uint<5> i;LOOP:for (i = 0; i < n; i++) {
#pragma HLS loop_tripcount min=32 max=32 avg=32out_accum += A[i];}return out_accum;
}

循环次数(tripcount) 表示循环的迭代次数。优化后的是示例中,tripcount 最大值 32,那么报告将更新为显示如下内容:

* Loop: 
+----------+---------+---------+----------+-----------+-----------+------+----------+
|          |  Latency (cycles) | Iteration|  Initiation Interval  | Trip |          |
| Loop Name|   min   |   max   |  Latency |  achieved |   target  | Count| Pipelined|
+----------+---------+---------+----------+-----------+-----------+------+----------+
|- LOOP    |       32|       32|         2|          1|          1|    32|       yes|
+----------+---------+---------+----------+-----------+-----------+------+----------+

LOOP_TRIPCOUNT 指令提供的值仅用于报告,或者用于支持 PERFORMANCE 编译指示或指令。指定的循环次数值使 Vitis HLS 能够在报告中判定时延值,以便对来自不同解决方案的值进行比较。要将此循环边界信息用于综合,必须使用断言更新 C/C++ 语言代码,这样会影响综合,由于断言条件假定为 true,因此必须谨慎使用。

由于变量边界循环无法完全展开,因此不仅阻止应用展开 (unroll) 指令,而且还会阻止循环上层的层级的流水打拍操作。

2.3 重写变量循环边界

这里的解决方案是将循环的迭代次数设置为一个固定的最大值(此处为32),然后在循环体内部使用条件语句来决定是否执行循环的主体。

#include "ap_int.h"ap_int<13> example(ap_int<8> A[32], ap_uint<5> n) {ap_int<13> out_accum = 0;ap_uint<5> i;LOOP:for (i = 0; i < 32; i++) {if (i < n) {out_accum += A[i];}}return out_accum;
}

在 LOOP 循环中,i 从0迭代到 32,但只有当 i 小于 n 时,才会将 A[i] 加到累加器 out_accum 上。这样,即使 n 是一个变量,循环的迭代次数也是固定的,满足硬件设计的要求。 

示例中的 for 循环 (LOOP) 则可完全展开。由于此循环的上限固定,因此 Vitis HLS 知晓需创建的硬件数量。在 RTL设计中包含 32 份循环主体副本。每份循环主体副本都包含与之关联的条件逻辑,并根据变量 n 值来执行。

3. 总结

在硬件设计中,固定的循环迭代次数对于资源分配和时序分析至关重要。Vitis HLS 在处理包含变量边界的循环时面临挑战,因为这限制了某些优化操作的执行。通过使用 LOOP_TRIPCOUNT 指令指定迭代次数的范围,可以帮助工具更好地进行时延分析。此外,将循环重写为固定次数的迭代,同时在循环体内部使用条件语句来控制执行,可以满足硬件设计的需求,允许循环展开和流水线化,从而提高性能。这些方法为变量边界循环提供了有效的解决方案,使得即使在变量驱动的情况下,也能实现硬件设计的优化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/25511.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java进阶_抽象类与方法

抽象类概念 在面向对象的概念中&#xff0c;所有的对象都是通过类来描绘的&#xff0c;但是反过来&#xff0c;并不是所有的类都是用来描绘对象的&#xff0c;如果一个类中没有包含足够的信息来描绘一个具体的对象&#xff0c;这样的类就是抽象类。 抽象类除了不能实例化对象之…

ESP32-C3模组上跑通NVS(6)

接前一篇文章:ESP32-C3模组上跑通NVS(5) 本文内容参考: 非易失性存储库 - ESP32 - — ESP-IDF 编程指南 latest 文档 ESP

【MySQL】探索 MySQL 中的 WITH 关键字:使用公共表表达式(CTE)简化查询

我已经从你的 全世界路过 像一颗流星 划过命运 的天空 很多话忍住了 不能说出口 珍藏在 我的心中 只留下一些回忆 &#x1f3b5; 牛奶咖啡《从你的全世界路过》 探索 MySQL 中的 WITH 关键字&#xff1a;使用公共表表达式&#xff08;CTE&#xff09;简化…

按键精灵安装有乱码并且不能启动的解决办法

在国外购了电脑&#xff0c;系统是英文版 Windows 11&#xff0c;按键精灵死活都装不上去&#xff0c;打开exe的安装文件后出现乱码&#xff0c;安装完了后还是乱码&#xff0c;并且启动不了&#xff0c;以下是解决办法&#xff1a; 进入控制面板&#xff0c;并且点 Region&am…

MATLAB算法实战应用案例精讲-【数模应用】逐步回归分析(附MATLAB、R语言和python代码实现)

目录 前言 几个高频面试题目 逐步回归分析和多元线性回归的区别 知识储备 多元线性回归 模型选择 (Model Selection) 算法原理 什么是逐步回归分析 实现策略 向前选择 向后剔除 逐步回归 特征选择与逐步回归分析 2.1特征工程 2.2原始特征的问题 2.3降维与特征选…

汇编:结构体

在32位汇编中&#xff0c;结构体&#xff08;structures&#xff09;用于组织和管理复杂的数据类型&#xff0c;结构体可以包含多个不同类型的数据项&#xff08;成员&#xff09;&#xff1b;在MASM&#xff08;Microsoft Macro Assembler&#xff09;中&#xff0c;使用结构体…

CentOS安装Node.js以及JSDOM跳坑记

笔者在一台 CentOS 7.9 的服务器上使用常规的安装命令&#xff1a;sudo yum install node 来安装 Node.js&#xff0c;到最后系统提示&#xff1a; Error: Package: 2:nodejs-20.14.0-1nodesource.x86_64 (nodesource-nodejs) Requires: libstdc.so.6(GLIBCXX_3.4.20)(64bit) …

vite获取所有环境变量(env)

0.环境变量文件 API_URL8888888 VITE_API_URL99999991.定义环境变量 默认情况下&#xff0c;vite只获取以VITE_为前缀的环境变量。 为了防止意外地将一些环境变量泄漏到客户端&#xff0c;只有以 VITE_ 为前缀的变量才会暴露给经过 vite 处理的代码 但如果你觉得你是进击的巨人…

VUE + nodejs实战

BVDN搭建 D: cd nodejs ::npm install bootstrap ::npm install jquery ::npm install popper.js ::npm install vue npm install vue-router pauseapp.html <!DOCTYPE html> <!DOCTYPE html> <html> <head><!--bootstrap--><link rel"…

vue面试题一

一、请解释Vue.js是什么&#xff1f; Vue.js 是一个构建用户界面的渐进式框架。它的核心库只关注视图层&#xff0c;不仅易于上手&#xff0c;也便于与第三方库或已有项目整合。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。 以下是 Vue.js 的一…

MySQL 5.7详细下载安装配置教程(MySQL 5.7安装包)_mysql5.7的安装教程

记录MySQL 5.7 的下载安装教程&#xff0c;并提供了Mysql 安装包 &#xff0c;以下是详细下载安装过程。 一、下载Mysql安装包 网盘下载&#xff1a; 下载MySQL 5.7安装包&#xff0c;网盘下载地址&#xff1a;点击此处直接下载 官网下载&#xff1a; 进入官网&#xff0c…

为什么选择Python作为AI开发语言

为什么Python适合AI 在当前的科技浪潮中&#xff0c;人工智能&#xff08;AI&#xff09;无疑是最热门的话题之一。无论是自动驾驶、智能推荐还是自然语言处理&#xff0c;AI都在不断改变我们的生活。而在这场技术革命中&#xff0c;Python作为主要的编程语言之一&#xff0c;…

python-win10跑通chattts笔记(亲测可跑)0.8.010

python-win10跑通chattts笔记-亲测可跑 背景项目地址安装过程使用技巧参考链接背景 克隆了项目中的代码,在无conda环境下使用pip安装了依赖,最后报错cl: 命令行 error D8021 :无效的数值参数“/Wno-register” error: command C:\,最后通过使用conda解决了,以此记录下 项…

构建LangChain应用程序的示例代码:27、FLARE:前瞻性主动检索增强生成技术实现与应用的示例

FLARE&#xff1a;前瞻性主动检索增强生成 这个示例是前瞻性主动检索增强生成&#xff08;FLARE&#xff09;的实现。 请查看原始仓库。 基本思想是&#xff1a; 开始回答问题如果开始生成模型不确定的标记&#xff0c;查找相关文档使用这些文档继续生成重复直到完成 在查…

【设计模式】行为型设计模式之 迭代器模式

介绍 迭代器模式&#xff08;Iterator Pattern&#xff09; 是行为设计模式之一&#xff0c;它提供了一种访问集合对象&#xff08;如列表、数组或其他集合结构&#xff09;中元素的方式&#xff0c;而不需要暴露集合的内部结构。迭代器模式定义了一个迭代器接口&#xff0c;该…

沪深历史行情下载,金融数据库查询

行情在线测试 在线测试 历史行情 jvQuant提供2008创立至今的历史股票行情数据&#xff0c;包含沪深主板、科创板、创业板&#xff0c;股票日内行情。 下载地址 http://jvquant.com/query/history?&token<token>&year<数据年份>.zip Copy 例:下载20…

K8S - 用kubectl远程访问内网的k8s集群

在之前的文章 K8S - 在任意node里执行kubectl 命令 介绍过&#xff0c; 通过任何node 的主机&#xff0c; 用kubectl 管理集群是很简单 无非就是两个步骤: 下载 k8s master 上的admin.conf在当前主机配置 K8SCONFIG 环境变量指向 下载的config file 其他内网主机也适用 其…

【Tools】探索动态隧道代理与普通代理:它们是什么,有何不同?

我已经从你的 全世界路过 像一颗流星 划过命运 的天空 很多话忍住了 不能说出口 珍藏在 我的心中 只留下一些回忆 &#x1f3b5; 牛奶咖啡《从你的全世界路过》 在互联网的世界中&#xff0c;代理服务器&#xff08;Proxy Server&#xff09;是一个重要的…

打字侠是一款PWA网站,如何下载到电脑桌面?

嘿&#xff0c;亲爱的键盘侠们&#xff01; 你是否还在为寻找一款好用的打字练习工具而烦恼&#xff1f;别担心&#xff0c;今天我要给大家介绍一位超级英雄——打字侠&#xff01;它不仅是一个超级酷的打字练习网站&#xff0c;还是一款PWA&#xff08;渐进式网页应用&#x…

在LUAT中使用MQTT客户端,游戏脚本,办公脚本自动操作

本文将介绍在LUAT中工程化使用MQTT客户端的方法及注意事项。实验平台为合宙AIR724UG&#xff0c;其固件版本为Luat_V4001_RDA8910_FLOAT_TMP。 面向对象 使用middleclass库为脚本提供基础面向对象支持&#xff0c;将此repo中的middleclass.lua文件添加到项目中即可使用。middl…