异构融合计算技术白皮书(2023年)研读2

读到工业和信息化部电子第五研究所所做的《异构融合计算技术白皮书(2023年)》,我关注的重点是FPGA与异构计算。续前篇,前篇为第1和第2点。

3 异构计算技术困境

性能瓶颈,性能/灵活性矛盾,编程框架不统一
FPGA灵活性好,其功耗、成本高,实际落地案例少
(我的想法:从FPGA本质入手,功耗和成本能打下来吗?FPGA如果用到满,资源不浪费,是否提高竞争力?)

(FPGA厂商莱迪思:物联网太碎片化,开发AI芯片成本太高20190523第一财经:莱迪思 sensAI解决方案 1mW~1W 实时在线的人工智能 专注于边缘端 低功耗、小封装市场。
为什么FPGA是战略芯片 20230510 成电少年学FPGA 适合太空探索 长尾市场 不适合ASIC FPGA在太空上可以定期刷新回读

(csdn上的一个文章《FPGA需要跑多快?影响FPGA计算性能的几大因素》作者Hack电子:FPGA作为可重构计算来加速CPU,如果和CPU跑一样快就没意思了,一般要比CPU快5倍才行。有可能FPGA算法升级的速度比不上CPU算法升级的速度,FPGA加速器做了无用功,比如数据压缩卡这样的功能,CPU直接带了还更便宜。静态控制逻辑,FPGA做计算就不希望靠参数确定怎么计算,而是希望一开始就定好,一个计算单位同时支持个位数和两位数平方计算就会很占资源,最好一开始就定)

(网上的一个文章《软件工具将GPU代码迁移到fpga以用于AI应用》20220602 software tools migrate GPU code to FPGAs for AI application人工智能软件初创公司Mipsology正与xilinx合作,使FPGA就能够仅适用一个额外的命令就可以替换AI加速器应用程序中的GPU,软件Zebra,xilinx的卡是Alveo U50,Alveo U200,Alveo U250。Mipsology公司的CEO拉祖尔 Ludovic Larzul。我们在FPGA上安装软件,使其透明,就像Nvidia为AI用户打造的Cuda CuDNN。Mipsology公司的核心团队来自于Zebu硬件辅助验证产品,属于EVE,被Synopsis收购。他们意识到GPU的缺点,比如寿命低,用2-5年,怕太阳暴晒,更耗电

4 异构计算孤岛问题

不同的加速器的存储器和内存管理机制不同,数据访问、传输方式复杂
异构计算编程框架各异,为GPU编的代码无法在CPU、FPGA上运行。
计算领域热门课题,真正统一的、能满足所有硬件和应用需求的编程框架
(我的想法:FPGA被软件直接操作可行吗,DDR接口有,通过某协议直接出来。FPGA工种:做IP核,是将来某SoC产品的硬件模块,用户直接用关键IP,总线,无线连接技术)
基于NOC的SoC,异构系统支持。
设备级融合技术(芯片间互联高速总线 PCIe,CXL,NVLink)
DPU为中心的计算架构,DPU主要是虚拟化、网络、存储、安全四类基础设施工作任务的集成加速平台。
DPU连DSA(DSA与FPGA有关)
FPGA算力计算复杂,考虑架构、时钟频率、并行度、逻辑单元数量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/134133.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

支付宝AI布局: 新产品助力小程序智能化,未来持续投入加速创新

支付宝是全球领先的独立第三方支付平台,致力于为广大用户提供安全快速的电子支付/网上支付/安全支付/手机支付体验,及转账收款/水电煤缴费/信用卡还款/AA收款等生活服务应用。 支付宝不仅是一个支付工具,也是一个数字生活平台,通过…

Ipswitch WS_FTP 12 安裝

Ipswitch WS.FTP.Professional.12.6.rar_免费高速下载|百度网盘-分享无限制 This works but quite difficult to figure out. It didnt allow me to replace the wsftpext.dll at 1st and had to test lots of ways how to replace it. This is how I did: 1. Follow the instr…

JS逆向爬虫---请求参数加密③【比特币交易爬虫】

查询参数确定 t无加密 请求头参数加密 X-Apikey参数加密确定 X-Apikey逆向 const API_KEY "a2c903cc-b31e-4547-9299-b6d07b7631ab" function encryptApiKey(){ var t API_KEY, e t.split(""), n e.splice(0, 8);return t e.concat(n).join("&…

Oracle RAC是啥?

Oracle RAC,全称是Oracle Real Application Cluster,翻译过来为Oracle真正的应用集群,它是Oracle提供的一个并行集群系统,由 Oracle Clusterware(集群就绪软件) 和 Real Application Cluster(RA…

ESP32网络开发实例-Web服务器以仪表形式显示传感器计数

Web服务器以仪表形式显示传感器计数 文章目录 Web服务器以仪表形式显示传感器计数1、应用介绍2、软件准备3、硬件准备4、代码实现4.1 Web页面文件4.2 Web服务器代码实现在本文中,我们将介绍使用服务器发送事件 (SSE) 构建 ESP32 仪表 Web 服务器。服务器将自动向所有连接的网络…

游戏开发中的“御用中介“

点击上方亿元程序员关注和★星标 引言 大家好,我是亿元程序员,一位有着8年游戏行业经验的主程。 本系列是《和8年游戏主程一起学习设计模式》,让糟糕的代码在潜移默化中升华,欢迎大家关注分享收藏订阅。 游戏开发中的"御用…

wsl和windows下编译C++以及函数重载和函数模板的问题记录

wslUbuntuvscodec 每次打开wsl,进入ubuntu中新建文件夹进行c编程的时候经常报错,显示配置文件有问题,但是每次按照vscode官方文件配置的话是没有问题的。百思不得其解。 今晚发现了问题所在。每次新建工作区的时候会自动生成.vscode文件夹&…

力扣每日一题 -- 2919. 使数组变美的最小增量运算数

//这题本质还是一个背包问题 //怎么去思考这个问题呢 //我最开始的思想是根据经验来看,最小增量运算数,并且使数组变美丽,那么就有点像编辑距离的问题 //但是我看了下时间复杂度,不能是n^2,那么再去仔细思…

六大排序算法:插入、选择、冒泡、快排、希尔、归并

1、插入排序 解析&#xff1a;第一个元素设定为已经排好序&#xff0c;依次选择后续的元素插入到已经排好序的组内进行排序。 图示&#xff1a; 代码&#xff1a; public static void insertionSort(int[] arr) {int n arr.length;for (int i 1; i < n; i) {int key a…

网络爬虫的实战项目:使用JavaScript和Axios爬取Reddit视频并进行数据分析

概述 网络爬虫是一种程序或脚本&#xff0c;用于自动从网页中提取数据。网络爬虫的应用场景非常广泛&#xff0c;例如搜索引擎、数据挖掘、舆情分析等。本文将介绍如何使用JavaScript和Axios这两个工具&#xff0c;实现一个网络爬虫的实战项目&#xff0c;即从Reddit这个社交媒…

洛谷P1024 [NOIP2001 提高组] 一元三次方程求解(优雅的暴力+二分,干净利落)

P1024 [NOIP2001 提高组] 一元三次方程求解 前言题目题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1 题目分析注意事项 代码后话额外测试用例样例输入 #2样例输出 #2 王婆卖瓜 题目来源 前言 没有前言&#xff0c;可能因为作者忘了编辑 题目 题目描述 有形如&…

Nginx默认会自动忽略请求头Headers里带下划线_的参数

起因&#xff1a;该接口设置了必须要传送app_code和app_secret才能正常访问。实际我在本地环境测试中&#xff0c;发现该接口是正常访问的&#xff0c;但是部署到正式系统之后发现&#xff0c;该接口一直提示app_code和app_secret不能为空。 后续排查&#xff1a;发现正式系统…

STM32 TIM定时器,配置,详解(1)

计数器寄存器(TIMx_CNT)、预分频器寄存器(TIMx_PSC)、自动重载寄存器(TIMx_ARR)。 PSC预分频器&#xff0c;顾名思义&#xff0c;先预备一下分频&#xff0c;有时候频率过高&#xff0c;后面的定时器承受不住&#xff0c;就先用PSC先分频一下。如何分频的&#xff1f;将每接受到…

ubuntu18.04上安装protubuf3.19.4

1、下载protobuf sudo wget https://github.com/protocolbuffers/protobuf/releases/download/v3.19.4/protobuf-all-3.19.4.tar.gz2、解压protobuf sudo tar -zxvf protobuf-all-3.19.4.tar.gz3、编译安装 cd protobuf-3.19.4sudo ./autogen.shsudo ./configure --prefix/us…

windows环境下安装Java过程(免登录Oracle官网下载java)

下载路径 oracle官网&#xff1a; java下载路径 Oracle共享账号可下载JDK&#xff1a; 指路 安装流程 执行下载后的jdk的可执行文件一路next下去&#xff0c; 可以自定义安装路径添加环境变量&#xff0c; 两个地方需要添加 在cmd中输入java -version 进行验证&#xff0c;…

计算/存储虚拟化高级特性

目录 计算虚拟化特性 HA高可用 虚拟机热迁移 虚拟机快照技术 存储虚拟化特性 链接克隆 存储热迁移 裸设备映射 计算虚拟化特性 HA高可用 通过HA&#xff08;High Available&#xff09;机制&#xff0c;可以提升虚拟机的可用度&#xff0c;允许虚拟机所在的服务器节点…

IP代理如何选择?4大误区你别踩!

近年来&#xff0c;我国互联网商业保持持续发展的状态大环境的优化&#xff0c;大大小小的企业都想乘胜追击&#xff0c;大展宏图&#xff0c;积极推动各项数据业务的进程。 而对于跨境业务来说&#xff0c;代理IP是不可或缺的重要工具之一&#xff0c;市面上代理IP类型众多&a…

每日一题(LeetCode)----数组--二分查找(四)

每日一题(LeetCode)----数组–二分查找&#xff08;四&#xff09; 1.题目&#xff08;367. 有效的完全平方数&#xff09; 给你一个正整数 num 。如果 num 是一个完全平方数&#xff0c;则返回 true &#xff0c;否则返回 false 。 完全平方数 是一个可以写成某个整数的平方…

获取狮子座明年恋爱运势预测API接口

获取狮子座明年恋爱运势预测API接口的功能是通过API接口获取狮子座明年恋爱运势的预测结果&#xff0c;为用户提供恋爱运势指导。 首先&#xff0c;使用挖数据平台该API接口需要先申请API密钥。在获取API密钥后&#xff0c;可以使用该接口进行开发。 API接口地址为&#xff1a…

基于卷积优化算法的无人机航迹规划-附代码

基于卷积优化算法的无人机航迹规划 文章目录 基于卷积优化算法的无人机航迹规划1.卷积优化搜索算法2.无人机飞行环境建模3.无人机航迹规划建模4.实验结果4.1地图创建4.2 航迹规划 5.参考文献6.Matlab代码 摘要&#xff1a;本文主要介绍利用卷积优化算法来优化无人机航迹规划。 …