Banana Pi BPI-F3, 进迭时空K1芯片设计,定位工业级应用,网络通信及工业自动化

香蕉派BPI-F3是一款工业级 8核RISC-V开源硬件开发板,它采用进迭时空(SpacemiT) K1 8核RISC-V芯片设计,CPU集成2.0 TOPs AI计算能力。4G DDR和16G eMMC。2个GbE以太网接口,4个USB 3.0和PCIe M.2接口,支持HDMI和双MIPI-CSI摄像头

进迭时空

进迭时空(杭州)科技有限公司是一家成立于2021年11月,专注于高性能RISC-V处理器核、芯片及核心软件系统的创新与研发的企业。公司由一批国内知名的RISC-V处理器技术专家共同发起,并在杭州、珠海、上海、北京、英国等地设有办公地点。进迭时空的核心团队成员来自平头哥、全志等国内知名的半导体企业,拥有丰富的高端芯片研发与商业运营经验。公司旨在推动RISC-V架构的技术发展,其产品广泛应用于边缘计算到云计算等多个场景,包括高端智能机器人、高性能计算盒子、边缘服务器、新一代智能云终端、自动驾驶等。

进迭时空 K1 开源硬件开发板: 香蕉派 BPI-F3

基于RISC-V开放指令集架构,致力于打造更节能、更通用的AI处理器平台,推动全球开源、开放生态计算能力建设。

K1主要用于单板计算机、网络存储、云计算机、智能机器人、工业控制、边缘计算机等。

卓越的CPU性能

8核RISC-V AI CPU,提供50KDMIPS CPU算力和2.0TOPS AI算力

单核CPU算力领先ARM A55 30%以上

强大的向量算力

全球首款支持RVA22 Profile、支持256bit RVV 1.0标准的RISC-V CPU, 提供2倍于Neon的SIMD并行处理算力

通用的AI算力

以CPU核融合方式提供AI算力,实现与所有主流AI生态的快速对接

领先的算力能效

RISC-V架构的精简和卓越的微架构设计,算力能效比ARM A55高20%

丰富的IO能力

集成多套PCIe、USB、GMAC、SPI等接口,提供全面的外设连接选型

符合工业级标准

CPU在-40˚C~85˚C的环境温度下仍能提供稳定可靠的持续算力输出,满足工业应用的苛刻环境需求

基于进迭时空的AI技术路线,以轻量化插件的方式,通过开放的软件栈,使得K1芯片能够在短时间内支持大量开源模型的部署,目前已累计验证了包括图像分类、图像分割、目标检测、语音识别、自然语言理解等多个场景的约150个模型的优化部署,timm、onnx modelzoo、ppl modelzoo等开源模型仓库的支持通过率接近100%,而且理论上我们能够支持所有的公开onnx模型。

作为进迭时空首颗自研高性能计算芯片,K1芯片除了在AI方面取得了突破性成果,在包括存储性能、计算性能、浮点性能等芯片的三个核心性能上,相较ARM同级别的Cortex-A55

芯片也都取得代差级优势。

同等微架构下,存储性能大幅领先于ARM Cortex-A55

芯片存储的速度越快,计算机的运行速度也就越快,这也意味着能够更快地访问和处理数据,缩短反应时间,对于需要高效数据交换的AI终端应用场景来说,尤为重要。陈志坚博士介绍,在存储性能方面,同等微架构下,K1芯片搭载的进迭时空自研RISC-V 智算核X60™表现亮眼,大幅领先ARM Cortex-A55 15%。其中,LMbench Write单项来看,最高可达6.32GB每秒,LMbench Copy和Read,分别可达3.35GB每秒和3.56GB每秒,远超ARM Cortex-A55的读写和复制速度。此外,X60智算核在内存stream方面的各项指标也远超ARM Cortex-A55。

同等微架构下,计算性能大幅领先于ARM Cortex-A55

在各大领域的真实应用中,X60™智算核的实际计算性能也大幅领先ARM Cortex-A55。在相同工艺下,X60™智算核单位频率的性能大幅领先,这来自于之前提到的出色的各项传统CPU的性能,也来自于X60™智算核基于RISC-V Vector的强大SIMD性能。图像性能方面,最高为ARM Cortex-A55图像性能的2.14倍,压缩性能的1.2倍,绘制性能的1.19倍。

提高芯片的计算性能,也可以通过提高数据并行性能来实现。这种能力也被称为向量计算能力。事实上,AI大模型推理涉及大量的向量运算和矩阵运算,利用处理器的向量指令功能,能够加快模型的推理速度。

据发布会公布的数据显示,基于RISC-V Vector 1.0标准,X60™智算核可以提供2倍于ARM Neon的256-bit SIMD并行处理算力。相比Arm Neon指令集能在多个领域的应用情况和带来的性能提升。在图像预处理、颜色空间转换、图形学等算法性能上,X60™是ARM Cortex-A55的1.5倍。此外,进一步在LU分解,QR分解,SVD分解,Chelesky分解,Eigen分解等五大矩阵进行分解后,基于在OpenBLAS+Eigen,核心计算,sgemm的性能上的突出表现,X60智算核是ARM Cortex-A55的1.5倍。更为重要的是,X60智算核的向量计算技术,还解决了SIMD技术带来的二进制不兼容问题,使同一份代码可以跑在基于RISC-V架构的任何矢量位宽的处理器上,开发者不需要经历ARM指令集扩展和代码重写,这意味着软件维护成本将大大降低,对RISC-V生态的建设具有重大意义。

同等微架构下,浮点运算能大幅领先于ARM Cortex-A55

浮点运算能力是芯片在进行浮点计算时的速度和精确度,对于Robot Computer时代里高强度的科学计算和图型处理等密集运算的应用程序来说,浮点性能尤为关键。

陈志坚博士介绍,进迭时空随机抽取的18个应用程序进行实测后,测试结果显示,X60™智算核在14个应用程序的运行数据都大幅领先于ARM Cortex-A55。其中,在X60™智算核上运行从头计算量子化学程序GAMESS,是ARM Cortex-A55的12.2倍,称得上“遥遥领先”。

下一步工作

面向未来,进迭时空将持续投入 RISC-V 高性能 CPU 核、高性能 CPU 芯片、基础和系统软件研发,形成完整计算系统解决方案:

第二代 RISC-V 高性能 CPU 核“X100”研发完毕,采用 12 级流水线和 4 发射乱序执行的超标量处理器架构,通用计算性能Coremark 达到 7.7/MHz,Spec2k6 超过 8.2/GHz,在 12nm 工艺下频率可达到 2.5GHz。同时完整符合服务器规格要求,是全球首款同时支持完整虚拟化、RAS 特性、安全、标准向量扩展、向量加解密、64 核互联的 RISC-V CPU 核,获得中国开放指令生态(RISC-V)联盟 2023 年度唯一的前沿创新奖。

搭载“X100”核的下一代 RISC-V AI CPU 芯片已启动研发,未来将继续拓展 RISC-V 在高性能计算领域的边界,成为新的标杆级别的量产 CPU 芯片产品。

同时进迭时空作为中电标协 RISC-V 工委会副会长单位,全球 RISC-V生态软件计划“RISE”会员单位等,将继续携手业界共建 RISC-V 应用生态。

进迭时空表示,坚信 RISC-V 是下一个机器人时代最佳的计算架构,RISC-V让中国企业有机会从指令集和 CPU 核开始做芯片和计算系统的软硬件融合优化,为世界交付具有代差级优势的芯片产品,在中国会诞生出具有全球影响力的 CPU 芯片企业。

BPI-F3 ,接口齐全的RISC-V开发板

丰富的硬件接口:

在线文档:https://docs.banana-pi.org/zh/BPI-F3/BananaPi_BPI-F3

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/12169.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Jenkins构建流程

Jenkins是DevOps【(Development和Operations的混成词)是一种重视“软件开发人员(Dev)”和“IT运维技术人员(Ops)”之间沟通合作的文化、运动或惯例)】的重要一环,是一款开源的CI&CD软件。也就是持续集成…

【Viso画图】Viso导出与图形适配的pdf

step1:选中开发工具点击shapeSheet,选中页 step2:进入页面参数设置窗口,将下面框选的参数设为0,enter后保存 目前效果: step3:选中设计->大小,选择适应页面大小或者自己根据图片调整 目前效果: step4: 以…

【C++】priority_queues(优先级队列)和反向迭代器适配器的实现

目录 一、 priority_queue1.priority_queue的介绍2.priority_queue的使用2.1、接口使用说明2.2、优先级队列的使用样例 3.priority_queue的底层实现3.1、库里面关于priority_queue的定义3.2、仿函数1.什么是仿函数?2.仿函数样例 3.3、实现优先级队列1. 1.0版本的实现…

android自定义view仿微信联系人列表

说明:最近碰到一个需求,弄一个类似国家或省份列表,样式参照微信联系人 文件列表: step1:主界面 加载列表数据~\app\src\main\java\com\example\iosdialogdemo\MainActivity.java step2:右侧列表数据排序~\app\src\com\example\io…

6. 第K小的和-二分

6.第K小的和 - 蓝桥云课 (lanqiao.cn) #include <bits/stdc.h> #define int long long #define endl \n using namespace std; int n,m,k,an[100005],bm[100005]; int check(int x){int res0;//序列C中<x的数的个数for(int i0;i<n;i){//遍历数组A&#xff0c;对于每…

神级框架!!不要再封装各种 Util 工具类了【送源码】

这个工具类就比较厉害了&#xff0c;不过我在 Halo 当中用得最多的还是 HtmlUtil.encode&#xff0c;可以将一些字符转化为安全字符&#xff0c;防止 xss 注入和 SQL 注入&#xff0c;比如下面的评论提交。 comment.setCommentAuthor(HtmlUtil.encode(comment.getCommentAutho…

汇聚荣科技:拼多多开店没有流量应该怎么办?

拼多多开店没有流量是一个常见的问题&#xff0c;许多新手商家都会遇到这样的困境。那么&#xff0c;如何解决这个问题呢?下面从四个方面进行详细阐述。 一、优化店铺和商品 首先&#xff0c;要确保店铺和商品的质量。店铺要有自己独特的风格和特色&#xff0c;商品要有高质量…

Allegro如何输出各层PCB视图的PDF文件

如何输出各层PCB视图的PDF文件 1、说明 用Allegro设计好PCB后&#xff0c;有时需要出各层的PDF文档出来进行汇报和展示&#xff0c;这时就需要将各层的平面视图全部以PDF的形式加载出来&#xff0c;具体方法如下。 2、PDF文件的输出方法&#xff08;以四层板为例&#xff09; …

原子学习笔记7——FrameBuffer 应用编程

Frame 是帧的意思&#xff0c;buffer 是缓冲的意思&#xff0c;所以 Framebuffer 就是帧缓冲&#xff0c;这意味着 Framebuffer 就是一块内存&#xff0c;里面保存着一帧图像。 应用程序通过对 LCD 设备节点/dev/fb0&#xff08;假设 LCD 对应的设备节点是/dev/fb0&#xff09;…

css如何实现边框模糊的效果

其实并不难&#xff0c;用属性 filter: blur(数字px); 即可。效果如下&#xff1a; 图上的圆形内有色彩的渐变&#xff0c;同样也是用filter: blur(数字px); 实现的&#xff0c;代码如下&#xff1a;、 <template><div id"root" :style"{}">…

ros键盘控制程序teleop_twist_keyboard 键值含义及用法

在机器人仿真中&#xff0c; 经常会用到键盘控制程序teleop_twist_keyboard 对机器人进行控制。但是对各个键值是何种含义&#xff0c; 如何操作并没有任何资料介绍,初次使用时会不知所措。 通过实践&#xff0c; 发现各个键值的作用如下&#xff1a; u-- 向左前方前进 i-- 直…

RIP动态路由协议详解

目录 一&#xff1a;RIP协议的基本信息 二&#xff1a;RIP协议中的更新方式 三&#xff1a;RIP协议中的计时器 定时更新器&#xff08;UPDATE timer&#xff09; 无效定时器&#xff08;invalid Timer&#xff09; 垃圾收集定时器&#xff08;garbage collection timer&a…

第五课,输入函数、布尔类型、比较运算和if判断

一&#xff0c;输入函数input() 与输出函数print()相对应的&#xff0c;是输入函数input()&#xff0c;前者是把程序中的数据展示给外界&#xff08;比如电脑屏幕上&#xff09;&#xff0c;而后者是把外界&#xff08;比如键盘&#xff09;的数据输入进程序中 input()函数可…

Verilog代码bug:一种特殊的组合逻辑环

Verilog代码bug&#xff1a;一种特殊的组合逻辑环 组合逻辑环&#xff08;Combinational Loop&#xff09;是什么&#xff0c;别的文章已经写的很多了&#xff0c;本文就不赘述了&#xff0c;本文主要记录遇到过的一种特殊的逻辑环&#xff1b; 代码如下所示&#xff1a; mo…

MacApp自动化测试之Automator初体验

今天我们继续讲Automator的使用。 初体验 启动Automator程序&#xff0c;选择【工作流程】类型。从资源库区域依次将获取指定的URL、从网页中获得文本、新建文本文件三个操作拖进工作流创建区域。 然后修改内容&#xff0c;将获取指定的URL操作中的URL替换成https://www.cnb…

for循环 while循环

for循环 for循环格式 for 变量 in 取值列表 #for in &#xffe5; &#xff08;seq 1 10&#xff09; do 命令序列 .......... done 另一种 for &#xff08;&#xff08;变量初始值&#xff1b; 变量范围&#xff0c; 变量迭代方…

JDK1.8 安装并配置环境变量

一、Windows 配置 1 安装文件 jdk-8u401-windows-i586.exe 2 环境变量 JAVA_HOME C:\Program Files (x86)\Java\jdk-1.8 CLASSPATH .;%JAVA_HOME%\lib\tools.jar;%JAVA_HOME%\lib\dt.jar; Path %JAVA_HOME%\bin 说明&#xff1a;Win7/Win8 中 Path 可能需要写成 ;%JAVA_HO…

Edge浏览器自动翻译功能按钮不见了

前言&#xff1a; 平时偶尔会用到Edge的页面翻译功能&#xff0c;使用挺方便。突然发现Edge浏览器的翻译功能不见 了。如下图所示&#xff1a; 解决思路&#xff1a; 1、从网上找各种解决方案也没有解决&#xff0c;其中有一个说到点右上角的三个点 2、点击设置…

30W 宽电压输入 AC/DC 导轨式开关电源——TPR/DG-30-XS 系列

TPR/DG-30-XS 系列导轨式开关电源&#xff0c;额定输出功率为30W&#xff0c;产品输入范围&#xff1a;90-264VAC。提供12V、24V输出&#xff0c;12V输出时&#xff0c;工作温度范围 (-25℃~70℃)具有短路保护&#xff0c;过载保护等功能&#xff0c;并具备高效率&#xff0c;高…

Windows内核--Kernel API简析(3.1)

如果所有的内核提供的功能&#xff0c;内核提供进程/线程创建和终止&#xff0c;内存分配和释放&#xff0c;文件操作&#xff0c;网络功能&#xff0c;驱动程序加载和卸载等功能。这些API将在后面陆续介绍&#xff0c;如下先介绍Kernel提供的基础API(Kernel自身或Driver使用).…