AI推理部署工具之大汇总,后面会逐步补充

目录

1、FastDeploy

1.1 安装

1.2 yolo推理部署示例

1.3 推理部署思路


1、FastDeploy

FastDeploy 通过提供简洁的API接口,让AI推理部署变得更加高效和灵活。适用于多种主流算法模型,且支持跨平台、多硬件兼容等优势。

支持 GPU、CPU、Jetson、ARM CPU、瑞芯微NPU、晶晨NPU、恩智浦NPU 等多类硬件;

支持Windows、Linux、Android、IOS等操作系统,可本地、服务化、Web端、移动端部署等;

支持CV、NLP、Speech 三大领域, 如物体检测、分类、分割、OCR、文本分类、信息抽取、跟踪、语音合成等主流算法。

1.1 安装

python虚拟环境下,直接使用pip命令,建议带上FastDeploy轮子网址。

#cpu版本安装
pip install fastdeploy==1.0.1 -f https://www.paddlepaddle.org.cn/whl/fastdeploy.html#gpu版本安装
pip install fastdeploy-gpu-python==1.0.1 -f https://www.paddlepaddle.org.cn/whl/fastdeploy.html

如需系统学习python虚拟环境,请转至如下文章链接。 

python:windows下管理虚拟环境_windows python 虚拟环境-CSDN博客文章浏览阅读1.4k次,点赞25次,收藏23次。通过miniconda工具,该工具可创建多个虚拟环境,每个虚拟环境内,都可以根据项目对版本的需求,安装python 解释器和 依赖包,并且多个虚拟环境独立管理_windows python 虚拟环境https://blog.csdn.net/weixin_47285222/article/details/141351119

我部署的硬件平台,intel cpu下的win10操作系统;虚拟环境,python 3.9,fastdeploy1.0.1。

1.2 yolo推理部署示例

以最常见的yolov5检测为例,部署推理代码,仅需两步,示例代码如下。

#导包
import fastdeploy as fd#加载模型
det_model = fd.vision.detection.YOLOv5(model_file, params_file,runtime_option,model_format)
#推理
result = det_model.predict(image,conf_threshold=0.5,nms_iou_threshold=0.5)

1、加载模型时,参数说明如下

  • model_file:字符串,表示模型路径
  • params_file:字符串,表示参数文件路径。如果模型为ONNX格式,则可为空
  • runtime_option:fastdeploy.RuntimeOption类型,以option = fd.RuntimeOption()方式创建,用于设置推理设备,数据大小,推理引擎等。如果为空,则默认使用CPU模式
  • model_format:fastdeploy.ModelForamt类型,表示加载模型的格式,默认为ONNX 

比较常用的模型格式ONNX,且yolo中有导出该格式模型的脚本export 。如果有NVIDIA GPU的,可在runtime_option参数中进行设置,代码示例如下

import fastdeploy as fdoption = fd.RuntimeOption()
if device == "GPU":option.use_gpu()#加载模型,onnx格式,参数params_file和model_format默认即可
det_model = fd.vision.detection.YOLOv5(model_file,runtime_option=option)
#推理
result = det_model.predict(image,conf_threshold=0.5,nms_iou_threshold=0.5)

进入 fd.RuntimeOption() 类中,里面支持很多设置API,不光有设备选择,还支持panddle和openvion等推理引擎。这里不一一截图了,大家可根据自己需要,自行探索。

2、模型推理predict,yolo检测后处理中的非极大值抑制,需要用到两个阈值参数

这里将yolo中的后端处理(非极大值抑制),一并包含在推理过程中,得到的结果 result 字典中包含以下几部分。其中,box,label,score 是我们经常需要用到的,可自行加载。

1.3 推理部署思路

1.2小节内容以yolov5检测为例,详细介绍,使用fastdeploy部署推理时,调用API时的一些规则。

如果大家有不同需求,譬如分类、分割等,亦或者使用其他检测模型,检查该类模型是否可用该工具部署,都可通过检查fastdeploy 中的API。

譬如先确定是检测、分类,或者是分割等大方向。使用代码提示,如下都会自动提示和填充

fd.vision.detection
fd.vision.classification
fd.vision.segmentation

确定好大方向后,可直接点进该类,查看其包含的模型都有那些。比如检测,如下图所示。

如果确定有你所需的模型后,在选择使用什么格式加载模型,这步就回归到1.2小节了,可根据API参数说明规范使用。 

以上内容,足以让一个新手小白,快速查看和使用fastdeploy工具,部署自己的推理模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/55832.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

研发中台拆分之路:深度剖析、心得总结与经验分享

背景在 21 年,中台拆分在 21 年,以下为中台拆分的过程心得,带有一定的主观,偏向于中小团队中台建设参考(这里的中小团队指 3-100 人的团队),对于大型团队不太适用,毕竟大型团队人中 …

Qt源码-Qt多媒体音频框架

Qt 多媒体音频框架 一、概述二、音频设计1. ALSA 基础2. Qt 音频类1. 接口实现2. alsa 插件实现 一、概述 环境详细Qt版本Qt 5.15操作系统Deepin v23代码工具Visual Code源码https://github.com/qt/qtmultimedia/tree/5.15 这里记录一下在Linux下Qt 的 Qt Multimedia 模块的设…

Java | Leetcode Java题解之第472题连接词

题目&#xff1a; 题解&#xff1a; class Solution {Trie trie new Trie();public List<String> findAllConcatenatedWordsInADict(String[] words) {List<String> ans new ArrayList<String>();Arrays.sort(words, (a, b) -> a.length() - b.length(…

RelationGraph实现工单进度图——js技能提升

直接上图&#xff1a; 从上图中可以看到整个工单的进度是从【开始】指向【PCB判责】【完善客诉】【PCBA列表】&#xff0c;同时【完善客诉】又可以同时指向【PCB判责】【PCBA列表】&#xff0c;后续各自指向自己的进度。 直接上代码&#xff1a; 1.安装 1.1 Npm 方式 npm …

JavaScript下载文件(简单模式、跨域问题、文件压缩)

文章目录 简介简单文件下载通过模拟form表单提交通过XMLHttpRequest方式 跨域(oss)下载并压缩文件完整示例文件压缩跨域设置 简介 相信各位开发朋友都遇到过下载的文件的需求&#xff0c;有的非常简单&#xff0c;基本链接的形式就可以。 有的就比较复杂&#xff0c;涉及跨域…

【顶刊核心变量】中国地级市绿色金融试点改革试验区名单数据(2010-2023年)

一、测算方式&#xff1a; 参考《中国工业经济》崔惠玉&#xff08;2023&#xff09;老师的研究&#xff0c;2017 年&#xff0c;国务院决定将浙江、广东、江西、贵州和新疆的部分地区作为绿色金融改革创新试验 区的首批试点地区。试点地区在顶层设计、组织体系、产品创新、配…

Biomamba求职| 国奖+4篇一作SCI

转眼间我也要参加秋招啦&#xff0c;认真的求职帖&#xff0c;各位老师/老板欢迎联系~其它需要求职的小伙伴也欢迎把简历发给我们&#xff0c;大家一起找工作。 一、基本信息 姓名&#xff1a;Biomamba 性别&#xff1a;男 出厂年份&#xff1a;1998 籍贯&#xff1a;浙江…

flutter升级,从3.10.6升级到3.16.9 混编项目iOS跑不起来

flutter升级&#xff0c;从3.10.6升级到3.16.9&#xff0c;如果直接去终端用命令行flutter upgrade v3.16.9很难保证不进入 dev分支升级成beta版本。 所以采取了 https://docs.flutter.dev/release/archive 点击这里去进行升级&#xff0c;这个时候也不要直接替换&#xff0c…

Visual Studio 2022安装(含重生版)

前言&#xff1a; 昨天调试代码的时候发现程序怎么都运行不了&#xff0c;错误显示无法找到文件啊啊啊&#xff0c;能力有限&#xff0c;找不出错误源&#xff0c;然后就狠心删掉所有相关文件来“重新开始”&#xff01; 正文&#xff1a; 1.官网下载&#xff08;内定中文版…

GS-SLAM论文阅读笔记-CG-SLAM

前言 这是一篇不是最新的工作&#xff0c;我之前没有阅读&#xff0c;但是我前几天阅读GLC-SLAM的时候&#xff0c;发现它的一部分内容参考了CG-SLAM&#xff0c;并且CG-SLAM最近被ECCV2024接收&#xff0c;说明这是一片值得参考的好文章&#xff0c;接下来就阅读一下吧&#…

QUUID 使用详解

UUID 通常由 128 位&#xff08;16 字节&#xff09;组成&#xff0c;通常表示为 32 个十六进制数字&#xff0c;分为五个部分&#xff0c;格式如下&#xff1a; QUuid 是 Qt 框架中用于生成和处理 UUID&#xff08;通用唯一标识符&#xff09;的类。UUID 是一种标准的标识符格…

sklearn机器学习实战——随机森林回归与特征重要性分析全过程(附完整代码和结果图)

sklearn机器学习实战——随机森林回归与特征重要性分析全过程&#xff08;附完整代码和结果图&#xff09; 关于作者 作者&#xff1a;小白熊 作者简介&#xff1a;精通python、matlab、c#语言&#xff0c;擅长机器学习&#xff0c;深度学习&#xff0c;机器视觉&#xff0c;目…

知识图谱入门——7:阶段案例:使用 Protégé、Jupyter Notebook 中的 spaCy 和 Neo4j Desktop 搭建知识图谱

在 Windows 环境中结合使用 Protg、Jupyter Notebook 中的 spaCy 和 Neo4j Desktop&#xff0c;可以高效地实现从自然语言处理&#xff08;NLP&#xff09;到知识图谱构建的全过程。本案例将详细论述环境配置、步骤实现以及一些扩展和不足之处。 源文件已上传我的资源区。 文章…

【VScode】如何使用详细步骤【笔记】、配置 C / C ++【笔记】

2024 - 10 - 10 - 笔记 - 24 作者(Author)&#xff1a;郑龙浩(仟濹) 该笔记写于 2024-07-02 摘抄到博客上的时间是 2024-10-10 VScode配置 C / C 笔记 我是看了下方链接的视频后为了方便后期复习做的笔记: B站某UP主的视频如下&#xff1a; VScode配置C/C开发环境&#xff…

VMware桥接模式无法连接网络

windows下打开控制面板&#xff0c;找到WLAN&#xff0c;记住下面的名称&#xff08;带有VMware的都是虚拟机的网卡&#xff0c;要找到物理主机的网卡&#xff09; 回到VMware&#xff0c;编辑——打开虚拟网络编辑器 桥接选择上面的WLAN下的网络名称&#xff0c;确定即可。&…

需求9——通过一个小需求来体会service层的作用

昨天在完成了睿哥的需求验收之后&#xff0c;暂时没有其他任务&#xff0c;因此今天可能会比较有空闲时间。趁着这个机会&#xff0c;我打算把之前完成的一些需求进行总结&#xff0c;方便以后复习和参考。 在8月份的时候&#xff0c;我负责了一个需求&#xff0c;该需求的具体…

基于xml配置文件的Spring事务

在项目中对事务属性通常传播属性&#xff0c;回滚属性&#xff0c;隔离级别&#xff0c;超时属性都取默认值&#xff0c;只有只读属性会如下的配置&#xff1a; 什么意思&#xff1a;Service层你的类里的方法&#xff0c;以get&#xff0c;find&#xff0c;select等开头的方法是…

Robust多模态模型的开发

本文所涉及所有资源均在 传知代码平台 可获取。 目录 Robust 多模态模型&#xff1a;寻找遗失的模态&#xff01; 一、研究背景 二、模型结构和代码 三、数据集介绍 六、性能展示 六、实现过程 七、运行过程 Robust 多模态模型&#xff1a;寻找遗失的模态&#xff01; 近年来&a…

threejs-基础材质设置

一、介绍 主要内容&#xff1a;基础材质(贴图、高光、透明、环境、光照、环境遮蔽贴图) 主要属性&#xff1a; side: three.DoubleSide, //设置双面 color: 0xffffff, //颜色 map: texture, //纹理 transparent: true, // 透明度 aoMap: aoTexture, //ao贴图 aoMapIntensity: 1…

Linux下载安装MySQL8.4

这里写目录标题 一、准备工作查看系统环境查看系统架构卸载已安装的版本 二、下载MySQL安装包官网地址 三、安装过程上传到服务器目录解压缩&#xff0c;设置目录及权限配置my.cnf文件初始化数据库配置MySQL开放端口 一、准备工作 查看系统环境 确认Linux系统的版本和架构&am…