tensorrt轻松部署高性能dnn推理_NVIDIA TensorRT高性能深度学习推理

NVIDIA TensorRT高性能深度学习推理

NVIDIA TensorRT™ 是用于高性能深度学习推理的 SDK。此 SDK 包含深度学习推理优化器和运行时环境,可为深度学习推理应用提供低延迟和高吞吐量。

dc5a7292ce0db5d9797ce0c309dc3d5e.png

在推理过程中,基于 TensorRT 的应用程序的执行速度可比 CPU 平台的速度快 40 倍。借助 TensorRT,您可以优化在所有主要框架中训练的神经网络模型,精确校正低精度,并最终将模型部署到超大规模数据中心、嵌入式或汽车产品平台中。

TensorRT 以 NVIDIA 的并行编程模型 CUDA 为基础构建而成,可帮助您利用 CUDA-X 中的库、开发工具和技术,针对人工智能、自主机器、高性能计算和图形优化所有深度学习框架中的推理。

TensorRT 针对多种深度学习推理应用的生产部署提供 INT8 和 FP16 优化,例如视频流式传输、语音识别、推荐和自然语言处理。推理精度降低后可显著减少应用延迟,这恰巧满足了许多实时服务、自动和嵌入式应用的要求。

可以从每个深度学习框架中将已训练模型导入到 TensorRT。应用优化后,TensorRT 选择平台特定的内核,在数据中心、Jetson 嵌入式平台以及 NVIDIA DRIVE 自动驾驶平台上更大限度提升 Tesla GPU 的性能。

借助 TensorRT,开发者可专注于创建新颖的 AI 支持应用,无需费力调节性能来部署推理工作。

TensorRT 优化与性能

ba7e1539fe59e4a8f9feef1ed0a750a7.png

fa8e497d70b09a6c30e6d18ba923af1b.png

与所有主要框架集成

NVIDIA 与深度学习框架开发者紧密合作,使用 TensorRT 在 AI 平台上实现优化的推理性能。如果您的训练模型采用 ONNX 格式或其他热门框架(例如 TensorFlow 和 MATLAB),您可以通过一些简单的方法将模型导入到 TensorRT 以进行推理。下面介绍了一些集成,其中包含了新手入门信息。

TensorRT 和 TensorFlow 已紧密集成,因此您可以同时尽享 TensorFlow 的灵活性和 TensorRT 的超强优化性能。

MATLAB 已通过 GPU 编码器实现与 TensorRT 的集成,这能协助工程师和科学家在使用 MATLAB 时为 Jetson、DRIVE 和 Tesla 平台自动生成高性能推理引擎。

TensorRT 提供了一个 ONNX 解析器,因此您可以轻松地从框架(例如 Caffe 2、Chainer、Microsoft Cognitive Toolkit、MxNet 和 PyTorch)中将 ONNX 模型导入到 TensorRT。

TensorRT 还与 ONNX Runtime 集成,助您以 ONNX 格式轻松实现机器学习模型的高性能推理。

如果您在专有或自定义框架中执行深度学习训练,请使用 TensorRT C++ API 来导入和加速模型。

c3bae1c06ab7e9e383c4dcd6693c2b75.png

“通过在 V100 上使用 Tensor 核心、新近优化的 CUDA 库以及 TF-TRT 后端,我们能将原本就很快的深度学习 (DL) 网络速度再提升 4 倍”

公布 TensorRT 7.1:新功能

TensorRT 7.1 针对 NVIDIA A100 GPU 进行了优化并加入了新优化,现可使用 INT8 精度加速 BERT 推理,实现高达 V100 GPU 六倍的性能。NVIDIA 开发者计划成员可于 2020 年夏季下载 TensorRT 7.1。

TensorRT 7.0(当前版本)包含:

  • 新编译器,可对语音和异常检测中的常用时间递归神经网络进行加速
  • 对 20 多种新 ONNX 操作的支持,这些操作可对 BERT、TacoTron 2 和 WaveRNN 等关键的语音模型进行加速
  • 对动态形状的扩展支持,可实现关键的会话式 AI 模型
  • 新版插件、解析器
  • BERT、Mask-RCNN、Faster-RCNN、NCF 和 OpenNMT 的新示例

其他资源

概览

  • NGC 中的 TensorRT 容器、模型和脚本
  • 运行 TensorRT 的“Hello World”(示例代码)
  • 将 ONNX 用作输入,运行 TensorRT 的“Hello World”(示例代码)
  • 使用自定义校准以 INT8 精度执行推理(示例代码)
  • TensorRT 简介(网络研讨会)
  • 使用 TensorRT 执行 8 位推理(网络研讨会)

52165f3cca0e3854e8bfde46b960330f.png

会话式 AI

  • 使用 TensorRT 通过 BERT 实现实时自然语言理解(博客)
  • 使用 TensorRT 进行自动语音识别 (Notebook)
  • 使用 TensorRT 对实时文字转语音进行加速(博客)
  • 使用 BERT 实现 NLU (Notebook) (Notebook)
  • 实时文字转语音(示例)
  • 基于序列到序列 (seq2seq) 模型的神经网络机器翻译 (NMT)(示例代码)
  • 逐层构建 RNN 网络(示例代码)

开始实操训练

NVIDIA 深度学习学院 (DLI) 为 AI 和加速计算领域的开发者、数据科学家和研究人员提供实操训练。立即参加关于使用 TensorRT 优化和部署 TensorFlow 模型以及“使用 TensorRT 部署智能视频分析”的自定进度选修课程,获取 TensorRT 实操经验。

适用范围

NVIDIA 开发者计划会员可访问 TensorRT 产品页面,免费使用 TensorRT 进行用于开发和部署。最新版本的插件、解析器和示例也以开源形式提供,可从 TensorRT GitHub 资源库获取。

开发者还可以通过 NGC 容器注册表中的 TensorRT 容器获得 TensorRT。

TensorRT 已纳入:

  • 用于在计算机视觉和智能视频分析 (IVA) 应用中进行实时流分析的 NVIDIA Deepstream SDK
  • 适用于 NVIDIA DRIVE PX2 自动驾驶平台的 NVIDIA DriveInstall
  • 适用于 Jetson TX1、TX2 嵌入式平台的 NVIDIA Jetpack

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/486222.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Neuron最新研究:神经科学家测量球迷大脑对比赛的反应,试图挖掘人类的深层天性...

来源:brainnews2020年的1月27日早上,科比去世,父亲想办法安慰睡醒后的儿子;而在2020年11月26日早上,马拉多纳去世,儿子想办法安慰睡醒后的父亲。2020年,带走了全球无数球迷的青春。那么&#xf…

关于表情符号与UTF-8的探讨

4-23 现在无论原生还是网页端,表情符号绝大部分都可以正常显示,但是也有一部分是不能正常显示的。但存入到mysql的时候,不能够正常显示的表情符号,就会让mysql(utf-8)拜拜了。这个不仅仅是显示问题,很重要的一点是&…

删除数据清理oracle表空间,oracle数据库删除无用表空间及数据文件过程

应用场景:html数据库服务器A下的一张数据库表重建过,而且数据已经迁移到新表空间下,现遗留了一些原有的表空间数据文件在服务器上,耗费资源,如图所示:linux 原数据库表对应的数据文件:sql迁移后…

mfc oninitdialog 中的hwnd == null_在SOUI中使用动态多语言切换

动态语言切换是很多国际化产品的需求,SOUI之前的版本支持静态多语言翻译,通过在程序启动时设置好语言翻译模块,在程序中打开的UI都会自动调用该翻译模块进行文字翻译,但是不支持运行进语言切换。最近几个网友都提到这个需求&#…

2020年中国面向人工智能“新基建”的知识图谱行业白皮书

全文共计1379字,预计阅读时间8分钟来源 | 艾瑞咨询(经授权转载)编辑 | 蒲蒲日前,认知智能国家重点实验室&艾瑞咨询联合发布《2020年面向人工智能“新基建”的知识图谱行业白皮书》。白皮书从善政、惠民、兴业、智融四个部分对…

海尔对话 Unity:作为数字转型的高阶形态,数字孪生发展前景不可逆

来源:数字化企业作为信息化发展到一定程度的必然结果,数字孪生正成为人类解构、描述和认识真实世界和虚拟世界的新型工具。从发展态势来看,数字孪生不仅是全新信息技术发展的新焦点,也是各国实现数字化转型的新抓手,还…

js整体缩小网页_SEO网页优化的原则是什么?

SEO网页优化的原则是什么?SEO优化对于网页的排名是非常重要的,排名高低直接影响到流量和转化,那么怎么优化呢,SEO网页优化的原则是什么?下面小编来告诉你SEO网页优化的原则。1、不要抄袭。因为独特的内容是所有搜索引擎都喜欢的&#xff0c…

蒲慕明:今人眼中的大脑之美 | 书评

圣地亚哥拉蒙-卡哈尔(Santiago Ramn y Cajal, 1852-1934)来源: 知识分子撰文:蒲慕明现代神经科学起源于十九世纪末期;圣地亚哥拉蒙-卡哈尔(Santiago Ramn y)的神经解剖学研究和他提出的神经元理…

sqlite 0转换为bit_Cisco Talos在SQLite中发现了一个远程代码执行漏洞

思科Talos的研究人员在SQLite中发现了一个use-after-free() 的漏洞,攻击者可利用该漏洞在受影响设备上远程执行代码。攻击者可以通过向受影响的SQLite安装发送恶意SQL命令来触发此漏洞。“Sqlite3 3.26.0的窗口函数(Window_Function)中存在可…

构建未来情报体系—— AI及大数据时代情报分析人员的战略价值

知远战略与防务研究所 沐俭/编译来自:美国战略与国际问题研究中心网站【知远导读】本篇推送编辑节选自美国战略与国际问题研究中心(CSIS)技术与情报专项研究小组撰写的一篇利用新兴科技提高情报分析人员的战略情报分析能力的文章,…

中国的自动驾驶到底发展到了什么程度?

来源:面包板社区中国在自动驾驶汽车(AV)领域投入了大量资金,计划大力发展汽车工业这一新兴领域,包括技术、初创企业、测试、法律法规和部署等各个方面。图1:在百度世界2020大会上,百度展示了其全…

数据挖掘算法_技术分享|大数据挖掘算法之KNNk近邻算法

程一舰数据技术处K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。KNN是通过测量不同特征值之间的距离进行分类。其基本…

岩板铺地好吗_别人都说岩板好,我笑他人乐太早

若说岩板是陶瓷行业目前最火爆的产品,相信没有人会睁眼说瞎话表示反对。据统计,目前国内已建成的岩板生产线已有55条,计划在下半年建成/投产的岩板生产线已有17条。照此势头发展下去,国内岩板生产线的条数在2021年将逼近100条&…

人工智能和自然智能能否交汇?李飞飞对话斯坦福神经生物学教授Bill Newsome

作者:SHANA LYNCH机器之心编译编辑:张倩计算在神经科学中扮演了什么角色?在分子水平上理解大脑能否带来更好的神经网络?人工智能和自然智能之间是否存在一道无法逾越的鸿沟?会不会出现一个研究智能的统一框架&#xff…

spring(三)-事务管理

1、 Spring事务管理 事务管理:本质是使用spring管理事务,完成数据库对于事务的支持。 事务:一系列对数据库操作的集合,一个操作错误,所有都必须回滚,其特点是acid。 (1)事务并发存在…

思科nat配置实例_Cisco ASA 5520(8.2.4)配置企业内网案例

思科防火墙ASA5520 外观网络拓扑图如下内网 网段 192.168.2.0/24公网IP地址 118.25.235.100公网IP地址网关:118.25.235.1.1防火墙内网IP:192.168.2.1/24配置步骤:1、基本配置及配置内外网接口conf thostname ASAFW #设置主机名enable secret pass123 #设置特权密码c…

刘伟:什么是智能人机交互?

本文来自刘伟科学网博客北京邮电大学 刘伟这是一个非常有趣的问题,既涉及智能又牵扯人机交互,更重要的是两者之间的联系。如果把人机交互看成脖子以下,即生理与物理之间的相互作用(如视域、听域、可达域、舒适域)的话&…

警方建立了一个人工智能来预测暴力犯罪,它有严重缺陷

来源:机器学习研究组订阅号在英国,有一个被称为“最严重暴力”(简称MSV,即Most Serious Violence)的预测系统,这个预测系统归属于国家数据分析解决方案(NDAS)项目。过去两年&#xf…

大数据应用开发1——配置基础环境

一、基础环境配置 1.配置虚拟网络 1.1、点击1、编辑2和3, 1.2、点开4,编辑网关 2、配置虚拟机环境 1.1、安装一台虚拟机,使用root用户登录,打开终端 1.2修改主机名 终端输入: vim /etc/hostname使用vim编辑/etc/ho…

交叉科学部如何建?基金委:要做好这4点

来源:科学网微信公号 11月29日,国家自然科学基金委员会(以下简称自然科学基金委)交叉科学高端学术论坛在北京召开。第十二届全国政协副主席、中国科协名誉主席、中国科学院院士韩启德,自然科学基金委原主任、中国科学院…