近日,NVIDIA 创始人兼首席执行官黄仁勋在中国苏州举办的 GTC China 大会上发表主题演讲,宣布多项创新技术与合作,并阐述了 NVIDIA 如何助力 AI 加速进入大规模应用。
GTC China 是 NVIDIA 每年在中国最重要的大会,今年更是吸引了 6000 多名科学家、工程师以及企业家参与。在演讲过程中,黄仁勋谈到了 AI 变革的新动向,以及 NVIDIA 在自动驾驶、游戏和医疗等多个行业的最新进展。
TensorRT 7:实现更加智能的 AI 人机交互
在演讲中,黄仁勋宣布 NVIDIA 发布突破性的推理软件 NVIDIA TensorRT™ 7。借助该软件,全球各地的开发者都可以实现会话式 AI 应用,大幅减少推理延迟。作为 NVIDIA 第七代推理软件开发套件,TensorRT™ 7 为实现更加智能的 AI 人机交互打开了新大门,从而能够实现与语音代理、聊天机器人和推荐引擎等应用进行实时互动。
TensorRT 7 内置新型深度学习编译器。该编译器能够自动优化和加速递归神经网络与基于转换器的神经网络。与在 CPU 上运行时相比,会话式 AI 组件速度提高了 10 倍以上,从而将延迟降低到实时交互所需的 300 毫秒阈值以下。
黄仁勋表示:“我们已进入了一个机器可以实时理解人类语言的 AI 新时代。TensorRT 7 使这成为可能,为世界各地的开发者提供工具,使他们能够构建和部署更快、更智能的会话式 AI 服务,从而实现更自然的 AI 人机交互。”
加速汽车创新
开源自动驾驶深度神经网络 NVIDIA DRIVE™
在汽车与交通领域,黄仁勋宣布,NVIDIA 将在 NVIDIA GPU Cloud (NGC) 容器注册上,向交通运输行业开源 NVIDIA DRIVE™ 自动驾驶汽车开发深度神经网络。
NVIDIA DRIVE 已成为自动驾驶汽车开发的行业标准,并且被汽车制造商、卡车制造商、自动驾驶出租车公司、软件公司和大学所广泛采用。如今,NVIDIA 向自动驾驶汽车开发者开源其预训练 AI 模型和训练代码。通过一套 NVIDIA AI 工具,NVIDIA 生态系统内的开发者们可以自由扩展和自定义模型,从而提高其自动驾驶系统的稳健性与能力。
黄仁勋表示:“AI 自动驾驶汽车是软件定义的汽车,它必须基于大量数据集才能在全球范围行驶。我们向自动驾驶汽车开发者开源我们的深度神经网络,并为他们提供先进学习工具,使他们能够根据不同的数据集对这些网络进行优化。通过这一方式,我们正在实现跨企业和国家/地区的共享学习,并保护数据所有权和隐私,最终加快全球自动驾驶汽车的落地。”
发布软件定义的自动驾驶平台 Orin™
此外,黄仁勋还发布了用于自动驾驶和机器人的高度先进的软件定义平台——NVIDIA DRIVE AGX Orin™。该平台内置了全新 Orin 系统级芯片,由 170 亿个晶体管组成,集成了 NVIDIA 新一代 GPU 架构和 Arm Hercules CPU 内核以及全新深度学习和计算机视觉加速器,每秒可运行 200 万亿次计算,几乎是 NVIDIA 上一代 Xavier 系统级芯片性能的 7 倍。Orin 可处理在自动驾驶汽车和机器人中同时运行的大量应用和深度神经网络,并且达到了 ISO 26262 ASIL-D 等系统安全标准。
作为一个软件定义平台,DRIVE AGX Orin 能够赋力从 L2 级到 L5 级完全自动驾驶汽车开发的兼容架构平台,助力 OEM 开发大型复杂的软件产品系列。由于 Orin 和 Xavier 均可通过开放的 CUDA、TensorRT API 及各类库进行编程,因此开发者能够在一次性投入后使用跨多代的产品。
与滴滴达成合作
在客户合作方面,黄仁勋宣布,NVIDIA 和全球领先的移动出行平台 —— 滴滴出行达成合作,滴滴将使用 NVIDIA GPU 和其他技术开发自动驾驶和云计算解决方案。滴滴将在数据中心使用 NVIDIA®GPU 训练机器学习算法,并采用 NVIDIA DRIVE™ 为其 L4 级自动驾驶汽车提供推理能力。滴滴在 8 月将其自动驾驶部门升级为独立公司,并与产业链合作伙伴开展广泛合作。
作为滴滴自动驾驶 AI 处理的一部分,NVIDIA DRIVE 借助多个深度神经网络融合来自各类传感器(摄像头、激光雷达、雷达等)的数据,从而实现对汽车周围环境 360 度全方位的理解,并规划出安全的行驶路径。
NVIDIA GPU 为“双十一”提速
说起 AI 的力量,没有比阿里巴巴更生动的案例了。黄仁勋在演讲中宣布,阿里巴巴近期使用 NVIDIA GPU 大规模部署 AI,在年度最大购物节日——“双十一”为客户提供服务。
在今年“双十一”购物节期间,阿里巴巴创造了 380 亿美元的销售额,相比于去年的 310 亿美元,增长了近四分之一,是“黑色星期五”和“网购星期一”的网购销售额总和的两倍多。
对于阿里巴巴和其他领先的网络零售商来说,推荐系统都是一个至关重要的应用程序。该系统可以向用户展示与其喜好相匹配的商品,从而提高点击率。而点击率在电商行业一直都是提高销售量的重要驱动力。点击率的每一次小幅提高都会直接影响用户的体验和商家的营收。使用能够实时大规模运行的先进推荐系统模型可使点击率提高 10%,目前这只能通过GPU实现。
阿里巴巴团队使用 NVIDIA GPU 支持资源分配、模型量化和图变换三项优化策略,从而提高吞吐量和响应性。这使得 NVIDIA T4 GPU 能够为阿里巴巴广泛、深入的推荐模型提供加速,实现每秒处理 780 个查询。这远远领先于基于 CPU 的推理 —— 后者每秒只能处理 3 个查询。
与腾讯合作推出 START 云游戏服务
在游戏方面,黄仁勋宣布了 NVIDIA 与腾讯游戏的一项将电脑游戏带入云端的合作,该举措进一步增加了 NVIDIA 在云游戏领域的影响力。
NVIDIA 的 GPU 技术为腾讯游戏的 START 云游戏服务赋力,该服务已从今年初开始进入测试阶段。START 使游戏玩家可以随时随地,即使是在配置不足的设备上也能玩 AAA 游戏。腾讯游戏计划将扩展其云游戏产品,为数百万玩家提供与本地游戏设备一致的游戏体验。
NVIDIA 通过助力 START 平台不断扩大在云游戏领域的足迹。今年初,NVIDIA 宣布与日本 SoftBank 和韩国 LG U+ 公司合作开发云游戏解决方案。此外,NVIDIA 还在北美和欧洲部分市场提供 GeForce NOW™ 云游戏服务,为全球的游戏玩家提供最佳的专属云端电脑游戏体验。
更多精彩发布
百度广告系统采用 NVIDIA GPU
百度广告系统采用了 NVIDIA GPU,并将上百个推荐模型部署在众多应用中。百度使用的 AI Box 训练方案采用 GPU 和 Wide and Deep 架构,将训练成本降至 1/10,并且支持更大规模的模型训练。
更多支持 RTX 游戏发布
NVIDIA 和微软共同宣布《我的世界》将支持实时光线追踪(RTX)技术。当前 NVIDIA RTX 技术已被多个业界最流行的渲染平台所支持。现场,黄仁勋宣布了 6 款支持 RTX 的游戏:
(1)由上海钛核网络开发的《暗影火炬》
(2)由米哈游开发的《Project X》(项目代号)
(3)由腾讯北极光工作室群开发的《无限法则》
(4)由大宇资讯开发的《轩辕剑柒》
(5)由龙之力科技开发的《铃兰计划》
(6)由柳叶刀科技开发的《边境》
面向 AEC 的 OMNIVERSE
在今天的演讲中,黄仁勋还宣布了今年 3 月份发布的 OMNIVERSE 3D 制作流程协作平台 OMNIVERSE 的新进展——面向 AEC(建筑、工程、施工)的 OMNIVERSE。面向 AEC 的 OMNIVERSE 支持在 AEC 的工作流中增加实时协作功能,并且支持如 Autodesk REVIT、Trimble SketchUP 和 McNeel Rhino 等主流 AEC 应用。
NVIDIA PARABRICKS 基因组分析工具包
黄仁勋还发布了基于 CUDA 加速的 NVIDIA Parabricks 基因组分析工具包,可与用于发现变异并能产生与行业标准 GATK 最佳实践流程一致的结果,实现 30-50 倍的加速。NVIDIA 正在与华大基因合作,使用 CUDA 的生命科学超级计算机,以每天 60 个基因组的超大吞吐量改变着全基因组测序,同时还降低了成本。