AI大模型如何赋能智能座舱

AI 大模型如何赋能智能座舱

从上海车展上,我们看到由于智能座舱配置性价比较高,已经成为车企的核心竞争点之一,随着座舱硬件规模化装车,蔚小理、岚图、极狐等新势力开始注重座舱多模态交互,通过集成语音/手势/触控打造智能化差异体验。车展期间,百度、商汤、华为等拥有大模型的厂商相继推出智能座舱产品,我们认为 AI 大模型的落地,将加速赋能座舱语音助手向“AI 智能管家”升级,有望推动座舱人机主动式交互时代的到来。

智能座舱演进到了什么阶段?——全面朝 4.0 多模态阶段迈入

我们将汽车座舱从机械时代到智能时代的发展划分为 5 个阶段,可以看到现阶段下座舱正处于从 3.0(以特斯拉 Model3/Y 的简配为代表)到 4.0(以理想 L9 的高配为代表)的演进阶段。该阶段重要特征即视听触多模块硬件加速升级,丰富汽车座舱智能生态。我们参加了 2023 年上海国际车展,车展中我们看到造车新势力、传统车企、Tier1 等新产品的展出和发布。我们看到智能座舱配置的性价比推动其渗透率快速提升,已经由原先造车新势力“一骑绝尘”的方式,转换全行业“齐头并进”。搭载方案转向座舱视听触多模态硬件全方位升级,印证了 4.0 时代加速到来,

大模型如何赋能座舱?——“AI 管家”打造差异化体验

我们认为目前多模态交互的背后仍是通过“语音+触摸屏”来实现控制,靠乘客主动发起方能实现的指令识别型“被动式交互”。大模型的落地,将加速软件能力升级,推动座舱 5.0 人机主动式交互时代的到来。

大模型有望:

(1)通过赋能语音助手对于乘客的语音语义理解能力。打通其在视觉、听觉、触觉等多模态应用上的操控力,形成深度的乘驾人机主动式互动体验。

(2)摆脱座舱硬件堆栈同质化。通过大模型赋能语音助手或将成为“AI 智能管家”,因算法不同而具有不同的特色和功能,进而形成车企自身独特的智能化差异,构筑核心竞争力。

比较看好的产品方向:

(1)视觉:传统车载 TFT-LCD 显示技术的快速迭代,逐步趋向大屏、高清化。此外 HUD 结合 AR 技术兴起,法规允许 E-Mirror 上车,多态显示技术交互。我们测算 23-30E 全球车载显示硬件规模有望达 1723 亿元,CAGR 为 10.2%。

(2)听觉:通过搭载更多数量/不同区位扬声器实现环绕体验,增加数字功放/低音炮等器件提升听觉质感。我们测算 23-30E 全球座舱声学硬件规模有望达到约 483 亿元,CAGR 为 14.2%。

(3)触觉:3DTOF 作为最适合 AI 视觉的传感器,用于支持手势交互/DMS/乘客识别功能,目前已经在理想、问界、BBA 等率先上车,大模型发展有望驱动需求快速提升.

智能座舱:4.0 至 5.0,从多模态到大模型

如果我们将汽车座舱从机械时代到智能时代的发展划分为 5 个阶段,我们认为现阶段下座舱正处于从 3.0(以特斯拉 Model3/Y 的简配为代表)到 4.0(以理想 L9 的高配为代表)的全面演进阶段。该阶段重要特征即视听触多模块硬件加速升级,丰富汽车座舱智能生态。

(1)座舱 1.0-2.0:最开始座舱的 1.0 时代,仅有机械仪表盘和车载收音机等寥寥数个车载元件,座舱主要以功能性为主。行至座舱 2.0 时代(20 世纪 80 年代后),随着信息技术革命,中控屏应运而生,可以初步显示行车信息及实现舱内控制功能,同时电气式仪表盘广泛应用,为驾驶员提供更多辅助信息。车载 DVD 功能的出现开启了汽车座舱娱乐化属性的重要一步。

(2)座舱 3.0-4.0:后随着汽车实现区域集成架构,高性能、高集成、高扩展性的座舱域控制器以开始助推智能化加速。我们认为在座舱 3.0 时期(2010 年后),中控屏、液晶仪表盘、音响等基础视听硬件,以及车灯、座椅等均得到了全方位升级;此外 Carplay 等应用上车也开启了车机互联的时代。随后国内造车新势力不断推进座舱往 4.0 时代发展(2020 年后),我们看到 HUD、副驾/后排屏、电子后视镜开始陆续上车,杜比音效、AI语音及手势交互甚至 VR 眼镜等功能不断创新,快速丰富座舱智能化体验。

(3)座舱 5.0:展望未来座舱 5.0 生态,在中央集成架构下,整车智能化水平将达到一个新的高度。我们认为随着大模型的赋能,AI 语音助手将加速转变为“AI 智能管家”,进行深度人机情感交互。此外,参考 2023 年 CES 大会上宝马 i Vision Dee 概念车的构思:全息投影、透明显示、车灯投影、电子墨水、裸眼 3D 等元素或进一步升级。

图片

2023 年上海国际车展看到造车新势力、传统车企等新产品的展出和发布。智能座舱的渗透已经由原先造车新势力“一骑绝尘”的方式,转换全行业“齐头并进”,行业搭载方案转向座舱多模态升级,印证了 4.0 时代加速到来。具体而言包括:1)视觉:车载屏幕向大屏化、多屏化、高清化的方向发展,HUD 加速上车。2)听觉:扬声器、功放数量增加,致力于打造沉浸式听觉享受。造车新势力:蔚来发布第二代数字座舱,搭载于 EC7、ET7、新款 ES8;理想:L7 延续L9/L8 亮眼座舱配置,打造家庭座舱体验;极狐:20.3 英寸中控屏与副驾/仪表/HUD 多屏交互,装载哈曼卡顿音响;广汽埃安:Hyper GT14.6 寸 2.5k 中控屏+23 个 HIFI 扬声器实现 3D 环绕立体声场。

传统车企:宝马:X1 搭载第 8 代 BMW iDrive 操作系统,配备 10.7 寸悬浮式曲面屏及HUD,满足驾乘者的个性化需求;大众:新车型 ID.7 VIZZION 主打智能乘坐空间,内置15 英寸 2k 悬浮中控屏及 AR-HUD,配备哈曼卡顿音响。

图片

4.0 阶段是座舱往多模态演进的时期,硬件升级>软件升级。目前多模态硬件的堆栈背后仍是通过“语音+触摸屏”来实现控制,主要交互停留在“命令识别”层面,靠乘客主动发起方能实现的“被动式交互”,各模态之间仍互为独立。

往后随着硬件逐步上车,座舱交互性和操控便捷性的重要程度逐步凸显。车企开始探索舱内智能化交互,“语音助手”或成为核心交互载体。看到目前新势力在座舱交互上已经有所突破。例如智能化领先的小鹏语音助手小 P 可以支持多指令识别、离线响应。蔚来人车交互系统 NOMI 具有较强的学习功能和语音指令识别功能,此外还能根据不同状况表现出相对应的情感,与车主进行简单对话。而理想的“理想同学”同样属于可以由关键词触发,能够执行语音/手势/触控命令的初级智能 AI。

往后看大模型的落地,或将加速软件能力升级,推动座舱 5.0 人机主动式交互时代的到来。大模型有望:(1)通过赋能语音助手对于乘客的语音语义理解能力,提升全功能操控力。打通其在视觉、听觉、触觉等多模态应用上的操控力,形成深度的乘驾人机主动式互动体验。(2)打造智能生态差异化,摆脱座舱同质化。通过大模型赋能语音助手或将成为“AI智能管家”,因算法不同而具有不同的特色和功能,进而形成车企自身独特的智能化差异。

商汤日日新大模型亮相车展,大模型接入座舱。4 月 18 日上海车展上,商汤亮相了其“日日新 Sensenova”大模型,并展示了其中文语言模型“商量 SenseChat”以及“如影 SenseAvatar”等与座舱的结合,我们看到通过大模型可以赋予座舱多种生成式 AI 能力,提供包括情绪感知、智能助手、基于情感的对话、创意内容生成、个性交互等一系列功能,应用场景也可以拓展到娱乐、办公、购物、休息等。

1) AI 数字人:根据乘客偏好设置,形成数字虚拟人与乘客进行交流,形象趋近于“AI 座舱管家”,是乘客与车机的交互对象。

2)信息查询强化:通过语音询问乘客可以获得具体信息查询输出,此外还包括关于餐厅推荐、旅行路径规划、给儿童创造读物的创意性输出。

3)图片自动生成:类似 Midjourney 可以为乘客自动生成各种各样的图片。

4)安全识别:可以根据乘客是否登记分为嘉宾/主人,可以根据不同乘客的记录的偏好推荐其合适的内容产品。同时具备更好的 DMS(驾驶员监测)、OMS(乘客检测)、儿童滞留等功能体验。

5)API 接入:支持外接第三方应用,协助实现会议管理、购物、差旅等功能。

图片

百度推出座舱产品车载 OS 和语音 SDK,文心一言于多家用户开展内测。百度 Apollo 在上海车展前夕举办汽车智能化发布会,发布了全新升级的驾舱图产品矩阵,座舱方面百度发布车载 OS 和语音 SDK。其中,语音 SDK 基于大模型的本地化部署,具有全双工和毫秒级响应的优点,可以为车企提供更先进而出色的智能座舱体验。百度 SDK 突出优势包括:(1)将一切座舱功能集成到语音助手,可以通过语音实现舱内全功能调节;

(2)支持“多路对话”,不同的乘客可以在同一时间与语音助手展开交流并下达指令。目前包括集度、吉利、长城、红旗、岚图、东风启辰等主机厂已经宣布接入基于文心大模型的生成式对话产品文心一言(ERNIE Bot),开启自身座舱大模型的内测。

华为积极布局座舱 AI,大模型于秋季首发 M9 上落地。华为盘古大模型基于鲲鹏和昇腾算力底座,由 NLP(中文语言)大模型、CV(视觉)大模型、科学计算大模型、多模态大模型和 Graph(图网络)大模型 5 个模型组成。4 月 17 日车展前夕,在华为 nova11 系列及全场景新品发布会上,余承东宣布 2023 年秋季发布 AITO 问界 M9 将搭载 AI 大模型。

其语音助手“小艺”通过领先的多模态自适应技术,针对语速、语音、文本,对用户指令进行多维度综合判断,可以实现类似人与人的主动交流。目前“小艺”已经能够:

(1)根据日常通勤的情况自动提供通勤道路异常的提醒;(2)判断长途驾驶场景时,检测到车主有疲劳驾驶状态主动打开座椅按摩;车内午休/通勤回家后打开自动小憩模式,记录用户喜欢的氛围。(3)推荐适应当前车辆情况的驾驶模式;(4)停车找位的好帮手。

图片

据高工智能汽车研究院,2022 年中搭载智能数字座舱(大屏+语音+车联网+OTA)前装标配交付 795.05 万辆,搭载率为 39.89%,仍有较高渗透空间。市场规模方面,根据 IHSMarkit 预测,全球智能座舱市场规模将从 2021 年的 420 亿美元增长到 2030 年的 681 亿美元,2022-2030 年 CAGR 为 5.52%。IHS 预测国内智能座舱市场增速领先全球,国内规模从 2021 年 99 亿美元预计提升至 2030 年 247 亿美元,2022-2030 年 CAGR 为 10.69%,我国智能座舱规模全球占比将从 2021 年 24%左右上升到 2030 年的 36%。

图片

现阶段下智能座舱已经处于全面向 4.0 阶段发展的时期,已经从新势力领军转换

为行业内齐跑。硬件的装载是实现软件层交互的基础,座舱硬件已率先迎来大规模上车机遇,首先看好视听触多模态硬件:显示、音响以及 AI 视觉硬件 TOF 模组等快速装车,车端业务有望高速增长。在智能座舱大模型生态发展下,拥有大模型和机器视觉技术布局的软件层企业同样有望受益。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/14683.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode—2769. 找出最大的可达成数字【简单】

2024每日刷题(139) Leetcode—2769. 找出最大的可达成数字 实现代码 class Solution { public:int theMaximumAchievableX(int num, int t) {return num t * 2;} };运行结果 之后我会持续更新,如果喜欢我的文章,请记得一键三连…

【实战】SpringBoot整合Websocket、Redis实现Websocket集群负载均衡

文章目录 前言技术积累什么是Websocket什么是Redis发布订阅Redis发布订阅与消息队列的区别 实战演示SpringBoot整合WebsoketWebsoket集群负载均衡 实战测试IDEA启动两台服务端配置nginx负载均衡浏览器访问模拟对话 前言 相信很多同学都用过websocket来实现服务端主动向客户端推…

【知识蒸馏】deeplabv3 logit-based 知识蒸馏实战,对剪枝的模型进行蒸馏训练

本文将对【模型剪枝】基于DepGraph(依赖图)完成复杂模型的一键剪枝 文章中剪枝的模型进行蒸馏训练 一、逻辑蒸馏步骤 加载教师模型定义蒸馏loss计算蒸馏loss正常训练 二、代码 1、加载教师模型 教师模型使用未进行剪枝,并且已经训练好的原始模型。 teacher_mod…

利用Python去除PDF水印

摘要 本文介绍了如何使用 Python 中的 PyMuPDF 和 OpenCV 库来从 PDF 文件中移除水印,并将每个页面保存为图像文件的方法。我们将深入探讨代码背后的工作原理,并提供一个简单的使用示例。 导言 简介:水印在许多 PDF 文件中都很常见&#x…

全国数据库管理系统设计赛-人大金仓内核实训安排正式发布

作为数据库领域国家队,人大金仓积极响应国家战略,通过赛题设计、内核技术支撑及赛前培训等多方面,大力支持全国大学生计算机系统能力大赛-数据库管理系统设计大赛成功举办。目前第二届全国大赛正在火热报名中,各种奖项等你来拿&am…

《web应用设计》第八次作业

我的小组长是姚若希,我们组课程设计的题目是:学生管理系统 ,我认领的功能模块是:课程管理 2.查询并分页

只需三步,即可配置HTTPS跳转

HTTPS(全称:Hyper Text Transfer Protocol over Secure Socket Layer),是以安全为目标的HTTP通道,简单讲是HTTP的安全版。通过SSL/TLS协议对数据进行加密,保证了数据传输的安全,防止数据被截获、…

UWB论文:Introduction to Impulse Radio UWB Seamless Access Systems(2):脉冲;超宽带;测距;定位

3) 测距/接收器 像全球定位系统(GPS)这样的系统依赖于单向测距One Way Ranging(OWR),其中多个卫星(代表固定节点,称为锚点anchors)定期传输同步的无线电数据包集合,这允许…

sh控制台输入文字多行 按“# ꧂ ꧁”结束

如果在Unix shell中输入多行文字,那么这样操作: 1. 打开您的终端(Terminal)。 2. 输入您的文字,每行文字后按回车键。 3. 当您完成输入所有文字后,输入“# ꧂ ꧁”然后按回车键,表示输入结束。…

将Surface的分辨率减半以省电(二合一本\笔记本电脑适用)

【完全自定义分辨率教程】这篇教程用于将Surface之类的高分屏(高分辨率)的二合一本或笔记本等的分辨率调整为原来的一半,以实现省电等目的。 下载CRU(Custom Resolution Utility)解压后,打开CRU.exe选择当…

Java期末复习指南(1):知识点总结+思维导图,考试速成!

🔖面向对象 📖 Java作为面向对象的编程语言,我们首先必须要了解类和对象的概念,本章的所有内容和知识都是围绕类和对象展开的! ▐ 思维导图1 ▐ 类和对象的概念 • 简单来说,类就是对具有相同特征的一类事…

(全面)Nginx格式化插件,Nginx生产工具,Nginx常用命令

目录 🎫 前言 🎉 开篇福利 🎁 开篇福利 x2 Double happiness # 介绍 # 地址 # 下载 💻 命令及解析 # 整个文件系统中搜索名为nginx.conf的文件 # 编辑nginx.conf文件 # 重新加载配置文件 # 快速查找nginx.conf文件并使…

建筑施工突发事故应急处置vr安全培训平台

在不断发展的时代背景下,掌握必要的应急安全知识已成为我们生活中不可或缺的一部分。由央企携手我们华锐推出的3D线上应急宣教虚拟体验馆,标志着民众应急安全教育的全新里程碑,不仅突破了传统学习模式的局限,还让每个人都能在灵活…

防火墙技术基础篇:基于IP地址的转发策略

防火墙技术基础篇:基于IP地址的转发策略的应用场景及实现 什么是基于IP地址的转发策略? 基于IP地址的转发策略是一种网络管理方法,它允许根据目标IP地址来选择数据包的转发路径。这种策略比传统的基于目的地地址的路由更灵活,因…

深度学习之Python+OpenCV+Tensorflow实时人体检测和计数

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 深度学习之PythonOpenCVTensorflow实时人体检测和计数项目简介 一、项目背景与意义 随着科技的不断发展&#xff…

Go微服务: 日志系统ELK的应用

概述 基于前文,我们已经了解并搭建完成ELK的所有环境了,现在我们来结合应用程序来使用ELK参考前文:https://active.blog.csdn.net/article/details/138898538 封装日志模块 在通用工具模块: gitee.com/go-micro-services/common 这个包是通…

CTFHUB技能树——SSRF(三)

目录 URL Bypass 数字IP Bypass 302跳转 Bypass DNS重绑定 Bypass SSRF绕过方法: (1) http://abc.com127.0.0.1 (2)添加端口号 http://127.0.0.1:8080 (3)短地址 htt…

限制U盘使用:企业数据安全的软件解决方案

在当今数字化办公环境中,U盘作为一种便捷的数据传输工具,其使用在企业内部非常普遍。然而,U盘的不当使用也给企业数据安全带来了巨大风险。为了防止数据泄露和病毒传播,企业需要采取有效的软件解决方案来限制U盘的使用。本文将探讨…

docker容器安装mysql

linux: centOS-7 hadoop: 3.3.6 前置章节: (图文并茂)基于CentOS-7搭建hadoop3.3.6大数据集群-CSDN博客 可选:zookeeper安装教程-CSDN博客 1.安装docker 1.1 添加docker的repo源 sudo yum-config-manager --add-repo http://mirrors.aliyun.com/…