汽车数据应用构想(一)

自从电动汽车GB/T32960标准颁布,要求所有电动汽车必须上传数据开始,各车厂就开始花费大量的人力物力,用于数据的上传与存储。同时随着智能化、网联化的趋势,不断丰富上传数据的内容与数量。数据已成为车厂的重要资产,但这些资产如何变现,却成为产品经理们的难题。

大概是6年多以前吧,当时的数据量还远远比不上如今,单靠一家车厂的数据量根本称不上“大数据”,所以行业中开始有建设汽车行业统一数据平台的呼声(当然,发声的主要是软件供应商……)。有幸参加了相关会议,与会的车厂代表都对这个话题表达了“有兴趣”,但“不参与”的态度。理由也很简单:数据是私有财产,分享了有啥好处啊?!

对,就是这个“有啥好处”成为话题的焦点,也成为无法推动这个事儿的最大障碍。车厂不想参与,却想听听每年花费不少的数据资源,到底能干点儿啥!可惜的是,除了围绕电池分析的价值外,很少有人能讲出还能干点儿啥。而当时电池又处于一个技术更新非常快的阶段,技术路线、生产工艺,甚至化学原理都不一样的情况下,用今天的数据去看明天的电池,任谁想来也不是一个靠谱的事儿。

时至今日,即便是最保守的日系合资车厂,也都有百万级的车在上传数据,且数据范围早已从电池扩展到整车,甚至用户与车的每一次交互,都记录下来。单个车厂的数据存储量,已经把单位从TB,升级到了PB。在如此巨大的数据资源下,无需建立行业统一数据平台,车厂自己就已经具备了对应各种数据需求的底气。

各种“数据平台”“数据底座”“数据能力”...被供应商们吹得天花乱坠,但实际结果往往就是最基础的数据采集、数据清洗,以及各业务部门要求的数据统计。经历多年高投入的“数据基础能力”建设,车厂数据部门每年都要经历“数据价值”的拷问。供应商们也都纷纷从基础能力的牛皮中转向“价值”接着吹,但与花费不菲,且需要持续投入的成本相比,价值几乎少得可怜!

所以咱们就新开一个话题,专门聊聊数据应用价值的想法,本期作为第一篇,先不说实际的应用,而是重点说说在做这些应用的时候,我们会面临哪些问题!

上面都说过了基础建设做了多年,为啥还有问题?其实答案特别简单:你没做过饭,就异想天开地去打造一套万能厨具,等真开始做饭的时候,你就会发现,缺这个少那个!

一、数据项缺失:你想去做停车位预测应用,为了弥补低速下GPS漂移问题,就需要通过方向盘角度及车轮转数精确计算停车时的行驶路径,结果发现,这两数据没采集。

二、采集频率不足:还是上面的例子,如果更进一步地想知道停车位的类型(侧停、斜停、垂直),就需要精确的停车轨迹,如果数据采集频率是5秒1次,那就没办法满足需要。

以上两点,在实际数据应用中是不可避免的,因为谁也不知道未来的应用到底需要哪些数据,更无法知道需要什么样的采集频率。很多人会想,那就把车上所有的数据都按车端最大产生频率上传,解决一切。但这可是要成本的啊!流量成本、储存成本都会成倍,不,应该说是几十倍上百倍地增长,且未来的检索速度也会上百倍地下降!

想解决这个问题其实并不难,就是在车端去做一个可配置化的“数据网关”,车上产生的所有数据都先传到网关,通过规则去配置哪些数据,以什么样的频率去打包上传(当然,什么压缩啊,实时/定时啊,都可以是这个数据网关要解决的问题)。这样就可以“按需所取”,把钱花在刀刃上:数据只有满足业务需要才是有价值的!

三、数值异常:数据库中存在着大量的异常数值。比如“0”、“null”,甚至各种乱码,这些数据虽然会被“洗”掉,还是停车的例子,洗掉这些异常数值后,停车轨迹可能只剩一个点了。

四、时序异常:停车轨迹会出现点位前后反复横跳的现象,其实就是数据在上传时并没按时间顺序保存,前一秒的数据被保存在后一秒之后,导致了数据的不连贯性;

以上两点,是在实际应用落地工作中最常见的问题,毕竟车载场景的网络环境不稳定,重传机制、补数机制,以及网络传输错误都会导致这些问题的出现。甚至还有些重传机制没做好的平台中,会出现大量重复数据。“脏数据”在汽车领域要远高于其他场景

解决方案只能依赖技术手段,无非就是车端与云端的各种容错、纠错、校验手段。随便找一个车联网供应商,都会给出各种产品级的解决方案,这里就不再多说了。但要强调的是,脏数据不避免,要不我怎么还能遇到这些问题呢!在实际应用开发中先去检测数据质量,根据实际数据质量调整数据算法才是最务实的方法

五、分布密度不足:你会发现一个现象,同一品牌的车,在A城有15万辆在传数据,在B城只有5千辆,这种分布密度的不同,导致数据应用的价值与体验有天壤之别;

有些车厂面对这个问题的时候,对于应用价值的认可度就会大打折扣,认为不能满足所有客户价值的服务是不公平的,也就不再推动相关的落地工作,上面说的停车位预测应用就是因为这个原因导致一直没有落地!

但停车是汽车场景中最高频,最有用户价值的服务,就像城市NOA对于自动驾驶,是所有用户都期待的,但没办法保证所有城市都覆盖。那不如也试试逐步上线的策略,一个城市一个城市地去推,哪个城市的数据量够了就上哪个城市,“抢占市场”在数据应用中也是个非常重要的目标

最后再说说对于数据应用中“准确度”这个事儿的看法,最好的例子就是导航中提供的“红绿灯倒数秒”这个功能。只要是越来越准,用户就非常满意了,用户本来也没指望你一上来就准,差不多就可以,被互联网熏陶多年的中国用户,容忍度非常高,数据应用是个迭代的过程,真的没必要上来就要求准确度要高于多少多少。用起来,再升级,是数据应用价值落地的最重要原则

下期开始讲具体的数据应用场景,还没想好一共写几篇,一个一个来吧。


文章首发于公众号:昊叔说车

原创不易,转载请告知原作者,注明出处。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/841928.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Day16

Day16 一、迭代器 深入迭代器-foreach的底层 for (String element : list) {System.out.println(element);}底层: //使用foreach循环遍历集合的底层实现:String element;for(Iterator it list.iterator();it.hasNext();System.out.println(element))e…

微服务:eureka的搭建,以及服务注册、服务发现、负载均衡

eureka 搭建 新建一个Module,maven项目&#xff0c;导入依赖。 <dependencies><dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-netflix-eureka-server</artifactId></dependency><…

月入10万+管道收益,揭秘旅游卡运营的5个阶段!

网上的项目确实繁多&#xff0c;只要深入研究&#xff0c;总能找到适合自己的赚钱方式。在互联网上运营&#xff0c;关键在于理解其底层逻辑。旅游卡项目&#xff0c;就是一个能实现月入10万的实例。接下来&#xff0c;我将为你揭密旅游卡运营的5个阶段&#xff1a; 1、先赚成…

24年湖南教资认定即将开始,别被照片卡审!

24年湖南教资认定即将开始&#xff0c;别被照片卡审&#xff01;

Jenkins 流水线(Pipeline)详解

大家好&#xff0c;Jenkins 流水线&#xff08;Pipeline&#xff09;是一种可编排的持续集成和交付&#xff08;CI/CD&#xff09;方法&#xff0c;它以代码的方式定义整个软件开发过程中的构建、测试和部署流程。接下来就跟大家分享一下Jenkins 流水线&#xff08;Pipeline&am…

2024年5月26日 (周日) 叶子游戏新闻

资深开发者&#xff1a;3A游戏当前处于一种尴尬的中间地带游戏行业整体&#xff0c;尤其是3A游戏正处于艰难时期。尽管2023年3A游戏佳作频出&#xff0c;广受好评&#xff0c;但居高不下的游戏开发成本&#xff08;传闻《漫威蜘蛛侠2》的制作成本高达3亿美元&#xff09;正严重…

【机器学习结合AI绘画工具】——开启艺术创作的新纪元

目录 一、AI绘画工具的发展历程 二、AI绘画工具的技术原理 实例说明 三、AI绘画工具在艺术创作中的应用 实例网站 四、AI绘画工具的影响与未来展望 结论 机器学习和人工智能&#xff08;AI&#xff09;在过去的十年里取得了显著的进展。特别是在艺术创作领域&#xff0c…

【笔记】太久没有写selenium了

以前qyqt和selenium用来开发一个自动化测试工具&#xff0c;现在回忆一下已经过了将近6年。 DeprecationWarning: find_element_by_* commands are deprecated. Please use find_element() 例如&#xff1a;find_element_by_xpath改为web.find_element(By.XPATH from seleniu…

excel表格写存神器--xlwt

原文链接&#xff1a;http://www.juzicode.com/python-tutorial-xlwt-excel 在 Python进阶教程m2d–xlrd读excel 中我们介绍了Excel表格的读取模块xlrd&#xff0c;今天这篇文章带大家了解Excel表格写存模块xlwt。他俩名字相近都以Excel的简写xl开头&#xff0c;rd是read的简写…

Java顺序表

Java顺序表 前言一、线性表介绍常见线性表总结图解 二、顺序表概念顺序表的分类顺序表的实现throw具体代码 三、顺序表会出现的问题 前言 推荐一个网站给想要了解或者学习人工智能知识的读者&#xff0c;这个网站里内容讲解通俗易懂且风趣幽默&#xff0c;对我帮助很大。我想与…

金融序列的布朗运动

https://zhuanlan.zhihu.com/p/659164160 python金融衍生品定价系列之一 —— 布朗运动与伊藤公式 导语:网络上和书本上关于期权定价相关的内容已经较为丰富,但将理论和python代码结合起来讲的却很少,这也是python金融衍生品定价系列的写作初衷,在用python实现相关模型的同…

Rating 计算公式

Rating ⁡ \operatorname{Rating} Rating 计算公式一般有多种&#xff0c;具体公式取决于使用情境和数据结构。 常用的环形排序算法的Rating计算公式是&#xff1a; Rating ⁡ R K ( P − E ) \operatorname{Rating} R K\times(P -E) RatingRK(P−E)其中&#xff0c; R …

春秋云境CVE-2018-20604

简介 雷风影视CMS是一款采用PHP基于THINKPHP3.2.3框架开发&#xff0c;适合各类视频、影视网站的影视内容管理程序&#xff0c;该CMS存在缺陷&#xff0c;可以通过 admin.php?s/Template/edit/path/*web*..*..*..*..*1.txt 的方式读取任意文件。 正文 1.进入靶场 2./admin…

AI学习指南数学工具篇-凸优化在支持向量机(SVM)中的应用

AI学习指南数学工具篇-凸优化在支持向量机&#xff08;SVM&#xff09;中的应用 在机器学习领域中&#xff0c;支持向量机&#xff08;SVM&#xff09;是一种经典的监督学习算法。SVM通过寻找最佳的超平面来进行分类&#xff0c;其优化核心是基于凸优化理论。本文将详细介绍凸…

【数据结构】二叉树-堆(上)

个人主页~ 二叉树-堆 一、树的概念及结构1、概念2、相关概念3、树的表示4、树的实际应用 二、二叉树的概念和结构1、概念2、特殊二叉树3、二叉树的性质4、二叉树的存储结构&#xff08;1&#xff09;顺序存储&#xff08;2&#xff09;链式存储 三、二叉树的顺序结构以及实现1、…

【C++】——入门基础知识超详解

目录 ​编辑 1.C关键字 2. 命名空间 2.1 命名空间定义 2.2 命名空间使用 命名空间的使用有三种方式&#xff1a; 注意事项 3. C输入&输出 示例 1&#xff1a;基本输入输出 示例 2&#xff1a;读取多个值 示例 3&#xff1a;处理字符串输入 示例 4&#xff1a;读…

Python并发编程大揭秘:打造你的多任务处理超能战队!

今天给大家带来的是学习如何构建一个能够同时处理海量任务的超级团队。从简单的线程和锁&#xff0c;到复杂的异步IO和多进程部署&#xff0c;每一个工具都像是你团队中的一员&#xff0c;各有所长&#xff0c;共同协作&#xff01; 文章目录 Python进阶之并发和并行编程详解1.…

【Linux-INPUT输入的子系统】

Linux-INPUT输入的子系统 ■ input 子系统简介■ input 驱动编写流程■ ■ input 子系统简介 input 子系统就是管理输入的子系统&#xff0c; input 子系统分为 input 驱动层、 input 核心层、 input 事件处理层&#xff0c;最终给用户空间提供可访问的设备节点 ■ input 驱…

leetcode打卡#day39 738. 单调递增的数字

738. 单调递增的数字 class Solution { public:int monotoneIncreasingDigits(int N) {string strNum to_string(N);// flag用来标记赋值9从哪里开始// 设置为这个默认值&#xff0c;为了防止第二个for循环在flag没有被赋值的情况下执行int flag strNum.size();for (int i …

【Linux-中断】

Linux-中断 ■■■ ■■■ ■■■ ■ ■ ■ ■ ■ ■ ■ ■ ■