机器学习竞争其实是一场数据上的竞争

640?wx_fmt=jpeg

来源:网络大数据
摘要:
人工智能的三大发展要素已经是老生常谈了。算法、算力和数据对机器学习的重要性和声望不亚于“谦哥”的喝酒、烫头和抽烟。


那些热衷竞争实施机器学习的公司现在惊讶地发现,其实,实施一些算法使机器变得对某一数据或问题更加智能并不困难。毕竟,这年头“即插即用”又很稳健的算法编程解决方案简直“烂大街了”。例如,从开源机器学习框架谷歌TensorFlow,到微软Azure Machine Learning以及亚马逊SageMaker,应有尽有。


所以,数据已逐渐成为了机器学习竞争中最关键的区分点。一个原因是高质量数据并不常见;另一原因是数据尚未商品化,公司企业之间存在着信息不对称。


希望借助AI一臂之力的企业需要寻求外部数据源,甚至这样的数据甚至可能需要他们自己创建。


有用的数据:有价值、又很稀少


数据逐渐变成竞争中的区分点是因为许多公司根本没有他们需要的数据。尽管几十年来,公司都在使用通用的会计准则这样的系统化方法来评估自己,但是这种评估方法一直关注于实体资产与金融资产,也就是实物和钱。2013年甚至给资产定价理论颁了一个诺贝尔奖,强化了已有的对实体或金融资产重要性的认知。


但是,今天最有价值的那些公司贸易对象是软件或网络,而不仅仅是实体或金融资产。在过去的40年内,资产类型的重心有了很大的变化:1975年,83%的有形资产占整个市场绝大部分份额;而2015年时市场中84%的资产是无形资产。今天的公司巨头们不再生产咖啡壶也不再售卖洗衣机,他们转而提供应用程序,软件等等。这样的转变造成了会计记账的对象和实际产生价值的对象极其不匹配。


结果就是有用数据的缺少已经成为了一个问题。市面价值与账面价值的差别越来越大。公司们正在试图利用机器学习辅助重要的商业决策来改善这一差别。有时,机器学习甚至会取代一些昂贵的咨询顾问们,而最后他们经常会意识到算法所需的数据压根不存在。所以实际上,那些闪瞎人眼的先进AI系统最后依旧只是在同样老旧的数据上试图实施新技术。

和人类一样,除非有人教,机器学习系统并不会精通任何领域。不过比起人类,机器会需要更多的信息来进行学习,并且它们确实比人类读取数据的速度更快。因此,表面上公司间会互相竞争谁拥有更好的机器学习程序员以及谁先启动AI项目,在幕后其实是对于数据新颖度和广泛度的竞争。


比如说在金融领域,可供选择的数据来源远远超过了传统证券交易报告以及投资者展示等。数据还可以来源于社交网络情感分析或者获批专利数量等。


这些数据源的重要性主要基于两点原因。首先,传统数据局限于传统资产,在当今无形资产当道的时代,覆盖面上远远不够。第二,并没有任何必要在市场上所有人都在分析的数据上使用机器学习方法。所有对此感兴趣的人都早已经尝试过分析产业趋势、利润率、增长率、息税前利润、资产周转率以及资产回报率和其它上千个常见的变量与股东回报率之间的相关性。


在所有人都在分析的数据上试图发现相关性并不会帮助公司取胜。相反,希望使用AI取胜的公司需要寻找新数据集之间的联系,因此他们可能必须自己创建那些新数据集来评估无形资产。


谨慎思考:你想知道什么?


创建数据比仅仅把销售点与顾客信息两个表聚合到一起然后丢进数据库复杂得多。大多数企业错误地相信通过这样一种权宜的方法能够预测或区分出他们关心的信息:把所有能找到的数据都大费周章地聚合到一起然后指望能够找到一丝希望之光。


尽管机器学习有时会突然发现某些从未有人意识到的事物从而使所有人都大吃一惊,但它并不能够持续稳定提供这样的洞察。这并不意味着这项工具很垃圾,这意味着我们需要更明智地使用它。但说起来容易做起来难:比如,在我们研究外部数据市场时,我们发现大多数新数据提供者依旧在关注实体与金融资产。


许多企业遗漏的一步是提出一项真正重要的假设。机器学习真正体现优越性之处在于,它们能够通过采用人类已经拥有的见解,这可以来自于经验法则、广泛认知或者几乎完全不被理解的相关性,来建设一种速度更快、更易于理解、更易于扩展且更低错误率的方法。


为了这样使用机器学习方法,不应向系统塞进任何你能找到的数据。你仅仅输入被谨慎思考过的一组信息,希望它能够学习并拓展,得到比人类掌握的更多的信息。


有意义的机器学习来自于不同的数据


以下是为希望搭建有影响力、有价值的机器学习应用的公司提出的三点建议:


  • 1.成功的AI在于与众不同的数据。在你的竞争对手都已经掌握的数据上你是得不出什么新颖信息的。审视企业内部,找出只有你们知道并理解的信息并以此创建一个独特的数据集。机器学习算法确实需要大量的数据支持,但这并不意味着模型需要考虑大量变量。你应当把关注点放在企业已经具有独特之处的数据上。

  • 2.有意义的数据比全面的数据好。你可能就某问题上拥有大量详尽数据,但它们可能压根没什么用。如果你的公司根本不会在决策过程中随时使用这些信息,那这样的数据八成对机器学习也没有什么价值。专业的机器学习工程师会询问许多困难的问题来找出什么才是真正重要的领域,以及那些领域将如何对该应用程序输出结果产生影响。如果这些问题对你太难了,那么你并没有为得到实际价值而仔细思考。

  • 3.应当从你已知的信息出发。最善于利用机器学习的公司会从一个独特的视角出发,来找到与他们重要决策最为相关的因素。这将会指导他们去收集何种数据以及使用何种技术。就基于你们团队已经拥有的一部分知识之上进行拓展这个问题来着手是比较简单的,这也将为你企业创造更多价值。


很明显这个时代已经是“软件吃掉了整个世界”了(这个形容来源于软件工程师Marc Andreessen)。但它们依然很饥饿!软件们需要一份包含崭新数据与科技的食谱来持续创造价值。


没有人希望落后于这样的洞察、机器与外部数据的转变。那么,请从内部审视企业开始,去发掘你独特的见解以及你可以而且应该得到的有价值的外部数据来源。通过这些步骤,你才能够发现保持企业竞争力的相关洞见。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/492146.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

实验五 — — Java网络编程及安全

java的第五个实验——Java网络编程及安全 北京电子科技学院 实 验 报 告 课程:Java程序设计  班级:1352  姓名:林涵锦  学号:20135213 成绩: 指导教师:娄嘉鹏    实验日期&…

Viola-Jones人脸检测详解

在人脸检测中,Viola-Jones算法是一种非常经典的算法,该算法在2001年的CVPR上提出,因其高效快速的检测而被广泛使用。 这个算法用来检测正面的人脸图像,对于侧脸图像的检测不是很稳健。 算法可以被分为以下几个部分: …

中国的高铁世界第一,为何汽车却和德国、日本差距很大?

来源:中国经济大讲堂摘要:靠引进技术发展,可以换来制造技术,建成一定规模、一定水平的体系。但我们在抓住机遇、引进技术发展的同时,或者发展的后期,等我们有了市场,有了钱之后,应该…

硬核干货|揭示波士顿动力机器人背后的专利技术(上)

来源:超凡知识产权,机器人大讲堂整理发布摘要:如果说在腿足机器人领域里,有一个让人闻之色变的变态企业,那就非波士顿动力莫属了。深耕几十年的技术积累加上“不谙世事”的科研态度,使得BD一直保持在腿足机…

(Python+Tensorflow)编程踩坑集锦

(PythonTensorflow)编程踩坑集锦 1 开发环境安装 推荐视频:https://www.icourse163.org/learn/PKU-1002536002?tid1452937471#/learn/content?typedetail&id1229556595&cid1246770451&replaytrue 1.1 Tensorflow2安装过程(Win10平台&am…

复盘亚马逊从优秀到卓越的24年

来源:方证证券4月18日,据报道,亚马逊公司计划在今年7月中旬关闭其在中国的本土电商业务,将业务重点转移至更有盈利空间的海外购和云服务上。对此,亚马逊方面4月18日回应澎湃新闻记者称,“明确的是&#xff…

深度!移动机器人(AGV)产业链全分析

来源:广证恒生、乐晴智库精选产业链:下游需要求旺盛带动下游产业链发展 移动机器人(AGV)是工业机器人的一种。它由计算机控制,具有移动、自动导航、多传感器控制、网络交互等功能,在实际生产中最主要的用途是搬运,可以…

英国前首相:为什么欧洲没有诞生互联网巨头?

David William Donald Cameron(戴维威廉唐纳德卡梅伦)见面会现场来源:世界科技创新论坛英国当地时间2019年4月12日,世界科技创新论坛伦敦峰会成功举行,本次峰会特别邀请了出身牛津大学、英国近两百年历史上最年轻的首相…

IIS解决 上传文件大小限制

目的&#xff1a;通过配置文件和IIS来解决服务器对上传文件大小的限制 1&#xff1a;修改配置文件&#xff08;默认为4M 值的大小根据自己情况进行修改&#xff09; <httpRuntime maxRequestLength"2048000" /> 2&#xff1a;修改IIS配置 打开C:\Windows\Syst…

脑内世界模型:脑科学基础上的意识问题哲学解说

来源&#xff1a;《华侨大学学报》哲学社会科学版2018年第5期作者&#xff1a;方圆&#xff08;中国科学院大学人文学院博士后研究人员&#xff09;本文旨在以当今时代脑科学研究结论为基础&#xff0c;在哲学层面回答“意识是什么”这一问题&#xff0c;并试图给出一种在科学与…

直击5G的机遇与挑战,全新商业模式、规模化经济效益、最新技术进展…全解读...

来源&#xff1a;TechRepublic、物联网智库编译摘要&#xff1a;报告指出&#xff0c;5G将改善用户体验&#xff0c;带来新的应用以及新的商业模式&#xff0c;产生显著的经济效益&#xff0c;但同时&#xff0c;5G的发展也面临着许多不可避免的挑战。毫无疑问&#xff0c;5G是…

simulink仿真学习(实现半波整流、方波输出) day1

** simulink仿真学习常用模块及具体案例实现&#xff08;第一天&#xff09; ** simulink简介 Simulink是美国Mathworks公司推出的MATLAB中的一种可视化仿真工具。Simulink是一个模块图环境&#xff0c;用于多域仿真以及基于模型的设计。它支持系统设计、仿真、自动代码生成…

深度报告解密华为汽车业务!布局三大领域,对标世界级Tier1

来源&#xff1a;智东西摘要&#xff1a;华为进军汽车电子领域&#xff0c;定位世界级Tier1供应商。汽车电子产业链 Tier1 系统集成厂商目前处于国际寡头垄断的市场格局&#xff0c;全球前十大汽车电子供应商拥有 70%市场占有率。即使国内市场也被博世、大陆、电装等国际 Tier1…

simulink仿真学习(关系运算及逻辑模块、离散时间积分模块)day2

1.关系运算模块&#xff08;应用实例&#xff09; 关系运算分为单目运算和双目运算&#xff0c;单目运算左侧输入为一个变量&#xff0c;双目运算左侧输入为两个变量。输出可能逻辑真或逻辑假。其中&#xff0c;逻辑真为1&#xff0c;逻辑假为0。 下图为双目关系运算的逻辑关…

保研之旅(中科院空天院、武汉大学、华南理工大学、 北京理工大学、中科院国家空间科学中心)

保研之旅&#xff08;总结过往&#xff0c;启程未来&#xff09;目录个人背景5月 中科院空天信息创新研究院信息方向7月 武汉大学测绘遥感信息工程国家重点实验室7月 北京理工大学雷抗所7月 华南理工大学电子信息学院7月中科院国家空间科学中心往年去向最后结语目录 个人背景 …

这5家纳米技术公司正在推动医疗检测的变革

来源&#xff1a;资本实验室纳米技术自发明已来&#xff0c;已经在多个领域得到应用。特别是在医疗领域&#xff0c;纳米医学已经成为现代医疗的一个重要发展方向。目前&#xff0c;纳米技术已经成功地用于各种疾病的检测与治疗&#xff0c;美国FDA也已经批准了超过60种含有纳米…

simulink学习仿真(微分模块、传递函数模块使用、波特图频率特性)day3

1. 微分模块使用及举例建模 大多数物理系统可以用微分方程来描述&#xff0c;因此可以用连续系统模拟。最简单的模型为“线性模型”和**“定常模型”**。 在Simulink中&#xff0c;用来模拟连续系统的模块有四种&#xff1a;增益模块、求和模块、微分模块、积分模块。另外&am…

斯坦福大学的产学研之路

来源&#xff1a;老钱文集摘要&#xff1a;新技术和新的商业模式随时都会产生&#xff0c;但是&#xff0c;只有当它们成为产品后&#xff0c;才能改变人们的生活并以此获利。一个新生产业需要有斯坦福这样的孵化器。发明创造遍布世界&#xff0c;但硅谷仅此一家。那是因为&…

2021年中国IT服务人才供给报告(需求与挑战并存)

过去五年&#xff0c;移动互联网蓬勃发展&#xff0c;但自从去年的疫情黑天鹅事件爆发之后&#xff0c;传统行业受到前所未有的冲击&#xff0c;而互联网行业依旧在迅猛发展&#xff0c;尤其在电子商务、游戏等远程服务&#xff0c;更是日进斗金。未来IT行业又会如何变化呢&…

经济学人: 低调应用, 高调回报, 亚马逊才是AI技术最大受益企业

来源&#xff1a;经济学人编译&#xff1a;机器之能 张玺亚马逊六页会议备忘录举世闻名。公司高管必须每年写一篇商业发展规划。鲜为人知的是&#xff0c;这些备忘录上有一道必答题──机器学习的应用路径&#xff1f;据亚马逊的经理们透露&#xff0c;像「应用不多」这样的反馈…