人形机器人,穷途末路还是光明未来?

640?wx_fmt=jpegwebp

来源:任赜宇的知乎专栏

摘要:今年 11 月初在北京召开的 IEEE/RAS Humanoids 会议中,作者去听了这样一个 Workshop: Humanoid Robotics: Dead-end or Bright Future? (人形机器人,末路还是光明的未来?) 再结合当前的形势,比较有感触,这里分享给大家。


01

整体发展情况


约莫从 18 年下半年开始,相比较于人形机器人火热发展的 2014-2016 年,现阶段的发展可以说是进入了螺旋式上升发展中的“平缓期”,即触及到了天花板。典型体现为:近年来全球范围内人形机器人相关的科研项目和经费 (Funding) 较少,重灾区是欧洲:


先谈谈欧洲,欧盟最后一个人形机器人项目为 CoGiMoN,始于 2015 年 3 月,将在明年结束,从 15 年到 18 年这段时间内,就没有大型的欧盟人形机器人相关项目 (Funding) 再出现:


欧盟 CoGiMoN 项目: European Community's Horizion 2020 robotics program

(链接:https://cogimon.eu/news?page=4)


再看看引领世界科技的美国,近两年学术界鲜有亮眼的新型人形机器人面世,当年可以说与波士顿动力齐名的 SCHAFT,也因找不到下家接盘而被谷歌母公司 Alphabet 关闭:


Google is closing its Schaft robotics unit after failing to find a buyer

(链接:https://techcrunch.com/2018/11/14/google-is-closing-its-schaft-robotics-unit/?guccounter=1)


著名的 UCLA RoMeLa 很有意思地通过网络捐赠的方式筹集大人形机器人的项目经费

(链接:https://spark.ucla.edu/project/11565)


日本算是在当前不济大环境中,人形机器人还在蓬勃发展的一支力量。今年 AIST 发布的 HRP-5P 算是科研界 18 年最亮眼的人形机器人了 (封面图),相关的视频我会在文末分享给大家。日本情况稍微良好的主要原因在于:日本对于人形机器人有一种特殊的执念(考虑高达 & 新世界福音战士等),再加上其机器人圈子的浓厚底蕴和良好的经济基础。纵使今年 6 月 Honda 宣布关闭 Asimo 项目,但 Honda 还是宣称会坚持人形机器人的研究,只是不再对外使用“Asimo”的名称而已。


国内情况的话,因为很多都涉及军工和保密项目,我也不是圈子里的人,整体情况的了解可能会有一些出入。据我所知,近些年来比较活跃的专注于人形机器人的高校包括北理工,哈工大和浙大,但都面临着一些技术瓶颈难以突破的问题。


02

面临的问题和挑战 


1.缺钱


首当其冲的原因还在于经济基础,人形机器人的研发是相当烧钱的,涉及到高精端硬件的成本,并且由于涵盖的学科方向超多,一批高学历、有经验的科研、工程队伍的人力成本也是不容小视的。全球经济衰退,属于"奢侈品"的科研经费首当其冲,以欧盟为例,当整个科研经费的大蛋糕“缩水”时,在科研经费的分配上就会显得更加谨慎和保守——即更青睐于有希望技术突破性的学科,反之现阶段难以突破技术瓶颈且难以满足公众期望的人形机器人,就很难在和其他学科的竞争中胜出。同时也没有过硬的实际市场刚需,投资人也不会轻易出这份大钱。


 2.技术瓶颈 (w.r.t 市场需求)


说到技术瓶颈,我们就直接来谈代表人形机器人领域技术巅峰的波士顿动力 (Boston Dynamics)。


这里我们需要反问自己,是什么样的技术瓶颈?


这个瓶颈相应的参考坐标是什么?我觉得要把这个瓶颈的参考坐标定在实际的市场要求上——即实际的市场要求人形机器人具备什么样的技术指标。


客观地来讲,波士顿动力的 Atlas2 所展现出来的性能,已经能够足够好地解决人形机器人基本的动态运动性能问题 (Dynamics Locomotion):


640?wx_fmt=gif


但我认为波士顿动力实际上面临的挑战更大,这里斗胆地去评判一下 Atlas2 离真正的市场应用还差些什么:  


从 Demo 来看,没有看到相关惊艳的手部抓取 (Grasping) 操作——这对于机器人进入实际应用十分重要,动态的步行只是体现了机器人的移动能力,而操作性能就直接决定了机器人能够去做什么;


从特定而机械的应用场景到复杂而灵活的真实生活,即从“弱人工智能”到“强人工智能”。所包含的方向太多:Perception, Learning, Computer Vision etc.. 这些都是离在 Atlas2 上实际落地应用有很大一段距离;


找准实际的市场需求。什么样的应用场景是轮式、四旋翼和四足机器人没办法替代的,坦白来说,作者能想到的只有替代人的伴侣机器人或者性爱机器人 (请参考绫濑遥的《我的机器人女友》,而非某宝上的充气娃娃)。这个对技术上的要求会更高还涉及众多伦理问题;


合理的价格和可靠性。以当前的技术水平来看,Atlas2 的实现成本无异于天价,从 Raibert 透露出他们经常忙于修理机器人的状况而言,可靠性离实际的市场应用还有一定的距离;


......


就更不要去谈除波士顿动力以外的实验室和公司还在着手解决人形机器人的基本运动性能问题,这种技术上离实际市场要求的性能差距实在太大,瓶颈太难突破。


3.公众期望过高


太多的科幻电影和失败了 20 次只成功 1 次的学术 Demo 把公众对于人形机器人的期望拉得太高,远远高于 State of Art。


可以说在 2015 年 Darpa Robotics Challenge (DRC) 时期,无论是公众、学界和业界都对人形机器人的关注度和期望度达到了顶峰,DRC 也为推动人形机器人的发展起到了巨大的作用。


但如果我们换一个角度来看 15 年的 DRC,就会发现人形机器人的技术水平还是非常初级的:首先是决赛成绩的前几名几乎都较为"功利"使用了四足或轮式的方案,而非严格意义上的双足人形机器人,如下:


640?wx_fmt=jpegwebp

从左至右为 2015 DRC Final 的第 1-3-4-5 名,可以观察到非严格意义上的双足人形机器人


再其次是机器人的各种"摔倒集锦":  

2015 DRC Final 摔跤集锦


以这样的视角来看,即使是在相对固定的特定场景任务中,双足人形机器人的表现仍然是十分孱弱的。很自然的,很多来自其他领域的科研项目评审委员会或者投资人,也是属于普罗“大众”的一员,对人形机器人未来的发展前景产生质疑无可厚非——我们明明只有 70 分的水平,通过项目上的努力推进到 75 分,而大众错误地估计我们已经有了 80 分的实力,希望我们做到 90 分的水平,这 75 分与 90 分的差距带来了极大期望上的落差。


03

作者的态度


首先老生常谈来阐述一下做人形机器人研究的意义:


一方面,人形机器人在硬件本体设计、驱动器性能、运动控制上的技术要求高,相关技术很容易转化到其他自动化领域,诸如工业机械臂,四足机器人,AGV 等;


另一方面,由于其拟人性 (Anthropomorphic),人形机器人是未来最有潜力融入人类的生活的机器人,考虑使用为人类设计的工具和进入为人类设计的生活和工作空间。


对于人形机器人的未来,我们可以换个视角来宏观地参考汽车工业发展的时间线:


640?wx_fmt=jpegwebp

早期汽车发展历史

 (The evolution of automobile at early stage )


从上图中我们可以看到,从第一台蒸汽动力车辆问世到福特 T 型车从流水线量产走向市场,足足花了 129 年的时间 (1779-1908),而驱动的革新,即从蒸汽机到柴油发动机就用了足足 103 年的时间 (1779-1882)。对于人形机器人,会不会有比当前电机 (Elector-Magnet) 和液压 (Hydraulic) 驱动,更为高效、紧凑、可靠,同时具有更高输出能量密度和更低成本的新型驱动方式出现,我们很难去做预测,谁也不清楚。


虽然波士顿动力的 Atlas2 所使用的液压驱动方案展现了很强劲的运动性能,但现有技术下的实现难度和成本还是过高了,能量效率也是个有待解决的问题,因此还没达到作者脑海中最为理想的驱动方式,因此作者认为当前人形机器人还处在等待驱动方式革新的阶段。


无论如何,任何技术的发展都不太会存在断崖式的突破,对于"人形机器人,穷途末路还是光明未来?" 作者也是相当迷茫的。


悲观来说,如果缺乏像尼古拉斯·特斯拉这样天才人物的出现而带来革命新的技术突破,很有可能我们这代从业者都是人形机器人发展进程中的一粒尘埃。短期的将来(未来 10 年)作者对学术界人形机器人的研究尤其悲观,太多的时间都给了真的不太有用但必须要有的 paper 和向人”伸手要钱“的 proposal 之中,唯一的希冀还是在 Marc Raibert 的波士顿动力。


最后再分享一下开头提到的 IEEE/RAS Humanoids 的 Workshop (Humanoid Robotics: Dead-end or Bright Future?) 的一些关键结论给大家:


我们花了将近 30 年的时间去开发适用且可靠的商用力矩控制的机械臂, 人形机器人无疑要复杂得多,并且包含更多的技术方向,因此可能需要更长的时间。


但是,如果需要的时间是 100 年,那可能毫无意义,因此,当涉及人形机器人的应用时,我们首先应该采取较小的步骤(即从一个很小的突破口出发,找寻非常具体和有限的应用 / 商业模式),以便能够实现至少一些初步的商业成功和盈利。 如果没有,社会和创始机构可能会放弃并长期停止对人形机器人研究的支持。


飞机制造业可能是近期人形机器人应用的一个很好的落地方向,因为这种行业需要复杂的操作,并且相对富裕,以至于能够负担得起这样的机器人。 另一个很好的落地场景是娱乐业和人形机器人作为玩具的应用。


PS: 作者认为人形机器人在飞机制造业、娱乐业和作为玩具的需求现阶段都是”伪需求“。


附上今年 AIST 发布的 HRP-5P 的视频 Demo :

 

HRP-5P 重物搬运与相应操作


上述视频的整个过程是没有人工的遥操作 (tele-operation),完全基于机器人的自主操作 (autonomous) 。据 AIST 的人讲,这段 34s 的 Demo 前后调试了一年多之久。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/492840.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

进入opencv内部函数调试

主要问题参考:http://blog.csdn.net/daven172/article/details/45769129 这篇博客。 我们进入opencv内部函数进行调试,主要是设置断点,然后按下F11键,VS2013编译器会自动跳转到opencv内部的函数。 如果我们进入内部的函数&#xf…

javascript高级程序设计-Array迭代及归并

迭代方法 every() 如果该函数对每一项都返回true,则返回true,否则返回false。 var numbers [1,2,3,4,3,2,1]; var everyResult numbers.every(function(item,index,array){return (item > 2); }); alert(everyResult); //result为false some() 如…

全球自动驾驶政策概况及特征研究

来源:《中国信息通信研究院CAICT》近年来,美、欧、日等发达国家和地区将自动驾驶技术作为交通未来发展的重要方向,在技术研发、道路测试、标准法规、政策等方面为自动驾驶及其载体——智能网联汽车的发展提供政策支持,加快自动驾驶…

Android开发记录(转)

一、Android模拟器相关 1. Android模拟器安装 Market 模拟器默认没有安装 Market,看到网上有较为复杂的安装方法,也有1个简单的,试了简单的,在 Android2.2 模拟器下试过是OK的,简单的方法如下:1) 下载2个文…

高斯赛德尔迭代法

我们在求解矩阵时,有很多种方法,其中当矩阵是大型稀疏矩阵(矩阵中有大部分元素都为0)时,我们可以用迭代法求解。 关于该方法的思想和定义,请参考如下博客: http://www.doc88.com/p-6953977164…

中心化,去中心化?关乎互联网未来命运的重要选

作者:刘锋 计算机博士 《互联网进化论》作者前言:不知不觉互联网的未来发展出现了分歧,当Facebook、谷歌等互联网巨头越来越强大的时候,反弹的声音也越来越大,人类社会的有识之士希望解决这个问题,由此导致…

Arcgis for javascript不同的状态下自定义鼠标样式

俗话说:爱美之心,人皆有之。是的,没错,即使我只是一个做地图的,我也希望自己的地图看起来好看一点。在本文,给大家讲讲在Arcgis for javascript下如何自定义鼠标样式。 首先,说几个状态。1、鼠标…

泊松融合

泊松融合是一种很重要的图像融合算法,该算法选自论文([Poisson Image Editing]2003年发表),关于算法中的很多基础概念可以参考如下博客: https://blog.csdn.net/hjimce/article/details/45716603 https://blog.csdn.…

Facebook :AI 年度总结来啦

来源:AI 科技评论摘要:最近,Facebook 做了一份 AI 年度总结,详述了他们过去一年在 AI 上所做的代表性工作。在 Facebook,我们认为,人工智能以更有效的新方式学习,就像人类一样,可以在…

select,epoll的比较

机制: select:只支持水平触发(数据不处理完无限通知) epoll:支持水平触发和边缘触发(仅通知一次) 单进程监控FD个数 select: 由FD_SETSIZE设置,默认值是2048。在大量连接的情况下明显不足。 epoll&#xff…

积分图像

积分图像的大小尺寸与原图像 I(x,y)的大小尺寸相等,而积分图像在(x,y)处的值等于原图像中横坐标小于等于x并且纵坐标也小于等于y的所有像素灰度值之和,也就是在原图像中,从其左上角到(x,y)处所构成的矩形区域内所有像素灰度值之和。

android如何与服务器交互?

问题描述是用httpclient 还是socket 还是webservice?倒底哪种好用,哪种最常用?有没有好的框架介绍一下?解决方案11.afinal2.volley个人觉得不错的两个框架!当然也可以自己封装。如果对以上两个框架感兴趣&#xff0c…

一文读懂可穿戴技术

来源:传感器技术可穿戴技术(wearable technology),最早是20世纪60年代由麻省理工学院媒体实验室提出的创新技术。利用该技术,可以把多媒体、传感器和无线通信等技术嵌入人们的衣物中,可支持手势和眼动操作等多种交互方式&#xff…

C++函数指针使用总结

一 函数指针介绍 函数指针指向某种特定类型,函数的类型由其参数及返回类型共同决定,与函数名无关。举例如下: int add(int nLeft,int nRight);//函数定义 该函数类型为int(int,int),要想声明一个指向该类函数的指针,只需用指…

使用异或运算交换两个任意类型变量

这篇文章中将使用C语言,实现交换两个任意类型变量的功能.说到任意类型用C让人感觉很难做,如果是C则使用模板函数就轻松搞定: template<class T> inline void swap(T& t1, T& t2) { T tmp; tmp t1; t1 t2; t2 tmp; } 先说下使用^来交换两个整数,其代码…

2019与下一个十年:我们将要放弃的和将要拥抱的

来源&#xff1a;资本实验室2019年&#xff0c;是连接21世纪前两个十年的过渡一年。在金融支付和商业领域中&#xff0c;2019年也有望成为激动人心的一年。在这一年中&#xff0c;每家企业、每个人都需要对过去十年中所追求的创新进行反思&#xff0c;并决定下一个十年前进的方…

C++中虚函数、纯虚函数、普通函数三者的区别

转载自&#xff1a;https://www.cnblogs.com/cj2014/p/7692707.html 1.虚函数(impure virtual)   C的虚函数主要作用是“运行时多态”&#xff0c;父类中提供虚函数的实现&#xff0c;为子类提供默认的函数实现。 子类可以重写父类的虚函数实现子类的特殊化。 如下就是一…

麦肯锡发布调研,揭开“那些引入人工智能的企业都怎么了 ”

来源&#xff1a;亿欧智库摘要&#xff1a;根据麦肯锡的最新调研显示&#xff0c;人工智能技术普遍上得到企业接纳&#xff0c;但仍有不少企业在入门时就面临“不知道咋开门”的状况。新技术带来新问题&#xff0c;企业该如何应对&#xff1f;根据麦肯锡在全球范围内的调研&…

深度学习、图像识别的基本概念

图像识别 图像识别概念&#xff1a; 我们对图像进行一些列的处理&#xff0c;将其有用的信息提取出来&#xff0c;进行划分归类&#xff0c;这就是图像识别。 图像识别目的&#xff1a; 将景物、图像、字符等信息经过预处理&#xff0c;然后进行识别&#xff0c;让计算机具…

PHP-php.ini中文版

今天细看了下配置文件 有很多没用过的 就从网上搜了一篇 常看看 ;;;;;;;;;;;;;;;; 简介 ;;;;;;;;;;;;;;;;; 本文并非是对英文版 php.ini 的简单翻译&#xff0c;而是参考了众多资料以后&#xff0c;结合自己的理解&#xff0c;增加了许多内容&#xff0c;; 包括在原有 php.ini …