谷歌用AI研发「乒乓球机器人」,4分钟对拉300多次,还能指哪打哪!

一个人怎么练习乒乓球?或许这事你可以问问谷歌。

最近,谷歌又玩新花样,这回是乒乓球机器人AI 项目,号称和人类对战时能够连续接球340次?!

要知道,让解说员激动到破音的「乒乓球史上最疯狂一球」——许昕和朱霖峰超级对拉名场面也就止步于 42 板。

fb2f06f0ac43c6da3362d6ef19974655.gif

裁判:你不要过来啊啊啊。。。

在乒乓球比赛中,首要的就是速度和精度,这对学习算法提出了很高的要求。同时,这项运动具有高度结构化(具有固定的、可预测的环境)和多智能体协作(机器人可以与人类或其他机器人一起对打)两大特点,使其成为研究人机交互和强化学习问题的理想实验平台。

谷歌的机器人团队就建了这样一个平台来研究机器人在多人、动态和互动环境中学习所产生的问题,分别是Iterative-Sim2Real(简称i-S2R)GoalsEye。

用模拟器与人类合作进行游戏

i-S2R作为一种打造 AI 的方式,目的在于打造一套可应对人类快速且不可预测行为的机器人系统,借助虚拟或模拟的环境,来训练机器学习模型,再从模型运用知识到真实世界中,这样可以大幅缩短训练时间。


fe39a995d9243c019c998384167dd56c.gif

人与机器人对打 4 分钟,来回多达 340 次

虽然这握拍姿势略显僵硬,但接球可是稳得一批,你来我往配合的还挺有模有样~

aec93c6d9d8935a395ca23c238c33764.png

其实在此之前就已经有乒乓球机器人的身影,比如和邓亚萍老师对阵的“庞伯特”,面对邓亚萍老师的高速球、弧圈球,它都能够及时调整自己的策略,灵活变化的同时它还能找到一些致胜点,引来邓亚萍老师赞叹连连。

81580ca11aa9eac15dc51f968ed487dc.gif

那么谷歌这次推出的“乒乓球机器人”是如何精准学习人类行为的呢?

学习人类行为模型:破解“先有鸡还是先有蛋”

让机器人精准学习人类行为模型可没那么容易。

首先,想要让机器人学会与人类互动,就需要有人类的行为模型;然而,想建立人类的行为模型,就需要人类先与机器人进行互动。

15c2cd993b5d99754afcb8095a330bea.png

为了搞清楚这个“蛋鸡难题”,i-S2R 使用人类行为的简单模型作为近似起点,并在模拟训练和现实世界部署之间交替进行。在每次迭代中,人类行为模型和策略都会被细化。

虽然一开始AI的学习情况并不咋地,但随着人机对战次数和AI收集到的数据成正比增加,其准确性也自然随之upup↑↑↑

8ad6d4ff8501d5844cc9c64d0069a182.gif

i-S2R 方法论

为了评估 i-S2R谷歌搞了个实验,他们把玩家类型进行了细分:初学者(占 40% 的玩家)、中级(占 40% 的玩家)和高级(占 20% 的玩家)。

1d0c38e8b1250e57a65ec42ef208d410.png

按玩家类型划分的 i-S2R 结果

实验结果显示,对于初学者和中级玩家(占 80% 的玩家),i-S2R 的表现都明显优于 S2R+FT(sim-to-real plus fine-tuning)。

除了i-Sim2Real这种模拟与现实交替进行的方法,谷歌还公布了只使用现实的数据学习的方法,即GoalsEye项目。

GoalsEye目标:“指哪打哪”

GoalsEye结合了行为克隆技术(behavior cloning techniques)来学习精确的目标定位策略。


e246c9ff735c2a9613c2d0567355081e.gif

GoalsEye 策略将球返回到不同位置

粗暴地来说就是:打准就完了。

081e9b8685eebf0e2b548f65c9ae0269.png

研发团队为实现机器人精准的效果,他们还采用了 LFP(Learning from Play)、GCSL(Goal-Conditioned Supervised Learning)。

945e8a0b197c12f85da5e50b7cdba12a.gif

瞄准直径为 20 厘米的球门(左)的GoalsEye 策略/瞄准同一目标的人类玩家(右)

在最初的 2480 次演示中,谷歌的训练策略仅在 9% 的时间内准确地击中半径为 30 厘米的圆形目标。在经过了大约 13500 次演示后,小球达到目标的准确率上升到 43%(右下图)。

06f8f61444b6c80ad5eae1b3f3204ad5.png

看到这里,俺只想期待一下子让这个机器人和咱们的乒乓男团一决高下。

8c2a714b0f3980f9cf5e731303c8d613.png

不过很遗憾,谷歌表示,“乒乓球机器人”只是为了AI与人类的“合作”,并非为了击败人类。

不过,谷歌还是留下了一丝悬念,他们补充道,“以AI成长的速度来看,它将很快成为专业选手。”

话不多说,关于这两个项目的更多介绍,请小伙伴们自行采摘:

Iterative-Sim2Real 主页:https://sites.google.com/view/is2r

GoalsEye 主页:https://sites.google.com/view/goals-eye

排版 | 麦子

-----------------END-------------------

2717656ff85baf91a7f0ba59573d03b0.jpeg

更多精彩

*最新男团舞!波士顿动力机器人模仿动作惟妙惟肖,视频联动现代汽车发布

*无需气源系统,10kg负载,这款电动真空执行器怎么做到的?

*首次公开,云深处实现机器狗在未知环境下的全自主协同搜索

*沃尔玛收购Alert Innovation,三维移动机器人亮相,要真正实现新零售?

*出货量首超ABB,国产第一,埃斯顿到底牛在哪?

*否定配送机器人?亚马逊放弃探索Scout

*人民日报:机器人产业发展日新月异,奋进十年,新时代画卷已开启

*家用清洁机器人有没有未来?

*融资月报 | 中国机器人行业9月融资事件盘点

*融资金额频创新记录,中国eVTOL扶摇直上,指日可待!

*马斯克「造人」首秀,2万美元以下的机器人3年内「量产」?

*江南大学团队提出新方法,让微型机器人实现精确路径跟踪控制!

*大连理工大学团队实现「线驱动连续型机器人多模态感知」登国际权威期刊

*日本电气通信大学新型「自适应肌电假肢」问世,不训练就能拾取物体!

*全球首个能“生长”出新身体的软体机器人!只需光和液体,受植物和真菌启发

*协作机器人头部厂商节卡机器人发布焊接工艺包&一站式解决方案 “0”门槛实现焊接自动化

*史河机器人牵头制定中关村标准,助推先进技术规范化应用

*加州大学联合中国台湾研发「振动吸附式爬壁机器人」,可边爬行边吊装可乐

*用猪皮和磁铁制作“毛毛虫”机器人,可携带药物精准送入人体,48h内完全降解

*双足机器人界“博尔特”!百米奔跑仅用24.73秒创吉尼斯世界纪录

加入社群

欢迎加入【机器人大讲堂】读者讨论群, 共同探讨机器人相关领域话题,共享前沿科技及产业动态。

教育机器人、医疗机器人、腿足机器人、工业机器人、服务机器人、特种机器人、无人机、软体机器人等专业讨论群正在招募, 关注机器人大讲堂公众号,发送“ 交流群 ”获取入群方式!

招募作者

机器人大讲堂正在招募【兼职内容创作者】,如果您对撰写机器人【科技类】或【产业类】文章感兴趣,可将简历和原创作品投至邮箱: LDjqrdjt@163.com  

我们对职业、所在地等没有要求,欢迎朋友们的加入!

7e9bfc55fcb182bd4e5cdceb6241a103.png

75579cc660011ddc2f12a7314b8448cd.gif

看累了吗?戳一下“在看”支持我们吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481434.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【网络搜索】学习资料

文章目录1.综述2.相关技术3.课程4. 论文4.1综述召回预训练4.2 相关模型及论文5.书6. 博客6.1 电商搜索QP:Query Processor相关性1.综述 微软综述视频,较老但不过时 2.相关技术 相关技术目录 3.课程 北邮《网络搜索原理》2020 4. 论文 sigir 4.1综…

论文新鲜出炉 - 数学家张益唐攻克 Landau-Siegel 零点猜想(2022-11-05)

来源:北大大纽约校友会感谢钱朝晖师兄、贾德星师兄的分享。张益唐老师厉害,出来了!虽然还有待数学权威机构认定,但以张老师的性格,没有攻克他不会轻易公开。看了一下PDF时间戳,是昨天的:2022-11…

神奇!一篇不足700字的论文,竟然能发表在Science上

来源:彭聃龄科学网博客 作者:彭聃龄(北京师范大学教授)文字:南方配图:南方排版 :南方一篇不足700单词的文章为什么能发表在国际顶级期刊 Science 杂志上?刊登在 Science 上的这篇文…

【搜索/推荐排序】FM,FFM,AFM,PNN,DeepFM:进行CTR和CVR预估

文章目录1.FM1.1代码-是否点击预测效果和参数量级1.3 和其他模型的比较SVMMF2. FFMone-hot的比较eg训练注意事项效果和参数量级实现3. AFM4.FNN/PNN4.1 FNN4.2 PNN5. DeepFM与Wide&Deep比较与NFMFM 本来就可以在稀疏输入的场景中进行学习,为什么要跟 Deep 共享稠…

科学家首次3D生物打印出血管化肿瘤,并成功使用免疫疗法治疗

近些年,癌症治疗领域不断取得了突破性进展,但仍缺乏标准化和生理相关的体外测试平台。一个关键性障碍是肿瘤微环境和免疫反应之间复杂的相互作用。因此,该领域研究人员不得不依赖临床试验来测试治疗效果,最终限制了抗癌治疗药物的…

【搜索/推荐排序】总结

文章目录1.进化路线2. 公式比较1.进化路线 LR:没有较叉项->FM:LR交叉项,一个特征一个向量->FFM:一个特征对每一个field(属性名)的交互有一个向量,一个特征有一个特征矩阵。->AFM:每个内积都有一个权重&#…

人工智能帮助揭秘生物衰老的原理

编辑 | 萝卜皮年龄是流行疾病和死亡的主要风险因素。然而,人们对与年龄相关的生理变化和寿命之间的关系知之甚少。新加坡 Gero PTE 公司的研究人员结合分析和机器学习工具来描述大量纵向测量中的老化过程。假设衰老是由有机体状态的动态不稳定性引起的,该…

DALL-E 2的错误揭示出人工智能的局限性

OpenAI的文字图像转换器与文本、科学和偏见作斗争。在2022年4月,人工智能(AI)研究实验室OpenAI继2021年推出的DALL-E后,又推出了DALL-E 2。这两个人工智能系统都可以根据自然语言的文本描述来生成令人惊奇的图像,包括照…

【搜索/推荐排序】NCF,DeepCross,Deep Crossing,高阶:AutoINt,AFN

文章目录0.交叉特征1.NCF1.1 问题:基于FM的问题问题动机:神经网络替代点积1.2 NCF模型图1.3代码2. Deep Crossing:微软:ResNet3.Deep&Cross4. AutoInt(19)摘要贡献相关工作:模型结构优缺点实…

中国指挥与控制学会关于申请加入《城市大脑系列建设标准规范》第二批团体标准参编单位的通知...

来源:中国指挥与控制学会各有关单位和相关专家:2022年04月14日,中国指挥与控制学会组织召开立项评审会,与会专家审议通过了8个相关团体标准的立项申请。2022年9月1日,《城市大脑系列建设标准规范》首批三项团体标准《城…

【搜索/推荐排序】Pairwise:BPR

1.BPR 1.1 做法 构建样本对假设背后是某个常见模型:如MF排序对成立情况下倒推U/V向量,计算UV乘积,得到完整评分矩阵 矩阵分解:XˉWHT\bar{X}WH^TXˉWHT 贝叶斯:P(θ∣>u)P(>u∣θ)P(θ)P(>u)P(\theta|>_…

见证历史!数学家张益唐北大讲座:本质上已证明“零点猜想”,111页论文已公开...

来源:AI前线整理:凌敏有数论学者表示,张益唐有关朗道 - 西格尔零点猜想的论文结果意义重大,使得以前的很多结果从假设性结果变成了确定性结果。张益唐在北大作“零点猜想”学术报告11 月 8 日上午 9 点,数学家张益唐在…

【搜索排序】召回综述Semantic Models for the First-Stage Retrieval: A Comprehensive Review

Semantic Models for the First-Stage Retrieval: A Comprehensive Review 文章目录管道语义模型1.召回形式化1.0 Indexing MethodsThe inverted index倒排索引approximate nearest neighbor (ANN)1.1 classical term-based retrieval methods,VSM概率方法BIM二元独立模型语言模…

Science 封面 4 文连发:大脑分区不是功能关键!智慧从脑区间连接中诞生

来源:深度学术搜索是时候重新认识一下我们大脑的运行原理了!最新一期顶刊Science,以特刊的形式连发 4 篇论文,剑指同一核心要点:大脑各种功能的关键,并不在于各脑区独立完成特定功能,而在于不同…

【信息检索导论1】布尔模型

1.Information Retrieval 定义: Information retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) that satisfies an information need from within large collections (usually stored on computers). web search…

一个基于 Transformer 的深度学习架构,在基因调控中组蛋白代码的定量破译方面性能超群...

编辑 | 萝卜皮通过组蛋白修饰对转录控制的定量表征受到许多计算研究的挑战,但其中大多数只关注启动子周围的狭窄和线性基因组区域,留下了改进的空间。韩国首尔大学的研究人员提出了 Chromoformer,这是一种基于 Transformer 的三维染色质构象感…

【搜索排序】预训练综述Pre-training Methods in Information Retrieval

文章目录相关性效率系统预训练word embeddingtransformers2. 召回阶段2.1 Sparse Retrieval Models2.2 Dense Retrieval Models。2.3 混合方式3.re-rank阶段4. 其他组件4.1 在query理解上4.2 在doc理解上:未来工作数据集数据集中排行榜信息检索中的花式预训练综述&a…

i-Refill | 张益唐:虽未实现大海捞针,但摸透了整个海底的情况

来源:IDG资本#i-Refill欢迎回到本周的i-Refill! 我们知道,黎曼猜想是当代数学领域内最重要的待解决问题之一,很多深入和重要的数学及物理结果都将在它成立的大前提下得到证明。10月中,我们围绕数学家张益唐承认已攻克黎曼猜想的弱…

【搜索排序】(ReRank)A Deep Look into Neural Ranking Models for Information Retrieval

文章目录数据集3. 同一框架4. 模型结构-对称与非对称对称结构:s,t可互换siamese networksSymmetric interaction networks,非对称结构query splitdocument splitJoint split,one-way attention mechanism基于表示的模型和基于交互的模型representation-focused arch…

2022全国市域治理与城市大脑峰会开放报名

来源:中国指挥与控制学会未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术…