AI都会和人类谈判了?Meta AI最新研究登上Science,LeCun称里程碑式成果

59069835f3ac511cf8e1c4cff8898766.png

来源:明敏 羿阁 发自 凹非寺
量子位 | 公众号 QbitAI

AI都学会和人类谈判了?还能成功说服人类听它安排?

话术一流到人类完全分辨不出它是AI。

f12a822aef8fffe58dad4e454d724bf7.jpeg

这就是Meta AI的最新成果——AI模型CICERO(西塞罗),现已登上Science。

aeec05aaa47b0a0f1d1b46b243f14924.jpeg

嗯,就是和古罗马著名政治家、演说家西塞罗同名。

研究人员让这个AI西塞罗隐藏身份加入到一个外交游戏里,82名人类玩家在40场游戏中,都没有怀疑过它其实是个AI。

而且还战绩斐然,全程平均分达到25.8%,是人类玩家平均分的2倍,并且最终排名为前10%

成果一经发布,就在网上引发热议。

有人评价:这意味着AI在最具人类特点的游戏里战胜人类,超乎想象…

e387c57ce8dc00481a65095984b628f8.jpeg

LeCun都称它为:里程碑式的研究!

e28eb8861f301bc1f52b15817e9f5047.jpeg

目前,模型代码已在GitHub上开源。

真有AI纵横家那感觉了

AI唠嗑其实一直都引人诟病,更别提外交这种需要超高话术的场景了。

它需要理解对方的语言、动机,制定自己的话术策略,并调整好措辞。

有时甚至还需要“耍心眼”,故意说一些假话给对方设套。

14439587ac86ff50ceb9fa4b6a0197f7.jpeg

这种超高难度任务,怎么挑战?

俗话说一口吃不成胖子。

Meta AI就想到了先从游戏场景来切入(毕竟AI在玩游戏上是老手了)。

不过和之前棋类或竞技游戏不同,外交游戏并没有那么强的规则性,运筹帷幄、随机应变的环节不少。

实验中用到的游戏是webDiplomacy(以下用“外交游戏”指代它)。

0b3110ac9ba467940563c2cc8b8105f8.jpeg

这款游戏的背景是1901年的欧洲,7位玩家每人控制一个大国,通过相互合作、协商,尽可能地占领更多领土。

西塞罗的核心是由一个对话引擎和一个战略推理引擎共同驱动的。

简单理解,这里的对话引擎和GPT-3、LaMDA类似,战略推理引擎和AlphaGo相近。

77542654cb5009a9eed0e9027fc4d234.jpeg

用到的对话模型,是从一个类似于2.7亿参数的BART模型训练而来。

BART吸收了GPT和BERT各自的特点,它比BERT更适合文本生成的场景,还能双向理解上下文语境信息。

具体来看,研究人员先从互联网上获取文本训练对话模型,然后再在实际的外交游戏场景中微调。

战略推理引擎用到的是一个规划算法(planning algorithm)。

该算法能够基于现况计算出一个最优选择。再通过强化学习训练,惩罚模型做出的“不像人”的策略,以此让模型给出的策略更合理。

毕竟,在外交游戏中是和人打交道,让AI更像人也是最基本的要求之一。

而且强化学习这种迭代式的训练,可以不断改进AI做出的策略预测。比传统方法中常用的监督学习(即打标签的方式)效果更好。

实操中,西塞罗首先会根据目前为止的游戏状态和对话,对每个人的会采取的动作做一个初步预判。

64e1acb849406ab4f97b3ccfe80be7a2.jpeg

接下来,在不断地协商过程中,它都会不断地改进预测,然后使用这些预测为自己和合作伙伴设置一个共同的目标。

aee1646a4f7b6166ca211b1a306e9069.jpeg

其次,它会根据局势状态、对话及其目标,从对话模型中生成几个候选消息,使用分类器等过滤机制过滤掉无意义的,生成最终的高质量输出文本。

99f340c6b70980c63b48786fda939bbd.jpeg

例如,以下图为例,在这一局中,西塞罗扮演“奥地利”。

当玩家“意大利”向它询问意见,自己是否应该攻击土耳其时,西塞罗会根据场上局势——土耳其正在攻击俄罗斯,判断出这是一个两面夹击的好机会,然后劝意大利跟进攻打土耳其。

这一步既建立了与意大利的伙伴关系,又消灭了一个潜在的对手。

26807487a9d972faa66d4145833b8256.jpeg

不仅如此,谈判也是西塞罗的拿手好戏。

这次西塞罗扮演的是“德国”,与玩家“法国”一直在交战。这时法国南部同时受到了意大利的攻击,于是向西塞罗请求和谈。

西塞罗则趁机狮子大开口,要求法国归还侵略的领土,并保证不攻击荷兰。双方在讨价还价中顺利达成了协议。

0c2739f9be8825f3faffad542a498917.jpeg

就像上述展示的例子一样,两个月间,西塞罗共参与了40场外交游戏,与82名人类参赛者交锋。

在每场比赛中,西塞罗都会发送和接收平均130条消息

其游戏水平甚至强过了人类:平均得分是人类玩家的2倍以上,甚至在玩过一场以上游戏的参与者中也能排到前10% 。

网友:虽然它表现好但我很害怕

看完西塞罗在外交上的精彩表现,有网友感慨AI的发展速度:

Deep Blue击败了卡斯帕罗夫,Watson击败了智力竞赛的两位人类冠军,现在轮到Meta AI敲响马基雅维利(近代政治思想奠基人)的大门了。

36944985633fbf2c4b8ba22d7b026a7d.jpeg

还有人表示,这难道是迈向通识语言大模型的第一步吗?

LeCun给出了肯定回复:

至少语言是基于事实的。

9b8a5d5d6b92931cd4179ab593556900.jpeg

不过由于这款外交游戏以尔虞我诈著称,不少人也对此表示担忧:

这是直接鼓励研究人员开发更多擅长骗人的模型。

cc2dd2daed180ca0f52e5e42b2250345.jpeg

有网友就表示,玩这游戏甚至会失去朋友哦。

55cc27007470ca9bad7863e80c33a688.jpeg

而从AI西塞罗的战绩来看,它可以迷惑人类玩家,并且说服人类听从它的策略。

所以有人就表示,这不是AI控制人类的选择乃至生活?

8f465055c2d529ae690047b56561dbc1.jpeg

不过Meta AI表示,AI西塞罗不是全没有失误的。

并且游戏中也还有很多需要和人类协作的环节,西塞罗的表现同样很好。

目前,它还只被放在游戏场景中测试过,并没有尝试过在开放语境下和人类谈判。

参考链接:
[1]https://www.science.org/doi/10.1126/science.ade9097[2]https://ai.facebook.com/blog/cicero-ai-negotiates-persuades-and-cooperates-with-people/[3]https://twitter.com/ylecun/status/1595081004108206088

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

29243122abd411616c69842df7ec7af0.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481375.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

我在 MIT 人工智能研究实验室工作一年学到的

来源:AI科技评论Mike Ferguson ,麻省理工学院大脑和认知科学系 (MIT BCS) 担任研究软件工程师/ML工程师。专门研究 Brain-Score(一种衡量类脑 AI 的工具)。他于 2021 年春季毕业于弗吉尼亚大学,获得计算机科学和应用数…

《科学》重磅:首次实现监测多种神经元间实时毫秒级互动!

*仅供医学专业人士阅读参考大脑的复杂之处在于众多神经元之间的协同作用,若能在同一时间显示不同神经元群体的电活动,那么将大大加深我们对于大脑功能的理解。基因编码的电压指示蛋白(GEVI)是一类在细胞膜电位变化后产生可检测信号…

冯·诺依曼的遗产:寻找人工生命的理论根源

来源:集智俱乐部 作者:东方和尚现在的人工智能研究如火如荼。然而,尽管AlphaGo Zero早已经秒杀人类智慧,但它却是冷冰冰、无生命的机器,因为它缺少一颗热血沸腾的“心”。当我们看到小虫子沿着崎岖的路面爬向食物&…

AI好奇心,不只害死猫!MIT强化学习新算法,智能体这回「难易通吃」

来源:新智元编辑:David【新智元导读】MIT强化学习新算法,根据监督稀疏程度自动调整AI智能体「好奇心」,高低难度任务通吃。人人都遇见过一个古老的难题。周五晚上,你正试图挑选一家餐厅吃饭,但没有预定。你…

2022,青年科学家最关注的基础研究是什么?

来源:科学网编辑:方圆排版:李言文:韩扬眉科学问题,起初由科学家提出,最终被科学家突破,才是一个完美的探索闭环。11月27日,“十大基础研究关键词”在2022年“青年科学家502论坛”上公…

地球能够调控自己的温度,但是……

来源:公众号“原理”地球的历史并非一帆风顺,比如,地球气候曾经历过一些巨大的变化,从全球火山活动,到全球降温的冰期,还有太阳辐射的明显波动。然而,在过去37亿年里,生命的故事却未…

连发Cell,Nature顶级期刊,揭示脊髓和脑干在触摸中令人惊讶的新作用

来源:生物通触觉对我们做的几乎所有事情都至关重要,从家里的日常工作到在可能隐藏危险的陌生地形上导航。触觉对我们做的几乎所有事情都至关重要,从家里的日常工作到在可能隐藏危险的陌生地形上导航。长期以来,科学家们一直想弄清…

2022年度“十大基础研究关键词”在深发布

来源:读特客户端11月27日,“青年科学家50论坛”发布2022年度“十大基础研究关键词”。这些关键词由“科学探索奖”的获奖人提名、投票并经科委会确认。十个关键词,体现出以获奖人为代表的中国杰出青年科学家群体,对未来科技发展的…

“信创”的热火烧到了物联网

资料来源:综合整理自互联网整理发布:物联网智库 导读产业淘沙,市场铄金,蛰伏已久的风口终究要来了。如果说今年有什么板块在下半年异军突起,信创一定榜上有名。在大热赛道表现平平的十月份,信创板块指数累计…

神经网络与图灵机的复杂度博弈

来源:集智俱乐部 作者:东方和尚1931年,天才数学家图灵提出了著名的图灵机模型,它奠定了人工智能的数学基础。1943年,麦克洛克 & 皮茨(McCulloch & Pitts)两人提出了著名的人工神经元模型…

自主可控时代,物联网呼唤怎样的操作系统?

来源:物联网智库作者:Levin导读物联网产业的竞争正在向着生态系统发展,包括互联网巨头和运营商在内的企业都在基于平台,积极布局上游关键技术和下游解决方案。根据工信部发布的数据显示,截至今年8月末,三家…

在不确定的时代,用理性的思考去对抗群体的疯狂

来源:混沌巡洋舰本文整理摘编自《群体的疯狂》 威廉伯恩斯坦著 王兴华译 中信出版集团 2022.11近两个世纪之前,一位年轻的名叫查尔斯•麦基的苏格兰人,以令人难忘的方式同时攻击上帝和玛门。他出生于1814年,是一名颇受欢迎的诗人、…

深度学习的下一个十年,延展基础科学研究变革的「角力场」

来源:AI科技评论在更大的科学命题中,有人找到了更激动人心的原动力。图灵奖获得者、前微软技术研究员 Jim Gray 通过四种范式描述了科学发现的历史演变。从基于经验主义——即对自然现象的直接观察之“第一范式”,到以数据密集型科学发现&…

AI 硬件加速的重大飞跃!可训练机器学习硬件的光学芯片

编辑 | 绿萝根据麦肯锡(McKinsey)最近的一份报告,机器学习应用每年飙升至 1650 亿美元。但在机器能够执行诸如识别图像细节等智能任务之前,必须先对其进行训练。训练现代人工智能 (AI) 系统(如特斯拉的自动驾驶仪&…

机器人自己造自己,究竟是怎么办到的?

来源:AI科技大本营整理:杨阳说起自我创生,首先想到的就是克隆。或许你已经听说过欧洲的小龙虾灾难,因为一只大理石纹螯虾的突发变异,导致的孤雌生殖在极短时间内就能克隆出成千上万只龙虾。虽然说是吃货福音&#xff0…

量子计算和人工智能:应该知道的10件事

来源:中国机器人网近年来,新兴技术变得突出。其中,量子计算具有改变我们世界的独特潜力。量子计算已经显示出有希望的证据,以令人难以置信的方式加速启发式计算。因此,在复杂的解决方案中应用量子计算来解决药物和材料…

用量子计算机创造史上首个虫洞 加州理工学院团队发Nature封面文章

来源:FUTURE远见选编:FUTURE | 远见 闵青云 日前,来自美国加州理工学院的Maria Spiropulu领导的团队使用谷歌的量子计算机对全息虫洞进行量子「模拟」。据称,该研究团队创造了有史以来第一个虫洞。论文作者表示,他们的…

Science Bulletin | 从“网络神经科学”到“网络神经外科”

随着科技进步,人类对大脑的认识不断深入。2004年脑的大尺度网络论述初步形成,2005年脑连接组学的概念首次提出,到2017年Sporns等在Nature neuroscience撰文系统论述,并提出了Network neuroscience的概念。与此同时,欧美…

科幻电影里的机器人假肢已经照进现实

来源:机器人大讲堂编辑:Jack排版:麦子20日晚,在卡塔尔世界杯开幕式上,一个身有严重残疾,胸部以下几乎缺失的卡塔尔人一亮相就赢得全场欢呼。一直以来,人们对坚强不屈的肢体残障人士都深怀敬意&a…

马斯克脑机接口最新演示:猴子学会意念打字,预计6个月内人体试验

来源:文章转载自机器之心(ID:almosthuman2014)在迟到半个多小时之后,马斯克在今日的 Neuralink Show & Tell 演示活动中展示了脑机接口的最新进展。在脑机接口领域,马斯克创办的Neuralink一直走在前列。…