算法、算力与场景,是AI研究的关键要素。AI 对数据要求量极大,否则无法达到人类正确识别的程度。自 AlphaGo 一鸣惊人后,越来越多AI 研究团队意识到,游戏是 AI 的绝佳训练场之一。
游戏推动科技创新上行
一直以来我们很少把活泼轻松的游戏娱乐与严肃严谨的科学探索关联在一起。但是如果我们回顾人类各种职业的发展史,确可以发现游戏与科学研究恰恰有着最密切的关系。种地,捕猎,养牛,抓鱼,在人类最初的职业中,一定没有科学这个职业,只是当人类有了更多的粮食后,无聊之余产生各种游戏。讲故事,赛跑,摔跤,石头剪刀布,数星星,看蚂蚁,这些娱乐后来就分裂成人类的不同职业, 比生产更有趣的活动,譬如讲故事变成了戏剧。赛跑摔跤变成了体育运动,石头剪刀布变成了赌博,而数星星看蚂蚁就演变成了科学研究。
无论是伽利略为了更好的看星星发明了望远镜,达尔文通过环游世界观察到不同的动植物从而提出进化论,还是卢瑟福带着学生们兴致勃勃的用阿尔法粒子轰击金属板,发现原子的有核结构。科学的突破往往与科学家们像小孩子玩游戏一样做着自己感兴趣的事情有关。
当21世纪人类进入到人工智能时代后,业界普遍认为:下一个 AI 里程碑可能会在复杂策略游戏中诞生。若 AI 能在如此复杂的环境中,学会人一样实时感知、分析、理解、推理、决策到行动,就可能在多变、复杂的真实环境中发挥更大作用。通用人工智能的实现也许就在AI+游戏中悄然实现。
从游戏AI迈向通用AI
AI+游戏究竟能不能实现通用人工智能,我们首先从什么是通用人工智能说起。人工智能源于要制造“可与人类相媲美的‘思维机器’,由于实现能够通过图灵测试的有思维人工智能面临巨大困难,甚至人工智能本身在开始都被认为是误用的骗局,上世纪七八十年代主流AI逐渐避离通用目的的智能系统,转向特定的领域问题并寻找专用目的的解决方案。
这种转换逐步让社会认识到人工智能的用处,但也导致“AI”的领域被分割为许多关联松散的子领域。这些子领域之间没有共同的基础或框架,并遭受着统一性的挑战。在2004年至2007左右,在主流AI领域内外,研究通用目的系统的呼声再起。许多重量级的AI研究者提出了通用和类人智能(Human-level)的议题。通用人工智能(Artificial general intelligence),简写AGI ,是指研制像人一样思考、像人一样从事多种用途的机器。这一单词源于AI,但是由于主流AI研究逐渐走向某一领域的智能化(如机器视觉、语音输入等),因此为了与它们相区分,增加了general。
天普大学计算机与信息科学系王培教授在文章《通用人工智能导航:AGI的历史与现状》中提出”笼统地说,通用人工智能(AGI)的研究具有下列特点:强调智能通用目的的特点;基于整体或综合的智能观;相信打造可媲美人类智能AI的时机已经成熟”。
企业对“AI+游戏”的探索与实践
很多研究团队投入到通用人工智能的研究中来,利用游戏对通用人工智能进行探索是其中一个热点。譬如DeepMind推出了一款新的具备通才的AI智能体Gato,它受大规模语言建模的启发而构建,不仅能作用于游戏,还能作用于图像,不仅能作用于NLP,比如用来聊天,而且还能作用于操作,比如用机械臂堆叠积木。在AI+游戏方面,2019年DeepMind在《自然》发表论文,指出DeepMind已经到达了一个新的里程碑,他们开发的游戏AI AlphaStar在暴雪的即时战略游戏《星际争霸2》中达到了大师级水平,也就是超过了99.8%的人类玩家。
OpenAI 成立于 2015 年目标是以安全的方式实现通用人工智能(AGI),使全人类平等收益,2017年,OpenAI设计的智能体,就曾与Dota的人类顶级玩家Dendi进行过巅峰对决,并且最终AI大获全胜。2018年),OpenAI再次派出OpenAI Five,以5V5模式对战人类顶级阵容。结果,又是以AI100%胜率告终比赛。而就在这些比赛结果出来之前,没有人曾想过AI会赢。最近几年,OpenAI推出的自然语言处理大型预训练模型GPT-3、AI图像生成器Dall-E两大代表性研究,引领了业界新的技术潮流,也被认为是创造AGI(通用人工智能)最有实力的公司之一。
在中国代表性的企业的腾讯,2018 年王者荣耀职业联赛(KPL)秋季赛总决赛上,王者绝悟首次露面,接受前KPL职业选手和职业解说组成的人类战队(平均水平超过99%玩家)的5V5水平测试,并取得胜利。这标志着腾讯 AI Lab 与王者荣耀共同开启了对“AI+游戏”的全新探索,向AI技术走向产业化应用这一命题进一步迈进。腾讯的“王者绝悟”的自我强化学习,也正在为前沿人工智能技术的核心研究领域的多智能体系统提供有效的参考范本,推动产业技术发展。
对于不少研究人员和开发者来说,多智能体技术研究依然存在显著的现实困难, 基于此,在王者绝悟的基础上,2019 年 8 月,王者荣耀与腾讯AI Lab 携手共建“开悟”AI 开放平台, 利用双方核心技术,为研究者打造低成本的科研教学平台,推动多智能体人工智能算法研究、教学和验证。如今,围绕“开悟”平台,王者已与清华、北大等十余所高校开展教学合作,共同培养AI人才,同时面向国内外高校,构建多层级AI赛事体系,进一步完善高新人才培育体系,深化“产学研”一体化。今年,还面向全球高校,逐步开放“开悟”平台,助力行业开展科研技术。
6月24日,以“向善同行,以悟丈量世界”为主题的第二届腾讯STAC科创联合大会在成都举行。大会聚焦人工智能技术,研讨人工智能未来发展和产业趋势,分享人工智能的科研成果和实践案例,全方位呈现人工智能从底层共性技术到行业、场景应用,以及对产业升级与转型带来的深刻影响。
其中腾讯通过王者绝悟、开悟平台推动的AI+游戏战略,是大会的一个亮点。在人类与前沿技术相互拥抱和促进的时代,腾讯不断加大对王者 AI 的建设,让 AI 从 0 到 1 去学习进化,并发展出一套合理的行为模式,短期看,可以给游戏行业、电竞行业带来直接的推动和帮助,中期看,有望在大范围内,如医疗、制造、无人驾驶、农业到智慧城市等领域带来更深远影响。长期来看,AI+游戏的研究,会推进 AI 的终极目标——通用人工智能问题的探索和发展。
对通用人工智能的探索推动着人类进步
但也应该指出,通用人工智能为未来发展依然存在诸多不确定性因素。迄今为止人类还没能创造出可以解决多种多样不同类型问题的人工通用智能。还没有听一两年人类对话的录音就能自己说话的机器。尽管 AlphaGo 通过分析数千局比赛然后又进行更多的自我对弈而「学会」了下围棋,但这同样的程序却不能用来掌握打篮球的秘密。
我们目前最好的成就离真正的通用智能还很远——真正的通用智能能灵活地无监督地学习,学习,或能足够灵活地选择自己想要学习的内容,不管那是玩棋盘游戏,还是设计 PC 板。
由此人们对通用人工智能的各种质疑声便不绝于耳。比较常见的包括“计算机必须遵循程序,因此不可能有灵活性和创造性”“计算机只能根据形式来使用符号,但无法获得其意义”“有些真理人能发现,但计算机永远不能”,一些人声称他们已经证明,受制于计算机的某些基本限制,AGI或之类的东西理论上都是不可能的。人工智能领域的专家对这个问题同样意见不一。一份最近的专家调查(Future Progress in Artificial Intelligence: A Survey of Expert Opinion)显示,通用人工智能可能是 2040-2050 年左右(概率为50%)。正如 LeCun 所言,人类水平的通用智能距离我们几十年。
虽然通用人工智是否能真正实现,在科学界依然没有明确的答案,但是包括Deepmind,OPenAI,王者AI在内团队用游戏+的方式对通用人工智能进行探索,无论最终的结果如何,在这个过程中不断挖掘出的科学问题,不断取得的科技成果对人类的未来进步都将是重要的推动力。
(作者:刘锋 远望智库数字大脑研究院院长,南京财经大学教授,中国科学院虚拟经济与数据科学研究中心研究组成员。)
参考文献:
1.https://zhuanlan.zhihu.com/p/37416905,王培,通用人工智能导航:AGI的历史与现状。