来源:脑极体
AI是个非常有趣的词,不管是中文翻译的,还是英文的Artificial Intelligence,都有“生物性”的含义。一个是集结了地球顶尖智慧的“人工”,另一个Intelligence则专指生物拥有的智慧。
不过在当今的AI风潮中,我们提到的种种AI应用大多属于机器学习——和生物性不沾边。AI可以从大量数据中寻找规律,经过训练完成种种工作,可给人的感觉依旧是一种更高效的机械。
语音助手可以听懂你需要播放音乐、叫车出行,也能在你要求下讲个笑话。可除了下达指令和获得反馈以外,语音助手很少能理解情绪、记忆、俚语、双关等等人与人交流时经常出现的元素,作为工具来讲尚且不算优秀,更别提什么生物性和人格化了。
丨除了把工具变成更好的工具,知识图谱还能做些什么?
之前我们在文章中,讨论过一个“人工智能不会看漫画”的问题,既利用大量四格漫画对神经网络进行训练,但将四格漫画中的对话框挖空后,人工智能依然不知道应该填入哪些内容。
原因在于漫画中的画面和文字并非具有严格的对应性,人类能看懂漫画是因为建立在对现实世界的理解之上,通过联想将文字与图片的内涵建立对应关系。知识图谱的作用,就是将不同的知识相互关联,并形成一个网状的知识结构,帮助人工智能增强认知、理解行业并且建立“世界观”。
丨认识自己,认识你:探访AI偶像的生命引擎
在上一篇关于Gowild产品“琥珀虚颜”的介绍中,我们提到了“未来偶像”这一概念。琥珀是以全息3D主机HoloEra为载体的虚拟形象,用户可以通过语音和手机App与琥珀进行交互。而琥珀自身的背景故事是一位无意降落地球的外星偶像,正向着成为“偶像”的道路进发。
所谓偶像,自然是人格化、有生命感的,这也是琥珀虚颜的主打卖点之一。Gowild曾经在一篇论文中提出过“虚拟生命”这一概念——有记忆、有情绪、能理解、能交互。想要实现这几点,依然离不开知识图谱的加持。
上图是Gowild提出的人工智能生命引擎(GAVE),把语义理解、QA系统、智能对话等等技术组件架构在了知识图谱之上,而知识图谱则是给予AI“生命感”的重要工具。
比较典型的是Gowild为琥珀建立了她自己的个人知识图谱,琥珀有自己的喜好和性格特点,喜欢紫色、爱吃葡萄、喜欢听别人的表扬。当用户和琥珀进行对话时,琥珀就会展露出这些性格特点,用户提到“紫色”、“葡萄”等等琥珀喜欢的东西时,会得到相关的反馈。
丨垂直化+动态化,或许能帮助知识图谱走入生活
邵浩博士表示,知识图谱的发展之所以相比深度学习、神经网络较慢,是因为知识图谱的建立过程非常复杂:将非结构化数据转变成结构化数据已经是一项繁重的工作,还需要建立数据之间的对应关系。如何保证知识的权威性,更需要技术专家和学术专家一同跨领域合作。
何况知也无涯,人类世界的知识实在太过细致庞杂,建立知识图谱需要耗费的时间和人力成本实在太高。在1984年,美国曾经启动过一项名为Cyc的工程,试图把人类世界的日常常识建立起一个适用于计算机的大型知识库,结果显而易见——四十多年了,这项工程还是没有完成。知识图谱的费劲程度,可能就和Cyc有的一拼。
Gowild的解决方案,其实已经展示了知识图谱的两个发展趋势。
第一个趋势是知识图谱的垂直化。建立一个大而全的知识图谱自然是不可能完成的任务,但将知识图谱分割成细分领域,如医疗、金融、安防,甚至更细分到某一种疾病、某一种货币等等,可以极大的降低知识图谱的建立成本,同时促进知识图谱的快速投入使用。
第二个趋势是知识图谱的动态化。琥珀之所以有“记忆”,是因为用户关系的知识图谱会源源不断的补充着用户在交互时透露的信息,因而逐渐让用户画像更加圆满。随着我们数据挖掘的能力越来越强,在流数据场景下储存和查询知识图谱正在成为可能。或许在未来不光琥珀能够“记住”你,冰箱、电视、洗衣机等等生活中的一切设备也可以通过类似的方式建立对用户的记忆和理解。
当然,问题并不只有一种解决方式。想要制造出有生命感的人工智能,知识图谱只是可以利用上的技术之一。而让人工智能具有生命感也仅仅是一段路程,路程的终点还是让更强大技术改变的我们的世界。
到最后,这些不同的技术路径还是要在顶点相见。
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”