北京智源大会是年度国际性人工智能高端学术交流的盛会,定位于内行的AI盛会。智源大会紧密围绕当前人工智能学术领域迫切需要解决的问题,以及产业落地过程中存在的诸多挑战,开展深入探讨。智源研究院是2018年11月份成立的一家人工智能领域的新型研发机构,致力于推动人工智能技术的原始创新。智源的含义是人工智能的源头。本文主要介绍了2024北京智源大会的报告概要,所有图片来源于官方的直播链接。本文作者为李杨,审校为朱旺和陆新颖。
2024北京智源大会以大模型为核心共同探讨AGI的发展之路。本次大会首先由智源研究院理事长黄铁军进行开幕式致辞,其次由智源研究院院长王仲远报告智源研究院最新的进展。接下来,本次大会还邀请了全球人工智能顶级专家进行专题汇报,包括OpenAI Sora及DALL·E团队负责人Aditya Ramesh汇报的多模态大模型,并由纽约大学助理教授谢赛宁与Aditya Ramesh进行问答环节。然后,由零一万物CEO李开复和清华大学智能产业研究院院长、智源学术顾问委员张亚勤来一起探讨通用人工智能的关键问题。由百度CTO王海峰进行大模型为通用人工智能带来曙光的专题报告。在大会的最后环节,邀请了月之暗面CEO杨植麟、百川智能CEO王小川、智谱CEO张鹏和面壁智能CEO李大海来进行通往AGI之路的尖峰对话。
图1 黄铁军|开幕式致辞
智源研究院理事长黄铁军为本次2024北京智源大会进行了开幕式致辞,并简要概述了当今热门的大模型技术为通用人工智能领域带来了新的机遇和挑战。
图2 王仲远|智源进展报告
智源研究院院长王仲远首先介绍了智源研究院的建设和初衷,然后介绍了2023年以大模型为主题的AI第三次浪潮,并开启了通用人工智能的探索之路。王仲远谈到在当下的人工智能时代,通用人工智能最大的特点就是模型规模非常大,通常跨越多个领域且具备涌现性。
图3 Aditya Ramesh|多模态大模型
Aditya Ramesh介绍了其团队在多模态大模型的探索历程,其中包括DALL的设计原理和改进思路以及CLIP是如何工作的相关内容。
图4 李开复、张亚勤|Fireside Chat
李开复谈到了大模型的两个关键基础,一是关于Scaling law,也就是通过不断地扩大模型的规模来增强大模型的表达能力,另一个是无损压缩,也就是通过压缩的理念来综合评估大模型的性能。张亚勤也提到了关于大模型的规模效应,还有基于大模型的token based以及大模型的通用性。此外,张亚勤还谈到现阶段大模型效率较低、对世界的表达能力较差和边界效应,这是需要在之后改进的地方。
图5 王海峰|百度CTO
王海峰谈到人工智能的目标是模拟延伸和拓展人的智能,他将通用人工智能的通用性分为两个层面,一个是技术的通用性,另一个是能力的全面性。然后,王海峰展示了人工智能技术的演进,并介绍了大模型的数据构建、对齐技术、提示优化和知识增强等。接着,王海峰还谈到了关于智能体的基本概念,其中涉及智能体的工具调用和代码智能体等。最后,王海峰还分享了人工智能的技术栈架构。
图6 圆桌论坛
杨植麟、王小川、张鹏和李大海在大会上首先深入探讨了关于大模型是否是通往通用人工智能的基石。然后,探讨了通用人工智能和Scaling Law技术的定义。他们相信,现阶段技术距离通用人工智能还很遥远,但不可否认的是,大模型是目前最有可能成为通往通用人工智能的手段或工具。相信在不久的未来,通用人工智能会普及在人们生活的方方面面。