2024年5月25日,第三届AIGC中国开发者大会在北京举行,蓝蛙科技公司CEO兼创始人李辰受邀出席并发表主题演讲。作为开源框架GeneralAgent的作者,发表了题为“Agent框架的挑战和解决方案”的精彩演讲。李辰先生深入探讨了在构建和部署基于大型语言模型(LLM)的Agent架构时所面临的挑战,并提出了一系列创新的解决方案。
李辰先生首先介绍了LLM-based Agent架构的基本概念,包括工具、计划和记忆三个核心组成部分。他指出,使用Function Call和Code Interpreter作为工具时,各有其优势和不足。例如,Function Call在安全性上表现优异,但在处理复杂任务时存在局限性。而Code Interpreter则能够一次性调用多个函数,支持任意变量类型,且具备自动修复错误的能力。
在计划方面,李辰先生提到了基于文本的方式和Self-Call的概念,强调了Self-Call在减少LLM调用次数和规划执行一体化方面的重要性。他还展示了如下所示的一个Self-Call 例子,Agent通过agent.run来自我调用生成细节,一次性完成了复杂PPT生成。进一步阐释了这一概念的实际应用。
记忆部分的讨论聚焦于如何通过Embedding和类GPT方案,使Agent能够主动存储和召回记忆。 李辰先生特别提到了GeneralAgent框架中自研的LinkMemory创新方法,这些技术能够有效地处理文档分段、概括和链接。
李辰先生还讨论了LLM与Agent耦合,比如不同的LLM会在输出代码风格、默认临时文件的存储地址、常用工具的用法等有不同的倾向性,从而要求Agent框架需要和这些特性耦合。他指出,每个LLM厂商都会推出自己的Agent框架,而开源Agent框架需要适配不同的大模型,甚至训练或者微调自己的大模型。
在企业落地方面,李辰先生分享了如何为多用户提供Agent能力,包括文件系统、多用户、多应用、长时间任务管理、资源节约、Agent状态序列化和安全隔离等关键点。 他还强调了Agent在高稳定性业务场景中,如时序性和一致性的重要性。
最后,李辰先生介绍了GeneralAgent和AgentServer两个开源项目的最新进展。GeneralAgent已经开源(https://github.com/CosmosShadow/GeneralAgent),而AgentServer正处于开源准备中。前者提供了Code Interpreter、Self-Call、LinkMemory等特性,后者可以高可靠为大量用户提供线上Agent访问。
成都蓝蛙科技有限公司于2019年成⽴,公司专注于⼈⼯智能技术的研发和应⽤,致⼒于通过 先进的AI技术推动各⾏各业的数字化转型。公司拥有⼀⽀由资深技术专家和业界顶尖⼈才组成的团队,在⼈⼯智能、机器学习、⼤数据分析等领域拥有丰富的经验和卓越的成就。公司秉承创新精神,不断探索AI技术的边界,为企业提供高效、安全的智能解决方案。
大会结束后,李辰先生表示:“我们很高兴能够在AIGC开发者大会上分享我们的成果和经验。我们相信,通过不断的技术创新和开源合作,可以推动AI Agent框架的发展,并为企业和开发者提供更强大的工具。”
结束语: 随着AI技术的不断进步,成都蓝蛙科技有限公司将继续在AI Agent框架领域深耕细作,为行业带来更多创新和价值。我们期待与各方合作伙伴携手共进,共创智能科技的美好未来。