先瞧一下 Chat 和 Agent 的差异。
Chat(聊天):纯粹的 Chat,宛如一个主要由“大脑与嘴”组成的智能体,着重于信息处置和语言沟通。诸如 ChatGPT 这般的系统,其能够领会用户的询问,给出有益且连贯的回应,然而它自身并不直接开展任务。
Agent(代理):犹如一个拥有“手、脚”的智能体,它能够进行思索、作出决策,并且能够执行具体的任务。
我们能够简略直接地理解为,Chat 着重的是“说”,Agent 着重的是“做”。
要是让你选择,你会选哪个?
这么说来吧,但凡人类对于躺平的美妙追求尚存,“让机器替我劳作”的念想就断不可能消逝。
自 ChatGPT 发布以来,从 plugin 的推出,到 Function Calling 再到 Assistant API 的问世,OpenAI 的这一连串举动就充分彰显,在有如此强大的 LLM 作为基础底盘的情形下,人们就决然不可能仅仅满足于让它“唠唠叨叨”。
历史总是有着惊人的类同。从 2014 年亚马逊开创性地推出 Amazon Echo 起始,智能音箱横空显现。最初的智能音箱,也仅仅是有个“嘴”,只能够达成播放音乐、查询信息、设置提醒等功能。并且“脑子”还不太灵敏。
然而随着阿里、百度、小米等科技巨头的纷纷介入,智能音箱在竞争中卷出了新的高度。打通支付、与智能汽车、智能家居相互连通,智能音箱持续地突破并拓展功能的边界,逐步坐上了智能家居生态的“大总管”之位。
伴随应用场景的不断延展,智能音箱又延伸至儿童教育、养老关怀等领域,深深地影响了人们的日常起居生活。
坚信有那么一天,智能音箱会强大和多元到某一程度,以至于“智能音箱”这个名称不再适配这个品类,那将会是新一轮故事的开端。
同样有着惊人相似之处的,还有从单纯的 AI 智能语音助手、智能客服(仅会说)到以 AI+RPA 作为核心技术的 AI 数字员工(会说又会做)的发展历程……
这些,均是人工智能迈向多元化和融合化的一个个微小写照。
故而,随着技术水准的持续提升和场景化落地的不断深挖,Chat 和 Agent 的界限必然会愈发模糊,生成式 AI 会融合 Chat 和 Agent 的特性,形成既能展开高质量、高人格化的对话,又能够高效执行复杂任务的 AI 自动化系统,为人们给予融合、互补、多样化的解决办法。
AI Agent 的兴起不单单是技术上的突破,更是针对软件开发理念的一次深刻变革。
在传统的软件开发当中,程序员需要预先界定所有的逻辑与规则,而后进行代码的实现。而 AI Agent 的出现,要求我们对软件进行充分的“放权”:它由一颗大脑(LLM)来进行自主支配运作,并在运行时自动学习、适应和优化调整。这种前所未有的开发范式的转变,让程序员不得不重新思索软件开发的本质,也重新思考软件开发的未来。
建议每一位技术人员,都去聆听一下知乎知学堂和 AGI 课堂联合推出的免费公开课——程序员的 AI 大模型进阶之旅。由几位业内大咖主讲,从 GPT 到开源模型再到 AI Agent,你将会看到一个个人开发者能够以怎样的力量撬动 AI 原生应用的全栈开发。
你还能够在后续的课程当中学习整套的数据处理、训练、fine-tune 模型等流程。更为难得的是它不但让你知晓大模型背后的原理和实际操作技术,还能从商业的角度带你深度剖析此轮 AI 变革与以往存在何种根本区别。相信听完公开课之后,你会拥有恍然大悟的认知和豁然开朗的思路。
典型的 AI agent 划分为 Memory(记忆)、Tools(外部工具) 、Planning(计划) 和 Action(行动)四个模块。
当前学习AI Agent基本上分作两条路径:
基于 OpenAI 技术路线,以及基于开源技术路线。建议每一位技术人员,都选定一条道路,亲身去闯荡一番。
大模型爆发之后,AI Agent 的发展称得上是突飞猛进,各类项目接二连三、数不胜数。
AutoGPT
项目地址:
https://github.com/Significant-Gravitas/AutoGPT
可以根据你设置的目标,将实现这个目标的任务进行拆解,再采用搜索、浏览网站、执行脚本等方式一条条去执行任务,帮你完成目标。
JARVIS
项目网址:https://github.com/microsoft/JARVIS
一个非常有意思的“模型选择”Agent。它将用户要求拆解成子任务,再到Huggingface上选择合适的专家小模型执行任务,最后对结果进行处理和返回给用户。
由于JARVIS可以调用其它模型工具,因此它可以执行多模态任务。
MetaGPT
项目网址:https://github.com/geekan/MetaGPT
MetaGPT是另一个开源人工智能体框架,试图模仿传统软件公司的结构。与ChatDev类似,Agent被分配产品经理、项目经理和工程师的角色,并且他们在用户定义的编码任务上进行协作。
工具、平台、社区的不断成熟,为个体开发者提供了一个全新的舞台。程序员与人工智能之间的距离从未如此之近。AI Agent的崛起,让有想法、有技术的人能够以前所未有的方式释放自己的创造力,打造出各种有趣、实用的AI原生应用。
那么,你准备好加入这场革命了吗?