2023年11月,OpenAI在首届开发者大会上推出了GPTs和Assitant API,不仅改写了AI Agent的构建范式,也把AI智能体的应用推向一个新高潮。
GPTs和GPT商店,使得用户无需编码通过自然语言就能创建并拥有多个专属私人助理,且可以如在苹果应用商店一样在GPT商店出售和购买这些专属助理。
这意味着,人人都能构建Agent的时代已然到来,Agent无处不在的序幕也已拉开。
在这之前,OpenAI开发者大会之后的几天里,曾把生成式AI比作“图形用户界面(GUI)一般爆炸性技术革命”的比尔盖茨,再次发表长文表达其对AI Agent的看法。
他认为,智能体不仅会改变人与计算机交互的方式,还将颠覆软件行业,带来自人类从键入命令到点击图标以来最大的计算革命,智能体会成为继Android、iOS和Windows等之后的下一个平台。
不只是比尔盖茨发布了影响行业发展趋势的Agent解读,微软也一直在做。
早在去年3月AutoGPT火爆之后,微软就发布了能够支持自定义ChatGPT助手无缝集成在CRM、ERP、OA等日常办公系统中Copilot Studio(隶属于Microsoft365 Copilot)。
8月份,微软研究院推出了赋予游戏NPC规划复杂任务的能力、相互协作并与人类玩家协作的多智能体框架MindAgent。10月份推出了允许多个 LLM 智能体通过聊天来解决任务的AI Agent框架AutoGen。
有了行业大佬的背书以及科技巨头的频频动作,AI Agent的火爆程度再度跃升一个量级。即便目前99%的GPTs都在裸奔,两句话就能套走GPTs数据库,也阻挡不住人们开发与分享GPTs的热情,GPTs的数量一直在高速狂飙。
2024年1 月 10 日,因为“宫斗事件”而推迟上线的GPT Store终于正式上线。官方数据显示,在这两个月的时间里,用户已经创建了超过 300 万个 ChatGPT 自定义版本,类别包括 DALL・E、写作、研究、编程、教育和生活方式等。
只是,GPT Store上线即乱象丛生,除了大家一直在重点关注的安全问题,更出现了软色情、假官方、刷单横行的GPT Store“开门黑”。
AI Agent大势所趋,已经成为LLM落地应用的主要途径。借着GPTs的火和比尔盖茨的风,很多LLM研发与应用厂商都打出了Agent的牌。反正早晚都要实现通用人工智能AGI,不管是概念阶段还是应用起步,先一步主打Agent必然没错。
但概念化陈述的AI Agent与实体化应用的AI Agent,仍旧存在很大差距。随着类似信息越来越多,大众也就无感,以致于目前大部分人认为AI Agent十之八九名不副实,仅是玩具一般的存在。
这种情况下,更多人则在思考在当前Agent应用早期,到底什么样的Agent,才是企业能够“用得起”的产品以及解决方案。
01 AI Agent只是玩具?
AI Agent是不是玩具,取决于从哪个角度看。
个人使用它自动购买机票、订披萨、写总结、收发邮件,看起来已经是不错的生产力工具。比如使用GPTs通过Zapier的海量API连接更多商业应用,可以在很多业务场景中使用。
现在市面上的大多Agent,包括OpenAI推出的GPTs,不过就是构建了一个基于某知识库或者专业数据的Chatbot。使用这些智能体进行问答交互,比如获取行业资讯、报告等,都可以做到对答如流。
但在程序联动与操作方面还有很大差距,至少现在还无法用GPTs直接操作SAP或者金蝶等ERP系统,因为其中涉及到了API的应用、授权、维护以及无API管理软件的连接问题。
对于广大企业而言,如果GPTs等AI智能体只能用于知识问答,确实像一个玩具,因为它还无法深入到企业运营的业务流程中去。
所以,无论现在对AI Agent的讨论多么热烈,不管2W+的GPTs和大量第三方Agents展现的应用场景有多丰富,它们仍算是Agent的初级应用,尚无法深度参与及影响广大组织的业务经营。
当然其中的因素是多样且复杂的,比如LLM能力、Agent架构、Prompt精确性、数据集大小、知识库丰富程度等,都能影响Agent能力的体现。
这种情况下,当前大家所提到的AI Agent大部分都停留在idea阶段,成熟产品很少。
还有重要的一点,随着Agent的构建越发简单,Agent生态的成熟会让C端Agent出现百花齐放的局面,应用价值方面也随边际效应而无限趋向于更小量级。
由此AI Agent更大的价值,最终还是要落到B端的商业落地与量级应用。
这,也就是比尔盖茨所言的智能体的平台价值。
02 Agent平台的价值
比尔盖茨在其撰写的《AI is about to completely change how you use computers》一文中提到,智能体作为下一个平台,将会影响人们使用软件的方式以及软件的编写方式。它更擅长查找信息并为用户总结信息,能够会为用户找到最优惠的价格,将取代搜索网站及电商网站,也将取代文字处理器、电子表格和其它生产力应用程序。
并且,现在各自独立的搜索广告、广告社交网络、购物、生产力软件等,都将变成智能体这一项业务。
Agent会彻底改变应用软件的打开方式,这一点毋庸置疑。
而相对于Agent带来的影响,如何构建Agent以及由什么样的Agent平台去构建能力足够强劲的Agent,是大家更为关注的,也是更需要探讨的问题。
在这方面,OpenAI已经率先用GPTs以及GPT Builder为业界打了一个样。
即AI Agent平台本身就是AI智能体,也是智能体构建平台,还是Agent分发平台。为了让人们更方便的构建与应用各种Agent,它会基于构建-应用-分享-反馈的应用路径发展,并且Agent的架构逻辑与思维也会用于支持平台的整体运营。
平台属性意味着它不只用于构建和分发Agent,更重要的是能够为用户提供包括安全、运营、维护等在内的交付能力。不仅需要内置为用户构建智能体所需要的各种插件和组件,还需要能够在智能体构建过程中随时给予用户反馈以保证项目成功。
这几点,对于B端用户尤其重要。
像最近GPTs推出后OpenAI出现的各种安全问题,首先在数据安全上就过不了企业用户的关,不是私有化部署的用户可能都不敢构建GPTs,更不用说对外分享。
现在GPT Store已经上线,但上线即癫狂,乱象丛生。
GPTs排名刷榜严重,热门GPTs频被抄袭,大批僵尸号充斥其中,AI女友疯狂涌现。
山寨号、僵尸号、刷单、色情聊天室……
以至于,软色情、假官方、刷单横行成了当前GPT Store的“三宗罪”。
而越来越多的乱象似乎也在证明,上线不到半个月的GPT Store,正在逐步成为灰色产业链的温床,AI安全成为大众再次提起的热词。
GPT Store的开发者生态与安全问题,面临着严峻的考验。
目前的GPT Store,处于一种混乱无序的状态。这种状态让大家见识到了商城模式生态构建的不容易,也让大家感叹APP Store生态背后苹果所付出的努力。
这种状态的GPT Store,大部分企业用户是不敢轻易尝试的。
自大语言模型爆发之后,各国都多次表达对AI安全的看法,并推出相应的法规、措施与解决方案。
GPT Store可以在短期内扩张GPTs生态,然而它的混乱无序也进一步放大了AI对现实世界的威胁,这也正是因OpenAI“宫斗”事件而扬名的OpenAI首席科学家伊利亚·苏斯克沃(Ilya Sutskever)最为担心的事情。
除了安全,企业用户们更在意AI Agent的实际能力,即能不能深入到企业运营的复杂流程,能不能真正帮助企业降本增效。
从业务流程角度来看,Agent的应用是在LLM的基础上进一步实现的业务流程自动化。而目前包括GPTs在内的各种AI智能体表现来看,普遍存在两种情况:
一是安全系数不过关,频频出现的数据泄露问题让广大组织望而生畏,而中小企业又没有能力私有化部署LLM;
二是Agent所带来的流程自动化仍停留于粗浅层面,尚无法为企业内部动辄几十上百种的业务系统提供业务流支持。
所以,AI Agent想要真正在B端实现大量业务场景的落地商用,需要综合考量其本身的安全性、技术发展周期是否成熟以及To B端的场景是否密切贴合等。
说到这里有人可能会问,连GPTs都存在那么多问题,现阶段企业想要应用AI智能体,就没有合适的解决方案吗?
当然有,下面我们就会讲到。
03 企业级AI智能体平台
在讲述企业级AI智能体平台之前,我们先来看一个真实应用案例。
这是一个使用RPA智能体自动构建「从招行网银客户端下载交易数据(敏感信息打码)」自动化流程的应用案例,可以看到要构建这样一个自动化流程,只需在TARS大模型对话框输入“打开客户端,查询默认账号几年的交易数据,并下载导出”,TARS就能自动创建执行计划,点击执行它就能按照执行计划一步步去执行,等它执行完以后,一个可以复用的自动化流程也构建完成了。
RPA Agent案例运行界面
使用这种方式构建自动化流程,人机协作的部分只有必要时人工才参与的点击功能按钮和必要元素,构建的全程不再需要“拖拉拽”各种组件和代码块,任何人随时都能构建需要的自动化流程。
案例所使用的AI智能体产品,是实在智能推出的RPA Agent智能体。这是一个以RPA为工具,能够自主拆解任务、感知当前环境、执行并且反馈、记忆历史经验的RPA Agent。
该产品的特色是基于其自研发垂直领域大模型TARS构建,采用“TARS+ISSUT(智能屏幕语义理解技术)”双模引擎模式,双模互动构成了TARS-RPA-Agent,实现对屏幕上一切元素的自动化操作,实现“你说,PC做”全新工作布置方式,达成流程自动化创建的“所说即所得”。
“你说,PC做”的意思是,通过RPA Agent构建包括所有企业管理软件在内的自动化操作流程,而并非通过GPT builder等Agent构建平台构建类GPTs的轻量级Agent。
这意味着,如果其他平台构建的Agent还是各种对话机器人,RPA Agent构建的Agent已经是智能体数字员工。
实在智能RPA Agent技术架构
在Agent的探索与应用方面,国内厂商已经走在了前列。
除了实在智能,目前国内很多国内的RPA\超自动化厂商都在探索RPA Agent模式。比如壹沓科技推出了能够帮助企业轻松构建专有“数字员工团队”的CubeAgent,中关村科金推出了集成企业知识大模型的AgentGraph应用开发平台,金智维也正在探索RPA与大模型、AI Agent的深度融合。
在国外,专注低代码的超自动化厂商Torq也已将其AI Agent添加到其安全超自动化平台,其他厂商也在陆续跟进RPA Agent模式。
RPA Agent不仅发挥了LLM理解与分析的优势,也保留了RPA特色,只要能够识别的元素全部都能实现自动化操作,可以面向包含API接口及UI自动化的所有管理程序构建自动化程序,因此完全可以用于企业运营的业务流程自动化构建。
04 超自动化平台推出的Agent更靠谱
企业要引入AI智能体进行流程优化,必须经过成本控制、投入预算、实现效率、安全管控等多方面严格及缜密的评估。这就要求技术供应商提供的必须是平台级解决方案,而不是只针对单一、个别场景需求来提供的智能体自动化解决方案。
越复杂的业务流程自动化,对智能体厂商平台的底层技术融合能力、数据安全性掌控能力、产品部署后的运营和维护能力、交付能力及产品和解决方案的可扩展能力等的要求也就越严格。
这也对AI Agent技术供应商提出了更高的要求,必须具备丰富的帮助大厂实现超大和复杂业务场景自动化落地的经验。
同时,大型企业引入新的AI技术不允许任何试错成本,因此技术供应商给出的解决方案必须是开箱即用、具备行业KNOW-HOW术语和业务规则的真实智能体数字员工。也只有这样的标准化智能体,才能被纳入企业的内部编制中去统一管理和调度。
除此之外,要实现AI Agent更好地商用,需要考虑接口成本、隐私、管理、授权等诸多因素,这既是很多供应商的技术与产品门槛,也是广大企业选型的重要依据。
所以,企业在选择用于业务流程自动化的AI智能体时,也是优先考虑超自动化厂商推出的AI智能体产品,而不是选择LLM厂商推出的尚未成熟的通过API连接各种插件的单一智能体解决方案。
这种情况下,在B端市场,由ERP、BPM、超自动化等企业管理软件厂商推出的AI智能体反而更受关注。
大部分企业会根据自身需求,选择能够结合业务特点、具备丰富流程自动化落地经验且能够解决更复杂更庞大业务流程自动化的需求的技术供应商,以快速实现新AI智能体解决方案落地。
这也是老牌RPA融合LLM后,更容易将智能体做成平台级别产品的原因。
一般而言,推出RPA Agent的RPA\超自动化厂商,具备上面所列的多个先发优势:之前的RPA、IDP、流程挖掘、ISSUT等所有产品组合都是按照平台级别打造的,现在的RPA智能体也是在之前超自动化平台的基础上融合LLM及Agent架构打造的。
这些RPA Agent自诞生开始,就是比尔盖茨所说的平台级智能体产品。
如果企业想在Agent被视作玩具的眼下引入企业级AI智能体数字员工,由成熟RPA\超自动化厂商推出的RPA Agent会是一个不错的选择。
05 后记:AI Agent前半场属于平台级AI智能体
在超自动化领域,很多人认为LLM厂商推出的AI Agent,可能会优先颠覆之前的RPA、低代码、工作流、流程挖掘等企业管理平台。
但现在的事实是,这些超自动化平台通过融合自有大语言模型或者集成第三方大语言模型API,在此基础上推出的AI Agent反而更胜一筹,无论在安全性方面,还是易用性、扩展能力等方面,都明显优于现在市面上其他Agent。
如果套上“LLM+规划+记忆+工具”这个Agent架构,RPA、低代码等都属于工具,但这个工具是融合AI等多种技术的平台级别工具,它与GPT等通过API调用的轻量级工具有着显著区别。
有的推出Agent智能体的厂商如实在智能,也推出了自己的垂直领域大模型,跻身成为大语言模型厂商,因此在Agent构建及技术架构方面可以有更多的选择以及灵活的策略。
更重要的是作为超自动化厂商,他们拥有更多的技术、工具、数据以及经验,可以基于自身优势打造更符合产品特性及用户属性的AI智能体,并能够为用户定制专属的个性化企业级AI智能体。。
这样的AI智能体能够更好地理解用户指令意图并为RPA等工具规划各种任务,更能够无缝融合及适配所有工具、数据、知识及经验。
目前而言,不管怎么对比,由企业管理软件厂商推出的平台级AI Agent明显要靠谱得多,且已真正实现落地商用。
AI Agent应用落地前半场,企服软件厂商的平台级AI智能体先跑出来了。
- END -