审视AI Agent:追捧、落地,和2024年的To B破局点

“十个AI应用里面,五个办公Agent,三个AIGC,还有两成是回春的数字人。”那么,Agent到底是不是大模型的AGI终局产品? 

作者|斗斗 

编辑|皮爷 

出品|产业家 

今年4月份,斯坦福和谷歌的研究者共同创建了一个“西部世界小镇(Westworldsimulation)”,在这个小镇里,25个智能体可执行类似人类的日常行为,比如起床后做早餐然后去上班,艺术家作画,作家写作。

这些就是如今人们共同谈论的“AI Agent实验”。而在国内的今年下半年,大模型市场的玩家们,似乎正齐刷刷地转向AI Agent——这个清晰可见的AGI终局产品。

一组数据显示,截止11月中旬,AI Agent赛道发生融资事件13起,总融资金额约735亿人民币,公司融资均值为56.54亿人民币。

而在国外,这一领域亦是火爆。“至少有100个项目正致力于将AI代理商业化,近10万名开发人员正在构建自主Agent。”外媒MattSchlicht曾表示。

AI Agent为何如此火爆?

关于AI Agent的想象力,一个高赞回答是:“大语言模型只能编个贪吃蛇,而AI Agent可以整出一个王者荣耀。”

成熟的AI Agent可以使软件生产大幅降低成本。未来Coding工作流中会很多Agent临时写成的软件和测试方案,不追求长期的可复用性,可以随用随抛。目前一家软件行业巨头动辄上万甚至十万人,有了AI Agent之后研发、交付需要耗费的人力和资金将大幅降低。而且使得软件可以灵活地解决更多长尾需求。

此外,AI Agent或将为LLM搭建一套框架来进行深度思考和分析,从而做出更复杂和可靠的决策。

总之,就像微软创始人比尔·盖茨所说的那样:“谁能主宰个人助理Agent,那才是大事。因为你将永远不去搜索网站,不去生产力网站,不去亚马逊。”

值得注意的是,在这种巨大的技术变革下,目前我们仍没有切身体会到AI Agent所带来的红利和变化。很明显,AI Agent的发展仍面临一些难题。

一些值得探讨的问题是,国内外AI Agent的发展现状如何?AI Agent落地的关键点是什么?以及AI Agent未来是怎样的?

一、AI Agent现状,海外VS本土

目前,国内一些科技公司已经产出了数个知名大模型,因此孕育而生的Agent智能体应用也开始逐渐进入大众视野。

例如百度将文心大模型应用到智能搜索、自动驾驶;阿里将通义千问模型应用到高德地图、优酷,盒马等产品。华为将其盘古模型应用到智能气象、语音识别等。

一家叫面壁智能的创业也公司推出了他们的AI Agent产品ChatDev,可以在短时间内完成一个软件或者一个小游戏的开发,用户所需要做的,只是提供给它一个要求。

值得注意的是,协同办公领域似乎是巨头们做AI Agent的“必经之地”。

例如钉钉魔法棒套件中,从聊天AI、文档AI、会议AI、宜搭AI、TeambitionAI等都汇集了钉钉AI产品能力;腾讯会议中的“会议助理”功能提供了一些智能化的支持,如自动总结会议纪要、转录和翻译;百度推出的智能工作平台如流搭载了文心大模型,可以实现智能创作、智能推荐等功能;字节跳动旗下的办公软件飞书宣布推出智能AI助手“MyAI”,旨在提升团队协作效率。

曾有投资人对媒体调侃:“十个AI应用里面,五个办公Agent,三个AIGC,还有两成是回春的数字人。”这不仅是国内AI Agent发展的现状,其实从国外一些诸如谷歌、微软等企业也在将AI Agent落于协同办公场景。

其实在海外,AI Agent概念从出现到爆发,已经迈过多个阶段。

单一Agent阶段,主要是针对不同领域和场景的特定任务,开发和部署专门的智能体。以GPTengineer为例,给它一个需求,其就可以把代码写个大概。

而多Agent合作阶段,是由不同角色的Agent自动合作完成复杂的任务。例如在MetaGPT上,如果让其做一个股票分析的工具,它会把这个任务分别翻译给产品经理、架构师、项目经理等5个角色,模拟整个的软件开发中所有决策工作流。

不过,随着微软全新工具AutoGen的发布,AI Agent很快翻开了新的篇章。

AutoGen允许多个LLM智能体通过聊天来解决任务。LLM智能体可以扮演各种角色,如程序员、设计师,或者是各种角色的组合,对话过程就把任务解决了。这与MetaGPT不同,MetaGPT的角色模型是被定义好的,而AutoGen可以让开发者自己定义Agent,还可以让他们相互对话。

这是一个新的且富有创造性的Agent框架。在AutoGen发布的两个星期内,星标量从390狂增到10K,并在Discord上吸引了5000多名成员。

微软在AI Agent的布局较早。2023年3月Microsoft365Copilot发布,在当时便提示了一种基于LLM的应用开发范式,即Agent。目前,微软CopilotStudio已经支持自定义ChatGPT助手无缝集成在CRM、ERP、OA等日常办公系统中。

可以发现微软的AI Agent能力主要是从其本身业务衍生出来的,AutoGen更像是一种自身基于业务所打造的能力的外放,这与OpenAI并不相同。

OpenAI开发的GPTs,以及推出的GPT-4Turbo和可定制AI Agent,使得每个人都可以打造自己的大模型应用。诸多业内人士认为,超低的创建门槛和APP Store一样的商业模型,会让OpenAI快速构建GPTs生态。

OpenAI提供的是基础Agent的构建能力,如工具调用、基于知识库文件记忆能力等。这项产品的发布,使得AI Agent进入了另外一个新阶段,即为人人都可以打造自己的Agent提供了一种可能性。

值得注意的是,目前海外已经在零售、房地产、旅游、客户服务、人力资源、金融、制造业等多个领域出现AI Agent架构与产品。

例如零售领域的亚马逊Alexa、Aktify、Regie.ai等;房地产领域的Epique、propertypen、Listingcopy等;客户服务领域的Agent4、Ebi.Ai、JasonAI、Aide等;人力资源领域的AutonomousHRChatbot、AIInterviewCoach、CareersAI等。

总体来看,在AI Agent在底层技术、架构以及具体产品应用等方面都较为完善。像OpenAI、微软、谷歌这类科技巨头,有着先发优势。另一个可以看到的现象是,国内AI Agent的深度与广度仍有所差距。

一个值得思考的问题是,Agent落地的关键是什么?

二、Agent落地的关键:

模型?行业经验?还是载体?

当前市场上的大多数Agent,包括OpenAI推出的GPTs,其实只是构建了一个基于特定知识库或专业数据的Chatbot。这些智能体主要用于进行问答交互,如获取行业资讯、报告等。

然而,在程序联动和操作方面还有很大的提升空间。目前,我们还无法直接使用GPTs来操作SAP或金蝶等ERP系统,因为这涉及到API的应用、授权、维护以及无API管理软件的连接问题。

对于企业而言,如果GPTs等AI智能体仅用于知识问答,那么其作用将非常有限,就像一个玩具一样,因为它目前还无法深入到企业的业务流程中。

这背后的原因有很多,包括模型能力、行业经验、场景贴合度等,都会影响Agent的能力体现。

AI Agent需要具备感知环境、做出决策并执行适当行动的能力。在这些关键步骤中,最重要的是理解输入给Agent的内容、进行推理、规划、做出准确决策,并将其转化为可执行的原子动作序列,以实现最终目标。

目前,许多研究利用LLM作为AI Agent的认知核心,这些模型的发展为完成这一步骤提供了质量保证。因此,基于GPT-4的Agent表现得更加智能。

但就目前而言,包括GPT-4在内的所有大模型,能力仍需提升。

“底座模型问题都还很大,AI Agent真正落地还要等更优秀的模型。”某位身处大模型技术一线的业内人士对产业家说。

不过针对模型能力不足这一问题,智谱AI&清华KEG提出了一种对齐Agent能力的微调方法AgentTuning,该方法使用少量数据微调已有模型,显著激发了模型的Agent能力,同时可以保持模型原有的通用能力。

AI Agent的行业经验对于其落地也至关重要。

“如果一篇论文提出了某种不同的训练方法,OpenAI内部的Slack上会嗤之以鼻,因为这些都是我们玩剩下的。但是当新的AI Agents论文出来的时候,我们才会认真兴奋的讨论。”这是OpenAI联合创始人AndrejKarpathy最近发表的一段讲话。

简而言之,我们基于大模型能做出什么样的东西,说到底还是要靠行业经验,而这恰是OpenAI等一众大模型巨头们所欠缺的。

要知道,企业要引入AI Agent进行流程优化,必须经过成本控制、投入预算、实现效率、安全管控等多方面严格及缜密的评估。这就要求技术供应商提供的必须是平台级解决方案,而不是只针对单一、个别场景需求来提供的AI Agent自动化解决方案。

大型企业引入新的AI技术不允许任何试错成本,因此技术供应商给出的解决方案必须是开箱即用、具备行业Know-How术语和业务规则的真实智能体数字员工。也只有这样的标准化AI Agent,才能被纳入企业的内部编制中去统一管理和调度。

例如,一个医疗行业的AI Agent需要具备医学知识,并能够理解和处理医疗数据。一个金融行业的AI Agent需要具备金融知识,并能够理解和处理金融数据。

AI Agent的落地效果也受限于应用场景。在如出行预订中,得益于丰富的API等问题,AI Agent表现出色。而在如法律助手场景中,由于新知识的频繁出现和API的不完善,实际应用面临更多挑战。

这一点,从国内AI Agent纷纷生长于协同办公平台就可见一斑。

事实上,协同办公平台本身具备良好的API接口和插件体系,这使得将大模型集成到现有工具中变得更加容易。

此外,许多企业和组织都在使用协同办公软件,这意味着大模型可以迅速覆盖大量的潜在用户。广泛的用户基础可以加速大模型的迭代和优化过程,使其更好地满足用户需求。

还有大量的数据资源助于提高模型的性能,丰富的场景也可以推动大模型技术持续改进。

钉钉、飞书和企业微信在作为Agent载体时,也各自具有不同的优势。钉钉提供了完善的组织架构管理功能,可以方便地创建、管理和调整团队架构,使得企业能够快速搭建适应其需求的组织结构。

飞书强调实时协作和沟通,支持多人在线编辑文档、共同讨论等功能,有助于团队高效地完成协作任务。其特有的一体化,使得整个办公流程更加标准化。

企业微信与微信互通,这使得其AI Agent有可能借助微信庞大的用户数据和应用场景,提供更加个性化和场景化的服务。

站在这个角度来看,国内AI Agent扎堆协同办公领域,则变得理所当然。而找到一个适合AI Agent落地的场景或者说载体更为重要。

不过,除了协同办公,还有许多其他载体可能更适合AI Agent的落地应用。

例如智能客服、智能助手、RPA、CRM等。具体来看,在智能客服方面,AI Agent可以自动回答用户的问题,处理投诉和建议,提高客户满意度和效率。在智能助手方面,苹果公司的Siri、谷歌公司的GoogleAssistant和亚马逊公司的Alexa都是智能助手的代表。

在智能流程自动化方面,许多企业采用智能流程自动化工具,如UiPath、BluePrism等,来自动完成某些特定的业务流程。

在智能营销方面,许多营销平台都集成了AI Agent,如HubSpot、Salesforce等。这些平台的AI Agent可以通过数据分析和机器学习技术,提供精准的营销建议和预测,帮助企业更好地了解客户需求,提高销售业绩。

总而言之,模型能力是核心,行业经验是关键,载体是保障。无论是模型能力还是行业经验抑或是载体都是AI Agent落地的关键。值得注意的是,国内的软件业态,倒逼国内厂商造就了一身定制化、个性化能力,这种能力侧面验证了国内企业在技术落地上的潜力,这将会进一步推动Agent的落地。

三、AI Agent的终局是什么?

在文章开篇的“西部世界小镇(Westworldsimulation)”里,这些智能体可以与别人和环境交流(互相注意到彼此举动、发起对话或者问候)、反思这些观察结果(形成独特的个人观点)、制定每天的计划。他们拥有自己记忆和目标,会产生可信的个人和涌现的社交行为,而不是通过预先设计实现。

例如从用户指定的单一任务开始,即一个AI Agent想要举办情人节聚会,AI Agent们在接下来的时间里会自发的传播邀请、认识新朋友、互相约出参加聚会的日期,并协调在正确的时间一起出现在聚会上。

这是Agent项目里具有代表性的应用。人们之所以为这个项目感到惊讶,是因为Agent的交互出现了人类意料之外的现象。AI Agent爆发的一段时间,人们普遍认为补齐了大模型短板的AI Agent更具备实用性,将是大模型重要落地方向。

随着Agent的构建越发简单,Agent生态的成熟会让C端Agent出现百花齐放的局面,面对用户,Agent将会更加接地气,引起新一轮的爆发。

但就目前而言,这一路径的商业化存在诸多问题。拿游戏场景而言,目前收费主要来源于出售游戏装备、皮肤等方式。而AI Agent的价值无法体现在这些固有的变现途径上。并且就目前Agent落地效果来看,未出现颠覆性的能力,C端用户是否会为其买单无法得知。

更值得注意的是,随着让C端Agent百花齐放,其应用价值方面也随边际效应而无限趋向于更小量级。换言之,AI Agent能否成为AI大模型从C端商业化爆发一个最核心应用方向,还需时间验证。且即使未来会成为C端商业化爆发一个最核心应用方向,但其“寿命”并不长。

一个事实是,AI Agent最终的落脚点或将在B端。

比尔盖茨认为,智能体作为下一个平台,将会影响人们使用软件的方式以及软件的编写方式。它更擅长查找信息并为用户总结信息,能够会为用户找到最优惠的价格,将取代搜索网站及电商网站,也将取代文字处理器、电子表格和其它生产力应用程序。并且,现在各自独立的搜索广告、广告社交网络、购物、生产力软件等,都将变成智能体这一项业务。Agent会彻底改变应用软件的打开方式。

这些变革来临之前,相对于 Agent本身带来的影响,如何构建一个Agent,是一个更值得关注的问题。

Agent构建平台上,企业或将可以自己构建自己RPA、CRM、办公OA等一系列管理软件;软件厂商也可以基于此平台构建软件为企业提供服务。

对于身处或准备进入AI Agent领域的玩家而言,找到切入点以及好的商业模式至关重要。

未来AI Agent的发展将不仅仅局限于单体智能,而是会扩展到物的智能和机器人的联动。

从群体智能的角度来看,ToC可能会形成更大的社区化虚拟组织,每个人的Agent都能通过虚拟数据连接在一起;而ToB则可能形成虚拟的组织和企业,不同的企业和员工都能通过智能体纳入到网络当中。

最终,整个社会将变成一个巨大的虚实结合的网络,形成“智联网”。在这个网络中,不同的智能体将提供更强的生产力,重新塑造整个生产关系,从而提升整个社会的产能。

因此,AI Agent的发展前景非常广阔,它们将不断扩展其应用范围和影响力,为未来的社会发展带来巨大的变革和机遇。

时至今日,AI Agent虽然带来了诸多想象力,却仍旧存在诸多质疑。技术发展之路本就充满质疑与批判,科技变革对于任何一个企业与个体都是一场机遇,关键在于如何把握它。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/579387.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

QT小技巧 - 使用QMovie进行gif切帧

简介 使用QMovie 将 gif 进行切帧&#xff0c; magick 进行合并代码 QString gifPath "E:\\workspace\\qt\\gif2imgs\\203526qre64haq3ccoobqi.gif"; // 你的图片QMovie movie(gifPath); movie.setCacheMode(QMovie::CacheNone);qDebug() << movie.frameCou…

腾讯云上mysql连接不上

腾讯云服务器默认没开放&#xff0c;3306端口。 1.去腾讯云控制台 2.找到自己的服务器 3选择防火墙 4.添加规则 至此完事了。

CentOS7之开启ssh远程登录

参考&#xff1a;https://www.cnblogs.com/travis-li/p/12550370.html cd /etc/ssh/ # 修改配置 vim sshd_config# 开启服务 sudo service sshd start# 检查 ps -e | grep sshd# 开机自启 systemctl enable sshd.service# 查看(验证)开机自启服务 [rootlocalhost liangshijie]…

【已解决】Excel“打开密码”在哪里设置?

Excel可以设置“打开密码”&#xff0c;设置后只要打开表格就会提示文件有密码保护&#xff0c;需要输入密码&#xff0c;才能查看表格里面的内容。 那Excel“打开密码”在哪里设置呢&#xff1f;Excel提供了两种路径可以选择。 选择一、直接在Excel里设置 操作步骤&#xff1…

市场复盘总结 20231226

仅用于记录当天的市场情况&#xff0c;用于统计交易策略的适用情况&#xff0c;以便程序回测 短线核心&#xff1a;不参与任何级别的调整 昨日回顾&#xff1a; SELECT CODE,成交额排名,净流入排名,代码,名称,DDE大单金额,涨幅,主力净额,DDE大单净量,CONVERT(DATETIME, 最后封…

海德堡UV灯电源维修eta Plus Elc PE22-400-210

uv灯电源维修故障包括&#xff1a; 1、电压不稳&#xff1a;检查uv打印机的电压&#xff0c;设置一个稳压箱即可。 2、温度过高&#xff1a;uv打印机温度过高也会影响uv灯&#xff0c;可以更换为水冷式循环降温。 3、水箱里的信号线接触不好&#xff1a;将两边的信号线对调&…

Hive文件存储与压缩

压缩和存储 1、 Hadoop压缩配置 1) MR支持的压缩编码 压缩格式工具算法文件扩展名是否可切分DEFAULT无DEFAULT.deflate否GzipgzipDEFAULT.gz否bzip2bzip2bzip2.bz2是LZOlzopLZO.lzo否LZ4无LZ4.lz4否Snappy无Snappy.snappy否 为了支持多种压缩/解压缩算法&#xff0c;Hadoop…

理解MoCo

目录 1、简介 2、MoCo 2.1、引言 2.2、主要贡献 2.3、相关工作 2.4、方法 2.4.1、损失函数 2.4.2、队列 2.4.3、动量编码器 2.4.4、前向过程 2.5、实验 2.5.1、网络结构比较 2.5.2、动量参数m 2.5.3、imageNet数据集结果 2.5.4、迁移特性 2.6、MoCo代码 1、简介…

数字音频编辑软件audition 2021 mac功能介绍

Audition 2021 mac是一款专业数字音频编辑软件&#xff0c;提供先进的音频混音、编辑和效果处理功能&#xff0c;专为音频和视频专业人员设计。无论是要录制音乐、无线电广播&#xff0c;还是为录像配音&#xff0c;Audition都能帮到您。它可提供先进的音频混合、编辑、控制和效…

Zookeeper的使用场景

统一命名服务 利用ZooKeeper节点的树形分层结构和子节点的顺序维护能力&#xff0c;来为分布式系统中的资源命名。 例&#xff1a;分布式节点命名 分布式消息队列 1.在Zookeeper中创建一个持久节点&#xff0c;用作队列的根节点。队列元素的节点放在这个根节点下。 2.入队:…

【Unity学习笔记】1.创建场景

创建场景 注1&#xff1a;samplescene&#xff08;示例场景&#xff09;、standard assets&#xff08;标准资产&#xff09;、favorites&#xff08;收藏夹&#xff09;、terrain&#xff08;地形&#xff09;。 注2&#xff1a;favorites用于存放各种资源&#xff1b;sample…

Spring-2-配置和Springboot

bean的生命周期 挂钩到bean的创建 通过了解初始化的时间&#xff0c;bean可以检查是否满足其所需的所有依赖项。 尽管Spring可以帮助我们检查依赖项&#xff0c;但它几乎是一种全有或全无的方法&#xff0c;并且不会提供任何机会来将其他逻辑应用于依赖项的解析过程中。 假设…

打破常规:瑞幸咖啡如何实施RGM策略来逆袭市场趋势

瑞幸咖啡仅用短短18个月时间从品牌创立到纳斯达克上市&#xff0c;刷新全球最快上市记录。2020年因交易造假事件被勒令退市股价暴跌80%&#xff0c;有人说这个创造了赴美IPO奇迹的“巨婴”将是下一个倒下的ofo。2022年瑞幸咖啡以逆势超速增长领跑咖啡赛道有力回应了市场的质疑&…

TCP协议及工作原理(三)客户端的搭建

ui界面的搭建 &#xff1a; QTcpServer是基于TCP的服务器类提供一种方便的方式管理和创建TCP服务器&#xff0c;QTcpSocket处理TCP套接字编程用于建立TCP连接&#xff0c;发送接收数据等功能。 参考前两篇可深入理解&#xff01;&#xff01;&#xff01;&#xff01;&#xff…

用 Unity 实现的安检模拟小游戏源码,通过安检设备 (扫描仪) 检查乘客的随身物品 根据禁止名单对乘客做出判断是否允许通行

介绍 用 Unity 实现的安检模拟小游戏 软件版本 Unity 2019.4.9f1 (64-bit) Visual Studio 2019 游戏玩法 在游戏中你将扮演一名安全检查员 通过安检设备 (扫描仪) 检查每位乘客的随身物品 根据禁止名单对乘客做出判断&#xff1a;允许通行或者下令逮捕 游戏效果 游戏截图…

带你学C语言~指针(3)

目录 ✍0.前言 &#x1f680;1.字符指针变量 &#x1f685;2.数组指针变量 &#x1f431;‍&#x1f3cd;2.1.数组指针变量是什么 &#x1f431;‍&#x1f3cd;2.2数组指针变量怎么初始化 &#x1f6a2;3.二维数组传参的本质 &#x1f680;4.函数指针变量 ✈4.1函数指…

Python3.12 新版本之f-string的几个新特性

目录 概述 f-string表达式 1. 支持转义字符 2. 支持多行字符串 3. 支持重复使用的引号种类 4. 支持无限嵌套 附录 Python3.12新语法特性 概述 Python 3.12在10月2日发布&#xff0c;新版本包含一系列对语言和标准库的改变。 库的改变主要集中在清理已弃用的 API、可…

windows+ubuntu离线安装翻译软件有道词典

背景&#xff1a; 某些情况下&#xff0c;需要在无法连接互联网的电脑上翻译单词&#xff0c;句子以及段落&#xff0c;就需要能离线安装和翻译的翻译软件&#xff0c;具备一定的词库量&#xff0c;目前找到了《有道词典》。 windows 亲测&#xff0c;无法联网的win10中安装…

OpenAI GPT 模型 API 接口新增参数 top_logprobs 和 logprobs

文章目录 一、前言二、主要内容三、总结 &#x1f349; CSDN 叶庭云&#xff1a;https://yetingyun.blog.csdn.net/ 一、前言 在最新的 OpenAI 官方 APIs 文档中&#xff0c;Create chat completion 中新增了 top_logprobs 和 logprobs 这两个关键参数。 官方文档地址&#xff…

黑马程序员SSM框架-Spring

视频链接&#xff1a;Spring-00-Spring课程介绍_哔哩哔哩_bilibili Spring Framework系统架构以及学习顺序 核心概念&#xff08;IoC、DI、Bean&#xff09; IoC入门案例 导入坐标 提供需要被管理的类&#xff08;Dao&#xff09;和需要被注入的类&#xff08;Service&#x…