【AI大模型】生成式AI的未来——CHAT还是AGENT?

【AI大模型】CHAt还是AGENt?

最近,许多人工智能公司或者部门都在针对Agent——人工智能体有所动作。

例如:

在这里插入图片描述

文心一言智能体

在这里插入图片描述

Gnomic智能体

在这里插入图片描述

英伟达视觉AI代理

那么人工智能概念中的智能体Agent到底是什么呢?它又为何会突然在人工智能市场掀起一阵猛烈的风波呢?它会对将来的人工智能走向带来怎样的影响吗?

AI Agent的定义

AI Agent是**人工智能代理(Artificial Intelligence Agent)**的概念,它是一种能够感知环境、进行决策和执行动作的智能实体,通常基于机器学习和人工智能技术,具备自主性和自适应性,在特定任务或领域中能够自主地进行学习和改进。一个更完整的Agent,一定是与环境充分交互的,它包括两部分——一是Agent的部分,二是环境的部分。此刻的Agent就如同物理世界中的「人类」,物理世界就是人类的「外部环境」。
在这里插入图片描述

"AI agent"通常指的是人工智能代理程序,它是一个能够执行特定任务或完成特定目标的计算机程序或系统。这些代理程序通过收集和分析环境信息,并作出相应的决策或执行操作来达到其预定的目标。它们可以是简单的规则系统,也可以是复杂的机器学习模型或深度学习网络。AI agent在自动化、智能系统和人工智能应用中广泛使用,例如自动驾驶汽车、智能家居系统、游戏中的虚拟角色等。

在这里插入图片描述

例如以下几个方面:

AI Agent的用途

1. 自动化与效率提升
  • 机器人过程自动化(RPA):在业务流程中,通过模拟人类操作来自动化重复性任务,提高工作效率。
  • 智能文档处理:通过自然语言处理(NLP)技术,自动化处理和分析大量文档,如发票、合同等。
2. 数据分析与决策支持
  • 预测分析:通过机器学习算法对历史数据进行分析,预测未来趋势,如销售预测、市场分析。
  • 实时分析:在金融、物流等领域,实时处理和分析大量数据,支持即时决策。
3. 客户服务与用户体验
  • 聊天机器人:通过自然语言处理技术,为客户提供实时的问答服务,提高客户满意度。
  • 个性化推荐:在电商平台、流媒体服务等领域,根据用户行为和偏好,提供个性化推荐,提升用户体验。
4. 医疗健康
  • 疾病诊断:利用深度学习和图像处理技术,辅助医生进行疾病诊断,如癌症筛查、心脏病检测。
  • 个性化治疗:根据患者的基因数据和病历信息,提供个性化的治疗方案。
5. 金融服务
  • 欺诈检测:通过机器学习算法,实时监控和分析交易数据,检测和防止欺诈行为。
  • 自动化交易:利用算法进行自动化交易,提高交易效率和收益。
6. 制造业与工业4.0
  • 预测性维护:通过传感器数据和机器学习模型,预测设备故障,提前进行维护,减少停机时间。
  • 智能制造:通过自动化和智能控制系统,优化生产流程,提高生产效率和产品质量。
7. 交通与物流
  • 自动驾驶:通过计算机视觉、传感器融合和深度学习,实现车辆自动驾驶,提升交通安全和效率。
  • 智能物流:优化物流路径和仓储管理,提高物流效率和准确性。
8. 教育
  • 个性化学习:根据学生的学习行为和成绩,提供个性化的学习方案和建议,提升学习效果。
  • 智能评估:自动化评估学生作业和考试,减少教师工作量,提高评估效率和准确性。

不难看出,Agent主要的目的是用于创建个性化、自动化、智能化的人工智能代理,从而提高办事效率并且减少繁琐的工作。

在这里插入图片描述

在去年十一月份的OpenAI开发者大会上,OpenAI官方宣布了GPTs,也就是用户可以创建专属于自己的GPT智能体,无需输入代码,或者只需要低代码,即可生成一个人工智能管家,用以帮助你解决生活上的琐事。

在这里插入图片描述

针对化、个性化、高效化、区别化是类似GPTs智能体的主要特点,它将主动权和创造权力全部交给了消费者自己;商人的头脑往往是极度清晰和高速运转的——这样做的目的既可以减小开发者的开发成本,同时还能降低由于自主开发带来的某些消费者评论弊端——好似自助餐或者火锅,你可以自制属于你自己的那道菜,但至于菜好不好吃就是你自己的事了,提供食材的人只需要负食品品质好坏与否的责任了。

如此看来,Agent的发展前景确实广阔并且丰富;随着AI的发展,减少低效工作是必要并且符合时代的,那么Agent就是必不可少的帮手。

那么再转过头来看我们的AI老朋友——Chat,语言大模型,它是否会逐渐淹没于时代的洪流,地位逐渐被Agent取代呢?

我们来看Chat目前的发展趋势和发展程度。


人工智能中的聊天技术(Chat AI)的发展历程和趋势如下:

Chat发展历程

  1. 早期聊天机器人(20世纪60年代-80年代):

    • ELIZA (1966): 由Joseph Weizenbaum开发的早期聊天机器人,模拟了一个Rogerian心理治疗师,通过模式匹配技术对用户输入进行简单回应。
    • PARRY (1972): 模拟偏执型精神分裂症患者的聊天机器人,由Kenneth Colby开发,使用更多的规则和更复杂的状态机。
  2. 基于规则的聊天机器人(1980年代-2000年代初):

    • 这些机器人依赖于手工编写的规则和脚本,对特定类型的用户输入进行预定义响应。
    • A.L.I.C.E (1995): 使用AIML(人工智能标记语言)编写的聊天机器人,通过大量的规则实现对话。
  3. 统计模型与机器学习(2000年代中期-2010年代初):

    • Watson (2011): IBM开发的用于Jeopardy!比赛的系统,结合了自然语言处理、信息检索和机器学习技术,标志着聊天机器人的一个重要里程碑。
  4. 神经网络和深度学习(2010年代中期-至今):

    • Seq2Seq (2014): 由Google提出的序列到序列模型,用于翻译任务,随后应用于对话生成。
    • Transformers (2017): 由Vaswani等人提出的Transformer架构,大大提高了自然语言处理任务的性能,成为现代聊天机器人的基础。
    • GPT系列 (2018-至今): OpenAI开发的生成式预训练变换器模型,包括GPT-2 (2019) 和 GPT-3 (2020),具有生成高度连贯和逼真的文本的能力。
  5. 大规模语言模型(LLMs,2020年代):

    • ChatGPT (2022): 基于GPT-3.5和GPT-4的聊天机器人,广泛应用于各种对话场景。
    • 其他竞争模型: 如Google的BERT和LaMDA,Meta的OPT等,也在推动聊天技术的发展。
  6. 未来语言模型(2025及以后)

    • GPT4oGPT5:主流的大语言模型,依旧能在日常生活中应付大部分的疑问和交流。
    • 不断地自我迭代:相对于更具有多样性的Agent来说,或许Chat的主要发展途径就是不断地自我迭代,提高自己的精确度和高效程度

    我们观察Chat的发展趋势和近期的情况,实际上也并没有停下开发的脚步,它也在同时高速进步着,在日常生活所担任的角色也并没有被轻易抹去。

思考

其实当你仔细去观察这两种不同的方向时,你会发现,它俩实际上还是同一种东西——AI大模型。一切基于数据,一切基于积累。

如果硬要说它们之间的区别的话,或许是如下的:

从对象关系来看

代理更像是施令者受令者

对话更像是正常人之间的对话

而从技术更迭的角度来看

使**大型语言模型(LLM)**能够从助手演变为能够采取行动的代理——从这个方向来看Agent是Chat的进化。

在这里插入图片描述

而很明显,Agent在近期的大火,事实上也是说明了各大主流AI公司的发展方向的重点之变化。

或许AIGC的未来是以Agent为主流的时代,但我们不得不承认Chat在普通人生活中的常用和实用。或许会形成这么一个情况——**Agent主要面向商家和产业流,而Chat主要面向用户和服务业。**两者在各自分化的领域又发挥自己不同的力量。

我并不认为会有其中一者取代另一者的说法——世界总是发散性发展的。
在这里插入图片描述

未来的生成式AI可能会综合利用对话系统和自主代理的优势,形成更为智能和自主的系统。例如,智能家居系统既需要与用户进行自然的对话,又需要在后台自主管理和优化能源使用、安防措施等。

为了世界变得更好,为什么不是两者同时一起发展得越来越好呢?在这个物质富足、科技行业生机盎然的时代,是允许我们综合性发展的。所以我们只需坐好自己的船,在洪流中默默漂流即可。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/48780.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

虚拟化环境中如何实现以业务为中心的网络隔离?Everoute 推出虚拟专有云网络(VPC)功能

目前,不少企业都利用云计算和虚拟化技术提升 IT 系统灵活性、敏捷性和成本效益。然而,云环境的“多租户”特性也为业务安全带来了新的挑战,如何保障不同业务主体或租户之间的数据安全和网络隔离,成为企业关注的焦点。 作为 Smart…

可控硅触发板选型指南

可控硅触发板(SCR Trigger Board)是一种用于触发和控制可控硅(SCR)导通的电子设备。在电力控制、电机驱动、变频调速等领域中,可控硅触发板发挥着至关重要的作用。它通过精确的触发信号,实现对可控硅的启动和控制,从而实现对电路的开关和电流…

【ROS2】高级:安全-理解安全密钥库

目标:探索位于 ROS 2 安全密钥库中的文件。 教程级别:高级 时间:15 分钟 内容 背景安全工件位置 公钥材料 私钥材料域治理政策 安全飞地 参加测验! 背景 在继续之前,请确保您已完成设置安全教程。 sros2 包可以用来创…

昇思25天学习打卡营第25天 | RNN实现情感分类

学习心得:RNN实现情感分类 在自然语言处理(NLP)的领域中,情感分类是一个极具挑战性的任务,它要求模型能够准确地从文本中识别出情感倾向。通过使用MindSpore框架和RNN模型进行情感分类,我获得了许多有关构…

如何理解String的不可变性

一、缓存角度 在Java中对于字符串的处理,是利用字符串池去存储Java中的字符串,在字符串池中,俩个内容相同的字符串变量,可以从池中指向同一个对象,这样就节省了空间资源。 public class Main {public static void ma…

web服务器测试

[rootlocalhost ~]# vim /etc/nginx/conf.d/test_ test_ip.conf test_name.conf test_virtualdir.conf [rootlocalhost ~]# vim /etc/nginx/conf.d/test_name.conf [rootlocalhost ~]# tree /www/

【学习笔记】无人机系统(UAS)的连接、识别和跟踪(五)-无人机跟踪

目录 引言 5.3 无人机跟踪 5.3.1 无人机跟踪模型 5.3.2 无人机位置报告流程 5.3.3 无人机存在监测流程 引言 3GPP TS 23.256 技术规范,主要定义了3GPP系统对无人机(UAV)的连接性、身份识别、跟踪及A2X(Aircraft-to-Everyth…

HarmonyOS应用开发者高级认证,Next版本发布后最新题库 - 单选题序号3

基础认证题库请移步:HarmonyOS应用开发者基础认证题库 注:有读者反馈,题库的代码块比较多,打开文章时会卡死。所以笔者将题库拆分,单选题20个为一组,多选题10个为一组,题库目录如下,…

MySQL0.MSI方式安装

本机运行环境:Windows10 1.下载 进入MySQL官方下载页面:https://downloads.mysql.com/archives/installer/ 红色箭头:点击选择下载的版本 黄色箭头:点击下载MSI安装包 此次下载选择MySQL8.0.37的MSI安装包 2.安装 下载完毕后…

AJAX复习总结

AJAX复习总结 AJAX即“Asynchronous JavaScript and XML”(异步的JavaScript与XML技术),是一种在无需重新加载整个网页的情况下,能够更新部分网页的技术。简单来说,AJAX就是让网页变得更快、更灵活的一种方法 举个例子&#xff1a…

水表数字识别3:Pytorch CRNN实现水表数字识别(含训练代码和数据集)

水表数字识别3:Pytorch CRNN实现水表数字识别(含训练代码和数据集) 目录 水表数字识别3:Pytorch CRNN实现水表数字识别(含训练代码和数据集) 1.前言 2. 水表数字识别的方法 3. 水表数字识别数据集 4. 水表数字分割模型训练 5. 水表数字识别模型训…

Qt中 .pro、.pri、.prf、.prl文件简解

一、pro文件 .pro就是工程文件(project),是Qt项目的主配置文件,用于描述整个项目的基本信息和编译配置。在Qt中用qmake生成makefile文件,它是由.pro文件生成而来的,.pro文件的具体格式语法如下&#xff1a…

Linux 显示文件行号命令

cat (可能要搭配grep 进行过滤) vi 或 vim (缺点可能会因为粗心,改动文件,如果要修改当没说)

分布式系列之ID生成器

背景 在分布式系统中,当数据库数据量达到一定量级后,需要进行数据拆分、分库分表操作,传统使用方式的数据库自有的自增特性产生的主键ID已不能满足拆分的需求,它只能保证在单个表中唯一,所以需要一个在分布式环境下都…

昇思25天学习打卡营第23天 | 基于MindSpore的红酒分类实验

学习心得:基于MindSpore的红酒分类实验 在机器学习的学习路径中,理解和实践经典算法是非常重要的一步。最近我进行了一个有趣的实验,使用MindSpore框架实现了K近邻(KNN)算法进行红酒分类。这个实验不仅加深了我对KNN算…

idea如何让包结构分层

文章目录 前言1.选中前项目包结构2.取消后项目包结构3.情况二 前言 在大型项目中,代码的分层管理至关重要。IDEA编辑器提供了强大的package分层结构功能,帮助开发者更好地组织和管理代码。通过合理配置,我们可以清晰地看到各个package之间的…

stm32平台为例的软件模拟时间,代替RTC调试

stm32平台为例的软件模拟时间,代替RTC调试 我们在开发项目的时候,如果用到RTC,如果真正等待RTC到达指定的时间,那调试时间就太长了。 比如每隔半个小时,存储一次数据,如果要观察10次存储的效果&#xff0…

在服务器调用api操作rabbitmq

不同的rabbitmq版本可能api不同,仅做参考,RabbitMQ 3.7.18。同时,我基本没看官方api文档,根据rabbitmq客户端控制台调用接口参数来决定需要什么参数。例如: 1、添加用户 curl -u 用户名:密码 -H “Content-Type: a…

蓝屏死机不再怕!CrowdStrike故障修复指南中心上线!

系统之家于7月22日发出最新报道,安全公司CrowdStrike因其Windows更新引发全球 850 万台电脑蓝屏死机问题后,上线了全新的“修复和指南中心”(Remediation and Guidance Hub),该中心汇集了与其错误更新相关的详细信息&a…

Android音视频—OpenGL 与OpenGL ES简述,渲染视频到界面基本流程

文章目录 OpenGL 简述特点和功能主要组件OpenGL ES当前状态 OpenGL ES 在 Android 上进行视频帧渲染总体流程 OpenGL 简述 OpenGL(Open Graphics Library)是一个跨平台的、语言无关的应用程序编程接口(API),用于开发生…