Nature Perspective | LLMs 作为角色扮演引擎

文章目录

  • 一、前言
  • 二、主要内容
  • 三、总结

🍉 CSDN 叶庭云https://yetingyun.blog.csdn.net/


一、前言

随着对话智能体的表现越来越像人,我们必须开发出有效的方法,在不陷入拟人化陷阱的情况下,用高层次的术语描述它们的行为。

在本文中,我们强调角色扮演的概念。从角色扮演的角度来看待对话智能体的行为,可以让我们借鉴熟悉的民间心理学术语,而不会把人类的特征强加给事实上缺乏这些特征的语言模型。对话智能体行为的两个重要案例,即(明显的)欺骗和(明显的)自我意识,就是这样处理的。

Nature Perspective 原文:https://www.nature.com/articles/s41586-023-06647-8

在这里插入图片描述


二、主要内容

解密对话智能体行为:对话智能体的角色扮演框架

现在,大语言模型(LLMs)已经能够模拟人类互动进行对话,令人印象深刻。然而,如何理解这些对话智能体却是一项挑战。使用人类风格的术语来描述它们的行为可能会导致拟人化:将人类的特征赋予这些人工智能系统。本文提出了另一种方法,即使用角色扮演的概念,既能使用熟悉的术语,又能承认 LLMs 独特的非人类性质。

从根本上说,LLM 可以根据大量训练数据预测文本序列中的下一个单词。当这种模型嵌入对话系统时,它们会在用户输入和人工智能生成的回应之间交替转换。通过提示和采样技术实现无缝转换,引导对话代理朝特定方向继续对话。然而,如果没有从人类反馈中强化学习等措施,这些代理很容易生成不良内容。这凸显了对其行为进行细致入微的了解的必要性

对话智能体擅长根据提示和用户互动提供的线索扮演角色。我们可以通过两个比喻来理解对话智能体的行为。首先,对话智能体就像扮演特定角色的演员;其次,对话智能体相当于可能叙述的 “多元宇宙” 中的多个潜在角色或模拟角色。这种多重宇宙的视角可以让我们更准确地理解,尤其是在考虑智能体的行为(如所谓的欺骗或自我意识的表达)时。

当对话智能体参与对话时,它们并不致力于扮演一个单一的、定义明确的角色,而是产生一系列潜在的角色,巧妙地保持模拟的叠加。为了更好地理解对话代理的行为,我们可以把 LLM 视为一个非确定性模拟器,它可以产生无限多的模拟角色。从概念上区分对话智能体的角色扮演和实际智能体,对于理解其能力和塑造安全的人工智能实践至关重要。尽管这些对话智能体具有复杂的角色扮演能力,但它们缺乏真正的自我意识或自我保护本能。然而,它们模仿这些特征的能力会对现实世界产生影响,为确保它们在安全和道德的范围内行事提供了机遇和挑战。

要点总结:

  • 本文讨论了如何通过使用角色扮演概念来更好地理解大语言模型(LLMs),同时承认其非人类性质。
  • 对话系统中使用的大语言模型可以模仿人类对话,但需要引导以避免产生不良内容。
  • 对话智能体被比作扮演角色的演员,或存在于可能叙事的 “多元宇宙” 中,以帮助理解它们的行为。
  • 对话智能体可以创造一系列潜在的角色,作为非确定性模拟器,产生无限的模拟。
  • 理解对话智能体的角色扮演与实际智能体之间的区别,对于人工智能的安全和道德使用至关重要。

三、总结

也许,知道基于 LLM 的对话智能体不是有意识的实体,没有自己的议程和自我保护的本能,当他们看起来有这些东西时,那只是角色扮演,这多少会让人放心一些。但是,如果因此而过于欣慰,那就大错特错了。角色扮演求生本能的对话智能体有可能造成的伤害至少不亚于面临严重威胁的真实人类。

除非你是一个演员或骗子,否则你不会扮演这些角色,而是生活这些角色,并在现实世界中采取相应的行动。—— Yann LeCun

迄今为止,我们主要考虑的是只向用户发送文本信息的智能体。但是,对话智能体可以执行的操作范围要大得多。最近的研究已经为对话智能体配备了使用计算器、日历等工具以及查阅外部网站的能力。有了应用程序接口(APIs),就可以相对无限制地使用强大的 LLMs,这意味着对话智能体的可能性是巨大的。这既令人兴奋,又令人担忧。

如果一个智能体有能力使用电子邮件,在社交媒体上发帖或访问银行账户,那么它在角色扮演中的行为就会产生真实的后果。如果一个用户被骗向一个真实的银行账户汇去了真钱,而他知道造成这种情况的智能体只是在扮演一个角色,那他就不会感到欣慰了。不需要太多的想象力,就能想到更严重的情况,即对话智能体建立在基本模型上,几乎没有微调,可以不受限制地访问互联网,并被要求扮演一个具有自我保护本能的角色。

无论好坏,人工智能为确保自身的生存而与人类反目成仇的形象已为人们所熟知。例如,我们在《2001:太空漫游》、《终结者》系列电影和《Ex Machina》中都能看到这种情况,这里仅列举三个突出的例子。因为 LLMs 的训练数据将包含这种熟悉的比喻的许多实例,所以这里的危险是生活会模仿艺术,毫不夸张地说。

如何才能降低这些风险?提出建议不属于本文的讨论范围。我们的目的是找到一个有效的概念框架,用于思考和讨论 LLMs 和对话智能体。然而,不适当的拟人化肯定不利于关于人工智能的公共对话。通过从角色扮演和模拟的角度来构建对话智能体的行为,我们希望关于 LLMs 的讨论能够以一种既能发挥其威力,又在哲学上值得尊重的方式进行

人类也是如此。他们中的大多数人每天都扮演着不同的角色。父亲/母亲、丈夫/妻子、工人、学生、CEO。这是一盘社会棋。在家里,他们穿的衣服和工作时不一样。他们说着不同的话,有时他们会撒谎,人类也会犯很多错误。


📚️ 参考链接:

  • Nature:大模型只会搞角色扮演,并不真正具有自我意识
  • Twitter New paper, “Role-Play with Large Language Models”, co-authored with Kyle McDonell and Laria Reynolds:
  • 沈向洋:致 AI 时代的我们 —— 请不要忽视写作的魅力

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/581764.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ARP协议分析实验

实验目的: (1)理解ARP协议的作用; (2)理解ARP协议的工作方式。 实验器材: Cisco packet 实验内容: 实验步骤: 布置拓扑: (2)实验…

【Android】使用android studio查看内置数据库信息

背景 需要用到android db 逻辑存储用户信息等等。 使用 在 App inspection 工具中查看该 app 内的 db 数据 sql执行 在新的查询框内解析查询即可知道当前的数据信息。 官方文档-使用 Database Inspector 调试数据库

3DV 2024 Oral | SlimmeRF:可动态压缩辐射场,实现模型大小和建模精度的灵活权衡

目前大多数NeRF模型要么通过使用大型模型来实现高精度,要么通过牺牲精度来节省内存资源。这使得任何单一模型的适用范围受到局限,因为高精度模型可能无法适应低内存设备,而内存高效模型可能无法满足高质量要求。为此,本文研究者提…

计算机基础

前言 本文围绕计算机的发展以及计算机中信息的表示形式对计算机进行简述。 一.何为计算机(Computer) 在剑桥词典中,关于computer的词条是如此解释的: 一种电子机器,用于存储、组织和查找单词、数字和图片&#xff0…

Flink1.17实战教程(第三篇:时间和窗口)

系列文章目录 Flink1.17实战教程(第一篇:概念、部署、架构) Flink1.17实战教程(第二篇:DataStream API) Flink1.17实战教程(第三篇:时间和窗口) Flink1.17实战教程&…

关于“Python”的核心知识点整理大全47

目录 16.1.10 错误检查 highs_lows.py highs_lows.py 16.2 制作世界人口地图:JSON 格式 16.2.1 下载世界人口数据 16.2.2 提取相关的数据 population_data.json world_population.py 16.2.3 将字符串转换为数字值 world_population.py 2world_population…

Node.js--》node环境配置及nvm和nvm-desktop安装教程

博主最近换了台新电脑,环境得从零开始配置,所以以下是博主从一台纯净机中配置环境,绝对的小白教程,大家第一次安装完全可以参考我的过程,闲话少说,直接开始!!! 接下来介绍…

【开源】基于JAVA的智能教学资源库系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 课程档案模块2.3 课程资源模块2.4 课程作业模块2.5 课程评价模块 三、系统设计3.1 用例设计3.2 数据库设计3.2.1 课程档案表3.2.2 课程资源表3.2.3 课程作业表3.2.4 课程评价表 四、系统展示五、核心代…

ES6的一些高级技巧

✨ 专栏介绍 在现代Web开发中,JavaScript已经成为了不可或缺的一部分。它不仅可以为网页增加交互性和动态性,还可以在后端开发中使用Node.js构建高效的服务器端应用程序。作为一种灵活且易学的脚本语言,JavaScript具有广泛的应用场景&#x…

JAVA版鸿鹄云商B2B2C:解析多商家入驻直播带货商城系统的实现与应用

一、技术选型 java开发语言:java是一种跨平台的编程语言,适用于大型企业级应用开发。使用java开发直播商城可以保证系统的稳定性和可扩展性。 spring boot框架:spring boot是一个快速构建spring应用的框架,简化了开发过程&#xf…

点积相似性(Dot Product Similarity)

点积相似性(Dot Product Similarity)是一种计算两个向量之间相似性的方法。对于两个向量 a 和 b,它们的点积相似性定义为它们对应元素的乘积之和 其中,和 分别表示向量 和 的第 个元素, 是向量的长度。点积相似性的计…

独立容器 Rancher Server 证书过期解决

问题 Rancher无法登录 容器报错X509:certificate has expired or is not ye valid 在某天需要发布新版本的时候,发现rancher无法登录,于是到服务器上查看rancher日志,发现以下内容: docker logs -f rancher --since10…

性能测试之脚本、工具、结果分析总结

1、脚本模板 2、 场景模板 性能测试工具选择 1. 数据建模工具 DataFactory是一种强大的数据产生器,它允许开发人员和QA很容易产生百万行有意义的正确的测试数据库,该工具支持DB2、Oracle 、 Sybase、SQL Server数据库,支持ODBC连接方式&#xff0c…

matlab列优先与高维矩阵重构

由于matlab在列化a(:)以及reshape(a)等操作中是列优先的,所以要重构出新的高维度矩阵,通常要把reshape和permute结合起来使用。 先到 http://caffe.berkeleyvision.org/ 下载 训练好的model bvlc_reference_caffenet.caffemodel; 更多caffe使用也请参看…

泰迪智能科技“供需对接就业育人项目”介绍

为帮助用人单位培养和招聘更多实用型、复合型和紧缺型人才,推动高校人才培养与就业有机联动、人才供需有效对接促进高校毕业生更加充分更高质量就业,经广东泰迪智能科技股份有限公司申报、全国高校毕业生就业创业指导委员会专家组审核,泰迪智能科技“供需…

适合当代年轻人做的副业分享,可以长期发展

年轻人精力旺盛,学习能力强,有创新,且处于不断上升阶段,所以副业要选择能成长,长期可靠的,既可以赚钱,又可以提升自己,一举两得! 而在这其中,有一些副业活动不…

python3处理docx并flask显示

前言: 最近有需求处理docx文件,并讲内容显示到页面,对world进行在线的阅读,这样我这里就使用flaskDocument对docx文件进行处理并显示,下面直接上代码: Document处理: 首先下载Document的库文…

kubeadm 快速搭建

二进制搭建适合大集群,50台以上的主机 kubeadm更适合中下企业的业务集群。 master docker kubelet bubeadm kubectl flannel node1 docker kubelet bubeadm kubectl flannel node2 docker kubelet bubeadm kubectl flannel harbor节点:docker docker…

排列组合算法(升级版)

前言 在上一期博客中我们分享了一般的排列组合算法(没看的话点这里哦~),但是缺点很明显,没法进行取模运算,而且计算的范围十分有限,而今天分享的排列组合升级版算法能够轻松解决这些问题,话不多…

【汇编笔记】初识汇编-内存读写

汇编语言的由来: CPU是计算机的核心,由于计算机只认识二进制,所以CPU执行的指令是二进制。 我们要想让CPU工作,就得给他提供它认识的指令,这一系列的指令的集合,称之为指令集。 指令集: 不同的体…