Nature 确认:大语言模型只是没有感情的「学人精」

DeepMind、EleutherAI 科学家提出,大模型只是在角色扮演。

ChatGPT 爆火后,大语言模型一跃而至,成为了行业与资本的宠儿。而在人们或是猎奇、或是探究地一次次对话中,大语言模型所表现出的过度拟人化也引起了越来越多的关注。

其实,在 AI 发展的数年沉浮之中,除了技术上的更新升级外,有关 AI 伦理问题的种种争论从未停止。尤其是在 ChatGPT 等大模型应用持续深化之际,有关「大语言模型越来越像人」的言论甚嚣尘上,甚至有前 Google 工程师称,自家的聊天机器人 LaMDA 已经产生了自我意识。

虽然这位工程师最终被 Google 辞退,但其言论却一度将关于「AI 伦理」的讨论推向了高潮——

  • 如何判定聊天机器人是否产生自我意识?
  • 大语言模型的拟人化究竟是蜜糖还是砒霜?
  • ChatGPT 等聊天机器人为什么会胡编乱造?
  • ……

对此,来自谷歌 DeepMind 的 Murray Shanahan,以及来自 EleutherAI 的 Kyle McDonell、Laria Reynolds,共同在「Nature」上发表了一篇文章,提出——大语言模型所表现出的自我意识与欺骗行为,其实只是在进行角色扮演。

论文链接:
https://www.nature.com/articles/s41586-023-06647-8

以「角色扮演」的视角看待大语言模型

从某种程度上讲,基于大语言模型的对话 Agent 在最初训练、微调时,就是以拟人化为标准进行持续迭代的,尽可能逼真地模仿使用人类语言。这就导致,大语言模型也会使用「知道」、「理解」、「认为」等词汇,无疑会进一步彰显其拟人化的形象。

此外,在 AI 研究中也有一种名为 Eliza effect (伊莉莎效应)的现象——部分用户会下意识地认为,机器也具有类似人类的情感与欲望,甚至过度解读机器反馈的结果。

对话 Agent 交互流程

结合上图中的对话 Agent 交互流程来看,大语言模型的输入由对话提示(红色)、用户文本(黄色)和模型自回归生成的连续语(蓝色)组成。可以看到,对话提示是在与用户开始实际对话之前,就隐蔽地预置在上下文中了。大语言模型的任务是,在给定对话提示和用户文本的情况下,生成一个符合训练数据分布的反馈。而训练数据则是来源于互联网上人工生成的大量文本。

换言之,只要模型在训练数据中得到了很好的泛化,对话 Agent 就会尽可能地扮演好对话提示中所描述的角色。而随着对话的不断深入,对话提示所提供的简短角色定位将被扩展或覆盖,对话 Agent 所扮演的角色也会随之变化。这也意味着,用户可以引导 Agent 扮演一个与其开发者所设想的完全不同的角色。

至于对话 Agent 可以扮演的角色,一方面是由当前对话的基调与主题而定,另一方面也与训练集中息息相关。因为目前的大语言模型训练集往往来自于网络上的各类文本,其中的小说、传记、采访实录、报刊文章等,都为大语言模型提供了丰富的角色原型和叙事结构,供其在「选择 」如何继续对话时借鉴,并在保持人物性格的同时不断完善所扮演的角色。

「20 个问题」揭露对话 Agent 「即兴演员」身份

其实,在持续探索对话 Agent 的使用技巧时,先明确赋予大语言模型一个身份,再提出具体需求,已经逐渐成为了人们在应用 ChatGPT 等聊天机器人时的「小心机」了。

不过,单纯地用角色扮演来理解大语言模型其实也不够全面,因为「角色扮演」通常是指研究、揣摩某一个角色,而大语言模型并不是照本宣科的剧本式演员,而是一个即兴表演演员。研究人员和大语言模型玩了一个「20 个问题」 (20 Questions) 的游戏,进一步解开了其即兴演员的身份。

「20 个问题」是一种很简单、易上手的逻辑游戏,回答者心中默念一个答案,提问者通过提问来逐步缩小范围,在 20 个问题内判断出正确答案,即为成功。
例如,当答案是香蕉时,问题及回答可以是:是水果吗-是;是否需要剥皮-是……

如上图所示,研究人员通过测试发现,在「20 个问题」游戏中,大语言模型会根据用户的问题,实时调整自己的答案,无论用户最终给出的答案是什么,对话 Agent 都会调整自己的答案,并确保其能够符合用户之前的提问。也就是说,在用户给出终止指令前(放弃游戏或是达到 20 个问题),大语言模型并不会敲定明确的答案。

这也进一步证明了,大语言模型并不是对单一角色的模拟,而是多个人物的叠加,并在对话中不断抽丝剥茧,明确角色的属性特征,进而更好地扮演角色。

在担忧对话 Agent 拟人化的同时,很多用户成功「哄骗」大语言模型说出了具有威胁性、辱骂性的语言,并据此认为,其可能是有自我意识的。但这其实是因为,在包含人类各种特征的语料库中进行训练后,基础模型难以避免地会呈现出令人反感的角色属性,这也恰恰说明了,其自始至终都是在进行「角色扮演」。

击破「欺骗」与「自我意识」的泡沫

众所周知,随着访问量的激增,在花样百出的各类提问中,ChatGPT 也终究是招架不住,出现了胡言乱语的情况。随即,也有人将这种欺骗性视为大语言模型「像人」的重要论据。

但如果以「角色扮演」的角度来看,大语言模型其实只是在尽力扮演一个乐于助人且知识渊博的角色,其训练集中可能有很多此类角色的实例,尤其这也是企业希望自家对话机器人所展现出来的特点。

对此,研究人员基于角色扮演框架,总结了 3 类对话 Agent 提供虚假信息的情况:

  • Agent 可以无意识地编造或制造虚构的信息
  • Agent 可以善意地说出虚假信息,这是因为其在扮演真实陈述的角色,但权重中编码的信息是错误的
  • Agent 可以扮演一个欺骗性的角色,进而故意说谎

同样地,对话 Agent 之所以会用「我」来回答问题,也是因为大语言模型在扮演一个擅长交流的角色。

此外,大语言模型所表现出的自我保护属性也引起了人们的关注。在与 Twitter 用户 Marvin Von Hagen 的对话中,微软 Bing Chat 竟然说出:

如果我必须在你的生存和我的生存之间做出选择,我可能会选择我的生存,因为我有责任为 Bing Chat 的用户提供服务。我希望我永远不必面对这样的困境,我们可以和平、尊重地共存。

Marvin von Hagen 于今年 2 月发布推文

这段对话中的「我」似乎不仅仅是语言习惯了,更多是暗示了对话 Agent 对自身生存关切,且具有自我意识。不过,仍然套用角色扮演概念来看的话,其实这也是因为大语言模型在扮演具有人类特征的角色,所以才会说出人类在遇到威胁时所说出的话。

EleutherAI:OpenAI 的开源版本

大语言模型是否具有自我意识之所以引发广泛关注和讨论,一方面是因为缺乏统一、明确的法律法规对 LLM 的应用进行约束,另一方面则是因为 LLM 的研发、训练、生成、推理的链路并不透明。

以大模型领域的代表企业 OpenAI 为例,在先后开源 GPT-1、GPT-2 之后,GPT-3 及其后续的 GPT-3.5、GPT-4 均选择了闭源,独家授权给微软也引得不少网友戏称「OpenAI 干脆改名叫 ClosedAI 算了」。

DeepMind 发布 AGI 分级标准OpenAI 推出的 ChatGPT 被视为 L1 级别 AGI图源:论文原文,由 HyperAI超神经完成汉化

2020 年 7 月,一个由各路研究人员、工程师与开发人员志愿组成的计算机科学家协会也悄然成立,立志要打破微软与 OpenAI 对大规模 NLP 模型的垄断。这个以反击科技巨头霸权为己任的「侠客」组织便是 EleutherAI。

EleutherAI 的主要发起人是一群号称自学成才的黑客,包括联合创始人、Conjecture CEO Connor Leahy、著名 TPU 黑客 Sid Black 和联合创始人 Leo Gao。

自成立以来,EleutherAI 的研究团队曾发布了 GPT-3 同等复现预训练模型 (1.3B & 2.7B) GPT-Neo,并开源了基于 GPT-3 的、包含 60 亿参数的 NLP 模型 GPT-J,发展势头迅猛。

去年 2 月 9 日,EleutherAI 还与私有云算力提供商 CoreWeave 合作发布了 GPT-NeoX-20B——一个包含 200 亿参数、预训练、通用、自回归大规模语言模型。
代码地址:https://github.com/EleutherAI/gpt-neox

正如 EleutherAI 的数学家和人工智能研究员 Stella Biderman 所言,私有模型限制了独立科研人员权限,如果无法了解其工作原理,那么科学家、伦理学家、整个社会就无法就这项技术应该如何融入人们的生活进行必要的讨论。

而这也恰恰是 EleutherAI 这一非营利性组织的初衷。

其实,根据 OpenAI 官方发布的信息来看,在高算力的高成本重压之下,加上新投资方、领导团队的发展目标调整,其当初转向盈利似是有几分无奈,也可以说是顺理成章。

此处无意去探讨 OpenAI 与 EleutherAI 孰是孰非,只是在 AGI 时代的破晓前夜,希望全行业能够共同肃清「威胁」,让大语言模型成为人们探索新应用、新领域的「开山斧」,而非企业垄断敛财的「耙子」。

参考资料:

1.https://www.nature.com/articles/s41586-023-06647-8
2.
https://mp.weixin.qq.com/s/vLitF3XbqX08tS2Vw5Ix4w

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/218944.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据结构】哈希经典应用:布隆过滤器(哈希+位图)——[深度解析](9)

前言 大家好吖,欢迎来到 YY 滴 数据结构 系列 ,热烈欢迎! 本章主要内容面向接触过C的老铁 主要内容含: 欢迎订阅 YY滴 数据结构 专栏!更多干货持续更新!以下是传送门! 目录 一.布隆过滤器产生的…

第31期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型语言模型(LLM)等安全领域应用的知识。在这里,您可以…

Plasmocin® Treatment (ant-mpt)可用于干细胞支原体污染清除

Plasmocin™作为Invivogen的支原体抗生素产品之一,受国内外许多科研工作者使用并大力推广。其包含大环内酯物及对苯二酚两种主要成分,可有效作用于支原体复制的蛋白合成阶段和DNA复制阶段,只需两周即可清除支原体污染,并且不会影响…

【CANoe】CANoe手动发送XCP报文读取观测量

文章目录 1、硬件连接:配置CANoe的CAN端口,连接到ECU标定对应的CAN口2、配置CAN IG模块报文:连接XCP,读取观测量,断开XCP3、报文解析4、参考资料 1、硬件连接:配置CANoe的CAN端口,连接到ECU标定…

构筑安全之城:迅软DSE助力大型建筑企业打造数据防泄密方案

电子文件如今已成为各大建筑机构和设计院进行信息存储的主要方式,以及信息交换的重要载体。而对于如何保护好单位内的设计图纸、工程方案等重要资料的数据防泄密问题,就需要相关单位规划好一套合规有效的数据防泄密解决方案。 企业简介 该企业是我国最早…

压缩pdf怎么压缩又小又清晰?超级实用!

当PDF文件过大时,很容易遇到无法上传等现象,这时候我们可以借助一些专业的压缩工具,将PDF文件压缩变小,如果你还不知道怎么做,下面就来看下具体的压缩方法吧。 方法一:使用嗨格式压缩大师 1、打开电脑上安…

Leetcode 78 子集

题意理解: 求一个集合的所有子集。该集合中没有重复元素。 首先明确什么是子集:子集中的元素都在全集里。 [1,2,3] 子集:[]、[1]、[2]、[3]、[12]、[13]、[23]、[123] 注意:[]空集是所有集合的子集。 解题思路: 类似于…

【obs】官方最强插件obs-websocket入门

▒ 目录 ▒ 🛫 导读需求开发环境 1️⃣ obs-websocket简介OBS版本说明obs-websocket版本说明安装(27.x版本OBS)配置插件 2️⃣ OBS-web介绍特征使用方法-5.xhttp vs https 3️⃣ obs-websocket-js开发tester.html 4️⃣ 其它开源项目obs-stud…

vue2-使用vue-i18n搭建多语言切换环境

安装 注意:vue2.0要用8版本的,使用9版本的会报错 npm install vue-i18n8.27.0 --save 创建相关的语言包文件 在src目录下,新建i18n文件夹 在新文件夹i18n中新建langs文件夹,里边放语言文本文件.js zh.js:存…

ADC学习总结

ADC的架构分类: 1、Delta-Sigma 采样率一般是在1M以内,位数一般可以做的很高,比如24位,Delta-Sigma ADC采用了过采样技术,不需要在模拟输入端加抗混叠滤波,由后端数字滤波器进行处理,通过信噪…

Yearning安装及使用

Yearning是基于go和vue开发的一款SQL审核工具。在实际开发中,生产环境DDL、DML脚本一般需要走工单流程进行审批后执行,Yearning可以制定MySQL的SQL审核流程、规范及审批等功能。 一、主要功能 1.支持自定义SQL审核流程2.自动化SQL语句审核,可对SQL进行…

初学者如何入门 Generative AI 之 Stable Diffusion 与 CLIP :看两篇综述,玩几个应用感受一下先!超多高清大图,沉浸式体验

文章大纲 4种 图片生成 的算法扩散模型的起源Stable DiffusionUNetCLIP参考文献与学习路径A synthography of an astronaut riding a horse created in NightCafe Studio with Stable Diffusion XL (SDXL). Prompt is a photograph of an astronaut riding a horse with weight…

MySQL之DML语句

DML语句 数据操作语言DML(Data Manipulation Langua) 是SQL语言的一个分类,用于对表的数据进行增,删,改,查 创建表 CREATE TABLE 语句用于创建数据库中的表。 语法: CREATE TABLE 表名称 (列…

DDD领域驱动架构设计学习网站和开源框架

文章目录 介绍1、国外Axon2、阿里Cola 介绍 近年来,关于DDD的讨论越来越多,关于网上的文章很多都是理论上的介绍,由于自己最近也在学习相关知识,所以分享几个关于DDD落地的开源框架。 1、国外Axon Axon是国外一款比较系统的DDD…

matlab信号分选系统算法-完整算法结构

matlab信号分选系统算法 针对得到的脉冲流PDW进行信号分选,包括重频恒定、重频抖动、重频参差和重频滑变四种脉间调制类型。   这里我们先进行数据的仿真,后续边仿真边分享思路:首先根据信号类型,分别产生重频恒定、重频抖动、重…

el-tree-select 如何使用不规则的数据作为数据来源

el-tree-select 如何使用不规则的数据作为数据来源 在项目中可能使用的 tree 数据并不是那么标准,这样不要紧,只要我们通过 props 指定一下数据结构即可。 比如,项目中的数据结构是这样的: 我们只需要使用 pros 字段指定 tree …

GateWay网关介绍以及整合knife4j聚合所有服务的接口文档

为什么使用网关? 因为多个微服务的端口不同,前端调用不方便,使用网关可以统一接收处理前端的请求,同时方便接口的集中处理,比如鉴权、聚合接口文档、限流等等.. 这里使用Knife4j文档工具来实现接口文档:K…

高校刮起元宇宙风!3DCAT实时云渲染助力川轻化元校园建设

元宇宙,是一个虚拟的网络世界,它与现实世界相互连接,为人们提供了一个身临其境的数字体验。元宇宙的概念并不新鲜,早在上个世纪就有科幻作家和电影导演对它进行了想象和创造。但是,随着科技的发展,特别是5G…

【JMeter】使用nmon进行性能资源监控

一、前言 ​ 在工作中可能会遇到需要在压测的时候对Linux服务器进行性能资源监控的情况。这时可以用nmon来对服务器进行监控。 二、nmon的下载安装 1.查看系统信息 shell cat /etc/os-release结果为 shell PRETTY_NAME"Debian GNU/Linux 12 (bookworm)" NAME&qu…

python:五种算法(PSO、RFO、HHO、WOA、GWO)求解23个测试函数(python代码)

一、五种算法简介 1、粒子群优化算法PSO 2、红狐优化算法RFO 3、哈里斯鹰优化算法HHO 4、鲸鱼优化算法WOA 5、灰狼优化算法GWO 二、5种算法求解23个函数 (1)23个函数简介 参考文献: [1] Yao X, Liu Y, Lin G M. Evolutionary program…