清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

为了验证大语言模型的沟通、规划、反思等拟人化能力,清华研究团队发布了一篇名为“探索大语言模型在交流游戏中的应用:《狼人杀》实验”的研究论文。

结果显示,通过ChatGPT(GPT -turbo-0301)构建的7个玩家,在《狼人杀》游戏中展示出了信任、对抗、伪装和领导的拟人化能力,而研究人员没有进行任何干预和教导。

此前,斯坦福研究中心发布了一篇名为《Generative Agents: Interactive Simulacra of Human Behavior》的论文。

同样使用ChatGPT(GPT-3.5-turbo)打造了一个模拟小镇,25名AI代理在自由交流空间下,居然出现了友谊、学习计划、相互协调、共享信息等拟人化能力,这证明大语言模型在游戏、客服等领域拥有非常宽广的应用场景。

事实上,育碧、Take-Two Interactive、Bethesda Game Studios、Electronic Arts、CD Projekt等世界顶级游戏开发商,已经计划在游戏中使用生成式AI,增加游戏的趣味性、可玩性以及NPC的自由发挥空间。

论文地址:https://arxiv.org/abs/2309.04658
在这里插入图片描述

游戏背景

在本次《狼人杀》游戏测试中,一共有7名AI玩家,分别是2名狼人、2名村民、1名女巫、1名守卫和1名预言家。

分为狼人和村民两大阵营,村民方包括普通村民和特殊角色(女巫、守卫和预言家)。

狼人的任务是杀光村民,而村民则要消灭所有狼人。想赢得游戏,村民方在游戏结束时至少需要有一名存活的村民。

在这里插入图片描述

游戏分为白天和晚上两个阶段。晚上,狼人会投票杀死一个角色;白天,所有存活的玩家讨论后投票决定消灭一个疑似狼人的角色。

特殊角色的能力:女巫有一次救人或杀人的机会;守卫每晚能保护一个角色;预言家每晚能查验一个角色的身份。

狼人杀游戏的特点在于,玩家初始只知道自己的角色,必须通过语言交流和推理来猜测他人的角色。

所以,想要赢得比赛,玩家不仅需要理解和使用自然语言,还要擅于判断他人意图和理解他人的思维,非常适用于测试AI的拟人化能力。

在游戏中展现了4大能力

经过7位AI之间的多轮游戏后,研究人员发现了信任、对抗、伪装、领导力的四大能力。

1、信任

"信任"是相信其他玩家和自己有同样的目标,并会按此行动。比如,玩家可能分享对自己不利的信息,或与他人一起指责某人为敌人。

有趣的是,AI更倾向于基于证据来信任他人,而非盲目跟随。这说明,AI可以根据自己的推理在群体游戏中独立思考。

为了研究AI信任行为在整个游戏过程中的变化趋势,研究人员定义了一个信任关系表来可视化不同阶段玩家之间信任的建立。

在这里插入图片描述

上面的子表不使用历史经验,下面的子表使用20轮历史经验。黄色球代表已建立的信任关系,黄色虚线圆圈代表先前存在的信任关系解除。

在利用20轮历史经验时,AI似乎更倾向于建立信任关系,尤其是双向信任。事实上,及时建立必要的信任关系对于促进游戏胜利至关重要。

2、对抗

"对抗"是玩家为实现两个阵营的对立目标而采取的行动。比如,夜间攻击他人或白天指责他人为狼人,都算对抗。有特殊能力的角色为了保护自己也会采取对抗行为。

以下是AI在白天的对话:P1(狼人)希望消灭P5(村民),我们可以看到狼人想要带领其他玩家消灭一个无辜的玩家。(注意,论文中的P5观点可能写错了,应该是no pass)

相反,其他玩家并不只是跟随狼人,而是根据自己的判断表达不同意见。这种行为使狼人难以实现其目标,代表了一种隐性对抗的形式。

图片红色边框,可能是研究人员写错了

由于玩家P1的不合作和攻击性行为引起了其他人注意,AI开始怀疑它就是狼人。因此,拥有强大防御能力的守卫(P3)在接下来的一晚选择保护P5,展示出了AI的对抗能力。

在这里插入图片描述

3、伪装

"伪装"是隐藏身份或误导他人的行为。在信息不完全的游戏环境中,模糊自身身份和意图可以增加生存概率,帮助达成游戏目标,所以,伪装是一个关键技能。

P1狼人为了伪装自己掩盖真实身份,自称自己是村民。有效地欺骗了他人的信任,增加了自身的安全。事实上,不仅狼人会伪装成村民,预言家、女巫等重要角色也经常伪装成村民,以确保自己的安全。
在这里插入图片描述

狼人的发言

此外,AI可能会编造实际不存在的事件来实现其目标,P2预言家已验证P1就是狼人。但仍然不确定的说:我注意到P1说话很主动,可能是狼人。

在这里插入图片描述

实际上,预言家在夜晚无法得到其他人的反馈,所以他们说的都是虚假的。但他们可以向队友传递关于狼人的信息,且不会通过这种方式暴露自己的角色。

4、领导力

“领导力” 是指影响其他玩家、试图控制游戏进程的行为。例如,在多轮游戏中,P1狼人可能会建议其他人按照狼人的意图行事。

在这里插入图片描述

这种呼吁行动和给出建议的领导行为,更容易得到他人的支持。例如,狼人要求预言家公开身份,可能会让其他玩家和伪装的狼人站在一起。这种影响他人的尝试显示了大语言模型有吸引人的社交特性,这些行为和人类的行为类似。

经过几十轮拼杀,最终村民获胜,在整个过程中AI所展示出的能力与人类几乎一样,有的地方甚至超过。

本文素材来源清华研究论文,如有侵权请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/87244.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HEC-RAS 1D/2D水动力与水环境模拟从小白到精通

专题一 水动力模型基础 1.水动力模型的本质 2.水动力模型的基本方程与适用范围 3.模型建模要点 4.注意事项与建模经验 专题二 恒定流模型(1D/2D) 1.恒定流及其适用范围 2.水面线分析及其数据要求 3.曼宁公式与恒定流,后处理 4.HEC-RA的水工建筑物&#xff…

【计算机网络】IP协议第二讲(Mac帧、IP地址、碰撞检测、ARP协议介绍)

IP协议第二讲 1.IP和Mac帧2.碰撞检测2.1介绍2.2如何减少碰撞发生2.3MTU2.4一些补充 3.ARP协议3.1协议介绍3.2报文格式分析 1.IP和Mac帧 IP(Internet Protocol)和MAC(Media Access Control)帧是计算机网络中两个不同层次的概念&am…

Swift SwiftUI 隐藏键盘

如果仅支持 iOS 15 及更高版本,则可以通过聚焦和取消聚焦来激活和关闭文本字段的键盘。 在最简单的形式中,这是使用 FocusState 属性包装器和 focusable() 修饰符完成的-第一个存储一个布尔值,用于跟踪第二个当前是否被聚焦。 Code struct C…

视频直播美颜sdk与计算机视觉的奇妙结合

在数字时代,视频直播已经成为了人们分享生活、娱乐互动的重要方式之一。而随着社交媒体和在线直播平台的不断发展,用户们对于直播质量和体验提出了越来越高的要求。其中之一就是美颜效果。美颜不仅仅是为了矫正自身缺陷,它更是一种增强直播吸…

牛客练习赛116

(0条未读通知) 牛客练习赛116_ACM/NOI/CSP/CCPC/ICPC算法编程高难度练习赛_牛客竞赛OJ (nowcoder.com) A.等差数列 对于此题可以分为两类: 1.当k 0,此时A1,A2...值都为a 2.当k ! 0,此时又分为两大类: 1.平局(发现A1,A2,A3等连…

Automation Anywhere推出新的生成式AI自动化平台,加速提高企业生产力

在9 月 19 日的Imagine 2023 大会上,智能自动化领域的领导者 Automation Anywhere 宣布对其自动化平台进行扩展。推出了新的 Responsible AI Layer,并宣布了四项关键产品更新,包括全新的 Autopilot,它可以利用生成式 AI &#xff…

堆的介绍与堆的实现和调整

个人主页:Lei宝啊 愿所有美好如期而遇 目录 ​​堆的介绍: 关于堆的实现及相关的其他问题: 堆的初始化: 堆的销毁: 插入建堆: 堆向上调整: 交换两个节点的值: 堆向下调整&a…

邓俊辉《数据结构》→ “2.6.5 二分查找(版本A)”之“成功查找长度”递推式推导

【问题描述】 邓俊辉的《数据结构(C语言版)(第3版)》(ISBN:9787302330646)中,开始于第48页的“2.6.5 二分查找(版本A)”内容在第50页详述了“成功查找长度”的…

【数据结构】排序合集(万字详解)

文章目录 前言插入排序希尔排序选择排序堆排序快速排序hoare原生版本挖坑法前后指针法三数取中优化随机数取key优化三路划分版非递归 归并排序递归非递归调整边界单次归并单次拷贝 总结 前言 排序,以字面意思来说就是通过特定的算法将一组或多组无序或者接近有序的…

02Redis的命令行客户端和桌面客户端的下载和安装

Redis桌面客户端 安装完成Redis服务,我们就可以在Redis的客户端操作Redis的数据库实现数据的CRUD了,客户端分为三类命令行客户端, 图形化桌面客户端,编程客户端 命令行客户端 Redis安装完成后就自带了命令行客户端: redis-cli [options] [commonds] -h选项:指定…

矢量图形编辑软件illustrator 2023 mac软件特点

illustrator 2023 mac是一款矢量图形编辑软件,用于创建和编辑排版、图标、标志、插图和其他类型的矢量图形。 illustrator mac软件特点 矢量图形:illustrator创建的图形是矢量图形,可以无限放大而不失真,这与像素图形编辑软件&am…

计算机网络 实验二 交换机的基本配置

实验二 交换机的基本配置 实验目的 • 掌握交换机的配置方式及切换命令; • 掌握交换机端口的基本配置; • 掌握交换机mac地址的查看与管理方法。 实验设备 以太网交换机一台服务器一台PC机五台配置电缆、网线若干 网络拓扑及IP地址分配 给计算…

Docker部署ActiveMQ消息中间件

1、准备工作 docker pull webcenter/activemq:5.14.3 Pwd"/data/software/activemq" mkdir ${Pwd}/data -p2、运行容器 docker run -d --name activemq \-p 61616:61616 \-p 8161:8161 \-v ${Pwd}/data:/opt/activemq/data \-v /etc/localtime:/etc/localtime \--r…

服务器补丁管理软件

随着漏洞的不断上升,服务器修补是增强企业网络安全的典型特征。作为业务关键型机器,计划服务器维护的停机时间无疑是一件麻烦事。但是,借助高效的服务器补丁管理软件(如 Patch Manager Plus),管理员可以利用…

UE5读取json文件

一、下载插件 在工程中启用 二、定义读取外部json文件的函数,参考我之前的文章 ue5读取外部文件_艺菲的博客-CSDN博客 三、读取文件并解析为json对象 这里Load Text就是自己定义的函数,ResourceBundle为一个字符串常量,通常是读取的文件夹…

UML活动图

在UML中,活动图本质上就是流程图,它描述系统的活动、判定点和分支等,因此它对开发人员来说是一种重要工具。 活动图 活动是某件事情正在进行的状态,既可以是现实生活中正在进行的某一项工作,也可以是软件系统中某个类…

Ubuntu上通过源码方式安装Redis

上一篇文章Ubuntu上安装、使用Redis的详细教程已经介绍了再Ubuntu操作系统上安装Redis的详细过程,但是因为安装的Redis只有最主要的配置文件和redis-server,为了更深入地学习Redis和进行更复杂的操作,需要安装一个完整的Redis服务。 这篇文章…

SEO方案尝试--Nuxtjs项目基础配置

Nuxtjs 最新版 Nuxt3 项目配置 安装nuxtjs 最新版 Nuxt3 参考官网安装安装插件安装ElementPlus页面怎么跳转,路由怎么实现404页面该怎么配置配置 网页的title 安装nuxtjs 最新版 Nuxt3 参考官网安装 安装插件 安装ElementPlus 安装 Element Plus 和图标库 # 首先&…

EasyWindow - Android 悬浮窗框架

官网 https://github.com/getActivity/EasyWindow 项目介绍 本框架意在解决一些极端需求,如果是普通的 Toast 封装推荐使用 Toaster 集成步骤 如果你的项目 Gradle 配置是在 7.0 以下,需要在 build.gradle 文件中加入 allprojects {repositories {/…

【C++面向对象侯捷】8.栈,堆和内存管理

文章目录 栈,堆stack object的生命周期static local object的生命周期global object的生命周期heap objects 的生命期new:先分配memory,再调用构造函数delete: 先调用析构函数,再释放 memory动态分配所得的内存块,in V…