人工智能系统越来越擅长欺骗我们?

人工智能系统越来越擅长欺骗我们?

在这里插入图片描述
一波人工智能系统以他们没有被明确训练过的方式“欺骗”人类,通过为他们的行为提供不真实的解释,或者向人类用户隐瞒真相并误导他们以达到战略目的。

发表在《模式》(Patterns)杂志上的一篇综述论文总结了之前的研究,该论文指出,这个问题凸显了人工智能控制的难度,以及这些系统工作方式的不可预测性。

说到欺骗人类,或许表明这些模型是有意图的。他们没有,但人工智能模型会无意识地找到解决障碍的方法,以实现给定的目标。有时,这些变通方法会违背用户的期望,让人觉得具有欺骗性。

AI系统学会欺骗的一个领域是在游戏环境中,它们被训练成要赢的游戏,特别是那些涉及必须采取战略行动的游戏。

2022年11月,Meta宣布创造了Cicero,这是一款能够在《外交》(Diplomacy)在线版中击败人类的人工智能。《外交》是一款流行的军事战略游戏,玩家可以通过协商联盟来争夺对欧洲的控制权。

Meta的研究人员表示,他们已经在数据集的“真实”子集上训练Cicero,使其在很大程度上是诚实和有用的,并且为了成功,它“永远不会故意背后中伤”它的盟友。但这篇新论文的作者声称,事实恰恰相反:西塞罗违反了协议,说了彻头彻尾的谎言,并参与了有预谋的欺骗。作者表示,尽管该公司确实试图训练西塞罗诚实行事,但未能实现这一目标,这表明人工智能系统仍然可以出人意料地学会欺骗。

Meta既没有证实也没有否认研究人员关于Cicero表现出欺骗行为的说法,但一位发言人表示,这纯粹是一个研究项目,该模型只是为了玩《Diplomacy》而建立的。他们说:“我们根据我们长期以来对开放科学的承诺,在非商业许可下发布了这个项目的文物。”“Meta定期分享我们的研究结果,以验证它们,并使其他人能够负责任地利用我们的进步。我们没有计划在我们的产品中使用这项研究或其成果。”

但这并不是唯一一款AI通过“欺骗”人类玩家获得胜利的游戏。

AlphaStar是DeepMind为玩电子游戏《星际争霸2》(StarCraft II)而开发的人工智能,它非常擅长做出旨在欺骗对手的招式(即佯攻),击败了99.8%的人类玩家。在其他地方,另一个名为Pluribus的Meta系统在扑克游戏中成功地学会了虚张声势,以至于研究人员决定不公布它的代码,因为担心它会破坏在线扑克社区。

除了游戏,研究人员还列举了其他人工智能欺骗性行为的例子。OpenAI最新的大型语言模型GPT-4在一项测试中提出了谎言,该测试要求它说服人类为它解决验证码。在一次模拟演习中,该系统还涉及内幕交易。在模拟演习中,该系统被要求扮演一名受压股票交易员的身份,尽管从未被明确指示这样做。

人工智能模型有可能在没有任何指示的情况下以欺骗的方式行事,这一事实似乎令人担忧。麻省理工学院研究人工智能存在安全性的博士后彼得·s·帕克(Peter S. Park)参与了这个项目,他说,这主要源于最先进的机器学习模型所特有的“黑匣子”问题:我们不可能确切地说出它们是如何或为什么会产生这样的结果——或者它们是否会一直表现出这种行为。

他说:“仅仅因为你的人工智能在测试环境中有某些行为或倾向,并不意味着如果它被释放到自然环境中,同样的教训也会成立。”“没有简单的方法可以解决这个问题——如果你想知道人工智能一旦被部署到野外会做什么,那么你就必须把它部署到野外。”

我们将人工智能模型拟人化的倾向影响了我们测试这些系统的方式以及我们对它们能力的看法。毕竟,通过旨在衡量人类创造力的测试并不意味着人工智能模型实际上具有创造力。剑桥大学(University of Cambridge)人工智能研究员哈里•劳(Harry Law)表示,至关重要的是,监管机构和人工智能公司要仔细权衡这项技术对社会的潜在好处和造成伤害的可能性,并明确区分这些模型能做什么和不能做什么。他没有参与这项研究。“这些都是很难回答的问题,”他说。

他说,从根本上说,目前还不可能训练出一个在所有可能情况下都不会欺骗的人工智能模型。此外,除了放大偏见和错误信息的倾向之外,欺诈行为的潜在可能性是许多问题之一,这些问题需要在人工智能模型被信任用于现实世界的任务之前得到解决。

“这是一项很好的研究,表明欺骗是可能的,”劳说。“下一步将是尝试进一步弄清楚风险状况是什么,以及欺骗行为可能产生的危害有多大,以及以何种方式发生。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/24739.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

店匠科技亮相VivaTech,新零售解决方案引关注

在中法建交60周年之际,两国关系持续发展并共同推动双方在人工智能和全球治理领域达成重要合作。同时,浙江-法国高新产业创新合作对接会在巴黎顺利举行,进一步促进了中法两国在高新技术领域的交流与合作。 紧跟此次访问的步伐,众多中国科技创新企业齐聚巴黎,于5月22日至25日在法…

浅谈安全用电管理系统对重要用户的安全管理

1用电安全管理的重要性   随着社会经济的不断发展,电网建设力度的不断加大,供电的可靠性和供电质量日益提高,电网结构也在不断完善。但在电网具备供电的条件下,部分高危和重要电力用户未按规定实现双回路电源线路供电&#xff1…

代码随想录算法训练营第五十三天 | 309.最佳买卖股票时机含冷冻期、714.买卖股票的最佳时机含手续费

309.最佳买卖股票时机含冷冻期 视频讲解:动态规划来决定最佳时机,这次有冷冻期!| LeetCode:309.买卖股票的最佳时机含冷冻期_哔哩哔哩_bilibili代码随想录 解题思路 1. dp[i][0] 第i天持有股票的状态 dp[i][1]第i天不持股的状…

Elasticsearch:ES|QL 查询 TypeScript 类型(二)

在我之前的文章 “Elasticsearch:ES|QL 查询 TypeScript 类型(一)”,我们讲述了如何在 Nodejs 里对 ES|QL 进行查询。在今天的文章中,我们来使用一个完整的例子来进行详细描述。更多有关如何使用 Nodejs 来访问 Elasti…

JavaScript中的 和 || 区别

在 JavaScript 中,&& 操作符被称为逻辑与操作符。当使用 && 操作符连接两个表达式时,它会首先计算左侧的表达式: 如果左侧的表达式为 false 或者可以转换为 false 的值(如 null、undefined、0、“” 空字符串或 …

初入阿里云,上手走一波

初入阿里云,上手走一波 一阶:ECSMysqlDMS安装Mysql初始化MysqlMysql操作DMS管理Mysql 二阶:ECSOSS远程连接ECSOSS控制台其他图片服务 三阶:更多搭配操作 可以说个人在日常使用过程中,操作最多的阿里云产品就是阿里云服…

全身控制(Whole-Body Control,WBC)简化版

全身控制(Whole-Body Control,WBC)概述 WBC是一种集成了多种控制策略的方法,旨在同时控制人形机器人的多个自由度(DOF),以实现复杂的运动和任务。WBC通常通过优化来解决,同时考虑到…

Python爬虫实战:从入门到精通

网络爬虫,又称为网络蜘蛛或爬虫,是一种自动浏览网页的程序,用于从互联网上收集信息。Python由于其简洁的语法和强大的库支持,成为开发网络爬虫的首选语言。 环境准备 Python安装 必要的库:requests, BeautifulSoup, Sc…

使用 LLaMA-Factory 实现对大模型函数调用功能

节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 合集&#x…

现代密码学-认证、消息认证码

什么是单向散列函数 单向散列函数(one way hash function):一个输入:消息(message),一个固定长度的输出(散列值,hash value),根据散列值检查消息完整性(integrity) 单向散列函数也称为消息摘要…

linux中创建sftp

前言:每次创建sftp的时候总是查一堆文档,不是有的步骤不对,就是缺失步骤,索性自己写一份以供后续方便使用。 一、添加用户组sftp --> groupadd sftp ●查看用户组是否创建成功 --> cat /etc/group 二、创建用户&#xf…

Docker大学生看了都会系列(七、Dokcerfile详解)

系列文章目录 第一章 Docker介绍 第二章 2.1 Mac通过Homebrew安装Docker 第二章 2.2 CentOS安装Docker 第三章 Docker常用命令 第四章 常用命令实战 第五章 Docker镜像详解 第六章 Docker容器数据卷 第七章 Dockerfile详解 第八章 Dokcerfile部署go项目 文章目录 一、Dockerfil…

图形化红队行动辅助平台Viper使用记录

图形化红队行动辅助平台Viper使用记录 简介 Viper(炫彩蛇)是一款图形化内网渗透工具,将内网渗透过程中常用的战术及技术进行模块化及武器化. Viper(炫彩蛇)集成杀软绕过,内网隧道,文件管理,命令行等基础功能. Viper(炫彩蛇)当前已集成70个模块,覆盖初始访问/持久化/权限提升/…

Python 中的字符串、列表、元组和字典数据类型的特点和使用场景

字符串(str)是一种不可变的序列类型,由字符组成。它的特点是: 可以使用单引号或双引号来定义字符串。字符串中的字符是按照索引进行访问的,索引从0开始。字符串可以进行切片操作,获取部分子串。字符串可以…

【数据结构】初识数据结构之复杂度与链表

【数据结构】初识数据结构之复杂度与链表 🔥个人主页:大白的编程日记 🔥专栏:C语言学习之路 文章目录 【数据结构】初识数据结构之复杂度与链表前言一.数据结构和算法1.1数据结构1.2算法1.3数据结构和算法的重要性 二.时间与空间…

【FPGA】arm数据总线和axi数据总线有什么异同点?

ARM数据总线和AXI数据总线在概念和应用上有一些异同点: 相同点 功能目的:两者都是用于处理器与外部设备或内存之间传输数据的通道。设计原则:它们都遵循一些设计原则,以确保数据传输的可靠性和效率。 异同点 架构级别&#xff…

Elasticsearch 认证模拟题 - 13

一、题目 集群中有索引 task3,用 oa、OA、Oa、oA 查询结构是 4 条,使用 dingding 的查询结果是 1 条。通过 reindex 索引 task3 为 task3_new,能够使 task3_new 满足以下查询条件。 使用 oa、OA、Oa、oA、0A、dingding 查询都能够返回 6 条…

【纯血鸿蒙】——自适应布局如何实现?

界面级一多能力有 2 类: 自适应布局: 略微调整界面结构 响应式布局:比较大的界面调整 本文章先主要讲解自适应布局,响应式布局再后面文章再细讲。话不多说,开始了。 自适应布局 针对常见的开发场景,方舟开发框架提…

React Native 快速Demo(1)

为了快速实现一个项目雏型(prototype)demo并提交给他们确认,可以按照以下步骤进行: 1. 环境设置 1.1 安装开发工具 安装Node.js和npm:用于管理项目依赖。 sudo apt install nodejs sudo apt install npm安装React Na…

QT系列教程(10) QTextEdit学习

简介 QTextEdit是文本编辑器,支持富文本功能。接下来我们创建一个Qt Application 应用,然后在ui中添加一个QTextEdit插件。 运行程序后,可以在QTextEdit中输入任何文字也包括富文本。 文本块 我们在MainWindow的ui文件中添加了textedit插件…