纳什均衡:博弈论中的运作方式、示例以及囚徒困境

文章目录

  • 一、说明
  • 二、什么是纳什均衡?
    • 2.1 基本概念
    • 2.2 关键要点
  • 三、理解纳什均衡
  • 四、纳什均衡与主导策略
  • 五、纳什均衡的例子
  • 六、囚徒困境
  • 七、如何原理和应用
    • 7.1 博弈论中的纳什均衡是什么?
    • 7.2 如何找到纳什均衡?
    • 7.3 为什么纳什均衡很重要?
    • 7.4 如何计算纳什均衡?
    • 7.5 纳什均衡的局限性是什么?
  • 八、后记

关键词:Nash Equilibrium、Dominant Strategy

一、说明

   博弈论者使用纳什均衡来分析多个决策者战略互动的结果。在战略互动中,每个决策者的结果取决于其他人的决策以及他们自己的决策。纳什思想背后的简单见解是,如果孤立地分析多个决策者的决策,就无法预测他们的选择。相反,我们必须问每个玩家在考虑到玩家对其他人的期望后会怎么做。纳什均衡要求玩家的选择是一致的:没有玩家希望在其他人做出决定的情况下撤销自己的决定。

二、什么是纳什均衡?

2.1 基本概念

   在博弈论中,纳什均衡是非合作博弈中最常用的解决方案概念。纳什均衡是指没有玩家可以通过改变自己的策略(保持其他玩家的策略不变)来获利的情况。[1]纳什均衡的概念可以追溯到古诺时代,他在 1838 年将其应用于寡头垄断竞争模型。[2]

   纳什均衡表现为一种“饱和态”,如果每个玩家都选择了一种策略 (基于游戏中迄今为止发生的事情的行动计划),并且在其他玩家保持不变的情况下,没有人可以通过改变自己的策略来增加自己的预期收益。表现为“势均力敌”的状态。
   纳什均衡是博弈论中的一个概念,指博弈达到最优结果。这是一种不鼓励个体玩家偏离其初始策略的状态。玩家知道对手的策略,但仍然不会偏离他们最初选择的策略,因为这仍然是每个玩家的最佳策略。

   总体而言,假设其他玩家的策略保持不变,个人无法从改变行动中获得增量收益。然而,一场游戏可能有多个纳什均衡,也可能根本没有。

2.2 关键要点

  • 纳什均衡是博弈论中的一个决策定理,该定理指出玩家可以通过不偏离其初始策略来实现期望的结果。
  • 在纳什均衡中,每个玩家的策略在考虑其他玩家的决策时都是最优的。每个玩家都会获胜,因为每个人都会得到他们想要的结果。
  • 囚徒困境是一个常见的博弈论例子,它充分展示了纳什均衡的效果。
  • 纳什均衡通常与主导策略一起讨论,主导策略指出,无论对手使用何种策略,行为者选择的策略将在所有可能使用的策略中产生更好的结果。
  • 纳什均衡并不总是意味着选择最优策略。
    1

三、理解纳什均衡

   纳什均衡以其发明者美国数学家约翰·纳什的名字命名。它被认为是博弈论中最重要的概念之一,它试图从数学和逻辑上确定游戏参与者应采取的行动,以确保自己获得最佳结果。

   纳什均衡之所以被认为是博弈论中如此重要的概念,是因为它的适用性。纳什均衡可以纳入从经济学到社会科学等广泛的学科。

   为了快速找到纳什均衡或查看它是否存在,请向其他玩家透露每个玩家的策略。如果没有人改变他们的策略,那么纳什均衡就被证明了。

四、纳什均衡与主导策略

   纳什均衡经常与占优策略进行比较,两者都是博弈论中的策略。纳什均衡指出,参与者的最佳策略是在了解对手策略的情况下坚持其初始策略,并且所有参与者都保持相同的策略。

   主导策略断言,无论对手使用何种策略,行为者选择的策略将在所有可能使用的策略中产生更好的结果。

   所有博弈论模型只有当参与的玩家都是“理性主体”时才有效,这意味着他们渴望特定的结果,试图选择最优结果,在决策中考虑不确定性,并在选择上采取现实态度。
   这两个术语相似但略有不同。纳什均衡表明,如果任何一个玩家改变策略而其他所有玩家都保持策略,则不会有任何收获。主导策略断言,无论其他玩家选择了什么策略,玩家都会选择一种能够带来最佳结果的策略。主导策略可以包含在纳什均衡中,而纳什均衡可能不是游戏中的最佳策略。

五、纳什均衡的例子

   想象一下汤姆和萨姆之间的游戏。在这个简单的游戏中,两位玩家都可以选择策略 A,获得 1 美元,或者策略 B,损失 1 美元。从逻辑上讲,两位玩家都会选择策略 A,并获得 1 美元的收益。

   如果您向 Tom 透露 Sam 的策略,反之亦然,您会发现没有玩家偏离原始选择。了解其他玩家的举动意义不大,也不会改变任何一方的行为。结果 A 代表纳什均衡。

纳什均衡示例
在这里插入图片描述

六、囚徒困境

   囚徒困境是博弈论中分析的一种常见情况,可以运用纳什均衡。在这个博弈中,两名罪犯被捕,各自被单独监禁,无法与对方交流。检察官没有证据定罪这对罪犯,所以他们给每个囚犯一个机会,要么背叛对方,作证对方犯了罪,要么合作,保持沉默。

   如果两名囚犯互相背叛,则每人将被判处五年监禁。如果 A 背叛 B,但 B 保持沉默,则囚犯 A 将被释放,囚犯 B 将被判处十年监禁,反之亦然。如果双方都保持沉默,则每人将被判处一年监禁。

   在这个例子中,纳什均衡是两个参与者互相背叛。尽管相互合作会带来更好的结果,但如果一个囚犯选择相互合作而另一个囚犯不选择,那么其中一个囚犯的结果会更糟。

七、如何原理和应用

7.1 博弈论中的纳什均衡是什么?

   博弈论中的纳什均衡是指玩家在考虑到对手的策略后,将继续执行自己选择的策略,而没有偏离该策略的动机。

7.2 如何找到纳什均衡?

   要在游戏中找到纳什均衡,就必须模拟出每种可能的情况以确定结果,然后选择最佳策略。在双人游戏中,这将考虑两个玩家可以选择的可能策略。如果两个玩家都不了解所有信息并改变策略,则会出现纳什均衡。

7.3 为什么纳什均衡很重要?

   纳什均衡很重要,因为它可以帮助玩家根据自己的决策和其他相关方的决策确定最佳收益。纳什均衡可以应用于生活的方方面面,从商业策略到卖房,从战争到社会科学等等。

7.4 如何计算纳什均衡?

   没有特定的公式来计算纳什均衡。可以通过对给定游戏中的不同场景进行建模来确定每个策略的收益以及哪种策略是最佳选择。

7.5 纳什均衡的局限性是什么?

   纳什均衡的主要限制是它要求玩家了解对手的策略。只有当玩家了解对手的策略并选择继续使用当前策略时,纳什均衡才会发生。

   在大多数情况下,例如在战争中(无论是军事战争还是竞价战争),个人很少知道对手的策略或他们想要的结果。与主导策略不同,纳什均衡并不总是导致最优结果。它只是意味着个人根据他们掌握的信息选择最佳策略。

   此外,在与相同对手进行的多场游戏中,纳什均衡并没有考虑过去的行为,而过去的行为往往可以预测未来的行为。

八、后记

   纳什均衡是博弈论的一个组成部分,它断言玩家在了解对手的策略的情况下会继续使用他们选择的策略,因为他们没有改变路线的动机。纳什均衡可以应用于各种现实生活中的情况,根据你的决定以及对对手决定的了解来确定在某种情况下的最佳收益是什么。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/25836.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

素数的无穷大的证明

素数的无穷大——欧几里得的证明 文章目录 一、说明二、欧几里得证据三、哥德巴赫对素数无穷性的证明(1730)四、Frstenberg 对素数无穷性的证明(1955)五、库默尔对欧几里得证明的重述 一、说明 众所周知,素数是无限多的。然而,两…

运维一个宝塔面板的php项目的艰辛历程【解决了http3,ssl,quic】

在这个项目的环境 使用了宝塔面板 有4个php:php5.6,php7.3,php7.4,php8.0 nignx为1.20版本 升级计划: 升级nginx1.26.0版本,添加上http3协议,添加ssl证书 遇到的问题: 升级nginx1.26版本后 无法打开php5.6的后台 原因&#xff…

vmware-17虚拟机安装教程,安装linux centos系统

下载VMware 1.进入VMware官网:https://www.vmware.com/sg/products/workstation-pro.html 2.向下翻找到,如下界面并点击“现在安装” 因官网更新页面出现误差,现提供vmware17安装包网盘链接如下: 链接:https://pan.b…

Vue17-条件渲染

一、使用v-show属性做条件渲染 控制元素的显示和隐藏 v-show里面也能是表达式,只要表达式的值是boolean就行。 或者 当时结构还在: 二、使用v-if属性做条件渲染 结构也不在了 三、示例 方式一: 方式二: 当元素有很高的切换频率&am…

从0开始学人工智能测试节选:Spark -- 结构化数据领域中测试人员的万金油技术(四)

上一章节我们了解了 shuffle 相关的概念和原理后其实可以发现一个问题,那就是 shuffle 比较容易造成数据倾斜的情况。 例如上一节我们看到的图,在这批数据中,hello 这个单词的行占据了绝大部分,当我们执行 groupByKey 的时候触发了…

刚刚❗️德勤2025校招暑期实习测评笔试SHL测评题库已发(答案)

📣德勤 2024暑期实习测评已发,正在申请的小伙伴看过来哦👀 ㊙️本次暑期实习优先考虑2025年本科及以上学历的毕业生,此次只有“审计及鉴定”“税务与商务咨询”两个部门开放了岗位~ ⚠️测评注意事项: &#x1f44…

使用Nextjs学习(学习+项目完整版本)

创建项目 运行如下命令 npx create-next-app next-create创建项目中出现的各种提示直接走默认的就行,一直回车就行了 创建完成后进入到项目运行localhost:3000访问页面,如果和我下面页面一样就是创建项目成功了 整理项目 将app/globals.css里面的样式都删除,只留下最上面三…

【LeetCode算法】第112题:路径总和

目录 一、题目描述 二、初次解答 三、官方解法 四、总结 一、题目描述 二、初次解答 1. 思路:二叉树先序遍历。首先访问根节点,若根节点是叶子节点并且值等于目标值,则返回true,否则递归访问左子树和右子树,只要左…

PG 数据库常用参数调整

1.shard_buffers Postgresql使用自己的缓冲区,也使用操作系统缓冲区。这意味着数据存储在内存中两次,首先是 Postgresql缓冲区,然后是操作系统缓冲区。 与其他数据库不同, Postgresql不提供直接IO。这称为双缓冲(就是磁盘中的时候读的时候先放在数据库的缓冲区&am…

【上下界分析 差分数组】798得分最高的最小轮调

本文涉及知识点 差分数组 本题同解 C算法前缀和的应用:798得分最高的最小轮调 LeetCode798得分最高的最小轮调 给你一个数组 nums,我们可以将它按一个非负整数 k 进行轮调,这样可以使数组变为 [nums[k], nums[k 1], … nums[nums.lengt…

Web学习_SQL注入_布尔盲注

盲注就是在SQL注入过程中,SQL语句执行后,查询到的数据不能 回显到前端页面。此时,我们需要利用一些方法进行判断或者尝 试,这个过程称之为盲注。而布尔盲注就是SQL语句执行后,页面 不返回具体数据,数据库只…

未卸载干净的proteus安装教程7.8

提醒: 针对第一次安装推荐博文:https://jingyan.baidu.com/article/656db918f8590de381249cbf.html 1、一定要以管理员身份运行软件。 2、以管理员身份运行软件后,默认的ISIS Professional路径是C:\Program Files \Labcenter Electronics\…

802.11漫游流程简单解析与笔记_Part1

最近在进行和802.11漫游有关的工作,需要对wpa_supplicant认证流程和漫游过程有更多的了解,所以通过阅读论文等方式,记录整理漫游相关知识。Part1将记录802.11漫游的基本流程、802.11R的基本流程、与认证和漫游都有关的三层秘钥基础。Part1将包…

Excel行列条件转换问题,怎么实现如图一到图二的效果?

图一 图二 如果数据比较,不建议一上来就用公式,风速值那一列的数据可以确定都是数值型数字,可以先试试用数据透视表做转换工具: 1.创建数据透视表 将采集时间放在行字段,测风放在列字段,风速放在值字段 2.…

安卓逆向经典案例——XX牛

安卓逆向经典案例——XX牛 按钮绑定方式 1.抓包 2.查看界面元素,找到控件id 通过抓包,发现点击登录后,才会出现Encrpt加密信息,所以我们通过控件找到对应id:btn_login 按钮绑定方法——第四种 public class LoginA…

python tushare股票量化数据处理:学习中

1、安装python和tushare及相关库 matplotlib pyplot pandas pandas_datareader >>> import matplotlib.pyplot as plt >>> import pandas as pd >>> import datetime as dt >>> import pandas_datareader.data as web 失败的尝试yf…

使用NetAssist网络调试助手在单台计算机上配置TCP服务器和客户端

要使用NetAssist网络调试助手在同一台计算机上配置一个实例作为服务器(server)和另一个实例作为客户端(client),可以按照以下步骤进行操作: 前提条件 确保已经安装NetAssist网络调试助手,并了…

如何制定工程战略

本文介绍了领导者如何有效制定工程战略,包括理解战略核心、如何收集信息并制定可行的策略,以及如何利用行业最佳实践和技术债务管理来提升团队效能和产品质量。原文: How to Build Engineering Strategy 如果你了解过目标框架(如 OKR&#xf…

数仓建模中的一些问题

​​​在数仓建设的过程中,由于未能完全按照规范操作, 从而导致数据仓库建设比较混乱,常见有以下问题: 数仓常见问题 ● 数仓分层不清晰:数仓的分层没有明确的逻辑,难以管理和维护。 ● 数据域划分不明确…