博弈论中静态博弈经典场景案例

博弈论中静态博弈经典场景案例

1、齐威王田忌赛马

    田忌赛马是中国家喻户晓的故事,故事讲述的是齐国大将田忌的谋士孙膑如何运用计谋帮助田忌在与齐威王赛马时以弱胜强的故事,这个故事其实本质也是一个博弈的过程。
    齐威王要和田忌赛马,赛马规则如下:
    故事中说齐威王经常要田忌与他赛马,赛马规则如下:每次双方各出3匹马,一对一比3场,每一场输方输一千斤铜给赢方。齐威王和田忌的3匹马按实力都可以分上、中、下三等,但齐威王的上、中、下3匹马分别比田忌的上、中、下3匹马略胜一筹,因为总是同等次的马进行比赛,因此田忌每次都连输3场。那这不是纯纯欺负人嘛,但实际上田忌的上马虽然不如齐威王的上马,但比齐威王的中马和下马都要好,而田忌的中马比齐威王的下马要好一些,因此孙膑看不下去田忌当冤大头,就给田忌出主意,让田忌用自己的下马对抗齐威王的上马,上马对抗齐威王的中马,中马对抗齐威王的下马,这样对于田忌而言就是二胜一负,能赚上个一千铜。
    将这个故事抽象成博弈,则博弈方自然是齐威王和田忌,博弈策略是己方马匹的出战顺序(注意双方都是一次性定下三场比赛的出战顺序,而非一场一场进行),那根据排列组合的知识就知道,每一方都有3!=6种策略选择,比如“上中下”、“中上下”等等;双方同时进行决策(静态博弈);赢一千铜记为1,输一千铜记为-1。如此就可以发现,因为双方均有6种策略可选,则可能得结果为6x6=36种,我们将双方的得益用矩阵表示,如此得到得益矩阵(payoff matrix),具体如下。其中,前一位数字表示齐威王的得益,后一位数字表示田忌的得益。

在这里插入图片描述

结合表格,我们思考一下该博弈的特点:
    首先,无论对齐威王还是田忌,博弈中的六种可选择策略本身相互之间并没有优劣之分。对齐威王来说,每一种策略对应六种结果,包括一种得益为3,四种得益为1,一种得益为-1 ,究竟最终得哪种结果,主要看对方策略与己方策略的对应情况,而不是己方策略本身。同样地,田忌也是如此。
    其次,各博弈方千万不能让对方知道或猜中自己的策略,因为一旦自己的策略被对方猜中,对方就可以针对性选择策略,己方必输无疑。这也意味着,如果重复多次得进行该博弈,任何一方的策略选择不能一成不变,变动不能有规律性,必须以随机的方式选择策略。

2、囚徒的困境

    “囚徒的困境”是博弈问题中相当经典的基本模型,该问题非常简单,却能很好地反映博弈问题的根本特征,也是有效解释众多经济现象的基本模型。下面介绍一下谢老师书中改编的版本:
    警察抓住两个合伙犯罪的罪犯,但缺乏足够证据指证他们的罪行。如果其中至少一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将两名罪犯分别关押以防止串供或结成攻守同盟,并给他们同样的选择机会:如果两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑;如果两人中有一人坦白认罪,则坦白者从轻处理,立即释放,另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们将被各判5年监禁。
    本博弈的博弈方是两个罪犯,分别称“囚徒1”、“囚徒2”。本博弈两个博弈方的可选择策略均为“不坦白”和“坦白”两种。因为两个囚徒被隔离开,其中任何一人选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以认为他们是同时决策的。
如果分别用-1、-5和-8表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即释放的得益,则可以用下图所示的得益矩阵将这个博弈表示出来。其中,前一个数字为囚徒1的得益,后一个数字为囚徒2的得益。
在这里插入图片描述

    根据个体理性行为准则,两个博弈方的目标都是实现自身的最大利益。首先可以肯定的是,在这个博弈中,两博弈方各自的利益不仅取决于他们自己选择的策略,也取决于对方的策略选择。每个博弈方选择自己的策略时,即使无法知道另一方的实际选择,也必须考虑另一方有两种可能的选择,而且另一方的选择对自己的利益影响很大。

  • 对于囚徒1:

    (1) 在囚徒2选择“坦白”的情况下,囚徒1的得益分别为-5(“坦白”)、-8(“不坦白”),因此该情况下,囚徒1的最优策略即上策(dominant strategy)为“坦白”;
    (2) 在囚徒2选择“不坦白”的情况下,囚徒1的得益分别为0(“坦白”)、-1(“不坦白”),因此该情况下,囚徒1的最优策略即上策(dominant strategy)也为“坦白”。

因此可以发现,虽然囚徒1的得益与囚徒2的策略有关,但不论囚徒2的策略如何,囚徒1的最优选择均是“坦白”!

  • 囚徒2也类似:

    (1)在囚徒1选择“坦白”的情况下,囚徒2的得益分别为-5(“坦白”)、-8(“不坦白”),因此该情况下,囚徒2的最优策略即上策(dominant strategy)为“坦白”;
    (2)在囚徒1选择“不坦白”的情况下,囚徒2的得益分别为0(“坦白”)、-1(“不坦白”),因此该情况下,囚徒2的最优策略即上策(dominant strategy)也为“坦白”。

所以,该博弈的最终结果必然是两博弈方都选择“坦白”,双方得益均为-5,即都被判5年徒刑。
但是!!!
    需要注意的是,在这个博弈中,无论是对两个囚徒总体(囚徒1和囚徒2的得益之和)来讲,还是对他们各自来讲,最佳的结果都不是同时“坦白”(-5,-5),而是都“不坦白”(-1,-1)。但是,由于两个囚徒不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,因此只能实现对他们都不理想的结果,这也是该博弈被称为“囚徒的困境”的原因。当然,囚徒的困境对社会利益来说是理想的,因为罪犯都受到了应有的惩罚。但从博弈中两个决策者的立场上说则很不理想,因为既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益。

3、双寡头削价竞争

    双寡头削价竞争本质上也是囚徒的困境,其实囚徒的困境在社会经济中有很大的普遍性,在市场竞争的各个领域、政治、军事和法律等各种领域的问题中,都存在类似囚徒的困境现象。双寡头价格战就是其中一个典型案例。
    通过降价争夺市场是市场竞争中十分普遍的行为,但价格竞争并不一定是成功的策略,因此一个厂商降价往往会导致其他厂商也降价或者采取其他商业行为,而导致利润率以及销量的降低。这里用一个简单的双寡头两种价格的价格竞争模型来说明这个问题。
    设寡头1和寡头2是双寡头市场的两个寡头,它们原来用同一种较高的价格(“高价”)销售相同的产品。如果两个寡头不满足各自原来的市场份额和利润,就可能想通过降价争夺更大市场份额和更多利润。但自己降价可能引起对手的报复,目的并不一定能达到。假设两寡头同时“高价”各可以获得100万元利润;如果某个寡头单独降价,即单独采用“低价”,可以获得150万元利润,此时另一寡头因为市场份额被蚕食,利润将下降到20万元;如果另一寡头也降价,则两寡头都将只能得到70万元利润。得益矩阵如下图所示,前一个数字为寡头1的得益,后一个数字为寡头2的得益:
在这里插入图片描述

  • 对于寡头1:
    (1)当寡头2选择“高价”时,寡头1的得益分别为100(高价)、150(低价),因此该情况下,寡头1的最优策略为“低价”;
    (2)当寡头2选择“低价”时,寡头1的得益分别为20(高价)、70(低价),因此该情况下,寡头的最优策略为“低价”。

    可以发现,与囚徒的困境相似,虽然寡头1的得益与寡头2的策略有关,但不论寡头2的策略如何,寡头1的最优选择均是“低价”!寡头2也是如此,因此该博弈的最终结果必然是两博弈方都选择“低价”,双方得益均为70,这是两博弈方按照个体理性原则决策的必然结果 。
    虽然这个结果对两寡头来说都不理想,但因为两寡头都必须防备对方利用自己的合作精神(即认为自己会和对方合作,均保持高价)谋取利益,所以双方都不可能坚持采用“高价”,各得100万元利润的结果是无法实现的。
    囚徒困境式矛盾的存在,一定程度上否定了传统经济理论关于市场经济“看不见的手”总能把个人利己行为变为对集体、社会有利行为的论断,也说明了政府的组织协调在社会经济活动中是必需的,放任自流并不会导致全社会的最大福利。

4、猜硬币

    猜硬币是生活中最常见的游戏,具体来讲:一人用手盖住一枚硬币,由另一方猜是正面朝上还是反面朝上,猜对则猜者赢1元,盖硬币者输1元;否则,猜者输1元,盖硬币者赢1元。如果赢1元得益为1,输1元得益为-1,则得益矩阵如下,前一个数字为盖硬币方得益,后一个数字为猜硬币方的得益:
在这里插入图片描述
    其实,可以发现猜硬币博弈是个**“零和博弈”**,即不管结果是什么,总得益始终为0,直白点就是“不是你死,就是我亡”。田忌赛马其实也是一个零和博弈,不是齐威王输就田忌输。
    这就意味着,猜硬币博弈中没有哪个策略组合的双方策略相互是对对方策略的最佳对策,因此该博弈没有哪个策略组合双方同时愿意接受,因为我们无法像囚徒博弈一样,预测该博弈的结果。

5、夫妻之争

    与猜硬币没有最佳对策不同的是,“夫妻之争"博弈中存在两个最佳对策。一对夫妻得到两张时装表演票和同一时间的两张足球赛票。妻子更想去看时装表演而丈夫更想看足球,但又不愿或不能分头行动,双方争执不下,决定投票表决。若投票结果同选时装则去看时装表演,同选足球就去看足球比赛,如选择不一样则哪都不去。
    再假设若丈夫与妻子同看时装表演,妻子得益2单位,丈夫得益1单位;若丈夫与妻子都看足球赛丈夫得益3单位,妻子得益1单位;若因为双方选择不同什么都没看成,则双方得益均为0。得益矩阵如下图:
在这里插入图片描述

  • 对于妻子而言:
    当丈夫选择“时装”时,妻子的得益分别为2(时装)、0(足球),该情况下,妻子的最优策略为“时装”;
    当丈夫选择“足球”时,妻子的得益分别为0(时装)、1(足球),该情况下,妻子的最优策略为“足球”。
  • 对于丈夫而言:
    当妻子选择“时装”时,丈夫的得益分别为1(时装)、0(足球),该情况下,丈夫的最优策略为“时装”;
    当妻子选择“足球”时,丈夫的得益分别为0(时装)、3(足球),该情况下,丈夫的最优策略为“足球”。

    所以,其实该博弈有两个最佳对策(时装,时装)、(足球,足球),任意一个均具有合理性,因此也无法准确预测该博弈的结果。
    在经济活动中有许多与夫妻之争相似的博弈问题,制式问题就是典型的例子。电器和电子设备往往有不同的原理或相关技术标准,我们称之为不同的制式。如果生产相关电器或电子设备的厂商采用相同的制式,产品之间就能相互匹配,零配件也可能相互通用,这对于推广各自的产品和在生产经营中进行合作很有帮助。设有两个厂商同时计划引进彩电生产线,而彩电有A、B两种制式,这时候两个厂商之间就有一个选择制式的博弈问题。
在这里插入图片描述

    与之类似的,还有猎鹿博弈(stag-hunting)。两个人同时发现1头鹿和2只兔子,如果两个人合力抓鹿,可以抓住这头价值10单位的鹿平分,兔子就抓不到了;如果两个人都抓兔子,各可以抓到1只价值3单位的兔子,鹿会跑掉;如果一个人选择抓兔子,而另一个人选择抓鹿,抓兔子的能抓到1只兔子,抓鹿的人什么也抓不到。再假设两个人来不及商量,必须在瞬间作出决策,这就是一个典型的静态博弈问题。这个博弈的利益关系下图所示:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/91299.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

二叉树MFC实现

设有一颗二叉树如下; 这似乎是一颗经常用作示例的二叉树; 对树进行遍历的结果是, 先序为:3、2、2、3、8、6、5、4, 中序为:2、2、3、3、4、5、6、8, 后序为2、3、2、4、5、6、8、3&#xff1b…

MySQL学习笔记25

逻辑备份 物理备份 在线热备: 真实案例: 数据库架构是一主两从,但是两台从数据库和主数据不同步。但是每天会全库备份主服务器上的数据到从服务器上。需要解决主从不同步的问题。 案例背后的核心技术: 1、熟悉MySQL数据库常见…

【计算机视觉|人脸建模】PanoHead:360度几何感知的3D全头合成

本系列博文为深度学习/计算机视觉论文笔记,转载请注明出处 标题:PanoHead: Geometry-Aware 3D Full-Head Synthesis in 360 ∘ ^{\circ} ∘ 链接:[2303.13071] PanoHead: Geometry-Aware 3D Full-Head Synthesis in 360 ∘ ^{\circ} ∘ (arx…

大数据Doris(三):Doris编译部署篇

文章目录 Doris编译部署篇 一、Doris编译

学信息系统项目管理师第4版系列13_立项管理

1. 项目立项管理包括 1.1. 项目建议与立项申请 1.2. 项目可行性研究 1.2.1. 初步可行性研究 1.2.2. 详细可行性研究 1.2.2.1. 不可缺少 1.2.2.1.1. 【高21上选21】 1.2.3. 可以依据项目的规模和繁简程度合二为一 1.3. 项目评估与决策 2. 立项申请 2.1. 项目建议书 2…

Lua语法之简单变量

--nil有点类似空null a nil print(a) --type函数得到类型 返回值是string print(type(a)) print("*****")--number是数值 int float这些 --lua的变量可以随便赋值 自动识别类型 a 1 print(a) print(type(a)) print("*****")--siting可以用单引号双引号 a…

华为云HECS云服务器docker环境下安装nginx

前提:有一台华为云服务器。 华为云HECS云服务器,安装docker环境,查看如下文章。 华为云HECS安装docker-CSDN博客 一、拉取镜像 下载最新版Nginx镜像 (其实此命令就等同于 : docker pull nginx:latest ) docker pull nginx查看镜像 dock…

实体行业数字化转型怎么做?线上线下相结合的新零售体系怎么做?

如今,实体行业想要取得收入增长,只做线下业务或者只做线上业务,在当前的市场环境中是难以长久生存的,因此一定要线上线下相结合,将流量运作与线下转化进行充分结合,才能更好地发挥实体优势,带来…

Linux学习记录——삼십일 socket编程---TCP套接字

文章目录 TCP套接字简单通信1、服务端1、基本框架2、获取连接 2、客户端3、多进程4、多线程5、线程池6、简单的日志系统7、守护进程8、其它 TCP套接字简单通信 本篇gitee 学习完udp套接字通信后,再来看TCP套接字。 四个文件tcp_server.hpp, tcp_serve…

什么是Local Storage和Session Storage?它们之间有什么区别?

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ 什么是 Local Storage 和 Session Storage?Local Storage(本地存储)Session Storage(会话存储) ⭐ 区别⭐ 示例⭐ 写在最后 ⭐ 专栏简介 前端入门之旅:探索Web开发的…

程序员的浪漫:如何用java代码画❤️表白呢?

有位小伙伴说,看到一个帖子,一个计算机博士接亲时,要求现场写代码,5分钟做出一个爱心。我们就看看如何用java设计出心形的代码。 我找了一下,发现方法竟然很多,我们就来见识一下,最后我们看一下…

TouchGFX之字体缓存

使用二进制字体需要将整个字体加载到存储器。 在某些情况下,如果字体很大,如大字号中文字体,则这样做可能不可取。 字体缓存使应用能够从外部存储器只能加载显示字符串所需的字母。 这意味着整个字体无需保存到在可寻址闪存或RAM上&#xff…

Java自学(三)面向对象编程

目录 什么是面向对象 举例 this关键字和构造器 实体类 电影小案例 什么是面向对象 我们日常生活中谈到一个事物,总会描述它的性质与行为,这个事物也就是 ”对象”。比如一个学生对象,他的属性有姓名、学号、成绩......他的行为有上课、…

装饰器模式详解和实现(设计模式 二)

装饰器模式(Decorator Pattern)是一种结构型设计模式,它允许你动态地将对象添加到现有对象中,以提供额外的功能,同时又不影响其他对象。 实现示例 1.定义一个接口或抽象类,表示被装饰对象的公共接口 //抽…

关于 自定义的RabbitMQ的RabbitMessageContainer注解-实现原理

概述 RabbitMessageContainer注解 的主要作用就是 替换掉Configuration配置类中的各种Bean配置; 采用注解的方式可以让我们 固化配置,降低代码编写复杂度、减少配置错误情况的发生,提升编码调试的效率、提高业务的可用性。 为什么说“降低…

QT编译报错stdlib.h:No such file or directory

如图,需要将第19行,INCLUDEPATH /usr/include 注释掉 原因分析: 在Ubuntu的CSTDLIB中,使用的是#include_next下“stdlib.h” ,自行增加/usr/include 把include_next的顺序打乱,造成编译错误。但是在cento…

Ubuntu 20.04编译GPMP2过程记录

前言 GPMP2是董靖博士等人在16-17年提出的结合GTSAM因子图框架与Gaussian Processes完成motion planning的一项工作。前身源于Barfoot教授的课题组提出的STEAM(Simultaneous Trajectory Estimation and Mapping)问题及其相关工作。在提出董靖博士提出GPMP2后,borgl…

同步、异步

何为同步、异步? 同步任务(synchronous) 同步任务指的是,在主线程上排队执行的任务,只有前一个任务执行完毕,才能执行后一个任务;同步任务进栈顺序:先进后出,后进先出&…

网页采集工具-免费的网页采集工具

在当今数字化时代,网页采集已经成为了众多领域的必备工具。无论是市场研究、竞争情报、学术研究还是内容创作,网页采集工具都扮演着不可或缺的角色。对于许多用户来说,寻找一个高效、免费且易于使用的网页采集工具太不容易了。 147SEO工具的强…

Go-Ldap-Admin | openLDAP 同步钉钉、企业微信、飞书组织架构实践和部分小坑

目录 一、Docker-compose快速拉起demo测试环境 二、原生部署流程 安装MySQL:5.7数据库 安装openLDAP 修改域名,新增con.ldif 创建一个组织 安装OpenResty 下载后端 下载前端 部署后端 部署前端 三、管理动态字段 钉钉 企业微信 飞书 四、…