张维迎《博弈与社会》纳什均衡与囚徒困境博弈(2)囚徒困境博弈

囚徒困境大家应该都比较熟悉了,我觉得这篇的意义大概在与,经济学术语的运用?

囚徒困境:个人理性与集体理性的矛盾

假定有两个犯罪嫌疑人共同作案。警察抓住他们以后,分开拘押,并告诉他们:可以选择坦白,或是不坦白;如果一个人坦白,而另一个人不坦白,则坦白的一方会被立即释放,而不坦白的一方被判10年;如果两人都坦白,则会每人各判8年;如果两人都抵赖,因证据不足,则每人在关押1年后释放。那么,这两个犯罪嫌疑人该如何选择呢?

我们看到,这个博弈有两个参与人:犯罪嫌疑人(囚徒)甲和乙;每个人有两个行动:坦白或不坦白;两个人隔离审查,谁都不能观察到对方坦白还是不坦白,因此是一个不完美信息静态博弈。由于不能观察到对方的行动,也就没有办法把自己的选择建立在对方行动的基础上,因而,战略和行动是一回事(在静态博弈中,行动和战略可以交换使用)。这个博弈的支付结构如下图所示,图中列代表囚徒甲,行代表囚徒乙,甲的选择在第一列,乙的选择在第一行;矩阵中方框里的两个数字,第一个数字为甲的支付,第二个数字为乙的支付。这种描述博弈的方式我们叫标准式(normal form)。

现在我们来看参与人甲和乙会如何决策。我们假设参与人是理性的,不想坐牢,哪怕是多坐一天也会带来更多的痛苦,因此,他的目标就是能少坐就少坐;我们还假定每个人只关心自己,不关心对方(如果两个囚徒是父子关系或兄弟关系,他们的行为也许会与我们这里的情况不同)。我们先考虑甲的选择,他面对的问题是:如果乙坦白的话,自己坦白判8年,不坦白判10年,那么坦白比不坦白好;如果乙不坦白,自己坦白会被立即释放,不坦白则判1年,坦白还是比不坦白好。因此,对于甲来说,不管对方坦白不坦白,自己的最优选择都是坦白。同样,对乙来说也是一样的。所以,每一个人的最优选择都是坦白。

一般来说,博弈中每个参与人的最优选择依赖于别人的选择,但在上述囚徒困境博弈中,每个人的最优选择与他人的选择无关。这种独立于他人选择的最优战略称为该参与人的占优战略(dominant strategy)。正式地,所谓“占优战略”是指在博弈中参与人的某一个战略,不管对方使用什么战略,只要参与人使用这一战略,都可以给自己带来最大的支付。或者说,参与人的这一战略在任何情况下都优于自己的其他战略。占优战略类似我们常说的“上策”或“上上策”,如“三十六计,走为上策”。在博弈中,如果每一个参与人都有一个占优战略,则他们显然都会选择这一战略,那么,由占优战略组成的战略组合就构成了博弈的占优战略均衡(dominance equilibrium)。

显然在囚徒困境博弈中,坦白是每个参与人的占优战略。两个人都选择坦白也成了这个博弈的占优战略均衡。结果就是两个人都会坦白,各判8年。

但是,就两个囚徒而言,这个博弈中的帕累托最优是“都不坦白”,各坐1年牢。这就是我们讲的个人理性与集体理性的矛盾。尽管对两个人来讲,不坦白是最好的,但是每个人都会选择对自己最优的行动——坦白。结果对两个人都不好。这就回到我们前边讲的,个人理性不一定达到帕累托最优。

对此,我们可以用上一章中提到的“外部性”概念来解释。外部性可以简单理解为一个人的行为给别人所带来的影响。给定甲坦白,乙从不坦白(判10年)到坦白(判8年),可以让自己的刑期减少两年;但同时让甲的刑期从0年增加到了8年。这样,乙的行为不仅给自己带来了好处,还给甲带来了坏处。即乙的行为对甲来说有外部性,而且是不好的外部性,经济学中称为负外部性(negative externality)。类似地,甲的行为也会对乙产生负外部性。我们前面假定,人是理性的,他的目标是个人利益的最大化,而非集体利益的最大化,所以在存在负外部性的情况下,他出于追求自身的利益最大化选择的行动就不可能满足集体利益的最大化。这就导致个人选择和集体理性的矛盾

囚徒困境又被称为“合作悖论”或“集体行动悖论”,即尽管合作能够给双方带来好处,但双方仍然是不合作。选择不合作是基于个体理性,而选择合作则是基于集体理性

囚徒困境举例

这种个人理性与集体理性冲突的例子在生活中有很多。比如小孩子的学习负担问题,现在的孩子除了周一到周五的正常上课学习外,还要在周末去学习奥数、英语等等。其实这也是一个囚徒困境。我们可以设想一下,如果所有的学生周末都休息,考上重点中学和重点大学的一定是那些最聪明的孩子。问题是如果你周末休息,别的孩子周末补功课,那么可能别人考上了,你虽然聪明也可能考不上,所以你的最优选择也是周末补功课。结果是,所有的孩子一周7天都在学功课,最后考上重点中学和重点大学的仍然是那些聪明的孩子。竞争带来这种不合理的结果:每个人都忙活,但是最后的结果不一定对大家都好。我国现在的中小学生的学习强度这么高,从社会的角度讲肯定不是最优的。

企业之间的竞争也是一个囚徒困境。2000年6月9日,中国的九家彩电企业在深圳开会,制定了一些彩电型号的最低限价,形成价格同盟。但是,会议过去刚刚三天,6月12日,参加会议的一些企业就在南京等地率先降价,使得价格同盟名存实亡。一般来说,这种结盟是很难维持的。因为,给定你不降价,我先降价,就可以扩大销量,占领更多的市场份额。

类似地,企业做广告也可能是一个囚徒困境。做广告成本很高,不一定能给企业带来利润,但为什么大部分企业都做广告呢?假如某个行业有两个企业,如果每个企业都不做广告,各得10单位的利润;如果都做广告,各得4单位的利润;如果一个企业做广告,另一个企业不做广告,做广告的企业就可以赚到12,不做广告的企业只能赚到2。这个博弈的占优均衡,就是两个企业都做广告。因为无论别人做广告与否,你的最优选择都是做广告,最终两个企业的利润都变低了。即便两个企业事前达成一个协议,规定谁都不做广告,这个协议也不会得到遵守。

国与国之间的军备竞赛也与此类似。如果约定每个国家都不发展军备,将资源用于民用产品,对每个国家的国民都更好。但是,给定对方不生产武器,己方生产武器就可以取得军事上的优势;反之,如果对方发展军备,自己不发展的话,就会受到更大的威胁。所以,大家就会都搞军备竞赛。

公共产品(public goods)的供给也存在囚徒困境问题。所谓公共产品是指像国防、道路、桥梁等消费起来不会排斥他人的物品或服务。和公共产品相对应的概念是私人物品(private goods),如食物、衣服、汽车等消费起来具有排他性的物品或服务。一个苹果,若被我吃了,你就吃不到了。这就是消费的排他性。国防、道路、桥梁等公共物品,我消费时,你也可以消费,因此,这些物品没有消费的排他性。但正是这种消费的非排他性,使得个人没有积极性来提供这种产品,每个人都想着别人来提供,自己搭便车(free-riding)。这使得公共产品如果单靠私人来提供的话,会不足,从而使得整个社会的效用下降。因此,对于一个社会来说,如何有效地提供公共产品是公共治理的核心问题。

鉴于公共产品的重要性,下面,我们用修路的例子具体分析一下公共产品的提供问题。假如在一个由甲、乙两个人组成的社会中要修一条路。甲、乙二人都可以选择出力或不出力。如果两个人都出力,可以修好路,则每个人得到4个单位的收益;如果两个人都不出力,则修不成路,每个人得到的收益为零。如果一个人出力,另一个人不出力,则出力的人得不偿失,我们记为-1,不出力的人的收益为5。这样,我们就可以用下图表示公共产品博弈:

在这个博弈里,占优战略均衡是每个人都不提供。即,不论别人提不提供,己方都不提供。由此我们可以预测,在个人自愿基础上的均衡意味着没有公共产品的提供。所以,公共产品的提供一般需要政府使用强制的办法让个人为公共产品提供相应的服务或资金,例如,在现代社会中我们每个人都要交个人所得税,而在古代社会则是很多人都需要服劳役以及兵役等

囚徒困境的一般形式

以上是几个具体的例子。下面我们给出囚徒困境博弈的一般形式。下图是一个二人博弈的支付矩阵。

博弈的双方都有两个选择:合作和不合作。如果两个人都选择合作,各自得到的支付为T;如果一个人合作另一个人不合作,合作方的支付为S,不合作方的支付为R;如果两个人都不合作,每一方的支付为P。

要使上述博弈成为一个囚徒困境需要满足这样一个条件:R>T>P>S。即:对每个人来说,最好的结果是别人合作自己不合作(R),其次是两人都合作(T),再次是两人都不合作(P),最坏的结果是自己合作别人不合作(S)。另外,我们假定T+T>R+S,即两人合作的总收益大于一人合作、另一人不合作时的总收益。只要满足这两个条件,无论支付的具体数字如何,结果一定是个人理性选择不满足集体理性。

囚徒困境是社会合作面临的最大难题。古今中外,人类社会的许多制度安排(包括法律和社会规范)都是为解决囚徒困境而设计的。前面提到公共财政是解决公共产品供给中的囚徒困境问题,后面我们还会讲到所有权如何解决囚徒困境问题。现在考虑如何借助法律执行的当事人之间的合同解决交易中的囚徒困境。设想甲、乙两人在采取行动之前签订一个合同,合同规定:不合作的一方将受到处罚,罚金为X。再假定双方都相信这个合同能够在法律上得到有效执行。我们得到了下图。

此时,给定对方合作,己方如果也合作,则双方都得到T;己方如果不合作,对方如图2-3所示得到的支付为S,而己方得到的支付为R-X。显然,只要罚金X足够大,使得R-X<T,那么,每个人的最好选择都是“合作”,双方都选择合作就成为一个均衡,解决了个人理性与集体理性的矛盾。这就是合同的价值。当然,如果当事人不相信合同能够得到有效执行,或者违约处罚的力度不够大(即X<R-T),我们就又回到了囚徒困境,合作仍然不会出现。

在上述例子中,我们也可以通过对合作一方提供奖励的办法解决囚徒困境。在经济学上,对不合作行为的惩罚等同于对合作行为的奖励,都属于激励制度,尽管在心理学上,奖励和惩罚的效果并不总是等同的。家庭和企业内部有各种各样的奖惩制度,其目的就是解决囚徒困境问题,促进合作。对整个社会来说,往往是通过法律来对不合作行为进行处罚来促进合作。可以说,法律是解决囚徒困境、促进社会合作的重要手段,尽管如我们在第六章和第七章中将看到的,在重复博弈中,许多合作无须借助法律和正式的制度也可以实现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/657103.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Chiplet,汽车“芯”风向

异构集成、高速互联、算力灵活可扩展正在成为新一轮汽车芯片竞争的焦点。尤其是随着以ChatGPT为代表的大数据、大模型产品在车端的落地,对于芯片的要求还在持续提升。 本周,12家日本汽车制造商(包括丰田、日产、本田等)、零部件制…

设计与实现基于Java+MySQL的考勤发布-签到系统

课题背景 随着现代经济的迅速发展,电子考勤签到服务已经渗透到人们生活的方方面面,成为不可或缺的一项服务。在这个背景下,线上签到作为考勤签到的一种创新形式,为用户提供了便捷的操作方式,使得任务签到、个人签到记…

代码随想录算法训练营第35天 | 860.柠檬水找零 406.根据身高重建队列 452.用最少数量的箭引爆气球

柠檬水找零 局部最优&#xff1a;收到20元时优先找零10元5元&#xff0c;不够再找零3个5元&#xff0c;因为5元可以找零20和10&#xff0c;更有用。全局最优&#xff1a;完成所有的找零。 class Solution { public:bool lemonadeChange(vector<int>& bills) {int fi…

c++的发展史、缺省参数、命名空间你了解吗?

1.c的发展历史概述 1.1.什么是c C语言是结构化和模块化的语言&#xff0c;适合处理较小规模的程序。对于复杂的问题&#xff0c;规模较大的 程序&#xff0c;需要高度的抽象和建模时&#xff0c;C语言则不合适。为了解决软件危机&#xff0c; 20世纪80年代&#xff0c; 计算机…

TypeScript实战系列之强力爆破泛型的困扰

目录 介绍开始如何理解泛型语法泛型约束泛型默认值练习后续 介绍 泛型在typescript 中使用频率相当高&#xff0c;也给了初学者相当大的阻碍。希望这一篇文章&#xff0c;能帮助你们爆破它。 开始 下面通过模拟实现一个简易版本的axios来引入泛型的使用 // axios.ts type M…

如何在centos7上配置为桥接模式

一、打开虚拟机的设置页面&#xff0c;设置虚拟机桥接模式如图&#xff1a;选择桥接模式&#xff08;复制物理网络连接可选&#xff09; 二、net0对应桥接模式的配置&#xff0c;如下方式选择 三、 在 CentOS 7 中&#xff0c;通过编辑网络配置文件来配置网络参数。找到 /etc…

(九)springboot实战——springboot3下的webflux项目参数验证及其全局参数验证异常处理

前言 在上一节内容中&#xff0c;我们介绍了如何在webflux项目中自定义实现一个全局的异常处理器ErrorWebExceptionHandler&#xff0c;正常情况下其可以处理我们系统的运行时异常&#xff0c;但是无法处理参数验证的异常WebExchangeBindException&#xff0c;所以这里提供另外…

算法随想录第四十八天打卡| 198.打家劫舍 , 213.打家劫舍II , 337.打家劫舍III

详细布置 今天就是打家劫舍的一天&#xff0c;这个系列不算难&#xff0c;大家可以一口气拿下。 198.打家劫舍 视频讲解&#xff1a;动态规划&#xff0c;偷不偷这个房间呢&#xff1f;| LeetCode&#xff1a;198.打家劫舍_哔哩哔哩_bilibili 代码随想录 class Solution(…

STM32 E18-D80NK红外避障传感器

E18-D80NK-N是一款红外光电传感器&#xff0c;它同时具备发射和接收功能。通过对发射光进行调制后发出&#xff0c;并通过接收头对反射光进行解调输出。 E18-D80NK-N采用了透镜来增强传感器的性能&#xff0c;使其能够检测更远的距离。根据红外光的特性&#xff0c;不同颜色的…

拒掉了一个双 985 的面试者

下班路上&#xff0c;和一个大佬聊天&#xff0c;他说今天面试&#xff0c;拒掉了一个双 985 的候选人。 候选人背景很好&#xff0c;本科和硕士都是 985 院校毕业&#xff0c;并且是除了清北浙之外&#xff0c;排名非常靠前的 985院校。 本硕专业都是计算机专业&#xff0c;…

Spring Boot + security + jwt 测试安全策略

一、测试概述 主要目的是测试security的用法。因测试搭建mysql和redis比较麻烦&#xff0c;所以我这里将自定义的jwt和用户信息缓存到程序的内存中。 本人测试的项目比较混乱&#xff0c;Spring Boot父类只标出有用的依赖。其子类用的版本为jdk11。后续会继续深入oauth2&#x…

数据库之TiDB基础讲解

文章目录 1 TiDB1.1 引言1.2 TiDB介绍1.3 系统架构1.3.1 TIDB Server1.3.2 PD Server1.3.3 TIKV Server1.3.4 TiKV如何不丢失数据1.3.5 分布式事务支持 1.4 与MySQL的对比1.5 性能测试1.5.1 测试一1.5.2 系统测试报告 2 1 TiDB 1.1 引言 当我们使用 Mysql 数据库到达一定量级…

调试小结:PHY初始化前后Link Status是否能正确反应网线插上、拔下状态

1 说明 为了验证是否需要初始化PHY才能检测到网线插上、拔下&#xff0c;这里我们对比初始化PHY&#xff08;LAN8720&#xff09;前后&#xff0c;插拔网线PHY寄存器1的bit2的是否按照预期变化来进行测试。 我们查看的PHY寄存器是1的bit2&#xff0c;定义如下&#xff1a; 2…

springboot的actuator

1、actuator简介 微服务的特点决定了功能模块的部署是分布式的&#xff0c;大部分功能模块都是运行在不同的机器上&#xff0c;彼此通过服务调用进行交互&#xff0c;前后台的业务流会经过很多个微服务的处理和传递&#xff0c;出现了异常如何快速定位是哪个环节出现了问题&am…

STM32 CAN接口中断处理与性能优化技巧

在基于STM32的CAN接口中&#xff0c;中断处理是一个非常重要的部分&#xff0c;它可以帮助我们实时地处理接收到的数据和处理其他CAN事件。为了优化CAN接口的性能&#xff0c;以下是一些中断处理和性能优化的技巧&#xff1a; ✅作者简介&#xff1a;热爱科研的嵌入式开发者&am…

系统架构19 - 面向对象

面向对象设计 相关概念面向对象分析基本步骤基本原则分析模型 面向对象设计设计模型类的类型 面向对象编程基本特点需求建模设计原则面向对象软件测试 相关概念 接口&#xff1a;描述对操作规范的说明&#xff0c;其只说明操作应该做什么&#xff0c;并没有定义操作如何做。消…

C与C++相互调用的“底层原理“

在你的C语言代码中&#xff0c;不知能否看到类似下面的代码&#xff1a; 这好像没有什么问题&#xff0c;你应该还会想&#xff1a;“嗯⋯是啊&#xff0c;我们的代码都是这样写的&#xff0c;从来没有因此碰到过什么麻烦啊&#xff5e;”。 你说的没错&#xff0c;如果你的头…

ES6理论及方法

一、基础知识 1.不可枚举就是不可遍历。 2.数据代理&#xff1a;通过一个对象代理对另一个对象中属性的操作&#xff08;读/写&#xff09; 二、方法 1.一个字符串是否包含在另一个字符串中 includes()&#xff1a;返回布尔值&#xff0c;表示是否找到了参数字符串。 starts…

Excel中将16进制数转化成10进制(有/无符号)

Excel中将16进制数转化成10进制&#xff08;有/无符号&#xff09; Excel或者matlab中常用XXX2XXX进行不同进制的转换 16进制转10进制&#xff08;无符号数&#xff09;&#xff1a;HEX2DEC 16进制转10进制&#xff08;有符号数&#xff09;&#xff1a; FA46为例&#xff0c…

看到小米SU7这顶配价格 全都坐不住了

文 | AUTO芯球 作者 | 李诞 果然被我猜中了吗&#xff1f; 我是真的猜中了吗 之前我的视频里说 小米SU7这技术、这车 绝对值35万 今天爆出来 小米汽车上牌售价 保险费用显示顶配36.14万 难怪雷总说 这是按照Dream Car的标准来设计的 投入百亿 雷总这点是真没骗人 …