走出囚徒困境的方法_囚徒困境的一种计算方法

走出囚徒困境的方法

You and your friend have committed a murder. A few days later, the cops pick the two of you up and put you in two separate interrogation rooms such that you have no communication with each other. You think your life is over, but the police offer up a deal:

您和您的朋友谋杀了。 几天后,警察将你们两个人抓起来,并把您放在两个单独的审讯室中,以便您彼此之间没有任何沟通。 您以为自己的生活已经结束,但是警察提出了一项协议:

Rat your friend out, and your sentence will be lighter.

把你的朋友赶出去,你的句子就会轻些。

The catch is that your friend is offered this deal, too.

问题是您的朋友也被提供了这笔交易。

More specifically, if you rat your friend out but your friend says nothing, they get a heavy sentence and you get a light one. If you rat each other out, there’s a heavy penalty for both. If both of you stay silent, the sentences are light for you and your friend.

更具体地说,如果您淘汰了您的朋友,但您的朋友什么也没说,他们的句子就会很重,您的句子就会很轻。 如果您互相淘汰,则两者都将受到重罚。 如果你们两个都保持沉默,那么对您和您的朋友来说句子很轻。

The decisions must be made without communicating with each other, and both you and your friend only have two choices: “defect” and rat them out, or “withhold” information from the cops and stay silent.

这些决定必须在不相互沟通的情况下进行,您和您的朋友只有两种选择:“瑕疵”并将其淘汰,或者“隐瞒”警察的信息并保持沉默。

Take a look at the following diagram that describes your choices and sentences:

看下面的图表,它描述了您的选择和句子:

Image for post
A punishment diagram for you and your friend.
你和你的朋友的惩罚图。

The matrix describes the number of years the two of you get depending on what you and your friend independently choose to do. The first number represents your prison time and the second represents your friend’s.

该矩阵描述了你们两个人的年限,具体取决于您和您的朋友独立选择做什么。 第一个数字代表您的入狱时间,第二个数字代表您朋友的入狱时间。

For example, if you withhold information from the cops, but your friend chooses to rat you out, you get five years in a maximum-security prison but your friend only gets one.

例如,如果您从警察那里隐瞒信息,但您的朋友选择将您杀了出去,您将在最高安全牢狱中服刑五年,而您的朋友只会被服刑一年。

What would you do in this situation?

在这种情况下怎么做?

What should you do in this situation?

应该在这种情况下怎么办?

There’s no easy solution to this problem and there are a lot of interpretations to this. A utilitarian might say withholding is the better option because it minimizes the total number of years either person spends in prison (5 + 1 or 3 + 3 as opposed to 10 + 10). What does probability say?

这个问题没有简单的解决方案,对此有很多解释。 功利主义者可能会说,扣缴税是更好的选择,因为它使每个人在监狱中度过的总年限最小化(5 + 1或3 + 3,而不是10 + 10)。 概率说什么?

解决困境 (Solving the Dilemma)

I created a population of 1000 prisoners, each with a 50–50 chance of being a defector or withholder. I then simulated an interaction for 500 pairs of prisoners and took note of the outcomes. I repeated this experiment 200 times.

我创建了1000名囚犯,每名囚犯都有50–50个叛逃者或保留者的机会。 然后,我模拟了500对囚犯的互动,并记录了结果。 我重复了这个实验200次。

Image for post
Defectors vs. Withholders (50–50 split).
偏转器与持仓者(50-50分割)。

As you can see, if the number of defectors and withholders is roughly the same, it’s far better to attempt to withhold information. Most of the time, the payoff will be in your favor. The average number of years a defector spent in prison was 5.75 years vs. a withholders 4.01.

如您所见,如果叛逃者和撤回者的数量大致相同,那么最好隐瞒信息。 大多数时候,回报将对您有利。 叛逃者在监狱中的平均年限为5.75年,而扣留者的平均年限为4.01年。

We can make this a bit more interesting by varying the proportion of defectors and withholders. Say you’re in a country where everyone is untrusting of one another and that 75% of the population is a defector vs. 25% withholder.

我们可以通过改变叛逃者和持股者的比例使这一点变得更加有趣。 假设您所在的国家/地区每个人都不互相信任,并且75%的人口属于叛逃者,而25%的人是叛逃者。

Image for post
Defectors vs. Withholders (75–25 split).
偏转器vs.保留者(75-25分)。

Your best bet is to withhold information from the police. This makes sense, since if you were to defect as well there’s a much higher probability that you’ll end up with the worst option in the game — 10 years a piece.

最好的选择是不向警方提供信息。 这是有道理的,因为如果您也要叛逃,那么您最终有可能在游戏中遇到最糟糕的选择,那就是每10年一次。

Let’s try one more. Say everyone is overly trusting (despite the fact that they’ve just committed a murder).

让我们再试一次。 假设每个人都过分信任(尽管他们刚刚犯了谋杀罪)。

Image for post
Defectors vs. Withholders (25–75 split).
偏转器vs.保留者(25–75分割)。

This one is more interesting. It seems that you’d be slightly better off withholding information, but the payoff is wildly inconsistent (and in some cases ends up being worse than defecting!). This is because the possible sentences for withholding while the other defects can be either three or five years while the possible sentences for defecting while the other withholds can be either one or ten years. The difference between 3 and 5 is a lot less than the difference between 1 and 10 — so there’s a lot more variance in the latter scenario.

这个更有趣。 似乎您最好不隐瞒信息,但是收益却是完全不一致的(在某些情况下最终要比背叛更糟!)。 这是因为其他缺陷的可能扣留可能是三年或五年,而其他缺陷的可能扣留可能是一年或十年。 3与5之间的差异远小于1与10之间的差异-因此在后一种情况下存在更多差异。

What would you do in this particular situation?

在这种特殊情况下,您会怎么做?

If you enjoyed this article, you can follow me on Medium for more content like this. Thanks for reading!

如果您喜欢这篇文章,可以在Medium上关注我,以获得更多类似的内容。 谢谢阅读!

翻译自: https://towardsdatascience.com/a-computational-approach-to-the-prisoners-dilemma-837a799cedf0

走出囚徒困境的方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/389724.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Zookeeper系列四:Zookeeper实现分布式锁、Zookeeper实现配置中心

一、Zookeeper实现分布式锁 分布式锁主要用于在分布式环境中保证数据的一致性。 包括跨进程、跨机器、跨网络导致共享资源不一致的问题。 1. 分布式锁的实现思路 说明: 这种实现会有一个缺点,即当有很多进程在等待锁的时候,在释放锁的时候会有…

resize 按钮不会被伪元素遮盖

textarea默认有个resize样式,效果就是下面这样 读 《css 揭秘》时发现两个亮点: 其实这个属性不仅适用于 textarea 元素,适用于下面所有元素:elements with overflow other than visible, and optionally replaced elements repre…

平台api对数据收集的影响_收集您的数据不是那么怪异的api

平台api对数据收集的影响A data analytics cycle starts with gathering and extraction. I hope my previous blog gave an idea about how data from common file formats are gathered using python. In this blog, I’ll focus on extracting the data from files that are…

前端技术周刊 2018-09-10:Redux Mobx

前端快爆 在 Chrome 10 周年之际,正式发布 69 版本,整体 UI 重新设计,同时iOS 版本重新将工具栏放置在了底部。API 层面,支持了 CSS Scroll Snap、前端资源锁 Web Lock API、WebWorker 里面可以跑的 OffscreenCanvas API、toggleA…

逻辑回归 概率回归_概率规划的多逻辑回归

逻辑回归 概率回归There is an interesting dichotomy in the world of data science between machine learning practitioners (increasingly synonymous with deep learning practitioners), and classical statisticians (both Frequentists and Bayesians). There is gener…

sys.modules[__name__]的一个实例

关于sys.modules[__name__]的用法,百度上阅读量比较多得一个帖子是:https://www.cnblogs.com/robinunix/p/8523601.html 对于里面提到的基础性的知识点这里就不再重复了,大家看原贴就好。这里为大家提供一个详细的例子,帮助大家更…

ajax不利于seo_利于探索移动选项的界面

ajax不利于seoLately, my parents will often bring up in conversation their desire to move away from their California home and find a new place to settle down for retirement. Typically they will cite factors that they perceive as having altered the essence o…

C#调用WebKit内核

原文:C#调用WebKit内核版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u013564470/article/details/80255954 系统要求 Windows与.NET框架 由于WebKit库和.NET框架的要求,WebKit .NET只能在Windows系统上运行。从…

数据分析入门:如何训练数据分析思维?

本文由 网易云 发布。 作者:吴彬彬(本篇文章仅限知乎内部分享,如需转载,请取得作者同意授权。) 我们在生活中,会经常听说两种推理模式,一种是归纳 一种是演绎,这两种思维模式能够帮…

559. N 叉树的最大深度

559. N 叉树的最大深度 给定一个 N 叉树,找到其最大深度。 最大深度是指从根节点到最远叶子节点的最长路径上的节点总数。 N 叉树输入按层序遍历序列化表示,每组子节点由空值分隔(请参见示例)。 示例 1: 输入&#…

el表达式取值优先级

不同容器中存在同名值时,从作用范围小到大的顺序依次尝试取值:pageContext->request->session->application 转载于:https://www.cnblogs.com/wrencai/p/9006880.html

数据探索性分析_探索性数据分析

数据探索性分析When we hear about Data science or Analytics , the first thing that comes to our mind is Modelling , Tuning etc. . But one of the most important and primary steps before all of these is Exploratory Data Analysis or EDA.当我们听到有关数据科学或…

5930. 两栋颜色不同且距离最远的房子

5930. 两栋颜色不同且距离最远的房子 街上有 n 栋房子整齐地排成一列,每栋房子都粉刷上了漂亮的颜色。给你一个下标从 0 开始且长度为 n 的整数数组 colors ,其中 colors[i] 表示第 i 栋房子的颜色。 返回 两栋 颜色 不同 房子之间的 最大 距离。 第 …

stata中心化处理_带有stata第2部分自定义配色方案的covid 19可视化

stata中心化处理This guide will cover an important, yet, under-explored part of Stata: the use of custom color schemes. In summary, we will learn how to go from this graph:本指南将涵盖Stata的一个重要但尚未充分研究的部分:自定义配色方案的使用。 总而…

Anaconda配置和使用

为什么80%的码农都做不了架构师?>>> 原来一直使用原生python和pip的方式,换了新电脑,准备折腾下Anaconda。 安装过程就不说了,全程可视化安装,很简单。 安装后用“管理员权限”打开“Anaconda Prompt”命令…

python 插补数据_python 2020中缺少数据插补技术的快速指南

python 插补数据Most machine learning algorithms expect complete and clean noise-free datasets, unfortunately, real-world datasets are messy and have multiples missing cells, in such cases handling missing data becomes quite complex.大多数机器学习算法期望完…

NIO 学习笔记

0. 介绍 参考 关于Java IO与NIO知识都在这里 ,在其基础上进行修改与补充。 1. NIO介绍 1.1 NIO 是什么 Java NIO 是 java 1.4, 之后新出的一套IO接口. NIO中的N可以理解为Non-blocking,不单纯是New。 1.2 NIO的特性/NIO与IO区别 IO是面向流的&#x…

[原创]java获取word里面的文本

需求场景 开发的web办公系统如果需要处理大量的Word文档(比如有成千上万个文档),用户一定提出查找包含某些关键字的文档的需求,这就要求能够读取 word 中的文字内容,而忽略其中的文字样式、表格、图片等信息。 方案分析…

ab 模拟_Ab测试第二部分的直观模拟

ab 模拟In this post, I would like to invite you to continue our intuitive exploration of A/B testing, as seen in the previous post:在本文中,我想邀请您继续我们对A / B测试的直观探索,如前一篇文章所示: Resuming what we saw, we…

1886. 判断矩阵经轮转后是否一致

1886. 判断矩阵经轮转后是否一致 给你两个大小为 n x n 的二进制矩阵 mat 和 target 。现 以 90 度顺时针轮转 矩阵 mat 中的元素 若干次 ,如果能够使 mat 与 target 一致,返回 true ;否则,返回 false 。 示例 1: 输…