囚徒困境

来自计算思维百科
跳转至: 导航搜索
囚徒困境1.png

博弈论中有一个经典案例-“囚徒困境”,说的是两个囚犯的故事。甲和乙因为犯法被警察抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情况下,两个囚犯都可以做出自己的选择:坦白交代或保持沉默。

两个囚犯都知道,如果他俩都保持沉默的话,就都会被释放,因为只要他们拒不承认,警方是无法给他们定罪的。但警方对他俩说:如果他们中的一个人坦白了,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被判重刑,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯都选择坦白的话,两个人都会被按照最重的罪来判决,而且谁也不会得到奖赏。

那么,这两个囚犯该怎么办呢?是选择坦白还是沉默?

解决方法

描述此囚徒困境的决策表如下:

 

甲沉默(合作)

甲认罪(背叛)

乙沉默(合作)

两人同时释放

甲释放,获得奖金

乙判刑,施以罚款

乙认罪(背叛)

乙释放,获得奖金

甲判刑,施以罚款

两人同时判刑,没有奖赏

“囚徒困境”中的目标是最大限度地减少自己的痛苦和损失。从表面上看,两个囚徒应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。囚犯甲不是个傻子,他马上意识到,他根本无法相信他的同伙。同伙乙很有可能有向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。但他也意识到,他的同伙乙也会这样设想。

通过以上分析,囚犯甲的结论是,唯一理性的选择就是坦白交代,把一切都告诉警方。因为如果他的同伙保持沉默,那么他就会带着那笔奖金出狱;而如果他的同伙也根据这个逻辑向警方交代了,那么,囚犯甲反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯都会不顾一切地做出选择:坐牢。

运用的计算思维

解决此问题的一般思路是,其中一个人选择最佳策略时另一个人也要选择对应的最佳策略。决策表清晰地描述了所有策略对应的结果,运用的是抽象的计算思维。

参考文献

于雷.逻辑思维游戏大全集.北京:清华大学出版社,2015: