十大经典博弈理论

Contributor:角角 Type:简体中文 Date time:2024-02-24 15:34:42 Favorite:16 Score:0
返回上页 Report
请选择举报理由:




Collection Modify the typo
1. 囚徒困境
“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,
分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:
或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,
而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,
因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,
所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,
那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,
并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,
两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,
保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,
然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,
他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,
把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
2. 智猪博弈
假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,
按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,
大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,
在两头猪都有智慧的前提下,最终结果是小猪选择等待。
实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:
在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位
食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位
的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,
纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。
3. 枪手博弈
有三个枪手,第一个枪手A的命中率是80%, B是60%,C是40%。他们同时举枪瞄准、
同时射击另两个人中的一个,要尽可能消灭对手,每个人一次机会,一颗子弹,目标是努力使自己活下来。
谁活下来的可能性最大?如果你认为枪法最准的A胜出,那么你就错了。
我们来看,如果你是A,你毫无疑问的会瞄准对你威胁最大的B,而B也会瞄准对他威胁最大的A,
而C则也可能瞄准A,那么三个人存活的概率都是多少呢?
A = 100% - 60% - (1-60%)* 40% = 24%
B = 100% - 80% = 20% (因为命中率为80%的A在瞄准他)
C = 100% (因为没有人瞄准他)
原来,枪法最不准的C竟然活了下来。
那么,换一种玩法呢?
如果三个人轮流开枪,谁会生存下来?
如果A先开枪的话,A还是会先打B,如果B被打死了,则下一个开枪的就是C,
那么此时A生存的概率为60%,而C依然是100%(他开过枪后A没有子弹了,游戏结束);如果打不死B,
则下一轮在B开枪的时候一定会全力回击,A的生存率为40%,不管是否打死A,
第三轮AB的命运都掌握在C的手里了。
那么,如果游戏规则规定必须由C先开枪,如果你是C怎么才能让自己活下来呢?
答案是胡乱开一枪,只要不针对AB任何一人即可。
当C开枪完毕,AB还是会陷入互相攻击的困境。
4. 斗鸡博弈(即胆小鬼博弈、懦夫博弈)
两只斗鸡在决斗的时候,无论选择进或退都是一个难题。在很多较量下,死拼将是得不偿失的,
因为很可能给第三者机会。因此,两个已经在战场的强势力很可能自觉的遵循纳什均衡,
当一方攻击时,另一方暂退。虽然可能某方暂时受损,但较之于两败俱伤是好得多的。不过,
要维持这一状况,必须保证下一次先期受损的一方发动攻势的时候,另一方同样的后退。
于是这样的攻击性行为开始变得“仪式化”,没有人真正流血。这只不过是两个巨头玩弄的游戏,
目的是警告后来者,想进来,那么也得陪我们一起玩,可是你玩的起么?
5. 蜈蚣博弈
一个双人博弈,两人轮流行动,轮到一方时有两种选择:不合作,博弈将直接结束,
直接获得收益P;合作,博弈将继续进行,且轮到对方选择。如果对手选择不合作将结束博弈,
玩家将会获得一个稍微低于P的收益,但如果对手也选择继续博弈,该玩家将在之后的博弈中获得一个
高于P的收益。随着博弈的不断进行,两玩家的收益之和将越来越高。博弈进行有限轮,
若两玩家一直选择合作,两人最后的收益相同。
蜈蚣博弈的机理是以最终的结果倒退至开始。这是一个睿智的策略,因果相报,把握好因缘,
自有好结果。它的另一个好处,就是使得未来的计划明晰化,你不再徘徊。
蜈蚣博弈也有一个致命的悖论,仍旧是个人利益和集体利益的冲突,因为最后一次的背叛收益始终优于合作。
延伸阅读
“公地悲剧”?
有一片公共牧场,所有牧民都可以在这块牧场上放牧。但每个牧场的草,都是有容量上限的。
一开始所有牧民都商量好,每家放5头牛,不许多放。几天后,有几个自私的牧民,
多放了几头牛。其他人很气愤,他们想:我守规矩有什么用,草地早晚要被其他人糟蹋完的,不如我多放几头。
于是,越来越多的牛出现在草地上,最后,草场退化,牛群饿死。
这就是“公地悲剧”。
公地悲剧其实随处可见,比如环境污染、过度海洋捕捞等。
6. 分蛋糕博弈
两个小孩怎么分蛋糕?经典的故事,经典的解答:一个分,一个选。现实多如此,
权利的合理分配将有效促进公平与效率。经营权与所有权的分置的确使得经济更加活力。
不过分蛋糕的进阶模型却强调了讨价还价的策略,分蛋糕不是一次性的,而是多回合的,
而且出现成本:蛋糕在融化。
时间成本的加入,将使得分配变得复杂化。双方如果不能及时达成交易,不仅集体的收益将减量,
而且个体的收益也将减少。在此情况下,利用时间称本以及威胁、承诺将对其中一方极其有利。
顾客可能迫于情势,必须尽快结束谈判,这时卖方却不慌不忙,故意拖延,顾客一方将不得不在价格上作出妥协。
顾客一方当然也有策略,它的策略就是货比三家,要求承诺或威胁。这个前提是买方市场的存在。
顾客还应当保护自己讨价还价的能力,这就是顾客有权投诉商家。
7. 鹰鸽博弈
这个博弈很多人等同于斗鸡博弈。不过,斗鸡是两个兼具侵略性的个体,
鹰鸽却是两个不同群体的博弈,一个和平,一个侵略。在只有鸽子一个苞谷场里,
突然加入的鹰将大大获益,并吸引同伴加入。但结果不是鹰将鸽逐出苞谷场,
而是一定比例共存,因为鹰群增加一只鹰的边际收益趋零时(鹰群发生内斗),均衡将到来。
由此产生了进化上的稳定策略,也就是说一旦均衡形成,偏离的运动会受到自然选择的打击。
也就是鹰群饱满后,再试图加入的鹰将会被鹰群排挤。
进化上的稳定均衡最大的好处莫过于保持稳定。但问题在于形成强势的路径依赖,
也就是胜出的不一定是最好的。因为最好的会被当作出头鸟干掉,这是个体的失败,
集团的胜利以及集体的止步不前。
8. 脏脸博弈
恍然大悟的博弈。三个人在屋子里,不许说话。美女进来说:你们当中至少一个人脸是脏的。
三人环看,没有反应。美女又说:你们知道吗?三人再看,顿悟,脸都红了。
为什么?因为美女后一句废话点破天机,三个人都知道脏脸的存在,
而且推测知道对方也知道了脏脸的存在(因为另两人脸没红,说明他们看到脏脸了),
而且知道对方知道自己已经想到上一步……循环开始,知识开始共同化,真相大白:
三个人都是脏脸,所有人都脸红了。
这就是共同知识的作用,它的作用显得有点可怕的强大。几乎是一招无影腿,杀人不见血。
在台面上的博弈之前,私下的算计已经置对手于死地。不过,很可能对方也预料到这一点,
早也想到这一点,同时杀来。终于,形成双死局面。
当然,现实虽然存在类似现象,不过共同知识更大的作用在于减少交易成本。因为某些规则人尽皆知,
双方只要各自依之行事就可以了。
9. 以牙还牙
是一个用于博弈论的重复囚徒困境
(Reiterated Prisoner's Dilemma)非常有效
的策略。
也就是说,人家怎么对你,你也怎么对他。说得再准确点,这个策略在开局时选择合作,
以后则模仿对手在上一期的行动。这一策略有两个步骤:
① 第一个回合选择合作
② 下一回合是否选合作要看上一回对方是否合作,若对方上一回背叛,此回合我亦背叛;
若对方上一回合作,此回合继续合作。
以牙还牙策略有四个特点:
① 友善:以牙还牙者开始一定采取合作态度,不会背叛对方
② 报复性:遭到对方背叛,以牙还牙者一定会还击作出报复
③ 宽恕:当对方停止背叛,以牙还牙者会原谅对方,继续合作
④ 不羡慕对手:以牙还牙者个人永远不会得到最大利益,整个策略以全体的最大利益为依归。
10. 手表定律
手表定律是指一个人有一只表时,可以知道现在是几点钟,而当他同时拥有两只表时却无法确定。
两只表并不能告诉一个人更准确的时间,反而会让看表的人失去对准确时间的信心。
你要做的就是选择其中较信赖的一只,尽力校准它,并以此作为你的标准,听从它的指引行事。
记住尼采的话:“兄弟,如果你是幸运的,你只需有一种道德而不要贪多,这样,你过桥更容易些。”
如果每个人都“选择你所爱,爱你所选择”,无论成败都可以心安理得。然而,困扰很多人的是:
他们被“两只表”弄得无所,心身交瘁,不知自己该信仰哪一个,还有人在环境、他人的压力下,
违心选择了自己并不喜欢的道路,为此而郁郁终生,即使取得了受人瞩目的成就,也体会不到成功的快乐。
声明:以上文章均为用户自行添加,仅供打字交流使用,不代表本站观点,本站不承担任何法律责任,特此声明!如果有侵犯到您的权利,请及时联系我们删除。
Hot degree:
Difficulty:
quality:
Description: the system according to the heat, the difficulty, the quality of automatic certification, the certification of the article will be involved in typing!

This paper typing ranking TOP20

登录后可见