囚徒困境及其启示
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自己不努力
同学能找到好工作,自 己不能
都不能过找到好工作
上面的问题是关乎以后我们命运的博弈。我们都知道“近 朱者赤,近墨者黑”这句千古名言,环境对于我们的成长 起着至关作用。大学缺少的是学习氛围,我们要走出这个 不利的困境,要相互影响(当然是好的方面),找到各自 的目标,走出自己精彩的大学路。大学四年很短,我们要 抓紧这短暂的时间创造无限的财富,同学之间要相互团结、 沟通、合作、理解、帮助,一起实现各自的理想。
之政治博弈
50年后军事解密,朝鲜战争的起因,因为中国和美国都有考虑, 我国是怕韩国如果统一朝鲜后美军会侵略中国,而美军是怕如果 朝鲜统一韩国后,中国军队会侵略日本,在占领日本后威胁美国 本土。所以双方都是以出兵和不出兵考虑,如果出兵,会有经济 损失,如果不出兵会威胁自己的领土,所以双方在”囚徒困境 “模式下都选择了出兵,最后两败俱伤。
观简单的数据,我们不难发现,无论是其营业总收入、连锁店的总数 量与扩张速度乃至平均到每家单店的营业力与收益率,在中国市场,麦当 劳均大大逊色于对手肯德基,两者在中国市场的争锋结果,已形成了悬殊 落差。
在比较肯德基与麦当劳的过程中还发现了这样一个事实,虽然这两家 彼此都视对方为最重要、最直接的竞争对手,但也都在中国市场都取得了 不俗的成绩,他们没有陷入同质化进而互打价格战的恶性竞争中去,却各 以各的方式提升自己的竞争力,竞争的结果是实现了双赢。这也许更值得 中国本土企业去思考和借鉴!
政治博弈也是一种非零和博弈。
➢ 零和效应:实力相当的双方在谈判时做出大体相等的让 步,方可取得结果,亦即每一方所得与所失的代数和大 致为零,谈判便可成功。然而,人类社会发展的历程越 来越走向“非零和”也就是我们现在所说的双赢。
➢ 眼下没有哪个国家能够主导世界,相互对抗只能导致双 方人力财力的损失与浪费,合作共赢才是时代之流。
囚徒困境的启示
反映个人最佳选择并非团体最佳选择。 注重合作,力求双赢,注重策略选择,善于换位思考。
必须正视生活中普遍存在的“囚徒困境”现象,要想真正走出 困境仅靠博弈参与者的个人理性是难以办到的,它需要的是博 弈双方用长远目光看待问题,以集体理性为行动基础,从竞争 走向合作。只有在集体理性的作用下,参与博弈的“囚徒”们 才能限制对方的机会主义行为,增强彼此的互相信任,最终才 能摆脱困境,实现双赢。
(3)完全信息/不完全信息博弈:参与者对所有参与者的策略空间及策 略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。
(4)静态博弈和动态博弈
静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动 者不知道先行动者的策略。
动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动 者的策略。
❖如果双方都与警方合作共同招认, 各被判刑5年;
❖如果双方均不认罪,因为警察找不 到其他证明他们违法的证据,则判刑 1年。
A B
不坦白
坦白
不坦白 坦白
A:判刑1年 B:判刑1年 A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年 A:判刑5年 B:判刑5年
现实中,基于人是理性的这一前提,无论同伙是否坦白,自 己坦白总是比不坦白好。两个人这样一算计,最好的结果都 是选择坦白,各判刑5年。
5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即 相关量处于稳定值。在供求关系中,某一商品市场如果在某一价 格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出, 此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是 一稳定的博弈结果。
“囚徒困境”是1950年美国兰德公司提出的博弈论模 型。两个共谋犯罪的人被关入监狱,不能互相沟通情 况。如果两个人都不揭发对方,则由于证据不确定, 每个人都坐牢一年;若一人揭发,而另一人沉默,则 揭发者因为立功而立即获释,沉默者因不合作而入狱 十年;若互相揭发,则因证据确实,二者都判刑八年。 由于囚徒无法信任对方,因此倾向于互相揭发,而不 是同守沉默。
3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博 弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且 与全局中人所取定的一组策略有关。所以,一局博弈结束时每个 局中人的“得失”是全体局中人所取定的一组策略的函数,通常 称为支付(payoff)函数。
4)对于博弈参与者来说,存在着一博弈结果 。
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果 等。其中局中人、策略和收益是最基本要素。局中人、行动和结 果被统称为博弈规则。
类型
(1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收 益分配问题。
(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自 己的收益最大,即策略选择问题。
然而实际上,如果两人都抵赖,那么都会无罪释放,显然这 个结果是最好的。但人在理性算计排除了这一结果。
这个故事讲得就是囚徒困境,是在1950年,由就职于兰德公 司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔 (Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔 伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒 困境”。
囚徒困境的核心理念是:博弈全输,合作双赢,怀疑或不信 任导致失败。
要诀:注重合作,力求双赢;注重策略选择,善于换位思考。
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个 人最佳选择并非团体最佳选择。虽然困境本身只属模型性质, 但在现实中政治、经济、军事、企业经营、社会生活、组织 管理等方面,也会频繁出现类似情况。
要素
1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为 一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多 于两个局中人的博弈称为 “多人博弈”。
2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行 动方案,即方案不是某阶段的行动方案,而是指导整个行动的一 个方案,一个局中人的一个可行的自始至终全局筹划的一个行动 方案,称为这个局中人的一个策略。
囚徒困境
小组成员:王嘉瑶 王洁霞 王孟佳 王晓斌
什么是博弈论?
博弈论又被称为对策论(Game Theory)既是现代数学的一个新分 支,也是运筹学的一个重要学科。
博弈论主要研究公式化的激励结构间的相互作用。是研究具有斗 争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体 的预测行为和实际行为,并研究它们的优化策略。生物学家使用 博弈理论来理解和预测进化论的某些结果。
台湾要买美国的F16,中国希望欧洲对华军售,两个地区的政府都在 为武器画着大价钱从而损失了国家的经济发展力,这也是囚徒困 境的模式,都会担心如果一旦开战会对自己不利,如果我没有先 进武器,你有先进武器,那么开战的话我就会吃亏。如果我有先 进武器你没有的话,我就会得利。所以我一定要有先进武器。殊 不知如果两岸达成和平条约,双方都不购买先进武器,把资金都 放在经济发展人民收入上,那才是真的双赢。
非零和博弈是一种合作下的博弈,博弈中各方 的收益或损失的总和不是零值,它区别于零和 博弈。在经济学研究中比较有用。 在这种状况 时,自己的所得并不与他人的损失的大小相等, 连自己的幸福也未必建立在他人的痛苦之上, 即使伤害他人也可能“损人不利己”,所以博 弈双方存在 “双赢”的可能,进而达成合作。
现实中的囚徒困境
现实生活中还有很多囚徒困境的例子:
间谍战
商业战
关税战
大学生ຫໍສະໝຸດ Baidu博弈
大学生最关心的问题是以后的就业问题,能否找到好工作 和大学期间的努力使成正比的,这也是一个博弈问题(假 设是自己和竞争者之间努力与否的博弈,排除其他因素), 问题如下表:
同学努力
同学不努力
自己努力
都能找到好工作
自己能找到好工作,同 学不能
应用到国家中,国与国之间应避免斗争,合作共赢才是王道。
应用到企业中,管理者应当尽量避免囚徒困境,从而引导每个局 中人都自觉地为整体努力。
应用到个人中,每个人从自己收益最大化出发来考虑问题,最终 往往落得两败俱伤的结果。人类的个人理性算计有时能导致集体 的非理性——聪明的人类会因自己的聪明而作茧自缚。作为一个 理性的人,在陷入这种进退两难的囚徒困境的时候,必须计算下 厉害得失,采取合适的策略将可能面临的损失降到最低。
互相达成协议,减少广告的开支。(合作)
增加广告开支,设法提升广告的质量,压倒对方。(背叛)
肯德基与麦当劳
1、肯德基的价格稍高,但量大;麦当劳的价 格稍微便宜2、3元,但量少。 2、肯德基是百事可乐 麦当劳是可口可乐。 3、肯德基主要以鸡为主; 麦当劳有牛肉类 和鸡类。 4、肯德基的背景墙主要是发展历程; 麦当 劳的背景墙是以儿童纯真时代为主。 5、肯德基的音乐轻快、悠闲;麦当劳的音乐 纯真、童趣。
➢ 需要注意的是,在大国与小国之间,我们则不能单纯地 用非零和博弈去解释。毕竟这个世界仍然充斥着强权与 武力。
现实中的囚徒困境之
广告战
➢两个公司互相竞争,二公司的广告互相影响,即一公司的广告较 被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类 似的广告,收入增加很少但成本增加。但若不提高广告质量,生意 又会被对方夺走。 此二公司可以有二选择:
有2个涉嫌共同作案偷窃的嫌疑人 A和B被带进警察局。假定警方对 2名犯罪嫌疑人实行隔离关押,隔 离审讯,每个犯罪嫌疑人都无法 观察到对方的选择。
警方怀疑他们作案,但并没有掌 握他们作案的确凿证据,于是明 确地分别告诉2名嫌疑人:对他们 犯罪事实的认定及相应的量刑, 完全取决于他们自己供认与否。
❖如果一方与警方合作,坦白所做违 法之事,而另一方抵赖,招认方将无 罪释放,另一方则会被判重刑8年;