囚徒困境及其启示 1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
政治博弈也是一种非零和博弈。
零和效应:实力相当的双方在谈判时做出大体相等的让 步,方可取得结果,亦即每一方所得与所失的代数和大 致为零,谈判便可成功。然而,人类社会发展的历程越 来越走向“非零和”也就是我们现在所说的双赢。
非零和博弈是一种合作下的博弈,博弈中各方 的收益或损失的总和不是零值,它区别于零和 博弈。在经济学研究中比较有用。 在这种状况 时,自己的所得并不与他人的损失的大小相等, 连自己的幸福也未必建立在他人的痛苦之上, 即使伤害他人也可能“损人不利己”,所以博 弈双方存在 “双赢”的可能,进而达成合作。
现实中的囚徒困境
囚徒困境
小组成员:王嘉瑶 王洁霞 王孟佳 王晓斌
什么是博弈论?
博弈论又被称为对策论(Game Theory)既是现代数学的一个新分 支,也是运筹学的一个重要学科。
博弈论主要研究公式化的激励结构间的相互作用。是研究具有斗 争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体 的预测行为和实际行为,并研究它们的优化策略。生物学家使用 博弈理论来理解和预测进化论的某些结果。
然而实际上,如果两人都抵赖,那么都会无罪释放,显然这 个结果是最好的。但人在理性算计排除了这一结果。
这个故事讲得就是囚徒困境,是在1950年,由就职于兰德公 司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔 (Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔 伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒 困境”。
台湾要买美国的F16,中国希望欧洲对华军售,两个地区的政府都在 为武器画着大价钱从而损失了国家的经济发展力,这也是囚徒困 境的模式,都会担心如果一旦开战会对自己不利,如果我没有先 进武器,你有先进武器,那么开战的话我就会吃亏。如果我有先 进武器你没有的话,我就会得利。所以我一定要有先进武器。殊 不知如果两岸达成和平条约,双方都不购买先进武器,把资金都 放在经济发展人民收入上,那才是真的双赢。
3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博 弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且 与全局中人所取定的一组策略有关。所以,一局博弈结束时每个 局中人的“得失”是全体局中人所取定的一组策略的函数,通常 称为支付(payoff)函数。
4)对于博弈参与者来说,存在着一博弈结果 。
(3)完全信息/不完全信息博弈:参与者对所有参与者的策略空间及策 略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。
(4)静态博弈和动态博弈
静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动 者不知道先行动者的策略。
动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动 者的策略。
5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即 相关量处于稳定值。在供求关系中,某一商品市场如果在某一价 格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出, 此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是 一稳定的博弈结果。
“囚徒困境”是1950年美国兰德公司提出的博弈论模 型。两个共谋犯罪的人被关入监狱,不能互相沟通情 况。如果两个人都不揭发对方,则由于证据不确定, 每个人都坐牢一年;若一人揭发,而另一人沉默,则 揭发者因为立功而立即获释,沉默者因不合作而入狱 十年;若互相揭发,则因证据确实,二者都判刑八年。 由于囚徒无法信任对方,因此倾向于互相揭发,而不 是同守沉默。
有2个涉嫌共同作案偷窃的嫌疑人 A和B被带进警察局。假定警方对 2名犯罪嫌疑人实行隔离关押,隔 离审讯,每个犯罪嫌疑人都无法 观察到对方的选择。
警方怀疑他们作案,但并没有掌 握他们作案的确凿证据,于是明 确地分别告诉2名嫌疑人:对他们 犯罪事实的认定及相应的量刑, 完全取决于他们自己供认与否。
如果一方与警方合作,坦白所做违 法之事,而另一方抵赖,招认方将无 罪释放,另一方则会被判重刑8年;
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果 等。其中局中人、策略和收益是最基本要素。局中人、行动和结 果被统称为博弈规则。
类型
(1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收 益分配问题。
(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自 己的收益最大,即策略选择问题。
Βιβλιοθήκη Baidu囚徒困境的核心理念是:博弈全输,合作双赢,怀疑或不信 任导致失败。
要诀:注重合作,力求双赢;注重策略选择,善于换位思考。
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个 人最佳选择并非团体最佳选择。虽然困境本身只属模型性质, 但在现实中政治、经济、军事、企业经营、社会生活、组织 管理等方面,也会频繁出现类似情况。
如果双方都与警方合作共同招认, 各被判刑5年;
如果双方均不认罪,因为警察找不 到其他证明他们违法的证据,则判刑 1年。
A B
不坦白
坦白
不坦白 坦白
A:判刑1年 B:判刑1年 A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年 A:判刑5年 B:判刑5年
现实中,基于人是理性的这一前提,无论同伙是否坦白,自 己坦白总是比不坦白好。两个人这样一算计,最好的结果都 是选择坦白,各判刑5年。
之政治博弈
50年后军事解密,朝鲜战争的起因,因为中国和美国都有考虑, 我国是怕韩国如果统一朝鲜后美军会侵略中国,而美军是怕如果 朝鲜统一韩国后,中国军队会侵略日本,在占领日本后威胁美国 本土。所以双方都是以出兵和不出兵考虑,如果出兵,会有经济 损失,如果不出兵会威胁自己的领土,所以双方在”囚徒困境 “模式下都选择了出兵,最后两败俱伤。
要素
1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为 一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多 于两个局中人的博弈称为 “多人博弈”。
2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行 动方案,即方案不是某阶段的行动方案,而是指导整个行动的一 个方案,一个局中人的一个可行的自始至终全局筹划的一个行动 方案,称为这个局中人的一个策略。