囚徒困境

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

什么是囚徒困境(续二)
(2)叙述中的具体数字不具重要意义, 关键是四种可能的结果对于当事人可以 排成一个"好""坏"程度有差别的 "序列" 这不是逻辑悖论,而是一个两难性的问 题,所以被称为"困境(dilemma)"
囚徒困境的种种表现
囚徒困境是社会现实生活中常见的现象 日常生活 政治活动 国际关系 "搭便车"(free rider) 大规模囚徒困境
重复的囚徒困境(续)
哈灵顿策略(HARRINGTON)首先合作,如 果发现对方一直合作,就突然选择不合作,如 果对方立即报复,就恢复合作;如果对方仍然 合作,就继续背叛) TFT策略的特点:善良性,可激怒性,宽恕性, 清晰性 合作怎样产生:初始存活性问题;强壮性(卢 棒性)问题;稳定性问题
重复的Baidu Nhomakorabea徒困境(续)
对参与者和改革者的建议: (从个体的眼光看,目的是在一系列的对局中 尽可能地得高分. 参与者会受到背叛的短期诱惑,但是通过与对 方建立合作可以得到长期的好处) 1,不要嫉妒;( "一报还一报"从来没有在 比赛中比对手得更多的分, "一报还一报"赢 得比赛不是靠打击对方,而是靠从对方引出对 双方都有好处的行为.在"重复的囚徒困境" 中,其他人的成功是你自己成功的前提. )

重复的囚徒困境(续)
2,不要首先背叛; (参加比赛的许多学者都没有认识到 "善良性即不要首先背叛"的重要性.) (善良程序的群体相处得很好,可以阻 止"小群体"的侵入) (只会占"傻瓜"的便宜是没有用的) 3,对合作和背叛都要给以回报;(最优 的宽恕水平与环境有关)
重复的囚徒困境(续)
什么是囚徒困境
博弈论(game theory,又译为对策论, 游戏论);合作博弈和非合作博弈; 问题的提出;什么是囚徒困境 ? 嫌疑犯乙 坦白 沉默 嫌疑犯甲 坦白 -3,-3 0,-5 沉默 -5,0 -1,-1
什么是囚徒困境(续一)
前提设定(1)每个局中人都知道博弈规则和 博弈结果的支付矩阵;(2)每个局中人都是 理性的(个人理性和个人最优决策);(3) 不能"串通" 结果及其分析:(1)推理在逻辑上是正确的, 其推理形式是:P或Q 如果P,则R 如果Q,则R 所以,R
4,不要耍小聪明; (在比赛中许多"程序"出现的问题是使用一 些复杂的方法来推断对方,而这些推断常常是 错误的.) 零和博奕(如下棋)和非零和博奕(如"重复 的囚徒困境")有一些重要的不同.在下棋时 让你的对手猜疑你的企图是有用的,在"重复 的囚徒困境"中,你要从对手的合作中得到好 处,诀窍在于鼓励合作,一个好的方式就是清 楚表明你愿意合作
重复的囚徒困境
重复博奕 在由利己主义者组成的世界中是否可能建立合 作关系? 艾克斯罗德组织的三次计算机竞赛 (一)前两次比赛 第一次比赛(有15个程序——策略——参加比 赛) "一报还一报"策略(TIT FOR TAT)(第一 回合合作,以后各回合均重复对方在上个回合 中的策略,是一个最短的程序)
囚徒困境
思考题:什么是囚徒困境?谈谈你 什么是囚徒困境? 什么是囚徒困境 的分析和认识. 的分析和认识.
参考读物
Campbell,R.,and L. Sowden, eds.(1985). Paradox of Rationality and Cooperation Prisoner's Dilemma and Newcomb's Problem. Vancouver: The University of British Columbia Press. 罗伯特艾克斯罗德:《合作的进化》,上海人 民出版社,1996年版 周骏宇:"艾克斯罗德重复博奕实验及其应 用",《自然辩证法研究》2005年第3期
重复的囚徒困境(续)
弗里德曼策略(FRIEDMAN)(不选择背叛, 但一旦对方选择背叛就永远背叛) 乔斯策略(JOSS)(试图偶尔背叛而不受惩罚) 总是背叛策略(ALLD) 所有策略中TFT得分最高 第二次比赛(参加者事先得到了对于第一次比 赛的分析报告,有来自6个国家的63位参赛者) TF2T策略(比TFT更宽宏,对方连续背叛两次 才背叛 )
囚徒困境的原因和性质
是否由于"通讯"问题造成了囚徒困境? "要害"是否在于"利己主义"? 原因和性质:个人理性和集体理性的矛 盾;个人的"最优策略"使整个"系统" 处于不利的状态 囚徒困境的效果在不同情况下对社会而 言可能是"负面"的,也可能是"正面" 的
解决囚徒困境问题的"出路"
(1)"解决个人理性和集体理性之间冲 突的办法不是否认个人理性,而是设计 一种机制,在满足个人理性的前提下达 到集体理性";"一种制度安排,要发 生效力,必须是一种纳什均衡.否则, 这种制度安排便不能成立" (2)引入惩戒机制后引起的新博奕问题
第三次比赛(模拟生态适应性的"生态 比赛实验") 到第1000代,TFT是最成功的策略 1000 TFT 非善良的哈灵顿策略,在前200代表现 "成功",但200代以后增长下降,因为 这时不太成功的策略逐渐消失,可以占 便宜的对象也减少了,到第1000代,这 个策略也消失了
重复的囚徒困境(续)
相关文档
最新文档