博弈论的几个经典模型
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模型二、囚徒困境/非合作博 弈
囚徒困境可以用来说明许多现象。
寡头定价 拍卖出价 推销员的努力 政治上的讨价还价 军备竞赛等(冲突中出现两败俱伤的情况,
往往要考虑到囚徒困境)
*(纯策略)纳什均衡
问题与思考
• 什么是博弈论?试举两个你生活中的例子说明。
• 某年在荷兰召开了一次“合作及社会两难困境研讨 会”,与会者都是博弈论的专家。
基本术语
• 博弈涉及哪些内容呢?
博弈涉及至少两个独立的博弈参与者 (player)。
博弈涉及行动者存在着策略(strategy)选 择的可能,博弈论用策略空间来表示参与 者可以选择的策略。
参与者在不同策略组合下会得到一定的支 付(payoff)。
对于博弈参与者来说,存在着一博弈结果。
对于游戏设计者,这是一个最好的
模型二、囚徒困境/非合作博 弈
在博弈论中,含有占优战略均衡的 一个著名例子是由塔克给出的“囚徒困 境” (prisoners’dilemma)博弈模 型。该模型用一种特别的方式为我们讲 述了一个警察与小偷的故事。
模型二、囚徒困境/非合作博 假设:有两个小偷A弈和B联合犯事、私入
第四章 博弈论的几个经典模 型
讲授人 谭建国
引言
博 弈 论 又 被 称 为 对 策 论 ( Game Theory),按照2005年因对博弈论的贡献 而获得诺贝尔经济学奖的Robert Aumann 教授的说法,博弈论就是研究互动决策 的理论。所谓互动决策,即各行动方 (即局中人[player])的决策是相互影响 的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也 需要把别人对于自己的考虑也要纳入考 虑之中……在如此迭代考虑情形进行决
选择等待是小猪的占优策略。
大猪的最佳选择取决于小猪的行动,如果 小猪去按,大猪最好选择等待;如果小 猪不去按,则最佳选择是大猪亲自去按。
也就是说,在智猪博弈中,大猪没有占优 策略,而小猪有占优策略,它的最佳选择 就是耐心等待大猪去按钮,才能获得最 佳结果。
“小猪躺着大猪跑”的现象是由于故事中 的游戏规则所导致的。规则的核心指标
不完全信息意味着博弈各方中至少有一 个参与人有多个类型。
模型三、独立私人价值下的 一级密封拍卖/不完全信息静
态博弈
通过海萨尼转换,博弈开始时,所 有参与人有关“自然”的行动有一致的 信念,即都知道所有参与人类型的概率 分布函数,此即“海萨尼公理”。
失火了,你往哪个门跑——这就是博弈论
一天晚上,你参加一个派对,屋里有很多人, 你玩得很开心。这时候,屋里突然失火,火 势很大,无法扑灭。此时你想逃生。你的面 前有两个门,左门和右门,你必须在它们之 间选择。但问题是,其他人也要争抢这两个 门出逃。如果你选择的门是很多人选择的, 那么你将因人多拥挤、冲不出去而烧死;相 反,如果你选择的是较少人选择的,那么你 将逃生。这里我们不考虑道德因素,你将如 何选择?
引言
博弈论的应用领域十分广泛,在经济 学、政治科学(国内的以及国际的)、 军事战略问题、进化生物学以及当代的 计算机科学等领域都已成为重要的研究 和分析工具。此外,它还与会计学、统计 学、数学基础、社会心理学以及诸如认 识论与伦理学等哲学分支有重要联系。
引言
按照Aumann所撰写的《新帕尔格雷 夫经济学大辞典》“博弈论”辞条的看 法,标准的博弈论分析出发点是理性的, 而不是心理的或社会的角度。不过,近 30年来结合心理学和行为科学、实验经 济学的研究成就而对博弈论进行一定改 造的行为博弈论(behavoiral game theory ) 也日益兴起。
博弈的类型
博弈又可分静态博弈和动态博弈。
• 静态博弈:指参与者同时采取行动,或 者尽管参与者行动的采取有先后顺序, 但后行动的人不知道先采取行动的人采 取的是什么行动。
• 动态博弈:指参与者的行动有先后顺序, 并且后采取行动的人可以知道先采取行 动的人所采取的行动。
博弈的类型
从知识的拥有程度来看,博弈分为完全信 息博弈和不完全信息博弈。信息是博弈 论中重要的内容。
引言
博弈论的出现只有60多年的历史。 博弈论的开创者为诺意曼与摩根斯坦, 他 们 1944 年 出 版 了 《 博 弈 论 与 经 济 行 为》。博弈论天才纳什(John Nash)的 开创性论文《n人博弈的均衡点》(1950)、 《非合作博弈》(1951)等等,给出了纳什 均衡的概念和均衡存在定理。今天博弈 论已发展成一个较完善的学科。
模型二、囚徒困境/非合作博
弈
乙 甲
坦白
抵赖
坦白
(-8,-8)
(0,-10)
抵赖
(-10,0)
(-1,-1)
不难看出,“坦白”是任一犯罪嫌疑人 的占优战略,而(坦白,坦白)是一个 占优战略均衡。
模型二、囚徒困境/非合作博 弈
对于两个犯罪嫌疑人总体而言,他 们设想的最好的策略可能是都不交代。 但任何一个犯罪嫌疑人在选择不交代的 策略时,都要冒很大的风险,一旦自己 不交代而另一犯罪嫌疑人交代了,自己 就将可能处于非常不利的境地。对于A 而言,不管B采取何种策略,他的最佳策 略都是交代。对于B而言也是如此。最 后两人都会选择交代。
模型三、独立私人价值下的 一级密封拍卖/不完全信息静 海萨尼转换的具态体博方法弈
一个虚拟的参与人“自然”,自然首先决定
参与人的类型,赋予各参与人的类型向t 量 ,
其t中 (t1,t2 , ,tn ) ; 自然告知参与者自己的类型,却不告诉其 他 参参与与者者同的时类选型择;行动,每一参与i者 从可行A集i 中 各选 方择 得行 到动 收方益A案i (a1;, a2, , ai ,ti ) 。
民宅被警察抓住。警方将两人分别置于 不同的两个房间内进行审讯,对每一个 犯罪嫌疑人,警方给出的政策是:如果 一个犯罪嫌疑人坦白了罪行,交出了赃 物,于是证据确凿,两人都被判有罪。 如果另一个犯罪嫌疑人也作了坦白,则 两人各被判刑8年;如果另一个犯罪嫌 人没有坦白而是抵赖,则以妨碍公务罪 (因已有证据表明其有罪)再加刑2年, 而坦白者有功被减刑8年,立即释放。 如果两人都抵赖,则警方因证据不足不能
当大会结束之后,有两个学者,麦息克和路特提议 大家玩一个游戏。
他们将一个大信封拿出来,请在场的43位专家拿 出金钱装到这个信封里。如果到最后这信封里的钱 超过250元,麦息克和路特将自己掏腰包,退还 每人10元。不过,如果最后信封内的钱不足25 0元,就统统没收,大家拿不到半毛钱。
仔细想一想,如果你也在场,你会奉献多少钱呢?
博弈论对于社会科学有着重要的意 义,它正成为社会科学研究范式中的一 种核心工具,以至于我们可称博弈论是
引言
1994年经济学诺贝尔奖颁发给三位 博弈论专家:纳什、塞尔屯(R.Selten)、 海萨尼(John C.Harsanyi),而像1985年 获得诺贝尔奖的公共选择学派的领导者 布坎南,1995年获得诺贝尔奖的理性主 义学派的领袖卢卡斯 (Lukas),其 理论与博弈论都有着较深的联系。现在 博弈论正渗透到各门社会科学,更重要 的是它正深刻地改变着人们的思维。
模型一、智猪博弈/完全信息静态博弈
如果改变一下核心指标,猪圈里还会出现 同样的“小猪躺着大猪跑”的景象吗? 试试看。
改变方案一:减量方案。
改变方案二:增量方案。
改变方案三:减量加移位方案。
投食仅原来的一半分量,但同时将投食口 移到踏板附近。结果呢,小猪和大猪都 在拼命地抢着踩踏板。等待者不得食,而 多劳者多得。每次的收获刚好消费完。
参考书 • 汪贤裕、肖玉明编著,博弈论及其应
用,科学出版社,2008年2月 • 潘天群著,博弈生存(第二版),中
央编译出版社,2004年10月 • 王春永编著,博弈论的诡计,中国发
展出版社,2007年1月
基本术语
• 博弈论研究的对象:是理性的行动者或 参与者如何选择策略或如何作出行动的 决定。理性的人是对现实的人的基本假 定,即假定参与者努力用自己的推理能 力使自己的目标最大化。“理性的”与 “道德的”不是一回事,理性的与道德的 有时会发生冲突,但是理性的人不一定 是不道德的。
例:猪圈里有两只猪,一只比较大,一只 比较小。猪圈狭长,猪食槽在一头,猪 食按钮在另一头,按一下会有10个单位 的猪食落进槽里。由于按钮和食槽距离 较 位大远的猪,食按物小猪按。钮的体按力耗费相当不按于(等2个待单)
按
ቤተ መጻሕፍቲ ባይዱ
(5,1)
(5,3)
不按(等待)
(9,-1)
(0,0)
大猪和小猪分别该如何选择。
模型一、智猪博弈/完全信息静态博弈
引言
你的选择必须考虑其他人的选择, 而其他人的选择也考虑你的选择。你的 结果——博弈论称之为支付,不仅取决 于你的行动选择——博弈论称之为策略 选择,同时取决于他人的策略选择。你 和这群人构成一个博弈(game)。
上述博弈是一个叫张翼成的中国人 在1997年提出的一个博弈论模型,被称 之为少数者博弈或少数派博弈 (Minority Game)。
• 完全信息博弈:参与者对所有参与者的 策略空间及策略组合下的支付有“完全 的了解”,否则是不完全信息博弈。严格 地讲,完全信息博弈是指参与者的策略 空间及策略组合下的支付,是博弈中所有 参与者的“公共知识”的博弈。
• 不完全信息博弈:参与者所做的是努力 使自己的期望支付或期望效用最大化。
模型一、智猪博弈/完全信息静态博弈
生活中博弈的案例很多,你会见到 很多例子。只要涉及到人群的互动,就
引言
什么叫博弈?
博弈的英文为game,我们一般将它翻译 成“游戏”。而在西方,game的意义不 同于汉语中的游戏。在英语中,game即 是人们遵循一定规则下的活动,进行活 动的人的目的是使自己“赢”。奥林匹 克运动会叫Olympic Games。在英文中, game有竞赛的意思,进行game的人是很 认真的,不同于汉语中游戏的概念。在 汉语中,游戏有儿戏的味道。因此将关 于game的理论,即game theory翻译成博
模型三、独立私人价值下的 一级密封拍卖/不完全信息静 什么是海萨尼转态换博? 弈
海萨尼提出了一种处理不完全信息博弈 的 方 法 , 即 引 入 一 个 虚 拟 的 局 中 人 —— “自然”。自然首先行动,它决定每个 局中人的特征。每个局中人知道自己的 特征,但不知道别的局中人特征。这种 方法将不完全信息静态博弈变成一个两 阶段动态博弈,第一个阶段是自然N的 行动选择,第二阶段是除N外的局中人 的静态博弈。这种转换被称为“海萨尼 转换”,这个转换把“不完全信息”转 变成为完全但不完美信息,从而可以用
借助于第一步和第二步中虚构的参与者 “自然”的行动,我们可以把一个不完 全信息的博弈表述为一个不完美信息的 博弈。
模型三、独立私人价值下的 一级密封拍卖/不完全信息静
态博弈
海萨尼转换分析
海萨尼转换是处理不完全信息博弈的标 准方法。一般地,“自然”在博弈开始的 时候选择参与人的类型,参与人的某个 类型包括表征类型的各个特征如策略空 间、信息集、得益函数等,这些又称为 该类型参与人所拥有的个人信息。
模型二、囚徒困境/非合作博
该博弈刻划了两大难弈题:
冲突情形下,参与人的目标是什么?是采用(作 为个人)他自己的最好策略,还是采用(作为集 体的一员)他们共同的最好策略?前者导致均衡 策略(坦白,坦白),支付为(-8,-8);后者的最 好策略是(抵赖,抵赖),支付为(-1,-1)。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
博弈涉及均衡。
重要的均衡——纳什均衡。
博弈的类型
根据参与者能否形成约束性的协议, 以便集体行动,博弈可分为合作性博弈 和非合作性博弈。纳什等博弈论专家研 究得更多的是非合作性博弈。
• 合作性博弈:是指参与者从自己的利益 出发与其他参与者谈判达成协议或形成 联盟,其结果对联盟方均有利;
• 非合作性博弈:是指参与者在行动选择 时无法达成约束性的协议。人们分工与 交换的经济活动就是合作性的博弈,而 囚徒困境则是非合作性的博弈。