博弈论1:纯策略
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3/劣策略(dominated strategy)下的纳什均 劣策略( 劣策略 下的纳什均 衡。累次取优方法。智猪博弈 累次取优方法。
• 不论对方采取何种策略其利益函数都最小的策略 劣策略( 称劣策略(dominated strategy),因而是必须淘 , 汰的策略 • “累次取优”方法:每一步决策都要剔除自己和 累次取优”方法: 对方的劣策略, 对方的劣策略,从而作出策略选择 • 这种博弈常常发生在博弈各方不对称的情况下。 这种博弈常常发生在博弈各方不对称的情况下。 例如双方存在“主从关系” 例如双方存在“主从关系” • 例子:智猪博弈 例子:
博弈论与市场竞争策略
1994年诺贝尔经济学奖 年诺贝尔经济学奖—— 年诺贝尔经济学奖
约翰·海萨尼John C. Harsanyi b.1920 showed how games of incomplete information can be analyzed
约翰·纳什John F. Nash b.1928, developed an equilibrium concept for noncooperative games that later came to be called Nash equilibrium
博弈基本类型
参加者、策略空间与利益函数三者构成博弈 信息。以此为标准划分: 1. 完全信息博弈:各参加者对以上三类信息 都了解,据此选择自己的博弈策略; 2. 不完全信息博弈:各参加者在对上述三类 信息不充分了解的的博弈行为 根据参加者博弈行为的先后次序关系分为: 根据参加者博弈行为的先后次序关系分为: 1. 静态博弈:各方同时选择策略,其间无先 静态博弈:各方同时选择策略, 后因果关系; 后因果关系; 2. 动态博弈:各方根据他人已选策略来确定 动态博弈: 自身采取的策略。 自身采取的策略。
结论: 价格不变”是企业 的占优策略 的占优策略, 结论:“价格不变”是企业2的占优策略,企业 1在决策时必须以此为前提 在决策时必须以此为前提
双方占优策略下的纳什均衡: 双方占优策略下的纳什均衡:囚徒困境 纳什均衡
• 博弈各方都有占优策略,形成纳什均衡,例如: • 甲乙两个同案犯(抢劫与过失杀人,各自策略空间为 (坦白、抵赖),其利益函数用表中所填被判年数:
如何制定规则来约束
• 世界上有两种符合集体利益的正义: 世界上有两种符合集体利益的正义: 实质正义与规则正义。 实质正义与规则正义。实质正义必须通过 规则正义来实现,否则将被虚置。 规则正义来实现,否则将被虚置。因此规 则正义最重要。 则正义最重要。 • 分蛋糕或分粥故事: 20个人的小集体, 分蛋糕或分粥故事: 个人的小集体 个人的小集体, 每天吃粥。如果所有人抡吃, 每天吃粥。如果所有人抡吃,导致纳什悖 每人早早来等粥,成本极高, 论:每人早早来等粥,成本极高,对谁都 不利。 不利。 • 怎样制定规则,使分粥最公平? 怎样制定规则,使分粥最公平?
古典经济学及制度经济学的缺点
都是边际成本收益分析理论,但人们选 择的对象不是最小交易成本,而是根据 对方行动方案进行行为选择 孤立地分析行为者边际收益与成本,而 未分析他人行动对此行为者的影响,只 适合于利益无关者的利益分析 利益相关者的策略选择理 于是出现分析利益相关者的 利益相关者的 论——博弈论
企业2 企业 价格不变 企业1 价格不变 涨价 涨价
10, 10 -20, 30
100, -30 140, 25
二、纯博弈(确定性博弈)
纳什均衡
• Nash:一个数学天才,诺贝尔 经济学奖得主,美国大片 Beautiful Mind 主人翁 • 纳什均衡:在完全信息静态 博弈中各方都实现个利益最 大化的策略组合状态 •பைடு நூலகம்纯策略:假定每个参加者每 次只选择一个策略进行博弈 • 混合策略:每个参加者每次 按照各种几率选择不同策略 进行博弈,如监督博弈
不论对方采取何种策略时,某一策略均为最优策略, 不论对方采取何种策略时,某一策略均为最优策略 , 则此策略为占优策略。 企业2 则此策略为占优策略。 如: 企业 价格不变 涨价
企业1 价格不变 涨价
10, 10 -20, 30
100, -30 140, 25
企业1价格不变:10>-30,企业2应当选择“价格不变” 企业1涨价: 30>25,企业2应当选择“价格不变”
坦白 甲 (不合作) 坦白(不合作) -10, -10 抵赖(合作) -15, 0
乙
抵赖 (合作) 0, -15 -2, -2
甲方占优策略:乙坦白,因-10>-15,故坦白为利益最大策略。 乙抵赖,因0>-2,坦白亦利益最大。故坦白为占优策略。 乙方占优策略也为坦白。二者组合构成纳什均衡态。
对亚当·斯密“看不见的手”的挑战
• 亚当·斯密:个人自利的理性会被“看不见的手” 自动纳入增进社会集体福利的轨道 • 纳什说:不!相互影响的集体中各个部分如果 不合作而只追求自身利益最大化,将使整个集 体陷入到最不利的纳什均衡态。 • 必须使用某种力量来约束个人的自利行为,每 个人作出适当牺牲,才能实现集体利益最大化 • 亚当·斯密“看不见的手”实际上是用资源总量 控制对人们行为的经济约束——市场约束, • 一旦此约束失效,当有其他约束来补充(道德 与权力)
2/博弈论基本要素
博弈论( ):各方在游戏规则规定下的 博弈论(Game Theory):各方在游戏规则规定下的 ): 理性行为的理论。三大基本要素: 理性行为的理论。三大基本要素: 1.参加者(选择者)。用1,2,…… 表示; 2.选择对象与范围:策略空间,策略组合:每方可能采取 的策略是被选择对象。被选择对象的总体构成其策略 空间。用S1, S2, S3表示;所有各方都采取了某种 策略后,构成策略组合(strategy profile); 3. 利益函数:第 i个参加者的利益函数ui 为其在一定的策 略组合中得到的利益 • 收益矩阵(payoff matrix,又称“支付矩阵”):所有 策略组合中各方所得的收益组成的矩阵 •
二、博弈案例1:占优策略与劣策略 博弈案例 :
(dominant strategy and dominated strategy) 课本上译为“支配性策略” 被支配策略” 课本上译为“支配性策略”与“被支配策略”
1/支配性策略 占优策略) 1/支配性策略(dominant strategy,占优策略) 支配性策略 占优策略 下的纳什均衡
囚徒悖论的实践结果
• 与亚当 斯密“看不见的手”相矛盾,市场经济下 与亚当·斯密“看不见的手”相矛盾, 斯密 处处充满集体理性与个体理性之冲突: 处处充满集体理性与个体理性之冲突: • 污染问题:企业面临的“囚徒困境” 污染问题:企业面临的“囚徒困境” • 公用地悲剧:长江中的鱼虾为何越来越小? 公用地悲剧:长江中的鱼虾为何越来越小? • 价格战问题(寡头垄断模型):价格卡特尔困境 价格战问题(寡头垄断模型): ):价格卡特尔困境 • 超市布点问题:为什么超市会集中在一起?资源 超市布点问题:为什么超市会集中在一起? 配置不经济 • 为什么有人见义不勇为? 为什么有人见义不勇为? • 诚实纳税的企业为什么吃亏?因为大家都不诚实 诚实纳税的企业为什么吃亏?
由此形成博弈论对经济学的贡献:
• 肖特:价格只提供社会资源稀缺性的机制,而 经济决策还需要了解人们各种可能经济行为的 信息,及其产生的后果 • 博弈论研究利益相关者的策略选择的相互影响 的利益函数,研究人的行为及其形成的制度 • 从博弈论的角度看世界:整个社会生活是人们 的策略选择及其相互影响的过程,也即博弈过 程。实际生活中的博弈如市场竞争、高考填报 志愿、买卖股票、家庭生活等等一切人们之间 相互影响的过程,无所不包
由此交叉形成四种博弈类型: 由此交叉形成四种博弈类型:
• 完全信息静态博弈 游戏各方在完全知道博弈过程的三大要 素的情况下同时选择策略 • 不完全信息静态博弈(高考填报志愿) 不完全信息静态博弈(高考填报志愿) • 完全信息动态博弈(走象棋、围棋) 完全信息动态博弈(走象棋、围棋) 游戏各方的完全知识博弈过程的三大要 素的情况下, 素的情况下,相继作出策略选择 • 不完全信息动态博弈(国际市场竞争) 不完全信息动态博弈(国际市场竞争)
智猪博弈: 智猪博弈
题:大猪与小猪必须先踩猪圈一头之杠杆,才 大猪与小猪必须先踩猪圈一头之杠杆, 能放出8斤食物 到猪圈另一头进食。 斤食物, 能放出 斤食物,到猪圈另一头进食。踩杠需 耗食1斤 如小猪踩, 耗食 斤。如小猪踩,则跑到另一头后后大猪 已将8斤吃光;如大猪踩,则小猪已吃3斤, 已将 斤吃光;如大猪踩,则小猪已吃 斤 斤吃光 大猪可吃5斤 问纳什均衡点为何。 大猪可吃 斤。问纳什均衡点为何。 小猪 大猪
R·泽尔腾einhard Selten,b.1930 first to refine the Nash equilibrium concept for analyzing dynamic strategic interaction.
• for their pioneering analysis of equilibria in the theory of non-cooperative games. • Since then game theory has be taken as the Foundation for Understanding Complex Economic Issues
利益函数与payoff matrix(收益矩阵,又译 收益矩阵, 利益函数与 收益矩阵 支付矩阵) 为“支付矩阵) • 矩阵的每个位置显示每个参加者的每个 策略组合, 策略组合,此位置即一博弈格局 • 每个博弈格局上列出每个参加者的利益 函数,于是得到payoff matrix ,例如: 函数,于是得到 例如
克服纳什悖论的基本途径: 克服纳什悖论的基本途径:制度约束 • 道德约束:使人们在社会舆论与社会公 道德约束: 德压力下按照集体理性的行为( 德压力下按照集体理性的行为(例如朋 友义气等等) 友义气等等) • 规则约束:使人们行为服从集体理性的 规则约束: 要求,对违背者处罚。 要求,对违背者处罚。如:对不诚实纳 税者受社会信用机制的处罚, 税者受社会信用机制的处罚,建立休渔 期,制止倾销价 • 二者相结合将起到好结果
2/重复性博弈下的策略: 重复性博弈下的策略: 重复性博弈下的策略 对看不见的手的辩护 • 以上纳什均衡是一次性博弈,参加者仅仅 以上纳什均衡是一次性博弈, 从当次利益最大化出发, 从当次利益最大化出发,导致悖论 • 如果是重复博弈,参加者不仅要考虑眼前 如果是重复博弈, 利益,还要考虑其行为所引起的未来后果, 利益,还要考虑其行为所引起的未来后果, 也即对方的反应。 也即对方的反应。 • Robert Axelrod用请众多博弈论专家用计 用请众多博弈论专家用计 算机进行博弈表明:针锋相对是正确策略。 算机进行博弈表明:针锋相对是正确策略。 作用:简单易行;使行为者不敢先行欺骗; 作用:简单易行;使行为者不敢先行欺骗; 除非其希望合同瓦解;欺骗行为受到惩罚; 除非其希望合同瓦解;欺骗行为受到惩罚; 诚实行为得到回报。 诚实行为得到回报。
一、博弈论的基本理论框架
1/博弈论的理论意义与特征 博弈论的理论意义与特征
古典经济学:根据资源稀缺性配置资源 的科学,价格是资源稀缺性的信号,由 此对经济行为进行成本收益分析,MR= MC实现利润最大化 忽视了他人决策对彼此经济利益的影响 • 制度经济学:
科斯:对人之间的交易过程的成本收益分析 诺斯:对交易过程的制度环境进行分析,包括 制度约束与制度变迁与交易过程的关系
不劳动(不合作)
不劳动 (不合作) 0,0 (5–1), 3
劳动 (合作) 8, -1 (5-1), (3-1)
劳动(合作)
智猪博弈的社会事例:
• 拖欠工资时,谁积极讨回工资,谁坐享其成? • 要举办某项大家都得利的集体活动,但要付出 成本。谁会“伸头”承办? • 市场竞争中,哪些企业最关心全行业利益? • 国际联盟中,哪些国家会积极维护联盟集体利 益? • 智猪博弈 智猪博弈是此类博弈的典型。