第10章_博弈论初步
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
制作者:张昌廷(河北经贸大学)
23
第十章 博弈论初步 第二节 同时博弈:纯策略均衡 五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第四,将已经划好线的甲厂商的支付矩阵和 乙厂商的支付矩阵再合并起来,得到整个的 有下划线的支付矩阵
2016年3月30日星期三
制作者:张昌廷(河北经贸大学)
第十章 博弈论初步
1
一、 博弈论和策略行为
(一)博弈论简介 博弈论(Game Theory)又称对策论或游戏
论,是一门研究在互动关系的游戏中,参与者选择
策略的科学。 博弈论是研究在策略性环境中如何进行策略性 决策和采取策略性行动的科学。 。
2
博弈论引例——“囚徒困境”
警察抓住了两个合伙犯罪的罪犯,但却缺乏足够的证据指 证他们的罪行。如果其中至少一人供认犯罪,就能确认罪名成 立。为了得到所需的口供,警察将这两名罪犯分别关押并给他 们同样的选择机会:如果他们两人都拒不认罪,则因缺乏证据, 他们会被以较轻的妨碍公务罪各判2年徒刑;如果他们两人中有 一人坦白认罪,则坦白者从轻处理,立即释放,而另一人则将 重判10年徒刑;如果两人同时认罪,则他们将各判4年徒刑。
6
• 最后,让我们做一个游戏,来测试一下 你的博弈思维能力。 要过年了,公司要 发年终奖,作为老板,你论功行赏。你 给每位员工一个信封,并告诉他们:每 个信封里面都有一张扑克牌,如果里面 装着1,就可以去领1000元奖金,是2则 可以领2000元,依此类推,是K就可以 领13000元,“小王”可以领15000元, “大王”则是20000元
寡头价格联盟 的不稳定性: 每个成员都有 强烈的降价获 利冲动
-100 200 100 100
32
寡头厂商之间降价竞争导致两败俱伤;
16
支付矩阵(Payoff Matrix,又称收益矩阵等) 描述一个博弈结构。下面的支付矩阵中,两个参 与者甲和乙各自可以选择两种策略;数字表示双 方在不同策略选择组合下得到的支付,较大数字 代表较大利益。 寡头间的价格竞争
甲厂商的条件策略和条件策略组合 乙厂商策略
合作 不合作
合作
甲厂商策略 不合作
2.对纳什均衡的理解 一是“单独改变策略”是指任何一个参 与人在所有其他人都不改变策略的情况下改 变自己的策略。其他人也同时改变策略的情 况不在考虑之列。 二是“不会得到好处” 是指任何一个参 与人在单独改变策略之后自己的支付不会增 加,这包括两种情况:或者支付减少,或者 支付不变。
2016年3月30日星期三
策略 按 大猪 等待 按 (5,1) (9,-1) 等待 (4,4) (0,0)
– 纳什均衡:大猪按,小猪等待,小猪搭便车 – 智猪博弈的其他含义。
•
“小猪躺着大猪跑”的现象是由于故 事中的游戏规则所导致的。规则的核心 指标是:每次落下的事物数量和踏板与 投食口之间的距离。 如果改变一下核心指标,猪圈里还 会出现同样的“小猪躺着大猪跑”的景 象吗?试试看。
13
博弈的简单分类 根据参与人的数量,可以分为二人博弈 和多人博弈;根据参与人的支付情况,可分 为零和博弈和非零和博弈;根据参与人拥有 的策略的数量多少,可分为有限博弈和无限 博弈;根据参与人在实施策略上是否有时间 的先后,可分为同时博弈和序贯博弈。
2016年3月30日星期三
制作者:张昌廷(河北经贸大学)
4
原来:在赛马之前,田忌的谋士孙膑给他出主 意,让田忌用自己的下等马与齐王的上等马比,用 自己的上等马与齐王的中等马比,用自己的中等马 与齐王的下等马比。 田忌的下等马当然会输,但是上等马和中等马 都赢了。因而田忌不仅没有输掉黄金三千两,还赢 了黄金(铜)一千两。 在有双方参加的竞赛或竞争中,策略很重要。 如果策略适当,就可能在注定要失败的情况下取 得胜利。 研究这种竞赛策略的数学分支,叫作博弈论, 也叫对策论;它是运筹学的一部分。
25
五、寻找纳什均衡的方法——条件策略下划线法 3.总结 在一个单元格中,如果两个数字之下均划有线, 则两个参与人都没有单独改变策略的动机,因为这两 个数字分别是列最大值和行最大值;如果两个数字之 下均没有线,则两个参与人都有单独改变策略的动机, 因为这两个数字分别不是列最大值和行最大值;如果 两个数字中一个下面有线一个下面没线,则有线的数 字所代表的参与人没有单独改变策略的动机,没线的 数字所代表的参与人有单独改变策略的动机。
小猪策略: 等待
小猪 按 按 等待 5 9 1 -1 等待 4 0 4 0
28
大 猪
• 智猪博弈
– 猪圈里有两头猪,一头大猪,一头小猪,采用 自动喂养,猪圈一头有一个猪食槽,按钮在另 一头,控制猪食,按一下会有10个猪食进槽, 但按的成本为2,若大猪先到,可吃9个食,小 猪吃1个;若同时到,大7小3;若小猪先到, 大 6小 4。 小 猪
囚徒2
坦白 坦白 囚徒1 不坦白 不坦白 0,-10
-4, -4 -10,0
-2, -2
案例:田忌赛马
《史记》:有一天,齐王要田忌与他赛马,规 定每个人从自己的上、中、下三等马中各选出一匹 参加比赛;并约定,各方每有一匹马获胜可获黄金 千两,每有一匹马落败就要输掉黄金千两。 当时,齐王每一等次的马都比田忌的马跑得快, 如果田忌用自己的上等马与齐王的上等马比,用自 己的中等马与齐王的中等马比,用自己的下等马与 齐王的下等马比,则田忌要输三次,因而要输黄金 (铜)三千两。 但是比赛结果出人意料,田忌不但没有输,反 而赢了一千两黄金。这是怎么回事呢?
• 对于拿到K的人来说,除了“大王”和 “小王”,和其他任何人交换都不合算, 而可想而知,“大王”和“小王”肯定 不会出来交换,因此,“K”的占优策略 也是不交换。 …… 依此类推,连拿到2 的人也明白,即使拿3的人也肯定不会出 来交换,因此,“2”的占优策略也是不 交换。 最后,敢出来与别人交换年终奖 的肯定是那些拿“1”的人。 既然大家的 年终奖都是最少的1000元,还交换它干 什么? 这种原理,博弈论称之为“逆向 10 选择”。
• 博弈论的发展改变了传统经济学的结构: • 1) 传统经济学着重研究市场机制 或 价格制 度,分析完全竞争市场中的最优决策,不考 虑决策者之间的相互影响。但是,现实经济 运行中市场是不完全竞争的,行为主体之间 的决策是相互影响的 • 2) 完全竞争市场是以完全信息为条件的, 而现实经济运行中也难以保证信息完全。在 信息不对称条件下,考虑行为主体相互影响 的非价格制度可以用博弈论分析 。
• 博弈论与最优化理论是不同的决策理论。
– 最优化理论——单人决策理论; – 博弈论——多人决策理论。
12
(二)博弈的基本要素
一个所谓博弈(Game/游戏)至少需要三个要素:
(1)参与者。就是在博弈中进行决策的个体;博 弈分析假定参与者都是理性的。
(2)参与人的策略,指的是一项规则,根据该规 则,参与人在博弈的每一时点上选择如何行动; (3)支付(或结果):有可评价优劣的博弈结果 (效用)。博弈论用数字表示这类结果,并称之 为支付(Payoff).
5,6
7,1
1,5
2,3
17
纳什均衡
1.博弈均衡的概念 当两个厂商的条件策略组合恰好相 同,从而,两个厂商都不再有单独改变 策略的倾向时,整个博弈就达到了均衡, 即博弈均衡。 博弈均衡是博弈各方最终选取的策 略组合,是博弈的最终结果,是博弈的 解。
2016年3月30日星期三 制作者:张昌廷(河北经贸大学) 18
制作者:张昌廷(河北经贸大学)
19
五、寻找纳什均衡的方法——条件策略下 划线法 1.基本方法 先用下划线法分别表示甲厂商和乙厂商 的条件策略,最后确定博弈的均衡(就是找 到在两个数字之下都划线的单元格即可,与 这些单元格相对应的策略组合就是所要求的 均衡策略组合)。
2016年3月30日星期三
制作者:张昌廷(河北经贸大学)
7
• 同时,你还告诉他们:拆开信封后,里 面的扑克牌只能自己看,不能告诉别人。 如果对自己的扑克牌(年终奖数额)不 满意,大家可以相互自由交换,但交换 前还是不能让对方知道自己的扑克牌是 什么。 问题是:会有多少人能成功与别 人交换扑克牌,改变自己的年终奖数额?
8
• 答案是:一个都不会成功。 让我们同样 用“向前展望,倒后推理”的办法来分 析一下这个博弈: 对于拿到“大王”的 人来说(估计你会把这张牌给功劳最大 的副总经理),他有交换和不交换两种 选择,但他知道没什么牌比“大王”更 大,和谁交换都不合算,因此,不交换 是“大王”的占优策略。 拿到“小王” 的人知道,除了“大王”,他和谁交换 都不合算,而“大王”又不可能和其他 人交换,因此,“小王”的占优策略也 是不交换。 9
2016年3月30日星期三 制作者:张昌廷(河北经贸大学) 26
纳什均衡的特点
• (1)纳什均衡的存在性:在同时博弈中, (纯策略)纳什均衡可能存在,也可能不存在 • 案例1:没有纳什均衡的同时博弈
B厂商策略 左 上 A厂商策略 4,6 右 9 ,1
下
7,3
2,8
27
• (2)纳什均衡的唯一性:如果纳什均衡存 在,那么,均衡可能是一个,也可能是多个 • 案例1:智猪博弈
2016年3月30日星期三
制作者:张昌廷(河北经贸大学)
22
第十章 博弈论初步 第二节 同时博弈:纯策略均衡 五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第三,在乙厂商的支付矩阵中,找出每一行 的最大者(每行的最大者也可能不只一个), 并在其下划线
2016年3月30日星期三
从游戏到博弈 博弈就是策略对抗,或策略有关键作用的游戏
• 博弈Game,博弈论Game Theory,Game即游戏、竞技 • 游戏和经济等决策,具有竞争较量的共同特征:规则、 结果、策略选择,策略和利益相互依存,策略的关键 作用
游戏——下棋、猜大小、石头剪刀布 经济——寡头产量决策、市场阻入、投标拍卖(新娘拍卖)、股票市场 政治——两党政治、多党政治、政党联盟 军事——美国和伊拉克、印巴危机、以色列和巴勒斯坦、台海两岸(反分裂) 娱乐——选美 其他——婚姻市场
20
五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第一,把整个的支付矩阵分解为甲厂商的支 付矩阵和乙厂商的支付矩阵
2016年3月30日星期三
制作者:张昌廷(河北经贸大学)
wenku.baidu.com
21
第十章 博弈论初步 第二节 同时博弈:纯策略均衡 五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第二,在甲厂商的支付矩阵中,找出每一列 的最大者(每列的最大者可能不只一个), 并在其下划线
30
• 改变方案:减量方案;增量方案。减量 加移位方案。投食仅原来的一半分量, 但同时将投食口移到踏板附近。结果呢, 小猪和大猪都在拼命地抢着踩踏板。等 待者不得食,而多劳者多得。每次的收 获刚好消费完。
31
(3)纳什均衡的最优性:如果纳什均衡存 在,那么,可能是最优的,也可能不是
B 的策略 低价 A 的 策 略 低价 高价 20 20 高价 200 -100
14
– 博弈树:序贯博弈 – 例:抛币游戏。甲乙两小孩抛硬币,甲先抛, 乙后抛。若硬币同面,甲赢乙一个硬币,如硬 币异面,甲输乙一个硬币。
正 乙 正 反 正 (-1,1) (-1,1) (1,-1)
甲
反
乙
反
(1,-1)
图10—7 竞争者—垄断者博弈
2016年3月30日星期三
制作者:张昌廷(河北经贸大学)
5
案例:小乞丐的故事
有一个小乞丐,对于路人的施舍,他只接受1 美元,而不要10美元。 许多人都想见识一下这个小傻瓜,拿10美元和 1美元给小乞丐,小乞丐总是选择1美元。好奇的实 验者络绎不绝,小乞丐则财源滚滚。 有人问小乞丐:为什么这么傻,只要1美元, 不要10美元? 小乞丐回答说:如果我选择了10美元,还会有 这么多人来做实验吗?
24
第十章 博弈论初步 第二节 同时博弈:纯策略均衡 五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第五,在带有下划线的整个的支付矩阵中, 找到两个数字之下均划有线的支付组合,则 由该支付组合代表的策略组合就是均衡的策 略组合
2016年3月30日星期三
制作者:张昌廷(河北经贸大学)