第三章__零和游戏与混合策略

合集下载

管理定律零和游戏

如：项目预算、采购预算
14
1.定义现实情况 2.确立目的和目标 3.预测达成目标的辅助因素和障碍 4.制定实现目的和目标的行动计划 5.制定预算 6.履行计划 7.管h理计划
主讲教师：刘慧峰
制订最佳计划是一个系统的过程
15
主讲教师：刘慧峰
第三节计划工作的一般方法
第二篇计划与决策
决策计划工作
目标管理战略管理
h
2
主讲教师：刘慧峰
开篇案例：唱 1、艺术家的职业生涯规划 2、演出地点 3、营销计划和宣传计划
注意：计划必须是灵活的，是指路的明灯，不是一成不变的路径。
h
3
主讲教师：刘慧峰
第三章计划
计划工作概述计划工作程序计划工作的一般方法
5.灵活性
6.创造性
h
7
主讲教师：刘慧峰
建立什么样组织结构
计划目标如何实现
目标
配备什么样的员工如何有效的指挥和领导
提供控制的标准
h
8
主讲教师：刘慧峰
计划的类型
1. 按计划的广度分类： 2. 按计划覆盖的时间跨度分 3. 按计划的明确性分类 4. 按组织管理职能分类 5. 按计划内容的不同分类 6. 按计划内容的表现形式分类：
主讲教师：刘慧峰
管理定律——零和游戏
20世纪，人类经历两次世界大战、经济高速增长、科技进步、全球一体化以及日益严重的环境污染，“零和游戏”观念正逐渐被“双赢”观念所取代。人们开始认识到“利己”不一定要建立在“损人” 的基础上。通过有效合作，皆大欢喜的结局是可能出现的。
h
1
主讲教师：刘慧峰
政策：为组织活动建立起一般指南。

完全信息静态博弈及其纳什均衡解

第三章完全信息静态博弈及其纳什均衡解1.完全信息静态博弈定义 3.1.完全信息静态博弈。

完全信息静态是指，博弈中的参与人同时采取行动，或者尽管参与人行动的采取有先后顺序，但后行动的人在行动时不知道先采取行动的人采取的是什么行动；同时博弈参与人的策略空间及策略组合下的支付是博弈中所有参与人的“公共知识”。

两个特点：（1）静态；（2）完全信息。

完全信息静态博弈例子。

例1：锤子-剪刀-布例2：交通行驶非“完全信息静态博弈”例子：英式拍卖——动态博弈；第一密封价格及第二密封价格拍卖——不完全信息博弈。

2.纳什均衡及其判定定义3.2 纳什均衡。

在一个n人博弈的标准式G={S1,S2，…,S n; u1,u2,…,u n}中，一个策略组合{s1*,s2*,…，s n*}，若满足u i(s1*,…,s i*,…s n*)≥u i(s1*,…s i,…，s n*)（i=1…n），则称这个策略组合为{s1*,s2*,…，s n*}为该博弈G的一个纳什均衡。

某策略组合是纳什均衡指的是，在该策略组合上任何一个参与人的收益在其他人策略不改变的情况下都至少是弱优的。

特点：（1）每个人没有单独改变策略的动机；（2）局部最优。

纳什均衡判定方法：用定义来判定：某点是均衡看它是否符合纳什均衡的定义。

求解纳什均衡的方法：（2）用定义来求解（3）对于策略空间为连续的博弈，用求极值的方法来求得。

3.纳什均衡存在定理：（纳什）定理3.1.在一个n人博弈的标准式G={S1,S2，…,S n; u1,u2,…,u n}中，如果n是有限的，且对每个i, S i是有限的，则博弈至少存在一个纳什均衡。

这里的均衡可能包含混合策略均衡。

证明：略例子3：囚徒困境的均衡例1：“锤子-剪刀-布”的均衡？4.混合策略与混合策略的均衡纯策略与混合策略概念。

定义.3.3.一个策略是纯策略指的是参与人策略空间中的某个确定策略；而一个混合策略是参与人策略空间上的一个概率分布，一般地，某个人i的策略空间为{s i1,s i2,…，s ik},则参与人i在策略空间上的一个概率分布p i=(p i1,p i2,…，p ik)构成他的一个混合策略，其中p i1+p i2+…+p ik=1。

零和游戏

内容
意义
内涵扑克
交易
应用
笑话简介
原理
内容
意义
内涵扑克
交易
应用
笑话
展开编辑本段简介
零和游戏又被称为游戏理论或零和博弈，源于博弈论（game theory）。是指一项游戏中，游戏者有输有赢，一方所赢正是另一方所输，而游戏的总成绩永远为零。零和博弈
编辑本段意义
对于非合作、纯竞争型博弈，诺伊曼所解决的只有二人零和博弈：好比两个人下棋、或是打乒乓球，一个人赢一着则另一个人必输一着，净获利为零。在这里抽象化后的博弈问题是，已知参与者集合(两方) ，策略集合(所有棋着) 零和博弈
，和盈利集合(赢子输子) ，能否且如何找到一个理论上的“解”或“平衡“，也就是对参与双方来说都最”合理“、最优的具体策略？怎样才是合理？应用传统决定论中的“最小最大”准则，即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利，并据此最优化自己的对策，诺伊曼从数学上证明，通过一定的线性运算，对于每一个二人零和博弈，都能够找到一个“最小最大解”。通过一定的线性运算，竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤，就可以最终达到彼此盈利最大且相当。当然，其隐含的意义在于，这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说，这个著名的最小最大定理所体现的基本“理性”思想是“抱最好的希望，做最坏的打算”。虽然零和博弈理论的解决具有重大的意义，但作为一个理论来说，它应用于实践的范围是有限的。零和博弈主要的局限性有二，一是在各种社会活动中，常常有多方参与而不是只有两方；二是参与各方相互作用的结果并不一定有人得利就有人失利，整个群体可能具有大於零或小于零的净获利。对于后者，历史上最经典的案例就是“囚徒困境”。在“囚徒困境”的问题中，参与者仍是两名(两个盗窃犯)，但这不再是一个零和的博弈，人受损并不等於我收益。两个小偷可能一共被判20年，或一共只被判2年。

Games3-Static Game with Complete Information

Shapley 金发 Nash 金发褐发 0, 0 5, 10
Games
褐发 10, 5 5, 5
Spring 2009
© Professor Ho-Mou Wu
3-3
The Blonde Problem
例2：此博弈有二个纯粹策略均衡及一个混合策略均衡。
Shapley 金发 q Nash 金发 p 褐发 1-p 0, 0 5, 10 褐发 1-q 10, 5 5, 5
3q − (1 − q ) = −q ⇒ q* = 0.2 2p + (1 − p ) = 3p ⇒ p* = 0.5
流浪汉以0.2的概率选择谋生；救济机构以0.5的概率救济。我们用“给定某一方的策略，另一方的策略行动收益相同” 的办法解得结果。这样的办法经济意涵为何？人们真的用类似掷硬币的办法决策么？
© Professor Ho-Mou Wu Games Spring 2009
3-9
Optimal Responses: MinMax
例4：再进一步来看以上策略组合是“互为最适反应”的纳什均衡。打击者若早挥棒得 12q-5 (A线) 打击者若慢挥棒得 3-8q (B线)
打击者报酬 3 早挥棒 (p=1) 慢挥棒 (p=0)
© Professor Ho-Mou Wu
变化球 1-q -5, 5 3, -3
Spring 2009
5, -5 -5, 5
Games
3-14
社会福利博弈
例5：某地区救济机构的工作会议上，正在讨论提供帮助，给流浪汉谋生需要的一些资金。这里，流浪汉决定是否付出努力：当救济机构努力给予救济但流浪汉却直接用来挥霍，机构白白浪费了很多资源；当辖区内流浪汉努力寻找谋生机会而相应机构未救济时，救济机构有失职之嫌。最好的情形是救济机构正好为努力谋生的流浪汉给予救济。

博弈论第三章混合策略纳什均衡.

§剪刀、石头、布的游戏
• 因此，秘决在于—— • 自己的策略选择不能预先被对手方知道或猜测到，在该博弈的多次重复中，博弈方一定要避免自己的选择具有规律性； • 观察对手方策略选择是否具有规律或者偏好，预先猜测对手策略，从而采用针对性策略赢得这个博弈。
§ 第三章混合策略纳什均衡
• 纯策略(pure strategies)：如果一个策略规定参与人在一个给定的信息情况下只选择一种特定的行动。 • 混合策略(mixed strategies)：如果一个策略规定参与人在给定的信息情况下，以某种概率分布随机地选择不同的行动。 • 在静态博弈里，纯策略等价于特定的行动，混合策略是不同行动之间的随机选择。
支付等值法?政府选择救济策略?政府选择不救济策略1???1??1????4113?????????gv期望效用0??????????1??????100gv期望效用如果一个混合策略是流浪汉的最优选择那一定意味着政府在救济与不救济之间是无差异的即
§ 第三章混合策略纳什均衡
• • • • • • • 混合策略与期望支付计算混合策略纳什均衡的三种方法支付最大值法支付等值法反应函数法多重纳什均衡及其甄别混合博弈在现实经济中的运用案例
策略得益博弈方1 （0.8，0.2） 2.6 博弈方2 （0.8，0.2） 2.6
夫妻之争的混合策略纳什均衡
看看这个博弈有几个均衡?
丈夫时装时装妻子 2， 1 足球 0， 0
足球
0， 0
1， 3
夫妻之争
存在两个纯策略均衡
丈夫时装时装妻子 2， 1 足球 0， 0
• 在这个博弈中,检查成本C越高,纳税人逃税的概率越大;罚款F越高,纳税人逃税的概率越小;应纳税款越大，纳税人逃税的概率反而越小。 • 应纳税款越大，纳税人逃税的概率反而越小？这跟我们的假设有关，假定一检查逃税行为就会被发现；假定检查成本一定，而不是跟应交税额有关，即应交税额越大，检查成本越高；不考虑纳税人在应交税额高时贿赂税务人员的积极性越高的情况。如果放开这些假设，其结果就有可能与现实更贴近。纳税税款越高，纳税人逃税的概率越高。

管理定律零和游戏

团队合作案例
总结词
零和游戏在团队合作中的体现，如何通过合作实现共赢。
详细描述
团队合作中的零和游戏是指团队成员之间的合作关系，一方获得利益，另一方可能遭受损失。为了实现共赢，团队成员需要建立良好的沟通机制、明确分工和协作方式，以及建立共同的价值观和目标，从而在合作中取得更好的成果。
个人发展案例
转换
在一定条件下，零和游戏可以转化为非零和游戏，反之亦然。
适用场景
零和游戏适用于竞争激烈、资源有限的场景；非零和游戏适用于合作创新、资源共享的场景。
02 管理定律与零和游戏
彼得原理
01
彼得原理总结
彼得原理是指在一个层级组织中，员工常常被提拔到超出其能力范围的
职位，从而导致效率降低和失败。
02 03
资源争夺
人力资源
在零和游戏中，人力资源成为争夺的焦点，团队成员可能会为了个人利益而忽视团队整体利益，导致人才流失或人才浪费。
物力资源
时间资源
在时间紧迫的情况下，团队成员可能会为了赶工而忽视质量，或者为了个人利益而延误项目进度，导致时间资源的浪费。
有限的办公用品、设备等物力资源也可能成为团队成员争夺的对象，导致资源分配不公，影响工作效率。
恶性竞争
过度竞争
在零和游戏中，团队成员可能会为了个人利益而过度竞争，不顾团队整体利益，导致团队工作效
率下降。
破坏性竞争
恶性竞争可能导致团队成员采取不正当手段，如诽谤、诬告等，破坏团队的和谐氛围和正常秩序。
竞争失控
恶性竞争可能导致团队成员之间的关系紧张，甚至出现敌对情绪，
影响团队的稳定性和发展。
04 如何打破零和游戏
建立信任与合作

零和游戏

零和游戏原理:当你看到两位对弈者时，你就可以说他们正在玩“零和游戏”。

因为在大多数情况下，总会有一个赢，一个输，如果我们把获胜计算为得1 分，而输棋为-1分，那么，这两人得分之和就是：1 (-1)=0。

这正是“零和游戏”的基本内容：游戏者有输有赢，一方所赢正是另一方所输，游戏的总成绩永远是零。

零和游戏原理之所以广受关注，主要是因为人们发现在社会的方方面面都能发现与“零和游戏”类似的局面，胜利者的光荣后面往往隐藏着失败者的辛酸和苦涩。

从个人到国家，从政治到经济，似乎无不验证了世界正是一个巨大的“零和游戏”场。

这种理论认为，世界是一个封闭的系统，财富、资源、机遇都是有限的，个别人、个别地区和个别国家财富的增加必然意味着对其他人、其他地区和国家的掠夺，这是一个“邪恶进化论”式的弱肉强食的世界。

但20世纪人类在经历了两次世界大战，经济的高速增长、科技进步、全球化以及日益严重的环境污染之后，“零和游戏”观念正逐渐被“双赢”观念所取代。

人们开始认识到“利己”不一定要建立在“损人”的基础上。

通过有效合作，皆大欢喜的结局是可能出现的。

但从“零和游戏”走向“双赢”，要求各方要有真诚合作的精神和勇气，在合作中不要耍小聪明，不要总想占别人的小便宜，要遵守游戏规则，否则“双赢”的局面就不可能出现，最终吃亏的还是自己。

正则形式的博弈是解释零和博弈的其中一个方式。

右方是一個兩人零和遊戲例子。

右方是一个两人零和游戏例子。

遊戲流程如下：第一個玩家（紅方）選擇動作1或動作2，第二個玩家（藍方），在不知道第一個玩家的選擇狀況下，選擇動作A、動作B或動作C其中的一個。

游戏流程如下：第一个玩家（红方）选择动作1或动作2，第二个玩家（蓝方），在不知道第一个玩家的选择状况下，选择动作A、动作B或动作C其中的一个。

然後，玩家的選擇被顯示和每個玩家的分數受根據這些選擇的結果而上升或下降。

然后，玩家的选择被显示和每个玩家的分数受根据这些选择的结果而上升或下降。

混合策略纳什均衡

(红 ) r 1 1/2 0 1/2 1 q （红）
博弈论第三章混合策略纳什均衡
r*=R(q)
反应对应曲线
第二节混合策略纳什均衡的求解方法
二、反应对应法
例：扑克牌对色游戏(p77)
再看乙的最优反应，记为q*=R(r)：观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
若r 1 / 2 2r 1 0, q越大越好 1, q* R( r ) [0,1], 若r 1 / 2 2r 1 0，无论q选什么都无影响 0, 若r 1 / 2 2r 1 0, q越小越好
博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方法
二、反应对应法
例：扑克牌对色游戏(p77)
先看甲的最优反应，记为r*=R(q)：观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0，无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
解：Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q
f.o.c. 2r-1=0
r*=1/2
混合策略纳什均衡是甲在策略空间{红，黑}上以概率分布 p甲*= （1/2，1/2）进行选择，乙也在策略空间{红，黑}上以概率p乙*= （1/2，1/2）进行选择
博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方法
二、支付最大化法
例：扑克牌对色游戏(p77)
无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q(-1)+(1-q) 1]+ (1-r)[q1+(1-q)(-1)] = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r1+(1-r)(-1)]+ (1-q)[r(-1)+(1-r)1] =2q(2r-1)-(2r-1) f.o.c. 1-2q=0 q*=1/2

博弈论基础3

第三章混合策略纳什均衡
举例：
1—— “剪刀、石头、布”
剪刀剪刀甲石头布 -1 0 0 -1 1 1 1 0 -1 0 -1 0 -1 0 乙石头 1 1 1 布 -1
不存在纳什均衡
1
第三章混合策略纳什均衡
举例：
“2——扑克牌对色游戏”
红红甲黑 -1 -1 1 -1 乙 1 1 1 黑 -1
(0.5 × 0.5) × 5 + (0.5 × 0.5 + 0.5 × 0.5) × 5 + (0.5 × 0.5) × 5
期望支付= 期望支付
11
二、期望支付
在博弈中，当局中人并不清楚其他局中人的实际策略选择时，他的支付便具有了不确定性，只能使用期望支付的方式来预测自己的得益情况，进而确定自己的策略选择
情侣博弈
1
何敏
[0,1]
0
1 如果 p > 4 1 如果 p = 4 1 如果 p < 4
26
第二节反应函数法
p
王军反应函数（1,1）
1
情侣博弈
何敏反应函数
（1/4,3/4）
1/4
（0,0）
0 3/4 1
纳什均衡
q
27
第二节反应函数法
纳什均衡情侣博弈
（电影，电影）（足球，足球）王军以25%的概率选择电影，何敏以75%的概率选择电影
U g (1/ 4,3 / 4) = 1/ 2
31
一、帕累托优势标准
按照支付大小筛选出来的纳什均衡，比其他纳什均衡具有帕累托优势。这种按照支付大小筛选纳什均衡的标准，称为
帕累托优势标准。

游戏设计概论考研复习笔记-第三章

游戏设计概论考研复习笔记-第三章●♠️第三章-游戏的规则和系统设计入门●第一节-了解与初步设计游戏的规则和系统●一、三级同心圆——游戏作品的构成规律1.三级同心圆理论：规则（核心玩法）、系统（结构框架）、样态（外在表现）2.规则是指游戏进行所依据的最高准则——游戏中的一切活动，都要符合规则的要求。

规则可以以一个时代的技术发展为前提，但规则的本质与技术没有直接关系，而是一种思想和理念，更加接近于哲学的领域。

3.游戏的最外层组成部分是“样态”，样态仅指基于感性认识的外在特征。

样态也是技术应用的体现。

4.“形式”是居于样态之上、规则之下的组成部分，是游戏的框架、进行方式与游戏进行所必不可少的结构。

游戏形式中创意和理念的部分不属于技术内容。

游戏的系统，是规则的补充和完善，是游戏运行的关键部分。

5.游戏规则的设计，是整个游戏设计的核心和第一步；而系统设计，则是紧随其后的第二步工作。

●二、解构经典游戏——学会分析游戏规则和系统的本质1.猜拳游戏：●猜拳游戏中无法动摇的规则，是几种事物的互相克制——这种相克表现为一个循环；游戏必须通过这种相克，在玩家之中产生一名胜利者。

●平局出现得越少越好。

●游戏过程的失败概率是随着玩家人数的增加而不断增加的2.三者相生相克：●猜拳游戏在相生相克的项数增多的情况下，游戏过程的失败几率将呈线性增长。

●双人游戏以及“三者相生相克”便是猜拳游戏最重要的系统。

3.扑克游戏“24点”：●扑克游戏“24点”中把四则运算的结果限定为24，也是出于成功几率的考虑，而24的运算目标,便是这个游戏最重要的系统。

●它们之所以是属于“形式”的系统，而不是“规则”或“样态”，是因为它们既不是不可改变的，也不是可以随意改变的。

4.《超级马里奥兄弟》：●其规则是“利用跳跃和跑步等移动手段，从场景起点移动到终点并触发过关条件”。

●而为了丰富这一核心规则，宫本茂等游戏设计师创造或借鉴了“卷轴平台系统”“金币系统”“道具变身系统”“敌人和 boss系统”“水管传送系统”“水下场景系统”等诸多系统。

混合策略纳什均衡

博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方法
二、反应对应法
例：扑克牌对色游戏(p77)
先看甲的最优反应，记为r*=R(q)：观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0，无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
纯策略（确定性）
q*=R(r)
(陈明德语) r 1 3/4
r*=R(q)
0 1/4 1 q （钟信德语）
博弈论第三章混合策略纳什均衡
第三节寻找多重纳什均衡
二、反应对应法：情侣博弈
支付的帕累托优势：初步印象 π陈明=r(4q-1)+2(1-q)，π钟信=q(4r-3)+(3-2r) r*=0, q*=0 纯策略（确定性）
第三节寻找多重纳什均衡
例：情侣博弈
两个（多个）纯策略纳什均衡问题：纳什均衡找完了吗？有无混合策略纳什均衡？
一、支付最大化法
给定混合策略p陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) r Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2二节混合策略纳什均衡的求解方法
二、反应对应法
例：扑克牌对色游戏(p77) 无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q)

投资博弈论——正和游戏、零和游戏与负和游戏

投资博弈论——正和游戏、零和游戏与负和游戏价值投资创始人——本杰明∙格雷汉姆说过：“投资是指根据详尽的分析，本金安全和满意回报有保证的操作。

不符合这一标准的操作就是投机”。

按照这个定义来深入分析，投资的收益应该来自于投资物所产生的财富，属于正和游戏；而投机的收益，是来自于另一个投机者的亏损，则是零和游戏。

博弈的英文为“game”，一般将它翻译成“游戏”，可分为三种：“正和游戏”、“零和游戏”和“负和游戏”。

“正和游戏”是指，赢家所得比输家所失要多，或者没有输家，结果为“双赢”或“多赢。

“零和游戏”，是指一项游戏中，游戏者有输有赢，一方所赢正是另一方所输，而游戏的总成绩永远为零。

“负和游戏”是指，博弈双方虽有一方获胜但付出了惨重的代价，得不偿失，可谓没有赢家。

举个简单的例子。

四人打麻将，不管谁输谁赢，不过是你的钱到了他口袋，或者他钱到你口袋，你们的收益和损失加起来总归是0，所以叫零和。

然而，如果到棋牌室去打麻将，不管谁输谁赢，总归要付台费，四人的收益和损失加起来总归是负的，所以叫负和。

投资的本质就是参与正和游戏。

在正和游戏中，公司上市后通过股票募集到的资金，再进行投资扩大生产，盈利后再分红，股东享受到价值的稳定与成长，正和游戏的本质决定绝大部分参与者都是赢家。

投机的本质是博弈零和/负和游戏。

股市中参与投机行为就是零和游戏，而期货、外汇、黄金，古玩、名画、钻石和邮票等，考虑手续费等交易成本就是负和，这两种游戏的本质注定绝大部分的参与者都是输家。

要区别投资和投机非常简单，就在于你买入一种金融产品后，希望从哪儿得到未来的收入。

比如买入了一支股票，期望企业做大做强且能不断得到利息分红；买入一套房子后希望租出去，每月都有房租收入，这就是投资。

而如果买入了一种金融产品后，是指望能以更高的价格卖出的话，不管你购买的是什么东西，都是投机。

同样是购买房子，可能是投资，也可能是投机。

最简单可用国际上通用的租售比(售价除以月租金)来衡量：低于150就属于投资，不过因为国内还没有征收房地产税，所以可调高到200，在国内超过200便属于投机了。

03 混合策略纳什均衡

博弈论第三章混合策略纳什均衡
小偷的混合策略（5%，95%），）守卫的混合策略（10%，90%），）
第一节混合策略与期望支付
一、混合策略（二）混合策略 4、数学刻画、给定博弈G=｛以及参与人i的纯策给定博弈｛S1，…,Sn;u1,…,un｝以及参与人的纯策 … 略空间为S 略空间为 i= ｛si1,…,sik｝， … ｝，i=1,…, K … 定义参与人i以概率分布以概率分布p 随机地在其k个可定义参与人以概率分布 i=(pi1,…,pik)随机地在其个可 … 随机地在其选策略中选择的“策略” 混合策略，选策略中选择的“策略”为混合策略， pik=p(sik )表示表示参与人i选择纯策略选择纯策略s 参与人选择纯策略 ik的概率其中：，其中：0≤ pik ≤1，∑ pik=1 纯策略s 可以看作是混合策略p 纯策略 i1可以看作是混合策略 i =(1,0,…0) 混合策略组合p=（ … … 混合策略组合（p1,…,pi,…pn）对应混合策略组合的期望支付期望支付为对应混合策略组合的期望支付为πi(p)=πi(pi,p-i)
博弈论第三章混合策略纳什均衡
第一节混合策略与期望支付
一、混合策略
（二）混合策略
-2 0 1、纯策略：偷，不偷；睡，不睡、纯策略：不偷；偷r 8 -2 小纯策略空间｛不偷｝小偷的纯策略空间｛偷，不偷｝偷 8 0 纯策略空间｛不睡｝守卫的纯策略空间｛睡，不睡｝不偷1-r 0 不偷 0 2、混合策略、就一次游戏而言，猜测对方的策略，保密自己的策略。就一次游戏而言，猜测对方的策略，保密自己的策略。在多次反复游戏中，游戏中，避免任何的倾向性和规律性怎样才能让对方彻底猜不透？连自己也不知道即将会采用哪个策略；怎样才能让对方彻底猜不透？连自己也不知道即将会采用哪个策略；把对方搞糊涂！把对方搞糊涂！随机地选择策略，即采用混合策略随机地选择策略，即采用混合策略参与人按照一定概率按照一定概率，参与人按照一定概率，随机从策略组合中选择一种策略作为实际行动随机行动的目的：随机行动的目的：使自己的行为不被对手预测守卫不睡 1-q 睡q

大数定理与墨菲法则(引花荣-常胜

大数定理与墨菲法则（引花荣-常胜狐狸第一、二章）(2009-06-13 17:33:03)标签：花荣智慧分类：常胜狐狸（引花荣-常胜狐狸第三章）在相当时间内，投机套利成了沪深股市最重要的获利方法。

而投机套利的实施，依赖的最经典的原理就是：零和游戏和大数定理。

1.零和游戏零和游戏是指，一项游戏中，游戏者有输有赢，一方所赢正是另一方所输，游戏的输赢总和成绩为零。

沪深股市的方方面面都能发现与“零和博弈”类似的局面，胜利者的光荣往往隐藏着失败者的辛酸和绝望。

需要注意的是，沪深股市在局部的阶段时间里，存在着短暂的“双赢”与阶段的“通输”。

2.大数定理在股市中，收益率大于零的游戏能胜，小于零的游戏不能胜。

投机取胜的关键在于，要知道该项目的收益率，收益率为正数的能玩，为负数的不能玩，这就是打败市场、战胜市场的正收益率原则。

具体地说，只有你习惯使用的战术胜率高于50%，才有可能成为胜利者；只有你习惯使用的战术胜率高于65%，你只依靠股市就能很好地生存；只有你习惯使用的战术胜率高于75%，你才能成为职业高手或是职业杀手。

遗憾的是，在利益即得者运用简单的大数定理大把大把赚钞票的时候，绝大多数投资者却不自觉地使用本能心理学上小数法则充当不自愿的贡献者。

3.墨菲法则墨菲定律：凡事只要有可能出错，那就一定会出错。

我们发现，墨菲法则对于证券期货投资有更独到的意义，成为许多职业操盘师测试的必考之题。

此时，墨菲法则也获得了极端的表述：如果坏事有可能发生，不管这种可能性有多小，它总会发生，并造成最大可能的破坏。

墨菲法则提醒我们，在进行投资活动时，应该考虑得更周到、更全面些，事先考虑的保险措施应该较为积极。

a.大盘的行情与墨菲法则在绝望中新生，在迟疑中上涨，在欢乐中死亡，在希望中下跌。

这种绝望不是小绝望，而是大绝望，一种大多数人彻底的绝望。

迟疑指的是大盘带量上涨的迟疑，而不是技术性的弱势上涨。

欢乐指的是涨停板的数量，以及市场放出罕见的高位大成交量。

第三讲混合策略纳什均衡

混合策略均衡
工人偷懒监督老板不监督 1，-1 不偷懒 -1，2

-2，3
2，2
假定老板选择混合战略（0.2，0.8) 工人选择“偷懒”期望支付为(-1)×0.2+3×0.8=2.2 工人选择“不偷懒”（期望）支付为2×0.2+2×0.8=2 工人应选择“偷懒” 老板选择“监督” “不偷懒’……
例子1 为什么一般人总是小错不断，大错不犯；偷税漏税的一般是中小企业，大企业会老老实实地交税？
税务部门不会对所有企业的交税情况每一次都去检查，因为这样做的成本太高，得不偿失。所以，税务部门总是随机地对企业的交税情况进行检查。
企业也是随机地在交税与偷漏税之间进行选择。税收部门与企业间进行的是混合战略博弈。因为如果企业总是交税，税务部门就最好不检查；但给定不检查，企业就会偷漏税。所以，两者只有在随机地检查与不检查，企业随机地在偷漏税与交税之间选择，才会达成均衡。
两人只能玩混合战略博弈，齐威
王分别以1/6随机的概率选择出上、中、下马的任一排列，田忌也如此。由于齐威王存在绝对优势，他平均看来仍然会赢田忌一千斤铜。
混合策略均衡
◆纯策略与纯策略纳什均衡纯策略：肯定会被选择——以100%的概率——被选择的策略。 ◆混合策略混合策略：以一定的概率分布选择某几个行动的策略。
??????11111111eupquacpquadpqubcpqubd?????????????????????????1222211110808308021020820202526????eupquacpquadpqubcpqubd???????????????多重均衡博弈和混合策略一夫妻之争的混合策略纳什均衡首先该博弈有两个纳什均衡本博弈的两个博弈方不会害怕对方猜到自己的选择他们主观上并不想隐藏自己的选择

第三章__零和游戏与混合策略

“我们谁也没有挣到钱，却吃了两对狗屎。。。” 甲之所以给乙钱,是因为甲看见乙吃狗屎感到了快乐.所以他们各吃了一堆狗屎,都没得到钱,但是都感到了一次快乐。
第六页，编辑于星期一：十七点三十七分。
零和游戏与混合策略
假定中大只有一名警察，负责全校治安。中大只有一个小偷，实施偷盗。
东区有一家士多，西区有一家银行。
故事还没有完。走着走着，乙忽然缓过神来了，对甲说：不对阿，我们谁也没有挣到钱，却吃了两对狗屎……甲也缓过神了，思考了一会儿说：可是，我们创造了200万的GNP 阿！
第四页，编辑于星期一：十七点三十七分。
零和游戏
“零和游戏”之所以广受关注，主要是因为人们发现，在社会的方方面面都有与“零和游戏”类似的局面，胜利者的光荣后面往往隐藏着失败者的辛酸和苦涩。
因分身乏术，警察一次只能在一个地方巡逻；而小偷也只能去一地偷盗。
假定银行需保护的财产价格为2万元，士多的财产价格为1万元。若警察在某地巡逻，而小偷也选择了该地，就会被警察抓住；若警察没有巡逻的地方而小偷去了，则小偷成功。
警察怎么巡逻才能使效果最好？
佛罗伦萨“警察抓小偷”雕塑
第七页，编辑于星期一：十七点三十七分。
假定：
Ａ、Ｂ两个开发商都想在广州开发一定规模的房地产，但广州市的房地产市场需求有限，只能满足一个房地产商的开发量；
而且，每个开发商必须一次性开发这一定规模的房地产才能获利。
在这种情况下，Ａ和Ｂ都不存在一种策略完全优于另一种策略，也不存在一个策略完全劣于另一个策略。因为，
如果Ａ选择开发，则Ｂ的最优策略是不开发；如果Ａ选择不开发，则Ｂ的最优策略是开发；
第十页，编辑于星期一：十七点三十七分。
赢家的诅咒

博弈论教材2013-2

第三章纳什均衡及其应用3.1 混合策略纳什均衡1 鹰鸽博弈我们知道老鹰具有攻击性，而鸽子爱好和平。

在原始社会里有两个部落，可以做出两个行动：一是进攻一是和平，分别用鹰和鸽表示。

表1 鹰鸽博弈乙甲鹰鸽该博弈的那是均衡为（鹰，鸽），（鸽，鹰）。

一些学者研究发现，在同一个地域内，“鹰”和“鸽”的比例为0.36：0.64。

事实上，设鹰鸽比为:1z z -，可以得出如下结果：()2514(1)1439E e z z z =-+-=-； ()95(1)514E d z z z =-+-=-90.3625z == 聪明的做法是：当鹰鸽比小雨0.36时，选择鹰策略；否则选择鸽策略。

使用混合策略方法分析：第一步：混合策略型表示：乙鹰鸽甲鹰 p 鸽 1-p第二步：计算期望效用：(925)514(259)514E p q q E q p p=-+-=++-甲乙第三步：作出最优反应函数91 259[0,1] 2590 25q p q q ⎧<⎪⎪⎪==⎨⎪⎪>⎪⎩若若若， 90 259[0,1] 259 1 25p q p p ⎧<⎪⎪⎪==⎨⎪⎪>⎪⎩如果如果如果第四步：作出反应函数的图像第五步：根据交点，找出纳什均衡：其中（99,2525）是混合策略纳什均衡。

2 斗鸡博弈我的老家地处安徽最北部，苏鲁豫皖四省交界之处，东北处有条小河。

河边的棉花地里，经常有鹌鹑栖息在其间。

秋末冬初的农闲时节，小鹌鹑刚好长成。

村民结网捕鹌鹑把玩、斗鸟儿为乐。

每天早晨4点多钟出发，大约7点钟回来，雄性的鹌鹑留起来先要整夜整夜的熬鹌鹑、放在手里把鹌鹑，真正熟练了，才拿出来和别人的相斗。

设想两只鹌鹑要在场子里一决雌雄。

每只鹌鹑都有两个策略：攻击或逃跑。

由于两只鹌鹑实力相当，若同时选择进攻会两败俱伤；若一只进攻，一只逃跑，进攻者胜利。

逃跑的鹌鹑算是玩完了，以后再也没胆量进场子，主人也不回在把玩它，会用一块黑布把它的笼子蒙起来，培养成“叫子”，以后后捕鹌鹑的时候拎出去吸引同伴。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

两个不到十岁的小男孩，一起玩的时候发生争执，两人商量用‘剪刀、石头、布’，谁赢就听谁的。下面是他们的对话：甲说：‚喂，咱们俩是好兄弟，非要分出胜负就太伤和气了。待会儿咱们都出‘剪刀’就算了事了，好不？‛ 乙说：‚没问题，好兄弟嘛！ ‛
他们说话的时候一脸的纯真。结果——甲出的是石头，乙出的是布。
合策略是参与者在各种备选策略中采取随机方式选取的。这就是纳什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点，而有混合策略均衡点。
纳什定理与混合策略
最常见混和策略就是猜硬币游戏。比如在足球比赛开场，裁判将手中的硬币让双方队长猜正反面。由于硬币落下是正是反是随机的，概率都是1/2。那么，猜硬币游戏的参与者都是1/2的概率择正
一个合乎逻辑的假定：通常情况下，车辆总是乐意到1/4麦当劳 1/2 3/4肯德基
B
从资源的最佳配臵来看，麦当劳、肯德基应该分别开在1/4、3/4处是最优。在这种均匀散布的情况下，每家快餐店所有拥有的客户从距离最近的城市到两家快餐店的中心为止，因此都拥有1/2的顾客量，同时对于开车的人们总体来说，这种策略的选择，车辆到快餐店的总的距离最短。
曹操败走华容道
但诸葛亮棋高一着，派关羽在华容道等候曹操。于是关羽上演了一场‚只为当初恩义重，放开金锁走蛟龙‛的捉放曹义举。曹操大败于华容道后，八十万大军只剩二十七骑。这是曹操和诸葛亮的一次零和博弈。曹操需选择走大路还是小路；而诸葛亮则需选择在大路还是小路上埋伏。博弈的关键是谁能猜到对方的策略选择。这个博弈不存在纯策略纳什均衡点。
零和游戏
两个经济学家散步，甲经济学家看见了一堆狗屎，思索着对乙说。你吃了这堆狗屎吧，我给你100万块钱。乙犹豫了一会儿，但还是经受不住诱惑，吃了那堆狗屎。当然，甲守信地给了他100万块钱。过了一会，乙也看见了一堆狗屎，就对甲说：你吃了这狗屎，我也给你100万。甲经济学家也经受不住诱惑，吃了那堆狗屎当然。乙把甲给他的 100万还了回去。
但20世纪以来，‚零和游戏‛观念正逐渐被‚非零和游
戏‛即‚负和‛或‚正和‛观念所取代。
‚负和游戏‛指，一方虽赢但付出了惨重的代价，得不偿失，可谓没有赢家。赢家所得比输家所失多，或者没有输家，结果为‚双赢‛ 或‚多赢‛，称为‚正和‛。
零和游戏
有人认为，双赢只不过是把负面隐藏到我们不能观及的地方而已……也就是把危害转让到与自己利益无关的地方。 ‚我们谁也没有挣到钱，却吃了两对狗屎。。。‛ 甲之所以给乙钱,是因为甲看见乙吃狗屎感到了快乐. 所以他们各吃了一堆狗屎,都没得到钱,但是都感到了一次快乐。
第三章零和游戏与混合策略
零和游戏
零和游戏——游戏者有输有赢，但整个游戏的总成绩永远为零。
零和游戏：博弈当中的参与者，其利益可能严
格对立，一人所得永远等于另一人所失。
零和游戏
‚无毒不丈夫‛也是零和博弈所致
著名经济学家茅于轼曾说：‚过去的帝王与将相就是这样一种博弈，他可以剥削你，抄你的家；你可以造他的反，夺他的天下。一方得利，一方受损，那是零和博弈。事实上也正是因为这种零和博弈反复上演，才使中国历史的每一页都充满了阴谋与血腥，并且使‘无毒不狠非丈夫’的文化观念深入到每一个中国人的意识中。‛
随机策略
随机策略的最广泛用途在于以较低的监管成本促使人们遵守规则，同时解释了惩罚不一定要和罪行吻合的原因。违章停车的罚金是正常收费标准的许多倍。设想一下，假如正常收费标准是1美元/小时，按每小时1. 01美元的标准进行处罚能不能让大家服服帖帖呢？有可能，条件是交通警察在你违章停车时一定能逮住你。而这需要大量的交警，费用巨大。监管当局有一个同样管用、代价又小的策略，就是提高罚金数目，同时放松监管力度。
赢家的诅咒
视频：《红男绿女》（18’28 ’) 在《红男绿女》中，赌棍斯凯·马斯特森想起父亲给自己提
的一个很有价值的建议：孩子，在你的旅途中，总有一天会遇到一个家伙走上前来，在你面前拿出一副漂亮的新扑克牌，连塑料包装纸都没有拆掉的那种；这家伙打算跟你打一个赌，赌他有办法让梅花J从扑克牌里跳出来，并把苹果汁溅到你的耳朵里。不过，孩子，千万别跟这个家伙打赌，因为就跟你确确实实站在那里一样，最后你确确实实会落得苹果汁溅到耳朵里的下场。但斯凯从来没有认真听取过他父亲的教诲。一分钟后，他就和内森打赌说内森不知道他的蝴蝶领结是什么颜色。如果内森知道是什么颜色，他一定愿意打赌，并且取胜。结果是，内森不知道什么颜色，所以他没有跟斯凯打赌。
以预测。我们无法知道，最后结果是A开发，B不开发还是 A不开发，B开发。
曹操败走华容道
赤壁之战，曹军八十万大军大败。曹操引兵逃跑。操行之间，前面有两条路，军士复曰：‚两条路皆取南郡，不知从那条路去？‛ 操问：‚那条路近？‛军士曰：‚大路稍平，却远五十余里。小路投华容道，却近五十余里；只是地窄路险，坑坎难行。‛ 操令人上山望之，回报小路山边有数处烟起；大路并无动静。操教前军便走华容道小路。诸将曰：‚烽烟起处，必有军马，何故走到这条路？‛操曰：‚岂不闻兵书有云：‘虚则实之，实则虚之。’诸葛亮见识，故使数个小卒于山僻烧烟，令我军不敢从这条山路走，却伏兵在于大路等着。吾料已定，因此教走华容。‛诸将皆曰：‚丞相妙策，人不可及。‛遂勒兵走华容道。
有两个或两个以上纳什均衡点的博弈中，其最后结果难以
预测。在‚夫妻博弈‛中，我们无法知道，最后结果是一同欣赏歌剧还是一起去看拳击。
纳什定理与混合策略
在博弈论中，可以选择出某个策略的纳什均衡，这个策略叫做纯策略。纯策略的纳什均衡只是博弈的一种特例。所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。纯策略是参与者一次性选取的，并且坚持他选取的策略。所谓混合策略是指参与者采取的不是惟一的策略，而是其策略空间上的概率分布。混
案例——房地产开发博弈
根据纳什均衡含义：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。
开发商博弈的纳什均衡点不止一个，而是两个：（A开发，B不开发）；（A不开发，B开发）。在有两个或两个以上纳什均衡点的博弈中，其最后结果难
位置博弈
肯德基与麦当劳都是百年老店，自然是精明之至，从经济学上就是具有经济理性，总是希望自己的生意尽可能地红火，至于其他人的生意的好坏则与己无关。出于这种理性，肯德基肯定会想到：如果将店铺从3/4点处向左移一点，将从麦当劳抢夺走部分顾客，这对于肯德基单方面来说无疑是一个好主意。当然麦当劳也不甘示弱，作为一个“理性人”，麦当劳自然也应该想到将自己的店铺从1/4点处向右移动以争取更多的顾客。
佛罗伦萨‚警察抓小偷‛雕塑
警察怎么巡逻才能使效果最好？
零和游戏与混合策略
警察的一个最好的做法是，抽签决定去银行还是士多。因为银行的价值是士多的两倍，所以用两个签代表银行，比如如果抽到1、2号签去银行，抽到3号签去士多。这样警察有2/3的机会去银行进行巡逻，1/3的机会去士多。而小偷的最优选择是：以同样抽签的办法决定去银行还
故事还没有完。走着走着，乙忽然缓过神来了，对甲说：不对阿，我们谁也没有挣到钱，却吃了两对狗屎……甲也缓过神了，思考了一会儿说：可是，我们创造了200 万的GNP阿！
零和游戏
‚零和游戏‛之所以广受关注，主要是因为人们发现，在社会的方方面面都有与‚零和游戏‛类似的局面，胜
利者的光荣后面往往隐藏着失败者的辛酸和苦涩。
赢家的诅咒
即使你在拍卖中赢了，你也应该为此感到担忧。因为，你是最高的出价者，这一事实意味着其他人觉得这件物品不值你出的那个价。赢得拍卖后却发现自己出价过高，这种现象称为赢家的诅咒。
纳什定理案例——房地产开发博弈
假定：Ａ、Ｂ两个开发商都想在广州开发一定规模的房地产，但广州市的房地产市场需求有限，只能满足一个房地产商的开发量；而且，每个开发商必须一次性开发这一定规模的房地产才能获利。在这种情况下，Ａ和Ｂ都不存在一种策略完全优于另一种策略，也不存在一个策略完全劣于另一个策略。因为，如果Ａ选择开发，则Ｂ的最优策略是不开发；如果Ａ选择不开发，则Ｂ的最优策略是开发；类似地，如果Ｂ选择开发，则Ａ的最优策略是不开发；如果Ｂ选择不开发，则Ａ的最优策略是开发。
假如监管属于随机性质，我们必须定出一个超过罪行本身的惩罚。规则在于，预期的惩罚应该与罪行相称，而这种心理预期应该将被逮住的概率考虑在内。国税局的审查策略也是随机策略
混合策略
公司年饭抽奖，老板提出，今年特别奖不用抽签而是
用玩游戏的方式来决定。
游戏规则：大家围成一圈同时跟老板猜拳，猜赢老板或是平手的人可以参予比赛，猜输的就没有参赛资格。参赛者一直猜到剩下最后一个就是赢家而获得该奖项。如果你是该公司的员工，你如何增大你拿奖的概率？
零和游戏与混合策略
假定中大只有一名警察，负责全校治安。中大只有一个小偷，实施偷盗。东区有一家士多，西区有一家银行。因分身乏术，警察一次只能在一个地
方巡逻；而小偷也只能去一地偷盗。
假定银行需保护的财产价格为2万元，士多的财产价格为1万元。若警察在某地巡逻，而小偷也选择了该地，就会被警察抓住；若警察没有巡逻的地方而小偷去了，则小偷成功。
大部分电视台总是将最精彩的节目放在相同的时间段，甚至有些时候是在相同时间段播放类似的节目，比如你播“快乐大本营”，我就播 “超级总动员”；你播“玫瑰有约”，我就播“单身男女”。人都说文人相轻，电视台也是这么相煎太急。
立刻跟两位同事商量：三个人合作，得到奖项大家平分。大家讲好第一次大家都出不一样的。至少确定第一回合之后，接着还会剩下两个人能够参予这个游戏。
位置博弈
麦当劳和肯德基为什么总是相邻设店?
位置博弈
他们为什么总喜欢贴身撕杀?

第三章__零和游戏与混合策略

管理定律零和游戏

完全信息静态博弈及其纳什均衡解

零和游戏

Games3-Static Game with Complete Information

博弈论第三章混合策略纳什均衡.

管理定律零和游戏

零和游戏

混合策略纳什均衡

博弈论基础3

游戏设计概论考研复习笔记-第三章

混合策略纳什均衡

投资博弈论——正和游戏、零和游戏与负和游戏

03 混合策略纳什均衡

大数定理与墨菲法则(引花荣-常胜

第三讲 混合策略纳什均衡

第三章__零和游戏与混合策略

博弈论教材2013-2

第三讲混合策略纳什均衡