混合策略与随机行动概论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例如:乒乓球员以60%的概率选择正手发球,40%的概 率选择反手发球。
什么是纯策略?
路漫漫其修远兮, 吾将上下而求索
混合策略
如果你是踢球人,这两个纯策略中你更喜欢哪一种?( 70%)
你能不能做得更好? (1)以50:50(抛硬币)的比例随机地选择左边或右边。
如果守门员选择左边,你混合策略成功的概率: ½*58%+ ½* 93%= 75.5% 如果守门员选择右边,你混合策略成功的概率: ½*95%+ ½* 70%= 82.5%
70,30
得益:进球得分的百分比。根据1995-2000年间 意大利、西班牙和英国最高联盟的数据
严格竞争博弈
就一次游戏而言,猜测对方的策略,保密自己的策略 。在多次反复游戏中,避免任何的倾向性和规律性。
路漫漫其修远兮, 吾将上下而求索
零和博弈
实Hale Waihona Puke Baidu验
办法是将行动随机化。
混合策略
混合策略:
参与人在每一个给定信息的情况下以某种概率分布随机地 选择不同的行动。
如果守门员选择左边,你混合策略成功的概率: x*58%+ (1-x)* 93% 如果守门员选择右边,你混合策略成功的概率: x*95%+ (1-x) * 70% 两者相等,求得选x=0.383
路漫漫其修远兮, 吾将上下而求索
混合策略
不管守门员选择他的左边还是右边,你的最佳混合比 例都会使你得到相等的成功率 (4)以0.383:0.617的比例随机地选择左边或右边。
路漫漫其修远兮, 吾将上下而求索
混合策略
你的连续更优的混合策略比例就是如何使自己在守门 员选择左边时和选择右边的成功概率差距缩小。
58%--70%--12%
75.5%-- 82.5%--7.3% 79% --80%--1% x--y--0
路漫漫其修远兮, 吾将上下而求索
混合策略
不管守门员选择他的左边还是右边,你的最佳混合比 例都会使你得到相等的成功率 (3)以x:1-x的比例随机地选择左边或右边。
• 参与人:n个 • 每个参与人的战略集:{打电话,不打电话} • 效用:没有任何人打,所有人0支付;
打,v-c; 不打,但其他人至少有一个人打,v
路漫漫其修远兮, 吾将上下而求索
混合策略—案例
– 纯战略NE
• 当只有两个参与人的时候(公共产品提供的斗 鸡博弈)——两个NE
• n个人的时候: 假设有m个人提供,m>1 or m=1 n个NE
混合策略与随机行动概 论
路漫漫其修远兮, 吾将上下而求索
2020年4月2日星期四
赛场
路漫漫其修远兮, 吾将上下而求索
混合策略提出
点球射门 攻方的策略是:攻左边,或攻右边 守方的策略是:守左边,或守右边(以守方的方向为准)

左边 右边
路漫漫其修远兮, 吾将上下而求索
左边 58,42
95,5

右边 93,7
路漫漫其修远兮, 吾将上下而求索
实验显示: “陷入无意识但仍可预测的模式” 例如:官僚作风--连续出“布”
雪崩---连续出石头 排除策略--省略一个
随机:秘密的,足够复杂以至难以让人破解的规则
如果守门员选择左边,你混合策略成功的概率: 0.383*58%+ 0.617* 93%=79.6% 如果守门员选择右边,你混合策略成功的概率: 0.383*95%+ 0.617 * 70% =79.6%
路漫漫其修远兮, 吾将上下而求索
混合策略
那么守门员的策略怎样?
守门员的最佳策略是使踢球者选择左边和选择右边的成功 率相等的策略。 守门员应当分别以41.7%和58.3%的比例选择自己的左边 和右边,使踢球者成功的概率为79.6%. 混合策略纳什均衡?
• 报案(reporting a crime)
– n个人目睹一桩罪行,每个人都希望报警, 但是都倾向于其他人打电话。特别的,假定 能从报警中得到v单位的收益,而打电话的 人需要付出c单位的成本,v>c>0。分析这 个问题的纯战略NE和混合战略NE。
路漫漫其修远兮, 吾将上下而求索
混合策略—案例
– 分析:
路漫漫其修远兮, 吾将上下而求索
混合策略
法则
在纯冲突博弈(零和博弈)中,如果让你的对手事先看清 楚你的真实选择对你不利,那么你可以通过随机选择自己 备选的纯策略而获益。你的混合比例应该是这样的:对手 采取任何特定的备选纯策略,都不可能利用你的选择, 即,当你以混合策略对付他的混合策略中任一纯策略时, 你得到的平均赢利都相等。
路漫漫其修远兮, 吾将上下而求索
混合策略
50:50是你最佳混合策略吗?
(2)以40:60(在你的口袋里放一本书,如果页眉最后一位 数是1到4选左,0到5则选右)的比例随机地选择左边 或右边。
如果守门员选择左边,你混合策略成功的概率: 0.4*58%+ 0.6* 93%= 79% 如果守门员选择右边,你混合策略成功的概率: 0.4*95%+ 0.6* 70%= 80%
路漫漫其修远兮, 吾将上下而求索
怎样随机行动?
实验抛硬币
抛硬币翻出正面之后再抛一次,这时出正面的可能性与抛 出反面的可能性相等。
无规律的随机行动(点名4/18=22%,不点名78%)。 例如:一个秘密的、足够复杂以致让人难以破解的规则。 举例:秘密
路漫漫其修远兮, 吾将上下而求索
混合策略—案例
路漫漫其修远兮, 吾将上下而求索
但是,我们知道,玩这个游戏是总 是以对方不易猜出的随机方式出招。事 实上,可以通过数学证明,当双方都以 每个战略按1/3的概率出招时,达成一种 双方都不愿改变这种概率分布的局面。 这被称为“混合战略纳什均衡”,而这种以 随机方式选择纯战略的博弈被称为“混合 战略博弈”。
路漫漫其修远兮, 吾将上下而求索
混合策略—案例
• 混合战略NE • 随着人数n的增加,p减小,即人越多,每
个人选择报案的概率就会越小,如果n=1, 则p=1 • 社会心理学与博弈分析
路漫漫其修远兮, 吾将上下而求索
混合策略—案例
小孩玩的游戏“石头,剪子,布”, 也是一种博弈。但是,这个博弈有一种 有趣的特征,即给定一方的任何选择, 另一方都有制胜对方的战略,所以,给 定一方任何一个战略,对方都有制胜这 个战略的战略,因而这个战略不是最优 的。任何“纯战略”都不是最优的,纯战略 是“石头,剪子,布”中的任何一个。
相关文档
最新文档