纯策略与混合策略
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
纯策略与混合策略
回答1:简单来说,纯策略就是参与⼈始终坚持⼀个对其最有利的策略,⽽不论对⼿采取何种策略;⽽混合策略就是参与⼈为了不让对⼿明⽩他的⾏动原则以及选择偏好从⽽加以利⽤,⽽不断选择对其最有利(或相对有利)的策略,这些策略往往是随谈判阶段或环境(或其他因素)⽽不断变化的。
举个例⼦,⽐如在菜场买菜,买⽅想以较低的价格买下⼤量⽩菜,⽽卖⽅知道买⽅迫切需要⽩菜这⼀情况,因此会开出较⾼价格,并摆出“不买请便”的脸⾊,此时若买⽅坚持纯策略,则要么按卖⽅价格买,要么直接⾛⼈;若卖⽅采⽤混合策略,会先对⽩菜的质量(⽐如有⽆烂菜叶)做出评价、其他⼈卖的⽩菜的价格以及质量等以聊天的⽅式告诉卖⽅,从⼼理上击溃其⾼预期的⼼理防线,接着以购买⼤批量作为条件进⾏谈判,并以去购买其他⼈的⽩菜进⾏威胁,从⽽最终达到以较低价格买下⼤量⽩菜的最终⽬的。
这么说,楼主可明⽩了?
回答2:
以玩“⽯头、剪⼦、布”游戏为例。
设你与对⼿只出⼀次⼿,游戏便结束。
你确定地出“⽯头”(或“剪⼦”、或“布”),这是你的⼀个纯策略。
你以20%的可能出“⽯头”,30%的可能出“剪⼦”,40%的可能出“布”,这是你的(⼀个)混合策略。
也许你会说,只要游戏进⾏,这三种出法只能实现⼀种,混合策略有什么意义呢?不妨这样理解:这种策略分析是“事前的”。
出⼿前:
如果你确信对⼿将以100%的可能出⼿其中⼀种(即你知道了对⼿执⾏的纯策略),你⾃然知道该如何应对。
如果你不确信对⼿⼀定出⼿哪种,但确信对⼿将以20%的可能出“⽯头”,30%的可能出“剪⼦”,40%的可能出“布”(即你知道了对⼿执⾏的混和策略),那么,你该如何出⼿呢?这是基于“混合策略”要进⾏的分析。
知乎靠谱回答1:
混合策略的定义是纯策略上的⼀个概率分布,数学上来看很简单,但如何解释的确不像看起来的那么容易。
我觉得如果不是专门做纯博弈论的,学习过程中采⽤其中⼀种对你来说最⾃然的解释就⾏。
我在这⾥列出两种解释,因为⼿机答题,所有例⼦我都⽤“⽯头剪⼑布”这个游戏,两位参与者就叫A和B。
先说⼀个⽐较基本的解释,也是⼀本标准的⾼微书上会给出的解释。
混合策略就是随机化⾃⼰的纯策略,令⾃⼰的纯策略依赖于⼀个随机的信号。
⽐如玩⽯头剪⼑布的时候我事先给⾃⼰约定:我先扔⼀枚骰⼦,点数是1或2我就出⽯头;点数是3或4我就出剪⼑;点数是5或6我就出布。
这样就实现了(1/3,1/3,1/3)这个随机策略。
(要⽣成别的分布,你可以利⽤电脑依[0,1]上均匀分布取⼀个数。
)上述解释的⼀个缺点是:现实中没⼈玩游戏前还会掷个骰⼦啊。
于是出现第⼆种解释,最早由Aumann提出。
第⼆种解释是说:A的⼀个混合策略并不是描述A的⾏为,⽽是B对A的⾏为的⼀个信念。
举个例⼦来说,A⽤(1/3,1/3,1/3)这个策略其实是B猜测A会以
1/3概率出⽯头,1/3概率出剪⼑,1/3概率出布。
这样的话,⽯头剪⼑布这个游戏的纳什均衡就可以解释为B认为A出⽯头剪⼑布的概率各为1/3。
A认为B也是这样。
这种框架下纳什均衡的解释也并⾮采⽤“No profitable deviation”了,⽽是变成了以下两个条件:1.所有参与者给定⾃⼰对他⼈的信念选择对⾃⼰最优的纯策略。
2.所有参与者的信念是正确的。
参考《A Course in Game theory》Chapter3。
我⾃⼰的情况是:做题的时候(有计算的时候)会采⽤第⼀种解释,⽽理解理论的时候会采⽤第⼆种解释。
就好⽐概率论⾥计算时⽤Riemann积分,开发理论时⽤Lebesgue积分。
其余的解释还有许多。
⽐如Myerson在《Game Theory》Chapter3⾥引⼊⼀个Game Theorist的⾓⾊,说所以参与者的混合策略是这个Game Theorist的⼀个信念(和上述第⼆种解释并⽆本质区别)。