策略博弈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

耶鲁大学博弈论课堂笔记(一)
第一节:导论——五个入门结论
无论别人怎么选,如果选a的结果严格优于b,那么a相对于b是个严格优势策略。

结论一:不要选择严格劣势策略。

理由:如果我选择了优势策略,我在每次博弈都得到更好的收益。

结论二:理性的选择,使总结果变得糟糕。

(理性人的理性选择造成了次优的结果。

)——囚徒困境
结论三:汝欲得之,必先知之。

结论四:站在别人的立场上去分析他们会怎么做。

结论五:耶鲁大学的学生都很自私。

第二节:学会换位思考
博弈的要素有哪些?
例:
II
I
博弈分析:
不管i怎么选,中间总是优于右边,得出结论,参与者ii不应该选右。

(参与者i的策略s’i,严格劣于参与者i的另一个策略si,在其他参与者选择s-i时,此情况下选s’i的收益UI(s’i),对所有的s-i均成立。


表达:s’i严格劣于si, Ui(si,s-i)>Ui(s’i,s-i) for all “s-i”.
文字表述:如果si总是更好的选择,即总能给参与人i带来更高的收益,而无论其他参与人怎么选。

例:防线布置问题
入侵者打算入侵一个国家,有两条路,必须通过其一才能进入,你是这个国家的防御者,要决定在哪个路口布置防线,只能防守二者之一。

一条路崎岖(途中会损失一个营的兵力),另一条路平坦,如果入侵者遇到了你布置的防线,不管哪条路都要再损失一个营的兵力
入侵者收益为攻入国家时还剩多少兵力,防守者的收益为入侵者损失多少兵力。

分析:如果入侵者走eazy pass,你应防守 eazy pass(优于hard pass);
如果入侵者走hard pass,你应防守hard pass(优于eazy pass)
结论:入侵者不会采取“弱劣势策略”崎岖之路是弱劣势策略,应在平坦之路设防。

(弱劣势策略)(参与者的策略s’i弱劣于其他策略si当且仅当在对手选s-i的情况下,参与人i选择si的收益等于对手选s-i下她选s’i的收益。

而且在任何情况下此条件均成立)
表达:s’i弱劣于其他策略si ,Ui(si,s-i) >=Ui(s’i,s-i)
耶鲁大学博弈论课堂笔记(二)
第三节:迭代剔除和中位选民定理
『迭代剔除』:
例:政治模型案例
假设有两个候选人,他们为了选举必须确定自己的政治立场,他们要从一系列政治主张中选择一个政治立场。

一共有10个立场,
1,2,3,4,5,6,7,8,9,10
最靠近左边的(1)代表左翼分子的立场,最靠近右边的(10)代表右翼分子的立场,现假设每一个立场都会得到10%的选票,选民们会投票给离他们最近的候选人,出现平局时选票会分摊,收益为:候选者希望尽可能最大化获得的选票。

分析:1为严格劣势策略,因为2优于1,意味着选择立场2会比立场1获得更多选票,无论另一个候选人如何选择。

Test does 2 dominate 1?
vs 1: U1(1,1)=50% < U1(2,1)=90%
vs 2: U1(1,2)=10% < U1(2,2)=50%
vs 3: U1(1,3)=15% < U1(2,3)=20%
vs 4: U1(1,4)=20% < U1(2,4)=25%
……
结论:立场2严格优于立场1
立场9严格优于立场10
立场1与立场10是劣势策略。

Test does 2 is dominated by 3?——NO
vs 1: U1(2,1)=90% > U1(3,1)=85%
说明立场3并不优于立场2
如果我们剔除劣势策略1和10,Test does 2 dominate 1?
vs 2: U1(2,2)=50% < U1(3,2)=80%
vs 3: U1(2,3)=20% < U1(3,3)=50%
vs 4: U1(2,4)=25% < U1(3,4)=30%
vs 5: U1(2,5)=30% < U1(3,5)=35%
结论:立场2与立场9本不是劣势策略,无人选立场1和立场10的时候它们就变成了劣势策略。

以此类推,排除立场1和10,立场2和9,立场3和8,立场4和7,迭代剔除劣势,回头看看哪些策略是劣势的,最终剩下立场5和6.
It del leads to deleting all except 5 and 6.
预测的结果是候选人会挤在中间,被称为中间选民定理。

『思考』该模型存在的问题:
1.在现实生活中,每个立场的选民数并非是均分的
2.并非人人都在投票,有人不投票也是一种策略
3.实际上有多位候选人,不只有两个
4.候选人未必能坚定他的立场,也就是说选民未必相信你的立场
5.其他(党内初选,多维度问题)
『最佳对策』:Best response
选上是对手选左时的最佳对策
选中是对手选右时的最佳对策
上中下三个策略中对手选左或选右的可能性都为1/2
Choosing upper:expacted payoff of U is (1/2,1/2)=1/2*5+1/2*0=2.5
Choosing middle: expacted payoff of M is (1/2,1/2)=1/2*1+1/2*4=2.5
Choosing down:expacted payoff of D is (1/2,1/2)=1/2*4+1/2*2=3
模型解法:
画坐标图,假设选左概率为X,选右概率为(1-X),解出各自区域的概率面积,联立方程,X=1/3.
第四节:足球比赛与商业合作之最佳对策
伐点球问题:
U1(L,l)=4——射进的概率为40%
结论:无论如何千万不要从中路射门。

不要选择任何信念下都非最佳对策的策略。

我们忽略了什么?
……
Definition3(最佳对策):
(1)Player i’s strategy si is a best re sponse(BR) to the strategy s-i of the players Ui(si,s-i)>=Ui(si’,s-i) for all si’ vs si
参与人i的策略si,是一个最佳对策BR,是对手的策略s-i的最佳对策,如果参与人i在对手的策略s-i下,选si的收益弱优于其他策略si’,这对于参与人i的所有si’都适用。

OR
Si’ slove max Ui(si,s-i)
(2) Player i’s strategy si is a best response(BR) t o the strategy s-i of the players
Eui(si,p)>=Eui(si’,s-i) for all si’ vs si
例:Eui(L,p)=p(l)*Ui(L,l)+p(r)*Ui(L,r)
合伙人博弈:
有两个实体共同完成一个协作项目,这两家公司平分利润,即各自持有50%股份,每个股东都要选择为公司投入多少精力,S=[0,4](连续的),假设这个企业的利润是已知的,计算方式为:4*[s1+s2+b*s1*s2],0<=b<=1/4,
参与人1的收益U1(s1,s2)=1/2*4*[s1+s2+b*s1*s2]-s1^2,
参与人2的收益U2(s1,s2)=1/2*4*[s1+s2+b*s1*s2]-s2^2,
求参与人1的最佳策略。

分析:Max(s1) 2(s1+s2+b*s1*s2)-s1^2
一阶求导:2*(1+b*s2)-2*s1=0
二阶求导:s1=1+b*s2 =BR1(s2)
S1是参与人1的最佳对策
同理,s2=1+b*s1=BR2(s1)
S2是参与人2的最佳对策
由S1=S2得S1=S2=1/(1-B)
存在的问题:外部性。

相关文档
最新文档