博弈论理性是共同知识时的博弈求解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.1 基本概念
基本概念——期望效用 (上)
一个参与人的期望效用是指这个参与人采取策略si,而其 他人根据μ-i采取行动时的“平均”得益。
以右图所示的博弈为例,假设参与人1 相信参与人2采取策略L的可能性为1/2, 采取策略M和R的可能性都是1/4。即 μ2(L)=1/2, μ2(M)=1/4, μ2(R)=1/4。这个 信念简写为(1/2,1/4,1/4)。如果参与 人1选择U,他的期望效用为:
4.2 博弈求解:参与者是理性的
4.2.2 博弈求解:参与者是理性的 ——占有策略
占优策略(dominant strategy):如果一个策略严格 优于其他策略,那么称这个策略为占优策略。 如果一个策略被占优,则称为劣势策略。
一个理性参与者从不使用严格劣势策略, 一个理性参与者总是使用占优策略。
歌剧《托斯卡》的博弈情景反映了个人理性与 集体理性之间的重要区别。
4.1 基本概念
4.1.3基本概念——混合策略 一个参与人的混合策略是指这个参与人根据一个概率分
布来随机选择策略的行为。参与人i的混合策略用σi表示, σi ∈ ΔSi, ΔSi为参与人i的混合策略集合。 比如,一个参与人可以在U和D两种策略之间进行选择, 他选择U的概率为1/2,选择D的概率也为1/2,则他的混 合策略为(1/2,1/2)。 σi 性质: σi中的每个元素不小于0,各元素之和为1. 混合策略包括了纯策略,纯策略是混合策略的一种特殊 情况。
Biblioteka Baidu
4.2 博弈求解:参与者是理性的
4.2.4博弈求解:参与者是理性的——小练习 找出以下博弈中的劣势策略:
要点提示: 在一个策略未被纯策略占优时,要考虑 这个策略是否被混合策略占优!
4.2 博弈求解:参与者是理性的
4.2.5 博弈求解:参与者是理性的——种族隔离
4.2 博弈求解:参与者是理性的
4.2.6 博弈求解:参与者是理性的——香烟广告
4.1 基本概念
基本概念——期望效用 (下)
当在博弈中有参与人使用混合策略时,参与人的支付也 使用期望效用来计算。
仍以右图所示的博弈为例,假设参 与人2选择M,参与人1采取混合策略 (1/3,1/3,1/3),那么参与人1的支 付为: u1(σ,M)=(1/3)*0+(1/3)*1+(1/3)*2=1 参与人2的支付为: u2(σ,M)=((1/3)*2+(1/3)*2+(1/3)*3=7/3
参与者有足够的能力对自身的处境进行判断 参与者有足够的能力对其他参与者的行为进行预期 参与者有足够的能力对各种行动方案进行评估 参与者以自身支付最大化原则采取行动 理性意味着仅仅追求自身的利益,而不管这些利益是如何 被定义的。
偏好
4.1 基本概念
4.1.2基本概念——信念
信念是参与人对其他参与人行为的主观判断。从数学上看, 参与人i的信念是关于其他参与人的策略的一个概率分布,用 μ-i来表示, μ-i ∈ΔS-i,其中ΔS-i是指除了参与人i的其他所有参 与人所采取策略的概率分布集合。 在两方博弈中(-i=j),假定每个参与人都有有限数量的策略 。参与人i对于参与人j所采取策略的信念是一个函数μj∈ΔSj, 其中对于参与人j的每一个策略sj∈Sj, μj ( sj )表示参与人i 认为参与人j可能采取sj的概率。 μj性质:对于每一个sj∈Sj , 有 μj ( sj ) ≥0且 Σsj∈Sj μj ( sj ) =1 比如,参与人j的策略有A,B,C三种, μj ( A )=1/3, μj ( B) =1/6 , μj ( C )=1/2。
【要点说明】 1. 最优反应是一个集合,其元素不一定只有一个。 2. 根据对其他人策略的信念相应采取最优反应策略本身并不是一种策略 行为,可看作理性动物的一种本能。 3. 采取行动的最关键部分在于信念中所包含的信息。获得博弈的成功常 常取决于你对于对手的了解是否超过对手对你的了解。
4.2 博弈求解:参与者是理性的
两家烟草公司:PM和RJR。香烟的年需求量为10亿包。市场份额与广告 费成正比,PM的市场份额为:
PM的销售量为: 每包香烟获利10美分,PM支出的广告费用产生的收益为:
RJR支出的广告费用产生的收益为:
4.2 博弈求解:参与者是理性的
以右图所示的博弈为例,假设参与人1相信 参与人2采取策略L的可能性为1/3,采取策略 C的可能性为1/2,采取策略R的可能性为1/6. 这个信念可表示为(1/3,1/2,1/6)。 参与人1采取策略U、M、D的期望效用分别 为:
4.1 基本概念
基本概念——最优反应(下)
仍以右图所示的博弈为例,假设参与人 2对参与人1所采取的策略具有信念 (1/2,1/4,1/4)。 参与人2采取策略L、C、R的期望效用 分别为:
【小练习】试计算参与人1采取混合策略 (1/3,1/3,1/3),参与人2采取混合策略(0,1/2,1/2) 时,双方的支付情况。
4.1 基本概念
基本概念——最优反应(上)
假设参与人i对于其他参与人采取的策略具有信念,μ-i ∈ΔS-i,参与 人i的策略si ∈ Si如果对于任何s’i ∈ Si都满足ui(si,μi)≥ ui(s’i,μi),那么si 是一个最优反应。
第4讲 理性是共同知识时的博弈求解
基本概念:理性、信念、混合策略与期望效用 博弈求解:参与者是理性的 博弈求解:参与者是理性的且参与者知道 参与者是理性的 博弈求解:理性成为共同知识 定位博弈 合伙人博弈
4.1 基本概念
4.1.1基本概念——理性
当一位参与者尽可能使自己的支付最大化并采取行动时,
就认为这位参与者是理性的。
严格优于(strictly dominates):无论其他对手 的策略是什么,若策略s产生的支付(收益)严 格高于s’产生的收益,那么策略s为严格优于策 略s’。
4.2 博弈求解:参与者是理性的
4.2.2 博弈求解:参与者是理性的 ——弱优于
弱优于(weakly dominates):无论其他对手的策 略是什么,若策略s产生的支付(收益)不低于s’产 生的收益,那么策略s为弱优于策略s’。