博弈复习题及参考答案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4、“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整个、个体利益共同的最优。简单地说,“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。
现实中“囚徒的困境”类型的问题是很多的。例如厂商之间价格战、恶性的广告竞争,初中、中等教育中的应试教育等,其实都是“囚徒的困境”博弈的表现形式。
a)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示该博弈并作简单分析。
b)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示并简单分析。
参考答案:
a) 由于老板在决定是否克扣工资欠可以完全清楚工人是否偷懒,因此这是一个动态博弈,而且是一个完全信息的动态博弈。此外,由于双方都有关于得益的充分信息,因此只是一个完全且完美信息的动态博弈。该博弈用扩展形表示如下:
补充习题:
1.判断下列叙述是否正确,并作简单分析。
a)囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
b)合作博弈就是博弈方采取互相合作态度的博弈。
参考答案:
a)错误。结论恰恰相反,也就是囚徒的困境博弈中两囚徒之所以处于困境,根源正是因为两囚徒很在乎坐牢的绝对时间长短。此外,我们已开始就假设两囚徒都是理性经济人,而理性经济人都是以自身的(绝对)利益,而不是相对利益为决策目标。
第一章复习题
2,4,5,6,7
第一章参考答案
2、设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。如果设定博弈模型时不专门设定后两个方面,就是隐含假定是完全、完美信息和完全理性的非合作博弈。
0.9×(0.35×300+0.65×0)=0.9×105=94.5<100
因此也会选择不开。
(e)如果我是风险偏好的,那么因为开的期望收益为:
1.2×(0.35×300+0.65×0)=1.2×105=126>100
因此这时候肯定会选择开。
10、首先需要注意的是,在该博弈方的得益单位不同,逃犯得到的是增加或者减少的刑期(年),而看守得到的则是奖金(元),因此除非先利用效用概念折算成相同的单位,否则两博弈方的得益相互之间不能比较和加减。
直接采用单位不同的得益,该博弈的得益矩阵如下:
看守
路线一路线二
-10,1000
10,0
10,0
-10,1000
逃路线一
犯路线二
该博弈的扩展形表示如下:
根据上述得益矩阵和扩Hale Waihona Puke Baidu形不难清楚,该博弈中两博弈方的利益是对立的。虽然由于两博弈方得益的单位不同,相互之间得益无法相加,因此无法判断是否为零和博弈,但两博弈方关系的性质与猜硬币等博弈相同,也是对立的。因此,该博弈同样没有两博弈方都愿意接受的具有稳定性的策略组合,两博弈方最合理的策略都是以相同的概率随机的选择路线。
5、首先可根据博弈方的行为逻辑,是否允许存在有约束力协议,分为非合作博弈和合作博弈两大类。
其次可以根据博弈方的理性层次,分为完全理性博弈和有限理性博弈两大类,有限理性博弈就是进化博弈。
第三是可以根据博弈过程分为静态博弈、动态博弈和重复博弈三大类。
第四是根据博弈问题的信息结构,根据博弈方是否都有关于得益和博弈过程的充分信息,分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈和不完全信息动态博弈几类。
3.一个工人给一个老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于50元的负效用,老板想克扣工资则总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒是老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况使双方都知道的。请问
第五是根据得益的特征分为零和博弈、常和博弈和变和博弈。
第六是根据博弈中博弈方的数量,可将博弈分为单人博弈、两人博弈和多人博弈。
第七是根据博弈方策略的数量,分为有限博弈和无限博弈两类。
9、(a)根据问题的假设,该博弈的得益矩阵和扩展形表示分别如下:
自然
赚(35%)亏(65%)
300
0
100
100
开
我
不开
根据上述得益情况可以看出,在该博弈中偷懒对工人总是有利的,克扣对老板也总是有利的,因此在双方都只考虑自己的利益最大化的情况下,该博弈的通常结果应该是工人偷懒和老板克扣。
(b)如果我是风险中性的,那么根据开的期望收益与不开收益的比较:
0.35×300+0.65×0=105>100
肯定会选择开。
(c)如果成功的概率降低到0.3,那么因为这时候开的期望收益与不开的收益比较:
0.30×300+0.70×0=90<100
因此会选择不开,策略肯定会变化。
(d)如果我是风险规避的,开的期望收益为:
b)不正确。合作博弈在博弈论中专门指博弈方之间可以达成和运用有约束力协议限制行为选择的博弈问题,与博弈方的态度是否合作无关。
2.博弈与游戏有什么关系?
参考答案:
现代博弈论和经济学中的博弈通常指人们在经济、政治、军事等活动中的策略选择,特别是在有各种交互作用、策略互动条件下的策略选择和决策较量。游戏则是指日常生活中的下棋打牌、赌胜博彩,以及田径、球类等各种体育比赛。因此博弈和游戏之间当然是有明显区别的。但博弈和游戏之间其实也有重要的联系,因为博弈与许多游戏之间在本质特征方面有相同的特征:(1)都有一定的规则;(2)都有能用正或负的数值表示,或能按照一定的规则折算成数值的结果;(3)策略至关重要;(4)策略和利益又相互依存性。正是因为存在这些共同的本质特征,因此从研究游戏规律得出的结论可用来指导经济政治等活动中的决策问题,或者把这些决策问题当作游戏问题研究。因此博弈在一定程度上可以理解成就是游戏。其实“博弈”的英文名称“Game”的基本意义就是游戏。
现实中“囚徒的困境”类型的问题是很多的。例如厂商之间价格战、恶性的广告竞争,初中、中等教育中的应试教育等,其实都是“囚徒的困境”博弈的表现形式。
a)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示该博弈并作简单分析。
b)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示并简单分析。
参考答案:
a) 由于老板在决定是否克扣工资欠可以完全清楚工人是否偷懒,因此这是一个动态博弈,而且是一个完全信息的动态博弈。此外,由于双方都有关于得益的充分信息,因此只是一个完全且完美信息的动态博弈。该博弈用扩展形表示如下:
补充习题:
1.判断下列叙述是否正确,并作简单分析。
a)囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
b)合作博弈就是博弈方采取互相合作态度的博弈。
参考答案:
a)错误。结论恰恰相反,也就是囚徒的困境博弈中两囚徒之所以处于困境,根源正是因为两囚徒很在乎坐牢的绝对时间长短。此外,我们已开始就假设两囚徒都是理性经济人,而理性经济人都是以自身的(绝对)利益,而不是相对利益为决策目标。
第一章复习题
2,4,5,6,7
第一章参考答案
2、设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。如果设定博弈模型时不专门设定后两个方面,就是隐含假定是完全、完美信息和完全理性的非合作博弈。
0.9×(0.35×300+0.65×0)=0.9×105=94.5<100
因此也会选择不开。
(e)如果我是风险偏好的,那么因为开的期望收益为:
1.2×(0.35×300+0.65×0)=1.2×105=126>100
因此这时候肯定会选择开。
10、首先需要注意的是,在该博弈方的得益单位不同,逃犯得到的是增加或者减少的刑期(年),而看守得到的则是奖金(元),因此除非先利用效用概念折算成相同的单位,否则两博弈方的得益相互之间不能比较和加减。
直接采用单位不同的得益,该博弈的得益矩阵如下:
看守
路线一路线二
-10,1000
10,0
10,0
-10,1000
逃路线一
犯路线二
该博弈的扩展形表示如下:
根据上述得益矩阵和扩Hale Waihona Puke Baidu形不难清楚,该博弈中两博弈方的利益是对立的。虽然由于两博弈方得益的单位不同,相互之间得益无法相加,因此无法判断是否为零和博弈,但两博弈方关系的性质与猜硬币等博弈相同,也是对立的。因此,该博弈同样没有两博弈方都愿意接受的具有稳定性的策略组合,两博弈方最合理的策略都是以相同的概率随机的选择路线。
5、首先可根据博弈方的行为逻辑,是否允许存在有约束力协议,分为非合作博弈和合作博弈两大类。
其次可以根据博弈方的理性层次,分为完全理性博弈和有限理性博弈两大类,有限理性博弈就是进化博弈。
第三是可以根据博弈过程分为静态博弈、动态博弈和重复博弈三大类。
第四是根据博弈问题的信息结构,根据博弈方是否都有关于得益和博弈过程的充分信息,分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈和不完全信息动态博弈几类。
3.一个工人给一个老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于50元的负效用,老板想克扣工资则总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒是老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况使双方都知道的。请问
第五是根据得益的特征分为零和博弈、常和博弈和变和博弈。
第六是根据博弈中博弈方的数量,可将博弈分为单人博弈、两人博弈和多人博弈。
第七是根据博弈方策略的数量,分为有限博弈和无限博弈两类。
9、(a)根据问题的假设,该博弈的得益矩阵和扩展形表示分别如下:
自然
赚(35%)亏(65%)
300
0
100
100
开
我
不开
根据上述得益情况可以看出,在该博弈中偷懒对工人总是有利的,克扣对老板也总是有利的,因此在双方都只考虑自己的利益最大化的情况下,该博弈的通常结果应该是工人偷懒和老板克扣。
(b)如果我是风险中性的,那么根据开的期望收益与不开收益的比较:
0.35×300+0.65×0=105>100
肯定会选择开。
(c)如果成功的概率降低到0.3,那么因为这时候开的期望收益与不开的收益比较:
0.30×300+0.70×0=90<100
因此会选择不开,策略肯定会变化。
(d)如果我是风险规避的,开的期望收益为:
b)不正确。合作博弈在博弈论中专门指博弈方之间可以达成和运用有约束力协议限制行为选择的博弈问题,与博弈方的态度是否合作无关。
2.博弈与游戏有什么关系?
参考答案:
现代博弈论和经济学中的博弈通常指人们在经济、政治、军事等活动中的策略选择,特别是在有各种交互作用、策略互动条件下的策略选择和决策较量。游戏则是指日常生活中的下棋打牌、赌胜博彩,以及田径、球类等各种体育比赛。因此博弈和游戏之间当然是有明显区别的。但博弈和游戏之间其实也有重要的联系,因为博弈与许多游戏之间在本质特征方面有相同的特征:(1)都有一定的规则;(2)都有能用正或负的数值表示,或能按照一定的规则折算成数值的结果;(3)策略至关重要;(4)策略和利益又相互依存性。正是因为存在这些共同的本质特征,因此从研究游戏规律得出的结论可用来指导经济政治等活动中的决策问题,或者把这些决策问题当作游戏问题研究。因此博弈在一定程度上可以理解成就是游戏。其实“博弈”的英文名称“Game”的基本意义就是游戏。