212年秋季博弈论课程作业

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

212年秋季博弈论课程作业

学院:数计学院11级

专业:信息管理与信息系统

学号:111303014

姓名:魏雅雯

1.博弈有哪些分类方法,有哪些主要的类型?并分别给出例子加以说明。

2.举一个你在现实生活中遇到的囚徒两难困境的例子。(要求给出说明)

3.

4.划拳博弈:两个朋友在一些划拳喝酒在一些划拳喝酒,每个人有四个纯战略,

杆子、老虎、鸡和虫子。输赢规则是:杆子降老虎,老虎降鸡,鸡降虫子,虫子降杆子。两个人同时出令如果一个打败另一个人赢者的效用为1,输者的效用为-1,否则效用为0。给出以上博弈的战略式描述并求出所有的纳什均衡。

5.学生与修表师傅间的博弈。一个学生的瑞士手表坏了,他到博士商店找到修

表师傅。修表师傅告诉他其中一个配件坏了,需要花30元修理费。但是学生私下得知:如果是付给他换的是进口配件,那么师傅要花20元成本费(包括购买配件和劳动成本);而如果换的是国产件,他只需花15元成本。如果是进口配件,学生手表便可以正常使用,他得到的净收益(扣除30元成本)换算为10元货币;如果换的配件是国产的,则不匹配手表性能,尽量表面上无法识别,但是会损坏其他手表配件,此时学生得到的净支付(扣除30元成本)为-10元。这个博弈可以看做是两个阶段的。在第一阶段,学生决定是否信任该修表师傅。如果学生选择不信任,那么他不会在博实修表双方净支付都为0;如果选择信任,他将付给该师傅30元。此后,修表师傅有两种选择,即选择提供高质量的进口配件或者低质量国产配件。

1)通过计算,请写出该博弈的扩展形式extensive form即博弈树。

2)给出该博弈的纳什均衡。(不信任,提供国产件)

解答:

1.博弈论分类方法:

(1)第一个角度是按照参与人的先后顺序进行分类。从这个角度,博弈可以划分为静态博弈和动态博弈。静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动。动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。(2)第二个角度是按照参与人对其他参与人的了解程度进行分类。从这个角度,博弈可以划分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息,在这种情况进行的博弈就是不完全信息博弈。

(3)第三个角度是按照参与人之间是否合作进行分类。从这个角度,博弈可以划分为合作博弈和非合作博弈。合作博弈是指参与人之间有着一个对各方具有约束力的协议,参与人在协议范围内进行的博弈。反之,就是非合作博弈。典型的合作博弈是寡头企业之间的串谋。串谋是指企业之间通过公开或暗地里签订协议,对各自的价格或产量进行限制,以达到获取更多垄断利润的行为。非合作博弈可以得到四种不同的类型:完全信息静态博弈、纳什均衡完全信息动态博弈论、子博弈精炼纳什均衡不完全信息静态博弈、贝叶斯纳什均衡不完全信息动态博弈、精炼贝叶斯纳什均衡。

1、完全信息静态博弈

“完全信息静态博弈”,所谓完全星系,是指局中人对于对方的战略和各自的支付是清楚的。“囚徒困境”说的是,加以两个人入室抢劫,未果,但在房子里,发现有人被杀,因而两人被捕入狱。警察为了尽快破案交差,诱使他们交代罪行,把他们隔离开进行询问,并给他们讲明了“政策”:

如果两个人都坦白杀了人,各判8年;如果一个坦白一个抵赖,抵赖的人入狱10年;如果都抵赖,则因入室抢劫各判2年。

甲和乙叫博弈的局中人,坦白和抵赖是局中人的策略。先看甲,甲怎么行动,要看乙怎么行动。如果乙选择坦白,甲的最佳策略当然是坦白,因为坦白被判8年,抵赖则是10年;如果乙抵赖,甲的最佳策略是什么?还是坦白,因为坦白就可以放出去,而抵赖则是要判2年。所以,对甲来说,不论乙如何选择,他的最佳策略是坦白。再看乙,乙和甲是完全对称的,没有区别,,所以不管甲

怎样选择,一的最佳策略也是坦白。因此,最后结果就是都坦白,各判8年。各判8年,一共16年,对他们这个集体来说,是最差的结果。

亚当斯密的“看不见的手”的学说,是每个人都从自己的利益最大化出发去做事,结果对别人来说是最好的,可是囚徒困境恰好相反。记住,这个时候,每个人都还在追求自己利益的极大化。这就是个人理性与集体的矛盾。矛盾的原因,在于双方的信息不对称,甲乙都不知道对方的选择,或者说是静态,如果是反复博弈,则下一次一定都会选择抵赖。完全信息静态博弈的结果,就叫“纳什均衡”。

2、完全信息动态博弈

“完全信息动态博弈”。动态就是说,博弈的一方行动在先,另一方可以根据先做出决策者的决定、调整自己的策略。

比如,三国时期,魏蜀吴三国就形成了相互牵制的局面,类似于经济学中的寡头,任何一方如何行动,都要看另外两方的反应。《三国演义》第三十三回“曹丕乘乱纳甄氏郭嘉遗计定江东”里写道,官渡之战后,袁绍的两个儿子——次子袁熙和柚子袁尚,在河北战败后,逃往辽东,即今日的锦州一带。曹操发扬“宜将剩勇追穷寇”的精神,在后猛追。辽东的太守公孙康问手下怎么办。手下说,我们得先观察一下,如果曹操追到辽东,就要先于他们弟兄联合,把曹操先打跑了,在收拾他们两个;如果曹操没有追来,则先下手为强,把二人当即解决掉。这是一个完全信息博弈,因为博弈的各方(现在是三方)都知道,或者应该知道对方的策略或者支付。

但是这个博弈是动态的,因为曹操的行为在先,公孙康的行为在后。要紧的是小心奥应该怎样决策。这是一出好戏,习得者教师曹操的四大谋士之一:郭嘉。其实,郭嘉因为生病留在易州,即现在的河北易县养病。他在死前给曹操写了一封信,信中说“今闻袁熙、袁尚往投辽东,明公切不可加兵。公孙康久畏袁氏吞并,二袁投往必疑。若以兵击之,必并力迎敌,急不可下;若缓之,公孙康、袁氏必自相图,其势然也。”郭嘉说,我们不忙着追,他们双方必然互相残杀,可以左手渔翁之利。这是很高明的战略,这封信时郭嘉死后才到曹操手里的,所以叫“遗计定辽东”。郭嘉可谓博弈论高手。

3、不完全信息静态博弈

“不完全信息静态博弈”,即信息是不完全的,博弈的各方都有一些信息,是自己知道而别人不知道的。

比如你遇到一个号称武林高手的人,你要不要跟他过招,就要判断自己的功力与对手相比如何。假定对方真是一个高手,比你强,你跟他较量,他将获胜,他的支付是100,你是-100;假如他不是真的高手,你的功力比他强,则如果你们较量,你将获得100,他的支付是-100;假如你们不较量,则双方的支付都是零。海萨尼主要的工作就是研究这类问题,海萨尼假设博弈各方知道对方的类型有哪些,并且知道这类型的概率分布,也就是说,虽然我不知道对方是不是真的高手,但是我知道对方是方是高手的概率是多少,对方也知道我知道这一点。这时候我们就需要计算不同行动的数学期望,也就是不同类型下概率与支付乘积的和。比如,如果你决定与对方过招,你不知道对方是不是高手,但是我们假定你知道对方是真正高手的概率是X,不是高手的概率就是(1-X),则你的数学期望是:X*(-100)+(1-X)*100。如果你的决策是不交手,则你的数学期望是零。如果交手的数学期望大于零,则你就应该交手,因为交手的预期结果更好些。当X 小于50%的时候,数学期望大于零。不完全信息静态博弈,一般可以有几个结果,

相关文档
最新文档