博弈模型建立
双人零和博弈
一、双人零和博弈的概念零和博弈又称零和游戏,与非零和博弈相对,是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,一方收益多少,另一方就损失多少,所以博弈各方的收益和损失相加总和永远为“零”.双方不存在合作的可能.用通俗的话来讲也可以说是:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而双方在决策时都以自己的最大利益为目标,想尽一切办法以实现“损人利己”.零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分.二、双人零和博弈的模型的建立建立双人零和博弈的模型,就是要根据对实际问题的叙述确定参与人(局中人)的策略集以及相应的收益矩阵(支付矩阵).我们记双人零和博弈中的两个局中人为A和B;局中人A的策略集为a1,…,am,局中人B的策略集为b1,…,bn;cij为局中人A采取策略ai、局中人B采取策略bj 时A的收益(这时局中人B的收益为- cij).则收益矩阵见下表表1那么下面我们通过例子来说明双人零和博弈模型的建立: 例1甲、乙两名儿童玩猜拳游戏.游戏中双方同时分别或伸出拳头(代表石头)、或手掌(代表布)、或两个手指(代表剪刀).规则是剪刀赢布,布赢石头,石头赢剪刀,赢者得一分.若双方所出相同,算和局,均不得分.试列出对儿童甲的赢得矩阵.解 本例中儿童甲或乙均有三个策略:或出拳头,或出手掌,或出两个手指,根据例子中所述规则,可列出对儿童甲的赢得矩阵见表2.表2例2 从一张红牌和一张黑牌中随机抽取一张,在对B 保密情况下拿给A 看,若A 看到的是红牌,他可选择或掷硬币决定胜负,或让B 猜.若选择掷硬币,当出现正面,A 赢p 元,出现反面,输q 元;若让B 猜,当B 猜中是红牌,A 输r 元,反之B 猜是黑牌,A 赢s 元.若A 看到的是黑牌,他只能让B 猜.当B 猜中是黑牌,A 输u 元,反之B 猜是红牌,A 赢t 元,试确定A 、B 各自的策略,建立支付矩阵.解 因A 的赢得和损失分别是B 的损失和赢得,故属二人零和博弈.为便于分析,可画出如图3的博弈树图.图3中,○为随机点,□分别为A 和B 的决策点,从图中看出A 的策略有掷硬币和让B 猜两种,B 的策略有猜红和猜黑两种,据此可归纳出各种情况下A 和B 输赢值分析的表格,见表4.图3抽到红牌正面反面抽到黑球○□□○□1/2掷硬币让B 猜1/21/2猜红猜黑猜黑猜红1/2让B 猜p-q-rst-u表4对表4中各栏数字可以这样来理解:因让A 看到红牌时或掷硬币或让B 猜.若A 决定选掷硬币这个策略,当出现正面,这时不管B 猜红或猜黑,A 都赢p 元;当出现反面,不管B 猜红或猜黑,A 都输q 元.同样A 选择让B 猜的策略后,他的输赢只同B 猜红或猜黑有关,而与掷硬币的正反面无关.又若抽到的牌是黑牌,A 的决定只能让B 猜,因而掷硬币策略对A 的胜负同样不起作用.考虑到抽牌时的红与黑的概率各为1/2,掷硬币时出现正反面的概率也各为1/2,故当A 采取“掷硬币”策略,而B 选择“猜红”策略时,A 的期望赢得为:⎪⎭⎫ ⎝⎛-q p 212121+t 21=()t q p 241+- 当A 采取让B 猜策略,B 选择“猜红”策略时,A 的期望赢得为:()()⎪⎭⎫ ⎝⎛-+-r r 212121+t 21=()t r +-21 相应可求得其他策略对A 的期望赢得值.由此可列出本例的收益矩阵,见表5.表5三、双人零和博弈的求解定理1(极小极大定理)在零和博弈中,对于给定的支付矩阵U ,如果存在混合战略1σ*=(1σ*1,…1σ*m )和2σ*=(2σ*1,…2σ*n )以及一个常数v 满足,对任意j 有∑=mi i ij a 11*σ≥v ,对任意的i 有∑=nj j ij a 12*σ≤v ,那么战略组合(1σ*,2σ*)为该博弈的Nash 均衡.其中,v 为参与人1在均衡中所得到的期望支付,亦称该博弈的值.这个极小极大定理,其基本思想就是:参与人1考虑到对方使自己支付最小的最优反应,从中选择使自己最好的策略.参与人2也遵循同样的思路,这样才能满足Nash 均衡的互为最优反应的条件.这样我们就可以得到双人零和博弈Nash 均衡的计算方法了,如以下定理定理2 对于给定的零和博弈,如果博弈的值v 大于0,则博弈的Nash 均衡(1σ*,2σ*)为以下对偶线性规划问题的解Min ∑=mi i p 1s.t. ∑=mi i ij p a 1≥1 (j=1,…,n)i p ≥0 (i=1,…,m) 和Max ∑=nj j q 1s.t. ∑=nj j ij q a 1≤1 (i=1,…,m)j q ≥0 (j=1,…,n) 其中,Nash 均衡支付∑∑====nj jmi iqpv 1111Nash 均衡战略),,,,(1*1m i vp vp vp =σ,),,,(1*2n j vq vq vq =σ由于此定理只适用于v 大于0的情形,因此对于v 小于等于0的情形,该定理所给出的方法需做适当的修改.命题 如果支付矩阵U=mxn ij a )(的每个元素都大于0,即ij a >0,那么博弈的值大于0,即v >0.定理3 如果支付矩阵U '=mxn ij a )('是由U=mxn ij a )(的每个元素都加上一个常数c 得到,即c a a ij ij +=',那么支付矩阵U 和U '所对应的零和博弈的Nash 均衡战略相同,博弈的值相差c.根据以上定理,可以得到如下求解一般零和博弈Nash 均衡的方法:(1) 若支付矩阵U 中的所有元素都大于零,则可以直接根据定理进行计算;若支付矩阵U 中有小于0的元素,可以通过加上一个常数使它们都大于0,然后再根据定理进行计算. (2) 求解定理中的两个对偶线性规划问题.下面通过实例来说明如何求解双人零和博弈的Nash 均衡.例3 求解下图中战略式博弈的Nash 均衡. 参与人2L M RU参与人1 C D通过求解对偶线性规划问题求零和博弈的Nash 均衡解 根据前面的介绍,可知该博弈的支付矩阵为U=⎪⎪⎪⎭⎫ ⎝⎛224132312不难发现,该博弈的支付矩阵U=()33x ij a 的每个元素都大于0,即ij a >0,那么博弈的值大于0,即v>0.设参与人1和参与人2的混合战略分别是1σ=(321,,vp vp vp )和2σ=(321,,vq vq vq ),利用对偶线性规划求解方法求解该战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++}s.t. 321422p p p ++≥1 32123p p p ++≥1 32123p p p ++≥1 1p ≥0,2p ≥0,3p ≥0 和Max {321q q q ++}s.t. 32132q q q ++≤1 32132q q q ++≤1 321224q q q ++≤1 1q ≥0,2q ≥0,3q ≥0求解第一个规划问题,得到1p =1/4, 2p =1/4, 3p =0,参与人1的支付v=2.因此,参与人1的混合战略1σ*=(1/2,1/2,0).同理,对对偶问题求解,得到1q =0,2q =1/4, 3q =1/4,参与人2的损失v=2,因此参与人的混合战略2σ*=(0,1/2,1/2).所以,该博弈存在一个混合战略Nash 均衡((1/2,1/2,0)(0,1/2,1/2),).例4 求解下图中的战略式博弈的Nash 均衡.参与人2L M R U 参与人1 C D通过求解对偶线性规划问题求零和博弈的Nash 均衡解 该博弈的支付矩阵为U=⎪⎪⎪⎭⎫ ⎝⎛--203011122 在上树支付矩阵U=33)(x ij a 中,12a <0, 21a <0.为了利用对偶线性规划模型求解博弈的解,构造支付矩阵U '=33')(x ij a ,其中a 'ij=ij a +c.令c=2,那么新构造的支付矩阵为U '=⎪⎪⎪⎭⎫ ⎝⎛425231304 设参与人1和参与人2的混合战略分别是1σ=(v 'p 1, v 'p 2, v 'p 3)和2σ=(v 'q 1, v 'q 2 v 'q 3,),v 为原博弈的值,v '为新博弈的值,且v '=v+2,利用对偶线性规划求解方法求解新战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++} s.t. 32154p p p ++≥13223p p +≥1 321423p p p ++≥11p ≥0, 2p ≥0, 3p ≥0Max {321q q q ++}s.t. 3134q q +≤1 32123q q q ++≤1 321425q q q ++≤1 1q ≥0,2q ≥0,3q ≥0通过求解对偶问题,得到1p =0,2p =3/13, 3p =2/13,参与人1的支付v '=13/5, 1q =1/13, 2q =4/13, 3q =0,参与人2的损失v '=13/5.因此,参与人1的混合战略1σ*=(0,3/5,2/5), 参与人2 的混合战略2σ*=(1/5,4/5,0),原博弈的值v= v '-2=3/5.所以,博弈存在一个混合战略Nash 均衡((0,3/5,2/5),(1/5,4/5,0)).。
合作博弈模型
合作博弈模型合作博弈模型是一种数学模型,应用于多个人或组织协作完成某个任务的过程中。
该模型可以用于解决合作双方的决策问题,帮助确定最优的合作策略。
下面,我们将分步骤阐述合作博弈模型。
第一步,建立合作博弈模型。
在建立合作博弈模型时,需要确定问题的目标、期望结果和参与方的类型等。
例如,双方需要协作完成某个任务,目标是得到最高的收益,期望结果是发现最佳的共同利益点,参与方的类型包括决策者和普通成员等。
第二步,设计合作方案。
在设计合作方案时,需要考虑各个参与方的需求、要求和意见,以及合作过程中可能遇到的问题。
例如,在双方合作完成某个项目时,需要确定时间、资源、人力等具体合作方案,协商如何分配各项资源,协商可能的决策方案等。
第三步,确定收益分配模式。
在合作博弈模型中,收益分配模式是最重要的一部分。
确定合理的收益分配模式可以保证双方的利益最大化,同时也可以减少出现合作失败的风险。
例如,在双方协作完成某个项目后,可以根据项目的贡献度,协商如何划分收益,让各方得到公正的回报。
第四步,实施和监控合作方案。
在确定好具体的合作方案和收益分配模式后,需要开始实施和监控。
实施阶段需要严格按照合作方案执行,并根据需要调整。
监控阶段需要及时发现和解决合作中出现的问题,保证合作过程的顺利进行。
综上所述,合作博弈模型可以帮助决策者确定最优的合作策略,并在合作过程中保护各方的利益。
同时,合作博弈模型也可以提高合作效率,减少合作失败的风险。
因此,在实际应用中,合作博弈模型得到了广泛的应用。
博弈论基本模型
U : Z R n , U ( z ) (u1 ( z ),u 2 ( z ), , u n ( z )), z Z
5. 信息集与信息集分割 信息集由同一个局中人、在相同的时点上的具有相同信息 的决策节点组成。用 I ik (i 0,1,2, , n, k 0,1,2, , ri )表示局中 人i的第k个信息集。它满足 I (1) ik ( 表示空集); (2)从博弈起始点到任一终点的路径至多与 I ik 交一点 (描写同一信息集中的节点处于同一时点上); (3)从 I ik 中的任一节点出发,局中人i可能选择的行动集 合都相同(因为局中人在同一信息集的不同节点上具有相 同的信息)。 在博弈树上,将属于同一信息集的节点用虚线框在一起。 称 I i {I i1 , I i 2 , ,I ir } 为局中人 i( 0,1,2, , n) 的信息集类(在数 学上,称以集合为元素的集合为类)。 称 I {I 0 , I1 , I 2 , ,I n } 为信息集分割。
为什么学习?
从学习中获得心灵的提高,获得心灵的享受。 学习,其实就为自己创造一个美丽的心灵世界的过程。 有人说,我也没什么追求,就学一点实用知识就行,但问题是, 你没有那些“无用”的知识,你怎么驾驭哪些实用的知识呢? “世人只知有用之用,而不知无用只用”。 很多人30岁后就不再读书,到60岁还是30年前的思维;很多人感 慨“现在一读书就头痛”;农村现在不要为生存而挣扎了,那做 什么呢?“我不打牌又做什么呢?” 每个人都生活在现实的物质世界和心灵的精神世界中,但很多人 只知现实世界的繁华,却不知心灵世界的清新和高远。行万里路、 读万卷书,就是为追求心灵世界。这些年我深刻体会到:生活的 基础是衣食住行,但生活的重点在于文化和精神。我不知道文化 有什么用,我只知道一个人没有了文化还有什么用呢? 教师的功能:催化剂(使学生更快速更深入地学习) 大医医心:能医心者,才是大医。
数学建模博弈模型
博弈模型在实际问题中的应用前景
政策制定
01
利用博弈模型分析政策制定中的利益关系和策略选择,为政策
制定提供科学依据。
企业竞争策略
02
利用博弈模型分析企业竞争中的策略选择和预期行为,为企业
制定合理的竞争策略。
国际关系
03
利用博弈模型分析国际关系中的利益关系和冲突解决机制,为
国际关系管理提供理论支持。
THANKS
猎鹿博弈
总结词
描述两个猎人合作与竞争的关系,揭示了合作与背叛的平衡。
详细描述
在猎鹿博弈中,两个猎人一起打猎,猎物可以平分。如果一个猎人选择合作而另一个选择背叛,则背叛者可以独 吞猎物。但如果两个猎人都不合作,则都没有猎物可吃。最佳策略是合作,但个体理性可能导致两个猎人都不合 作,造成双输的结果。
03
智猪博弈
总结词
描述大猪与小猪在食槽竞争中的策略,揭示了合作与竞 争的平衡。
详细描述
在智猪博弈中,一个大猪和一个小猪共同生活在一个猪 圈里。每天都有一桶食物放在食槽中,大猪和小猪需要 竞争才能吃到食物。如果大猪和小猪同时到达食槽,大 猪会因为体型优势占据更多食物。但如果小猪先到食槽 等待,大猪到来时已经没有食物可吃。最佳策略是小猪 等待,大猪先吃,然后小猪再吃剩下的食物。
博弈模型的基本要素
参与者
在博弈中作出决策和行动的个体或组织。
策略
参与者为达到目标而采取的行动或决策。
支付
参与者从博弈中获得的收益或损失。
均衡
在博弈中,当所有参与者都选择最优策略时,达到的一种稳定状态。
博弈模型的建立过程
策略空间
确定每个参与者的所有可能采 取的策略。
均衡分析
通过分析收益函数和策略空间 ,找出博弈的均衡点。
第1章博弈论基本模型
为什么学习?
从学习中获得心灵的提高,获得心灵的享受。
学习,其实就为自己创造一个美丽的心灵世界的过程。
有人说,我也没什么追求,就学一点实用知识就行,但问题是, 你没有那些“无用”的知识,你怎么驾驭哪些实用的知识呢? “世人只知有用之用,而不知无用只用”。
很多人30岁后就不再读书,到60岁还是30年前的思维;很多人 感慨“现在一读书就头痛”;农村现在不要为生存而挣扎了,那 做什么呢?“我不打牌又做什么呢?”
齐 田忌策略:
上马 ∨
中马 ∨
下马 ∨
田
上马
中马
下马
结 果:
田忌将军每次输掉三千金
谋士孙膑 策略:
结 果:
齐
上马
中马
下马
∨
∧
∧
田
下马
上马
中马
田忌将军胜二负一赢一千金
博弈论的创立与发展
2、博弈论的发展阶段 第一阶段:萌芽期(20世纪40年代前)。利益冲突的研究是分散和初
步的、带有很大程度的随意性。 孙子兵法:古诺(Cournot,1883)—古诺的“双寡头垄断”模型;艾
专业学习:谋职、谋生(身无长物、何以生存)。 事理学习:明白事理、懂得分析生活中的很多问题。(崔琦:
明白这个世界是一个什么样子,这很重要)。一个人,其实只 要懂得了加减乘除四则运算,就可以挣到钱买房买车,在物质 世界中生活的很好。但这只是像一个盲人一样在生活,“春天 来了,但我却看不到” 。(明明德) 人生学习:充实人生、提高人生的境界、把学习融入人的生活 中。人不是做事和挣钱的工具,而是宇宙中的有血有肉的生灵, 需要提高生活的趣味,享受趣味化的人生,这就需要学习。一 个人,不会欣赏《二泉映月》,不会感受过禅宗的静谧,从来 也不思考什么是天行健,好像也是在生活。看看很多人下班后 在做什么?打牌、或者歌厅洗脚房等,当衣食住行解决了之后, 就不知怎么过了,只有赌博和玩乐,却找不到真正的趣味。 (身体在成长、心灵也在成长吗?)(新民) 仰望星空
博弈模型需求及设计思路
博弈论之需求及设计思路
一、需求
市场上的服务提供商之间是存在竞争关系的,但是相互之间是无法获知其他服务提供商的提供的服务数量,所以就不能知道自己是否处在竞争的有利位置,通过这个模型可以在保证服务提供商的既定的利益的情况下寻找到对自己竞争更有利且合理的提供服务的数量。
这样该服务提供商可以使用这个模型获得相关数据,可以在竞争中处于有利地位。
二、设计思路
假设市场上有A、B两个服务提供商要求提供服务;他们共同面临的市场的需求是线性的,A、B两个服务提供商都准确地了解市场的需求曲线;A、B两个服务提供商都是在已知对方提供的服务数量的情况下,各自确定能够给自己带来最大利润的提供的服务数量,即每一个服务提供商都是消极地以自己的提供的服务数量去适应对方已确定的提供的服务数量。
设市场需求函数为:
其中p1和p2分别是两个服务提供商的提供的服务数量。
假设两服务提供商的成本函数相同,都为C=c0p(p为提供的服务数量),则服务提供商1在预测服务提供商2的提供的服务数量为p2的情况下,寻求使自己利润最大化的最优提供的服务数量p1,即
上面优化模型中的最优解的p1显然是p2的函数p1=f(p2);
同样服务提供商2在以预测服务提供商1的提供的服务数量为P1的情况下,寻求使自己利润最大化的最优提供的服务数量p2,即
上面的优化模型中的最优解p2显然是p1的函数p2=g(p1);
同时满足下面方程的(p1,p2)称为古诺平衡,即双方的提供的服务数量达到了平衡点:
根据最优化条件可以得到均衡时:。
信号传递博弈模型
信号传递博弈模型信号传递博弈模型是一种博弈论模型,它主要研究的是当两个个体之间存在信息不对称时,如何进行决策。
这种模型被广泛应用于经济学、政治学、社会学等领域。
下面我们来详细地探讨一下这种模型的具体步骤:第一步:建立模型在建立模型的时候,需要确定参与者以及他们之间的关系。
通常有两个参与者,分别是信息获取者和信息提供者,他们之间存在着信息不对称的情况。
此外,还需要明确参与者的策略集和效用函数。
第二步:信息的传递过程在信息的传递过程中,信息的提供者需要利用某种方式向信息的获取者传递信息,而这些信息通常是存在不确定性的。
在信息传递过程中,双方可以采取不同的决策手段,对对方的决策产生影响。
第三步:信息的处理在信息传递之后,获取者会对所接收到的信息进行评估和处理,然后决定自己的行动方式。
这一步通常涉及到一些决策规则和信息的筛选机制,以此确保最终的决策是有层次的、合理的。
第四步:行动和策略选择在处理完信息之后,获取者将会根据自己的判断选择合适的策略并执行相应的行动。
同时,信息提供者也会根据获取者的反应和行动做出相应的调整,以达到其自身利益的最大化。
第五步:结果分析在模型执行完毕之后,需要对整个过程进行分析和评估,以便得出相应的结论。
通常情况下,结果分析会涉及到效用函数分析、稳定性分析等内容,以确保模型的具体输出结果是可靠的、具有实际应用价值的。
综上所述,信号传递博弈模型是一种十分有用的博弈论模型,它为我们研究信息不对称时各种决策手段的效能和使用提供了重要的方法和工具。
在实际应用中,我们可以通过模型来分析行业市场中的信息不对称、政策制定中的信息传递等诸多领域,并为实际决策提供重要的参考。
博弈模型分析范文
博弈模型分析范文博弈模型分析是研究博弈论的一种方法,通过分析参与博弈的各方的利益和策略选择,来推断博弈的结果及其影响因素。
博弈模型能够帮助了解决策者的行为动机,预测博弈结果以及寻找策略的改进空间。
下面将详细介绍博弈模型分析的步骤和应用。
第一步:定义博弈参与者,即博弈的主体。
参与者可以是个人、团队、企业或国家等。
第二步:确定参与者的策略空间。
策略是参与者在博弈中可以采取的行动。
策略空间则是所有参与者可能的策略组合。
在确定策略空间时,需要考虑参与者的限制条件和能力。
第三步:建立效用函数。
效用函数是博弈参与者对不同结果和策略的偏好程度的量化表示。
通过建立效用函数,可以分析参与者的动机、目标和行为。
第四步:制定收益矩阵。
收益矩阵是对博弈参与者在不同策略组合下可能的收益或成本进行展示的矩阵。
收益矩阵可以帮助分析博弈参与者选择不同策略的概率。
第五步:找到均衡解。
均衡解是指在博弈中不存在任何参与者可以改变自己的策略来获得更好收益的状态。
常见的均衡概念包括纳什均衡、帕累托最优解等。
通过寻找均衡解,可以预测博弈的结果和可能出现的情况。
1.经济领域:博弈模型可以应用于市场竞争、定价策略、合作与竞争等经济问题的分析。
例如,博弈模型可以用于分析企业之间的定价策略,预测市场价格的稳定性,同时帮助企业制定合理的竞争策略。
2.政治领域:博弈模型可以应用于政治家、政党及国家之间的决策分析。
例如,博弈模型可以用于分析选举策略、政府决策的权衡及外交策略的选择。
3.环境领域:博弈模型可以应用于环境保护、资源分配、排放管理等环境问题的研究。
例如,博弈模型可以用于分析各方在资源分配中的决策行为,预测不同策略对环境的影响,并提出合理的管理政策。
4.决策分析:博弈模型可以应用于决策分析中,帮助决策者理解和预测各方行为,并制定最优决策策略。
例如,在商业决策中,博弈模型可以用于分析市场竞争、产品定价等问题,帮助企业做出最优的决策。
总结来说,博弈模型分析是一种重要的决策分析工具,通过对博弈参与者的动机和策略选择进行细致分析,可以帮助理解和预测博弈的结果,并为决策者提供策略改进的空间。
斯塔克伯格博弈求解顺序
斯塔克伯格博弈求解顺序斯塔克伯格博弈是一种非常有名的博弈理论,被广泛应用于各种决策问题中。
在实际应用中,我们经常需要求解斯塔克伯格博弈的解答顺序。
本文将围绕这一问题进行阐述,分步骤进行介绍。
一、简介斯塔克伯格博弈斯塔克伯格博弈是一种博弈理论模型,通常用于研究两个参与者的决策问题。
在这个模型中,每个参与者都会面临一个选择的问题,需要在不知道对方决策情况的前提下做出决策。
最终,通过计算矩阵汇总所有可能的策略,可以得到一个最优解。
二、确定参与者在求解斯塔克伯格博弈的解答顺序时,首先需要确定参与者。
这通常包括两个人,但也可能涉及更多的参与者,包括团体或组织等。
三、建立博弈模型建立博弈模型是非常关键的一步,它需要考虑多种因素,包括博弈参与者、可选策略、决策的结果以及决策的优先级等。
在建立博弈模型时,应该考虑到实际情况,并选择最能反映决策问题的博弈模型。
四、确定决策优先级在斯塔克伯格博弈中,决策的优先级非常重要。
这通常涉及到参与者的利益和目标,以及可选策略所包含的风险和机会。
当确定决策优先级时,需要考虑到这些因素,并且有一个明确的计算模型。
五、识别设置解答顺序一旦决策优先级确定下来,就可以开始识别和设置解答顺序。
这需要考虑到每个参与者所面临的选择,以及这些选择之间的可能影响。
解答顺序需要在博弈模型中进行计算,并且严格按照优先级顺序执行。
六、计算最优解最终,通过计算所有可能策略,并将它们纳入到解答顺序中,可以得到斯塔克伯格博弈的最优解。
最优解通常反映了最高利益和最小风险,并可以帮助决策者做出更明智的决策。
以上是求解斯塔克伯格博弈解答顺序的一些关键步骤。
这些步骤需要按照严格的顺序执行,以确保最终得到的最优解能够在实际决策问题中发挥最大的作用。
因此,在进行求解斯塔克伯格博弈之前,必须全面考虑所有相关因素,选择最合适的博弈模型,并严格按照计算模型进行操作。
博弈模型构建
博弈模型构建一、博弈模型的种类博弈模型可以根据不同的分类标准进行划分。
根据参与人的数量,博弈可以分为单人博弈、双人博弈和多人博弈。
根据参与人之间是否有合作的可能性,博弈可以分为合作博弈和非合作博弈。
根据信息是否完全,博弈可以分为完全信息博弈和不完全信息博弈。
此外,根据决策结构的不同,博弈还可以分为静态博弈和动态博弈。
二、博弈模型的要素一个完整的博弈模型通常包括以下要素:参与人、行动、信息、策略、支付函数和均衡。
参与人是指参与博弈的个人或组织;行动是指参与人在博弈中可以采取的行动或决策;信息是指参与人在博弈中所掌握的知识和数据;策略是指参与人在给定信息和对手策略的条件下所选择的行动方案;支付函数是指参与人在博弈中所获得的收益或效用;均衡是指博弈达到的一种状态,其中每个参与人的策略都是最优的。
三、博弈模型的建立过程建立博弈模型的过程可以分为以下几个步骤:1.确定参与人:确定博弈中的参与人,包括个人、组织、国家等。
2.确定行动空间:确定每个参与人在博弈中可以选择的行动或决策。
3.确定信息集:确定每个参与人在博弈中所掌握的知识和数据,即每个参与人的信息集。
4.确定策略空间:在给定信息和对手策略的条件下,确定每个参与人可以选择的行动方案,即每个参与人的策略空间。
5.确定支付函数:根据各方的利益关系及均衡结果,为每个参与人设定一个效用水平,并使各方的支付函数相互制约、相互影响。
6.寻找均衡:通过逻辑推理和分析,找出均衡状态,即每个参与人的最优策略组合。
7.评估和比较:对不同均衡状态下各方的收益进行评估和比较,以选择最有利的策略组合。
8.调整和优化:根据实际情况和需要,不断调整和优化模型参数和假设条件,以提高模型的预测准确性和应用价值。
四、案例研究:公共资源博弈模型公共资源博弈是一种典型的资源分配博弈,其中资源是公共的,所有参与者都可以使用这些资源来最大化自己的利益。
然而,如果每个参与者都只考虑自己的利益,就可能会导致资源的过度使用和破坏。
第十一章博弈模型
• 用u1(a1,a2)表示对盟军产生的结果,即净胜场次, 称为盟军的效用函数.
盟军 德军 强化缺口 原地待命
向西进攻 盟军胜1场 盟军胜2场
向东撤退 无战斗 无战斗
1 0 M {mij}32 2 0
支付矩阵 2 1
东进 盟军败2场 盟军胜1场 (Payoff Matrix)
完全竞争: 零和博弈 (常数和博弈) u2(a1,a2)对应 –M
习题
• P411 ex1,ex3
11.5 效益的合理分配(合作对策)
例 甲乙丙三人合作经商,若甲乙合作获利7元, 甲丙合作获利5元,乙丙合作获利4元, 三人合作获利11元. 又知每人单干获利1元. 问三人合作时如何分配获利?
记甲乙丙三人分配为
x (x ,x ,x ) 123
x1 x2 x3 11
解不唯一
x1 x2 7 x1 x3 5
(5,3,3) (4,4,3)
x2 x3 4
(5,4,2)
x1, x2 , x3 1
……
怎样分配 更合理?
(1) Shapley合作对策
集合I {1,2, , n} 子集s I,实函数v(s)满足
v( ) 0 v(s1 s2 ) v(s1 ) v(s2 ), s1 s2
sSi (n s )!( s 1)!
1
w( s )
n!
nC|s|1
n1
s~子集 s中的元素数目, Si ~包含i的所有子集
[v(s) v(s \ i)] ~ i 对合作s 的“贡献” (i s)
w( s ) ~由s决定的“贡献”的权重
权重构成:|s|可能取值1~n, 先按此n等分;|s|=k的含有i的子
集个数有
C k 1 n 1
博弈模型要素
博弈模型要素
博弈模型是用于描述在策略互动中理性参与者如何决策的数学框架。
其构成要素主要包括以下几个方面:
参与者(Players):博弈中的决策主体,他们可以是个人、组织或国家等。
每个参与者都有自己的利益和目标,并会根据自己的利益和目标进行决策。
策略(Strategies):参与者可选择的行动方案,策略的选择直接影响到参与者的收益。
每个参与者都有自己的策略集,即可以选择的所有策略的集合。
信息(Information):参与者在进行决策时所依赖的知识,包括关于其他参与者身份、策略和历史数据等方面的知识。
信息的完整性、准确性和及时性对博弈的结果具有重要影响。
收益(Payoffs):参与者从博弈中获得的利益或损失。
收益通常取决于参与者的策略选择以及对手的策略。
在非零和博弈中,各方的收益之和可能大于或小于零,体现了各方利益的相互影响。
结果(Outcome):博弈结束时各方的状态和利益分配情况。
每个结果都对应于一定的策略组合,是所有参与者策略选择的综合体现。
均衡(Equilibrium):当所有参与者都选择最优策略,并且该策略组合不再发生变化时,就达到了博弈的均衡状态。
均衡是博弈分析的重要概念,它描述了在给定他方策略的情况下,每个参与者的最优选择。
理解这些要素是建立和分析博弈模型的基础,有助于深入理解不同策略和信息条件下参与者的行为模式和博弈结果。
交叉相遇态势下船舶避碰的展开式博弈决策方法
交叉相遇态势下船舶避碰的展开式博弈决策方法交叉相遇态势下的船舶避碰问题是海上交通安全中非常重要的问题,因此需要采用一种科学合理的展开式博弈决策方法。
在本文中,将会详细介绍交叉相遇态势下船舶避碰的展开式博弈决策方法,包括博弈模型的建立、决策者的行为动机、策略的选择和结果展示等方面,以期更好地解决该问题。
一、博弈模型建立在交叉相遇态势下,两艘船舶的避碰问题可以建立一个双人庄家非零和博弈模型,其中双方分别是船舶A和船舶B。
庄家表示船对之间的先后顺序,即首先是A进行决策,然后是B,所以A是庄家。
此时,庄家获取其作为一方能够获取到的最大利益作为收益。
二、决策者的行为动机在船舶避碰的问题中,船舶A和船舶B的行为动机是相似的。
如果两个船舶都采用相同的策略,那么两者将会发生相撞,带来严重的安全风险和经济损失。
因此,双方的行为动机是避免相撞,保证自己的安全,同时尽可能地获取最大的经济效益。
三、策略的选择船舶避碰的问题中,每个船舶可以选择不变速、减速或加速三种策略。
对于每个船舶,它必须选择一种策略,以最大化自己的收益。
在具体的决策中,可以如下考虑:1. 当两艘船舶都选择不变速时,两者即将相撞,必须采取行动才能避免碰撞。
2. 当一艘船舶减速时,需要选择速度大于相对速度(即另一艘船舶的速度)的速度。
这样,相对移动速度将减小,从而减少实际距离。
3. 当一艘船舶加速时,则需要选择速度小于相对速度的速度,以增加相对移动速度,从而避免碰撞。
四、结果展示对于交叉相遇态势下船舶避碰的问题,可以通过使用最小达令伯格值方法(MDP)来得出最优方案,从而保证最小的安全风险和最大的经济利益。
MDP是一种典型的决策树算法,能够在同时考虑不同决策和决策因素的情况下,给出最优决策方案。
可以通过解决MDP问题,得到一个最优的策略,以最大化自己的收益,同时保证相对安全。
最后,将该策略应用于实际的船舶操作中,即可实现交叉相遇态势下的船舶避碰。
综上所述,交叉相遇态势下船舶避碰的展开式博弈决策方法主要包括博弈模型的建立、决策者的行为动机、策略的选择和结果展示等方面。
bertrand博弈模型
bertrand博弈模型(实用版)目录1.Bertrand 博弈模型的概述2.Bertrand 博弈模型的基本假设3.Bertrand 博弈模型的类型4.Bertrand 博弈模型的应用5.Bertrand 博弈模型的局限性正文【1.Bertrand 博弈模型的概述】Bertrand 博弈模型是一种由法国数学家 Bertrand 提出的用于解决寡头垄断市场中价格竞争问题的博弈模型。
在寡头垄断市场中,只有几家企业控制着整个市场的供给,因此企业之间的竞争策略会直接影响市场价格和销售量。
Bertrand 博弈模型就是在这种背景下,通过分析企业间的竞争行为,来预测市场价格的变化。
【2.Bertrand 博弈模型的基本假设】Bertrand 博弈模型基于以下三个基本假设:(1)市场上的企业数量是有限的,每个企业都知道其他企业的存在和生产能力;(2)市场上的企业都以利润最大化为目标,即企业会选择能够带来最大利润的价格和产量;(3)市场上的企业能够自由进入和退出,没有任何进入和退出壁垒。
【3.Bertrand 博弈模型的类型】根据企业产品的替代性和企业的市场力量,Bertrand 博弈模型可以分为两种类型:Cournot 模型和 Bertrand 模型。
(1)Cournot 模型:该模型假设企业产品是相互替代的,因此企业的最佳策略是设置低于市场需求的价格,以吸引更多的消费者。
(2)Bertrand 模型:该模型假设企业产品是相互独立的,因此企业的最佳策略是设置等于市场需求的价格,以最大化销售量。
【4.Bertrand 博弈模型的应用】Bertrand 博弈模型在经济学、管理学等领域有着广泛的应用,主要应用于以下三个方面:(1)预测市场价格:通过分析企业间的竞争行为,可以预测市场价格的变化,为企业制定价格策略提供参考;(2)分析企业行为:Bertrand 博弈模型可以帮助企业了解竞争对手的行为,以便制定相应的策略;(3)政策制定:Bertrand 博弈模型可以帮助政府了解寡头垄断市场的运行规律,从而制定相应的产业政策和反垄断政策。
博弈模型-数模
* * * s s ( s , s 优战略是 =坦白。因此,囚徒困境问题的解是 1 2 ) =(坦白,坦白)。
* 2
注释:这正是囚徒困境的“困境”两个字的体现,如果用经济学中的“有效” 的术语的意思来讲,(沉默,沉默)是一个有效结局。有效结局并不是囚 徒问题的博弈解。这体现了个人利益和全体利益的矛盾。
现在,让我们试问一下,这个传教徒告诉了这些丈夫们他们所不知 道的什么?每个丈夫都已经知道了99个不贞的妻子,故这对任何人来 说都不是新闻。但“这个传教徒对所有男人做了一个声明”是共同知 识,从而这个传教徒所声明的内容,即有一个不贞的妻子,也就成了 所有男人中间的共同知识。在传教徒宣告之前,每个形如“(每个丈 夫知道)有一个不贞的妻子”的判断对于99都是正确的,但对100就 不正确了。
(3)收益函数
在博弈论中,收益指的是在一个特定的战略组合下参与者得到的确定效 用或期望效用。效用通常表现为博弈结果中输赢、得失、盈亏。效用必 须能用数值刻画其大小。收益是博弈参与者真正关心的问题 。 注释:博弈论的一个基本特征是一个参与者的收益不仅取决于自己的战略选 择,而且取决于所有参与者的战略选择。或者说,收益是所有参与者各选 定一个战略形成的战略组合的函数。 在博弈论中,通常用ui表示参与者i的收益,一个战略组合是,每个参与者 的收益可以表示为
* * * * s ( s , , s , , s 的解,则战略组合 1 i n ) 称为博弈 G 的一个解或纳什均
衡。
注释:研究博弈问题就是建立博弈模型,求解博弈的纳什均衡,下面我们用实例来说明我们的理论及应用
信息
stackelberg 博弈模型流程
stackelberg 博弈模型流程下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor.I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!Stackelberg博弈模型的流程解析Stackelberg博弈,又称为领导者-跟随者博弈,是一种非对称博弈理论模型,主要应用于经济学、军事战略和工业组织等领域。
博弈模型-数模
这两个犯罪嫌疑 人是坦白还是拒 不坦白呢?
2、假设:两囚徒都是理性的和智能的。
3、问题分析
囚徒困境问题可以用图1-1所示的双变量矩阵的形式来描述。
囚徒 2 坦白 沉默 囚徒 1 坦白 沉默 -6,-6 -9, 0 图 1-1
注释:在此博弈中,每个囚徒有两种战略可供选择:坦白(或招认)、不坦白(或沉默)。图 1-1的矩阵中每一个 单元的两个数字表示一组特定的战略组合下两个囚犯的收益(或支付、效用,这里已经开始引用经济学的术 语了),其中第1个数字是囚徒1(习惯上是位于矩阵横行上的参与者)的收益,第 2个数字是囚徒2(位于竖 行上的参与者)的收益。如果囚徒1选择沉默,而囚徒2选择坦白,那么囚徒1的收益是-9(表示判刑9个月) ,囚徒2的收益为0(表示马上释放)。
(2)战略
战略是参与者如何对其他参与者的行动作出反应的行动规则,它规定 参与者在什么时候该选择什么行动。或者说。战略是参与者“相机行 动方案”。
博弈论中, 常用小写 s i 表示参与者 i 的一个战略, 用大写 Si { si } 表 示参与者 i 的所有可选择的战略集合(又称为参与者 i 的战略空间) 。 如果 n 个参与者每个选择一个战略,那么 n 维向量 S ( s1 , s2 ,, sn ) 称 为一个战略组合,其中 s i 是参与者 i 选择的战略。
G { S1 , S2 ,, Sn ; u1 , u2 ,, un }
表示此博弈。
(4)博弈的解—纳什均衡
在 n 个参与者标准式博弈 G={S1,…,Sn;u1,…,un}中,如果对于每一 个参与者 i(i = 1,2,…,n) , si* 是针对其他 n - 1 个参与者所选战略 (s1*,…,s*i-1, s*i+1,…,sn*)的最优反应战略,即
博弈论的数学模型
博弈论的数学模型作者:竺可桢学院01混合班王大方何霈邹铭摘要博弈论现在得到了广泛的应用,涉及到人的决策问题都可以用博弈论的模型加以解释。
本文首先用数学的方法表述实际生活中的博弈行为,并导出一般情况下的博弈的结果,进而讨论一些不同的外部约束条件对博弈过程的影响。
我们用经济学中的垄断竞争现象作为博弈问题的一个实例,讨论生产者在不同状态下的决策,进而分析双方共谋的动机和可能性。
(一)基本博弈模型的建立一, 博弈行为的表述博弈的标准式包括:1.1.博弈的参与者。
2.2.每一个参与者可供选择的战略集。
3.3.针对所有参与者可能选择的战略组合,每一个参与者获得的利益在n人博弈中,用Si为参与者i的可以选择战略空间,其中任意一个特定的纯战略为s i,其中任意特定的纯战略为s i,s i∈Si,n元函数u i(s1,s2,……s n), 当n个博弈者的决策为s1,s2,……s n时,表示第I各参与者的收益函数。
二, 博弈的解当博弈进入一个稳定状态时,参与者选择的战略必然是针对其他参与者既定战略的最优反应,在此状态下没有人愿意单独背离当前的局势。
这个局势叫纳什均衡:在n个参与者标准式博弈,G={ S1,S2,……S n;u1,u2,……u n}中,若战略组合{s1*,s2*,……s n*}满足对每一个参与者i,s i*是针对{ s1*,s2*,……s i-1*,s i+1*……s n*}的最优反应战略,,目标战略组合{s1*,s2*,……s n*}为该博弈的纳什均衡。
即:u i { s1*,s2*,……s i-1*,s i*,s i+1*……s n*}≥u i { s1*,s2*,……s i-1*,s i,s i+1*……s n*},对一切s i∈Si均成立。
纳什于1950年证明在任何有限个参与者,且每个参与者可选择的纯战略为有限个的博弈中,均存在纳什均衡。
(包括混合战略)混合战略指认某种概率分布来取一个战略空间中的战略,在本文中不加讨论。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论期末测评姓名:游龙城
专业:土木工程
班级:104
学号:1008070417 任课老师:胡鸣时间:2011 12 28
1:博弈模型的建立
“海盗分赃”模型
5个海盗抢到100颗宝石,在如何分赃的问题上争吵不休。
于
是他们决定:
(1)抽签决定个人的号码[1,2,3,4,5]。
(2)由1号提出分配方案。
然后5人表决,如果方案超过半数同意就被通过,否则就把1号丢入大海。
(3)1号死后,由2号提出分配方案。
然后4人表决,当且仅当超过半数同意时方案通过,否则就把2号丢入大海。
(4)以此类推,直到找到一个大多数人能接受的方案。
如果只剩下5号,他一人获得全部宝石。
现在假定每个强盗都是足够理智能判断得失的“理性人”。
为了避免不必要的争执,我们还假定每个方案都能顺利表决并按照约定规则执行。
那么,如果你是第一个海盗,你该如何提出分配方案使自己的利益最大化?
2: 三要素,博弈方,支付函数,博弈分析和结果,均衡结果,博弈结果,博弈结果的效率分析。
严酷的分配规则给人的第一印象是:如果我抽到了1号,那将是一件十分不幸的事。
因为作为第一个提出分配方案的人,能活下去的机会微乎其微。
即使1颗宝石都不要,全部都给其余4人,分配方案也有可能被大家反对,只有死路一条。
如果你也这样想,那么答案会大大出乎你的意料:1号海盗留给3号1颗宝石,留给5号2颗宝石,自己独得97颗。
分配方案可以写成[97,0,1,0,2]。
只要你没有被吓倒,不妨站在剩下4人的角度分析:显然,5号是最不合作的,因为他没有死亡的威胁,从直觉上说,每扔下一个对手他就离获得全部宝石更近一步。
4号正好相反,他的生存机会完全取决于前面有人活着,因此4号值得争取。
3号对前面2位的命运完全不在乎,因为轮到他提出方案时,他只需要得到4号的支持再加上自己一票即可通过。
那么2号呢?他需要得到3票才能活命......
现在,你有思路了吧!下面我将通过严格的逻辑思维去推想他们的决定。
5号的策略最简单:巴不得把所有人扔下海(这并不是说他将对每个分配方案投反对票,他也会考虑别人的方案通过的情况,因为他是足够理智能判断得失的“理性人”。
)
再看4号。
如果前面3个人都被扔下大海,只剩他和5号。
5号一定会投反对票将他扔下大海,进而独得所有宝石。
所以4号一定会支持3号的分配方案以求得活命。
3号知道这一点,一定会提出[100,0,0]的分配方案,因为4号即使1颗宝石也得不到,也会因为不想死而投赞同票,这样2:1方案就通过了。
不过2号会针对3号的策略,提出[98,0,1,1]的分配方案。
即放弃3号,给4号和5号各1颗宝石。
因为3号的方案是自己独吞,对于4号和5号来说,不但能活命还能得到1颗宝石,显然2号的分配方案更好,因此他们会投赞同票支持2号的方案。
同样,2号的策略也会被1号洞悉。
所以1号会提出[97,0,1,0,2]或者[97,0,1,2,0]的分配方案。
由于1号的分配方案由于2号提出的方案,他会获得自己、3号和5号或者自己、3号和4号3票的支持。
这样1号的分配方案通过,97颗宝石轻松落入腰包。
但是还有另一种可能,就是4号提出[0,100]的分配方案,因为5号可以在不杀死4号的情况下独得所有宝石,所以他有可能同意4号的分配方案,因为毕竟是理性人,如果可以不杀死人是最好的。
这样4号支持3号和反对3号都可以活命的话,3号的保险分配方案应该是[99,1,0]。
即为了争取4号而分给他1颗宝石。
同理,2号的分配方案也应调整为[97,0,2,1]。
1号的分配方案将是[97,0,1,0,2]或者[96,0,1,3,0]两个方案相比较,显然同样稳妥的情况下,前者收益更好。
至此,1号的最佳分配方案终于出炉![97,0,1,0,2]
在"海盗分赃"模型中,任何"分配者"想让自己的方案获得通过的关键是,事先考虑清楚"挑战者"的分配方案是什么,并用最小的代价获取最大收益,拉拢"挑战者"分配方案中最不得意的人们。
1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。
而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。
不过,模型任意改变一个假设条件,最终结果都不一样。
而现实世界远比模型复杂。
首先,现实中肯定不会是人人都“绝对理性”。
回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。
所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。
如果某人偏好看同伙被扔进海里喂鲨鱼。
果真如此,1号自以为得意的方案岂不成了自掘坟墓!
再就是俗话所说的“人心隔肚皮”。
由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。
如果2号对3、4、5号大放烟幕弹,宣称对于1号所提出任何分配方案,他一定会再多加上一个金币给他们。
这样,结果又当如何?
通常,现实中人人都有自认的公平标准,因而时常会嘟嚷:“谁动了我的奶酪?”可以料想,一旦1号所提方案和其所想的不符,就会有人大闹……当大家都闹起来的时候,1号能拿着97枚金币毫发无损、镇定自若地走出去吗?最大的可能就是,海盗们会要求修改规则,然后重新分配。
想一想二战前的希特勒德国吧!
而假如由一次博弈变成重复博弈呢?比如,大家讲清楚下次再得100枚金币时,先由2号海盗来分……然后是3号……这颇有点像美国总统选举,轮流主政。
说白了,其实是民主形式下的分赃制。
最可怕的是其他四人形成一个反1号的大联盟并制定出新规则:四人平分金币,将1号扔进大海……这就是阿Q式的革命理想:高举平均主义的旗帜,将富人扔进死亡深渊……
制度规范行为,理性战胜愚昧!
如果假设变为,是10人分100枚金币,投票50%或以上才能通过,否则他将被扔入大海喂鲨鱼,依此类推。
50%是问题的关键,海盗可以投自己的票。
因此如果剩下两个人,无论什么方案都会被通过,即100,0。
往上推一步,3个人时,倒数第三个人知道如果出现两个人的情况,因此它会团结第一个人,给他一个金币
“往前推一步。
现在加一个更凶猛的海盗P3。
P1知道———P3知道他知道———如果P3的方案被否决了,游戏就会只由P1和P2来继续,而P1就一枚金币也得不到。
所以P3知道,只要给P1一枚金币,P1就会同意他的方案(当然,如果不给P1一枚金币,P1反正什么也得不到,宁可投票让P3去喂鱼)。
所以P3的最佳策略是:P1得1枚,P2什么也得不到,P3得99枚。
P4的情况差不多。
他只要得一票就可以了,给P2一枚金币就可以让他投票赞同这个方案,因为在接下来P3的方案中P2什么也得不到。
P5也是相同的推理方法只不过他要说服他的两个同伴,于是他给在P4方案中什么也得不到的P1和P3一枚金币,自己留下98枚。
依此类推,最终P10的最佳方案是:他自己得96枚,给每一个在P9方案中什么也得不到的P2、P4、P6和P8一枚金币。
结果,“海盗分金”最后的结果是P1、P2、P3、P4、P5、P6、P7、P8、P9、P10各可以获得0、1、0、1、0、1、0、1、0、96枚金币。
在“海盗分金”中,任何“分配者”想让自己的方案获得通过的关键是,事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。
真地是难以置信。
P10看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还获得了最大收益。
而P1,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,但却因不得不看别人脸色行事,结果连一小杯羹都无法分到,却只能够保住性命而已。
3:建议或措施,参考文献。
在分赃的过程中,作为第一个制定规则的人,应当充分考虑自己更低级的分赃者,有足够清晰的头脑和聪明的思维,拉拢竞争者分配方案中最不得意的人,使自己的利益最大化,不过也要考虑其他的任何情况,以使自己处于最优的地位。
制度规范行为,理性战胜愚昧!
参考文献:
1:海盗分金百度百科
2:wangxxmdl的博客2009-06-09临海望月网易博客
3:支付函数百度知道2008-09-19 910579535。