07 非合作博弈模型及分析

合集下载

非合作合作两型博弈

“非合作合作两型博弈”资料合集目录一、基于非合作合作两型博弈且押金返还回收商的闭环供应链定价与利润分配研究二、基于非合作合作两型博弈且押金返还回收商的闭环供应链定价与利润分配研究三、押金返还制造商的闭环供应链双渠道回收竞争与利润分配的非合作合作两型博弈方法四、限制交流结构下供应链碳减排策略的非合作合作两型博弈研究五、考虑链间竞争与链内研发成本共担的绿色供应链决策基于非合作合作两型博弈方法基于非合作合作两型博弈且押金返还回收商的闭环供应链定价与利润分配研究在当今复杂多变的商业环境中，供应链管理已成为了企业成功的关键因素之一。

在闭环供应链中，产品的回收再利用对于企业的可持续发展和利润增长具有重要意义。

本文将探讨基于非合作合作两型博弈且押金返还回收商的闭环供应链的定价与利润分配问题。

在非合作博弈模型中，供应链成员之间不存在信息共享和协同决策。

每个成员都追求自身利益最大化，导致整体供应链效率低下，甚至出现“囚徒困境”。

在闭环供应链中，非合作博弈模型无法充分利用回收商的信息和资源，可能导致过高的交易成本和较低的供应链效率。

相比之下，合作博弈模型强调供应链成员之间的信息共享和协同决策。

通过建立合作伙伴关系，供应链成员可以共同制定定价策略和利润分配方案，实现整体利益最大化。

在闭环供应链中，合作博弈模型有利于提高回收效率和降低交易成本，进而提升整个供应链的利润水平。

押金返还制度是一种促进产品回收再利用的有效手段。

在闭环供应链中，企业可以向消费者收取一定数额的押金，承诺在消费者退回产品后返还押金。

押金返还制度可以激励消费者参与产品回收，提高回收率，进而降低生产成本和增加供应链利润。

基于非合作合作两型博弈且押金返还回收商的闭环供应链，企业需要制定合理的定价与利润分配方案。

企业应通过市场调研和分析，确定消费者对产品的需求和接受程度；根据产品的特性、市场需求以及回收成本等因素，制定合理的定价策略；企业应与合作伙伴协商制定利润分配方案，确保整体利益最大化。

博弈论与信息经济学-非合作博弈理论

2、这一方法对博弈结果的预测经常是不准确的.
例2.2 石头、剪刀、布的支付矩阵
乙甲
石头剪刀
石头
0，0 -1，1
剪刀
1，-1 0，0
布
-1，1 1，-1
布 1，-1 -1，1 0，0
利用重复剔除严格劣策略无法求解
例2.6 利用重复剔除严格劣策略无法求解
乙甲上中下
左
0，4 4，0 3，5
策略：政济
府：救济，不救
不找工作
下岗工人：找工作，
工人政府
救济
找工作不找 3，2 -1，3
不救济 -1，1 0，0
求出性别大战博弈的混合策略纳什均衡
女
足球
男
足球 3，2
芭蕾 1，1
芭蕾 -1，-1 2，3
第五节纳什均衡的存在性
定理1：（Nash, 1950）每个有限策略型博弈至少存在一个纳什均衡（纯策略的或混合策略的）。
上下中 1，-1 3，-3 1，-1 1，-1 1，-1 -1，1
中上下 1，-1 -1，1 3，-3 1，-1 1，-1 1，-1
中下上 -1，1 1，-1 1，-1 3，-3 1，-1 1，-1
下上中 1，-1 1，-1 1，-1 -1，1 3，-3 1，-1
下中上 1，-1 1，-1 -1，1 1，-1 1，-1 3，-3
例2.4 性别大战（battle of the sexes)
局中人：男，女策略：男：看足球，看芭蕾女：看足球，看芭蕾支付矩阵：见下一页
性别大战的支付矩阵
女男
足球
足球 3，2
芭蕾 1，1
芭蕾
-1，-1
2，3
第二节重复剔除严格劣策略均衡

博弈论论文--非合作博弈论

博弈论论⽂--⾮合作博弈论⾮合作博弈论博弈论也叫对策论，是现代微观经济学的基础领域之⼀，主要研究在彼此互动的情形下个⼈是如何做决策的。

近年来它已经被⼴泛地应⽤于商业、政治、社会学等其他社会科学的分析中。

博弈的分类根据不同的基准也有不同的分类。

⼀般认为，博弈主要可以分为合作博弈和⾮合作博弈。

合作博弈和⾮合作博弈的区别在于相互发⽣作⽤的当事⼈之间有没有⼀个具有约束⼒的协议，如果有，就是合作博弈，如果没有，就是⾮合作博弈。

1950年和1951年纳什的两篇关于⾮合作博弈论的重要论⽂，彻底改变了⼈们对竞争和市场的看法。

他证明了⾮合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。

从⽽揭⽰了博弈均衡与经济均衡的内在联系。

纳什的研究奠定了现代⾮合作博弈论的基⽯，后来的博弈论研究基本上都沿着这条主线展开的。

1944年冯·诺依曼与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济⾏为》出版，标志着现代系统博弈理论的的初步形成。

尽管对具有博弈性质的问题的研究可以追溯到19世纪甚⾄更早。

例如，1838年古诺（Cournot）简单双寡头垄断博弈；1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断；2000多年前中国著名军事家孙武的后代孙膑利⽤博弈论⽅法帮助⽥忌赛马取胜等等都属于早期博弈论的萌芽，其特点是零星的，⽚断的研究，带有很⼤的偶然性，很不系统。

冯·诺依曼和摩根斯特恩的《博弈论与经济⾏为》⼀书中提出的标准型、扩展型和合作型博弈模型解的概念和分析⽅法，奠定了这门学科的理论基础。

合作型博弈在20世纪50年代达到了巅峰期。

然⽽，诺依曼的博弈论的局限性也⽇益暴露出来，由于它过于抽象，使应⽤范围受到很⼤限制，在很长时间⾥，⼈们对博弈论的研究知之甚少，只是少数数学家的专利，所以，影响⼒很有限。

正是在这个时候，⾮合作博弈—“纳什均衡”应运⽽⽣了，它标志着博弈论的新时代的开始！纳什不是⼀个按部就班的学⽣，他经常旷课。

非合作博弈

到一旁，吃光剩余的食物。在这种情况下，大猪得到的收益是 4，小
猪得到的收益是 2。
• 如果小猪去按压开关，大猪在盛食槽旁等待。那么当小猪按下开关后，大猪开始吃，即使当小猪从开关处跑到盛食槽旁后，大猪
仍然会霸占着食物，将食物全部吃光，小猪只能无可奈何地被挤
在一旁。在这种情况下，大猪可以不劳而获，得到的收益为 10。小猪徒劳无功，看到大猪不劳而获，更增加了小猪的郁闷，小猪得到收益 -2。 • 如果大猪和小猪都不去按压开关，则大猪和小猪都无法吃到食物，大猪和小猪均得到收益 0。
• 第一节占优策略均衡
• 第二节纳什均衡的应用例子 • 第三节古诺模型 • 第四节非零和博弈
6
一、严格占优策略的定义
博弈参与者进行策略选择时，有可能存在某个策略的收益严格优于其他策略的情况，该策略被称为严格占优策略（Strictly Dominant Strategy）。
• “囚徒困境”博弈与严格占优策略嫌疑人乙坦白不坦白
小猪按开关大猪等待
按开关
等待
（5，-1）
（4，2）
（10，-2）（0，0）
“智猪博弈”的支付矩阵
• 2．通过“划横线法”求解“智猪博弈”的均衡
小猪按开关按开关大猪等待（10，-2）（ 0， 0）（5，-1）等待（ 4， 2）
如果大猪选择按开关，那么小猪应该如何选择？理性的小猪会选择等待。
• 他的回答是，“把车钥匙给医生，让他带着老人去医院看病，我留下来陪着一见钟情的人雨中漫步。”
• 什么是博弈呢？博弈实际上就是如何在现有条件下做出最优选择的一种策略。 • 博弈论也叫做对策论，或称赛局理论，是研究具有斗争或竞争性质的现象的理论和方法。可以简单的说，博弈论就是运用你的智慧和理性思维，在纷繁的选择中能够使你的利益达到最大化的一门科学。

基于非合作博弈的绩效管理研究

基于非合作博弈的绩效管理研究引言绩效管理是一个组织中非常重要的管理活动，旨在评估和提高员工的工作绩效。

传统的绩效管理方法通常依赖于主管对员工的评估，然后以此为基础进行奖励和晋升决策。

然而，这种方法常常受到主管主观评价和局限性的影响，容易引发争议和不满。

因此，研究者们开始关注使用非合作博弈模型来解决绩效管理中的问题。

本文将探讨基于非合作博弈的绩效管理研究。

非合作博弈的概念非合作博弈指的是在决策中参与者之间缺乏合作与沟通的情况下进行的博弈。

各参与者在做出决策时，只考虑自己的利益，而不考虑其他参与者的利益。

非合作博弈模型常用于分析个体或组织在竞争环境下的行为和决策。

绩效管理中的非合作博弈模型在绩效管理中，非合作博弈模型可以帮助理解员工和组织之间的互动，并提供决策支持。

例如，通过建立员工之间的竞争关系，可以激励员工努力工作以获得更好的绩效评价。

另外，非合作博弈模型还可以用于设计激励机制，以确保员工能够在绩效管理中持续表现出优良的绩效。

基于非合作博弈的绩效管理方法激励机制设计在非合作博弈模型中，激励机制设计是非常重要的一环。

激励机制需要考虑员工的行为和决策对组织绩效的影响，并采取相应的奖励和惩罚措施来引导员工的行为。

通过将绩效评价与奖励挂钩，可以激励员工努力工作，提高绩效。

竞争关系建立建立员工之间的竞争关系是基于非合作博弈的绩效管理中的一种常见方法。

通过将员工的绩效评价与其他员工的绩效进行比较，可以激发员工之间的竞争意识，促使他们更加努力地工作。

同时，竞争关系还可以通过激励措施，如奖金、晋升和特权等来奖励表现优秀的员工，进一步激励他们追求卓越。

合作与共享尽管非合作博弈模型更注重个体的利益，但在绩效管理中，合作和共享也是非常重要的。

通过搭建合作平台和分享资源，可以促进员工之间的合作，充分发挥团队的力量。

此外，共享绩效奖励也能够促使员工之间更好地协作，共同为组织的绩效目标而努力。

基于非合作博弈的绩效管理的优缺点优点•基于非合作博弈的绩效管理能够减少主管评价的主观性，提高评价的客观性。

07 非合作博弈模型及分析

6) 参与人的能力和理性
完全理性和有限理性

完全理性：有完美的分析判断能力和不会犯选择行为的错误有限理性：博弈方的判断选择能力有缺陷个体理性：一个体利益最大为目标集体理性：追求集体利益最大化合作博弈：允许存在有约束力协议的博弈非合作博弈：不允许存在有约束力协议的博弈
个体理性和集体理性

问题：甲、乙如何选择？
乙
招招甲不招
不招
-3,-3
-5,0
0,-5
-1,-1
它的纳什均衡是(坦白，坦白）。
纳什均衡：通俗的讲是指参与人（局中人）单独改变策略不会得到好处的对局（策略组合），就叫做纳什均衡。
完全信息静态博弈纳什均衡分析方法
针对矩阵表达的形式一般采用相对优势策略划线法连续策略的情况下各自最优化自己的收益函数
2
运用逆向归纳法，先分析企业2的最优产量，是企业1产量的函数
2 max u2 max( 6q2 q1q2 q2 ) q2
q2 R2 (q1 ) 1 (6 q1 ) 2
代入企业1的收益函数
企业1预测到企业2将根据
q2 R2 (q1 ) 1 (6 q1 ) 2
来选择产量，则
混合策略博弈下各自最优化自己的期望收益函数
完全信息动态博弈子博弈精炼纳什均衡分析方法
逆向归纳法（倒推法）
（2）智猪博弈
猪圈中有一头大猪和一头小猪，在猪圈的一端设有一个按钮，每按一下，位于猪圈另一端的食槽中就会有10单位的猪食进槽，但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽，则大猪吃到9单位食物，小猪仅能吃到1单位食物；如果两猪同时到食槽，则大猪吃7单位，小猪吃3单位食物；如果小猪先到，大猪吃6单位而小猪吃4单位食物。请问：大猪和小猪如何选择？

合作博弈和非合作博弈例子

合作博弈和非合作博弈例子1. 你看啊，在篮球比赛中，两队球员之间的竞争就是非合作博弈呀！每个人都想着自己球队获胜，会尽力去得分、防守，这可不是为了对方好哟！相反呢，几个公司一起合作开发一个项目，大家各自发挥优势，共同努力去达成目标，这就是合作博弈嘛，就像一群小伙伴齐心协力搭积木一样呀！2. 想想看，商业谈判中双方为了争取最大利益而讨价还价，这明显是非合作博弈啦！都想让自己占便宜呢。

但要是同一产业链上的不同企业相互协作，一起去拓展市场，那不就是合作博弈嘛，就如同一起划船向前进呀！3. 好比选举的时候，候选人们互相竞争选票，那就是非合作博弈嘛，各显神通呀！可要是社区里的居民们一起商量怎么改善环境，共同行动，这就是合作博弈呀，跟一家人一起干活一个道理呀！4. 玩扑克牌的时候，每个人都想赢，这就是非合作博弈呀，藏着自己的心思呢！但在救灾的时候，各方力量汇聚起来，一起救援，难道这不是合作博弈嘛，简直就是众人拾柴火焰高哇！5. 市场上各个商家竞相降价吸引顾客，这是非合作博弈没错吧！但要是他们联合起来搞促销活动，吸引更多人来消费，这不就是合作博弈嘛，像一起把蛋糕做大一样嘛！6. 在战场上，敌我双方拼个你死我活，这是非合作博弈呀，多么残酷！而在科学研究中，不同的团队共享成果、互相交流，那就是合作博弈哇，这不是共同进步嘛！7. 同学们考试争取好名次，这是非合作博弈啦，都想自己更棒呀！但一起做小组作业的时候，互相帮助、共同完成，不就是合作博弈嘛，就像共同建造一个美丽的城堡呀！8. 两家企业为了争夺市场份额而拼命打广告、搞竞争，这绝对是非合作博弈咯！但当它们面临行业危机时，携手合作共度难关，这不就是合作博弈嘛，好比风雨中互相搀扶呀！9. 你想想，在求职中大家竞争岗位，各显其能，就是非合作博弈呀！可在一个项目组里大家一起头脑风暴，出谋划策，这就是合作博弈呀，像是一起烹饪一道美味佳肴嘛！我的观点：合作博弈和非合作博弈在生活中无处不在呀，我们要善于分辨，根据不同的情况选择合适的策略，这样才能让事情往好的方向发展哟！。

第三讲非合作博弈的解（3）

在谢林的实验中，7更‚突出‛（它在排列中是第一个数字，在所有数字中最小），并且其突出是明显的，尽管不是公共知识。谢林说：如果问到在所有正数当中哪个是最明显独特的，或者什么样的选择规则将导致明确结果，人们将会受到这种事实的强烈影响：即最普遍的选择是‘第一个’ 或‘最小’的那个正数。谢林进行的其他一系列实验也验证了这种‚位置优先性‛：在‚正面‛和‚反面‛二者之间，聚点在选择‚正面‛形成。
实验1（谢林）：请选择下列数字中的一个，如果你们的选择相同，你们都将获胜。
7 100 13 261 99 555
根据谢林，实验结果是在41人中37人选择了前三项，7领先于100、13位。可以看出，在这三项中，选择人数按数字排列的位置呈递降趋势。在谢林的实验中，聚点在第一个数上形成。似乎是，协调博弈的结果与被选择对象呈现的次序有关。
焦点又称为谢林点（Schelling point），这一概念最早由诺贝尔奖获得者谢林于1960年在《冲突的策略》一书中提出：人们如果得知别人也正试图做出和自己同样的行为时，常常能使他们的意图或期望达成一致。大多数情况——或许每一种情况都能为此种博弈参与人的合作提供一些线索，为每个人的期望提供聚点（focal point），其中每个人的期望是别人期望他期望被期望去做的事。也就是说，聚点是在协调博弈中博弈参与人通过相互期望所做出的共同选择形成的那个均衡点，它显示出了博弈中人们在没有沟通的情况下的共同选择倾向；或者说聚点就是参与人所选的最突出的那个解。
这个信号发送机制可以是‚调节人‛，信号是他向每个参与人做出不具约束力的秘密推荐策略。这里，推荐的策略是‚秘密的‛，而每个策略被推荐的概率是公共知识。
通过这样的信号而实施的均衡是自我强制的或自我约束力的。

不完全信息条件下的非合作博弈

不完全信息条件下的非合作博弈
不完全信息博弈的含义？讨价还价模型? 信号博弈？
1 不完全信息静态博弈 2 不完全信息动态博弈
• 不完全信息博弈的含义、讨价还价模型、信号博弈
• 不完全信息静态博弈
• 不完全信息动态博弈
1 不完全信息静态博弈
1.1 不完全信息博弈的定义
不完全信息动态博弈也称为贝叶斯博弈。在前面讨论的完全信息博弈中，参与者的收益函数是共同知识，而在不完全信息博弈中，至少有一个参与者不能确定其他参与者的收益函数。例如:市场交易中的买者不知卖者能够接受的最低价格是多少,卖者也不知道买者愿意出的最高价格是多少.当某个企业进入某个市场时,他并不清楚市场上已经存在的企业的成本函数等
２不完全信息动态博弈
2.3 信号博弈
信号博弈就是两个参与者之间的不完全信息动态博弈.
a1
m1
a2 接收者
a1 m1
a2
接收者 t1
自然
a1 m2
a2 接收者
a1
t2
m2 a2
发送者
扩简展单式的表信述号
博弈
:Leabharlann ２不完全信息动态博弈发送者具备的四个纯策略:
1.如果自然赋予类型t1,选择信号m1;如果自然赋予类型t2, 选择信号m1 2.如果自然赋予类型t1,选择信号m1;如果自然赋予类型t2, 选择信号m2 3.如果自然赋予类型t1,选择信号m2;如果自然赋予类型t2, 选择信号m1 4.如果自然赋予类型t1,选择信号m2;如果自然赋予类型t2, 选择信号m2
1 不完全信息静态博弈
1.2 不完全信息静态博弈
不完全信息静态博弈也称为贝叶斯静态博弈. 在不完全信息静态博弈中,不仅至少有一个参与者不知道其他参与者的收益函数,而且所有参与者进行决q1策时并不知道其他参与者的策略或行动.

第三讲非合作博弈的解：（4）

例子：斯坦伯尔伯模型。两个厂商垄断某个市场，其中厂商 1处于支配地位，它先行动，然后从属企业2后行动。假定市场需求函数为p=a-Q。厂商的单位产品的成本c。这些是企业1和2的公共知识。问：厂商1和2是如解。
假定厂商1和2所决定的产量分别为q1,q2。企业2后行动，对于企业1的任何行动，即任意给定的产量，
• 例子：假定甲在开采一个价值4万元的金矿时需要1万元资金，乙有1万元资金。甲向乙借钱来开金矿。在这个博弈的第一阶段，甲向乙承诺: 如果乙借钱给他的话，那么他就会将采到的金子与乙对半分成，即(2，3)—— 乙得到2万元的金子，同时收回自己的1万元投资。对于甲的承诺，乙如果不借钱给甲的话，那么博弈到此为止，双方收益为(0，1)。如果乙借钱给甲的话，那么博弈进入第二个阶段。在第二阶段中，若甲遵守他的承诺，分给乙一半的金子，这样两人的收益为(2，3)，其中1万元为投资成本。然而，若甲违背自己的承诺，博弈就会进入到第三个阶段: 如果乙同甲打官司，那么由于打官司费时费力，两个人的收益为(0，1)；若乙不打官司，那么两个人的收益就为(5，0)。
安娜
2 1
鲍伯
1 4
安娜
4 3 蜈蚣博弈
鲍伯 2n+1
3 6
安娜鲍伯
2n+2
2n 2n-1
2 n-1 2 n+2
• 这个博弈有两个参与人安娜和鲍伯。该博弈从安娜开始，她有两个策略“合作”和“不合作”，若她选择“不合作”，博弈即刻终止，安娜得到2，鲍伯得到1；若她选择“合作”，那么博弈继续进行，由鲍伯开始选择。鲍伯同样有“合作”和“不合作”两种策略。在这第二轮选择中，若鲍伯选择“不合作”，博弈终止，选择“合作”，博弈继续进行……在这个博弈最后一轮，即第2n 轮，若鲍伯选择“不合作”，他所得2n+1，安娜得2n-1；若他选择“合作”，鲍伯得2n+1安娜得2n+2。

第七章--非合作性策略

.
25
五、产品预告
除了改变产品的相容性，企业还可以通过提前发布新产品预告的竞争方式，减少竞争对手的利益。
在这种情况下，企业提前宣布将晚些时候发布新产品，就给消费者等待的机会。企业通过这种预告，降低了现有产品市场占有率，使得新产品能被消费者采用。
提前预告会带来“奥斯朋效应”。
.
26
第三节非合作性策略的福利探讨
一种普遍的经济学观点认为，如果市场允许自由进入或退出，则能实现经济的最优状态。因此，在有进入壁垒存在的市场，鼓励企业进入能够增进社会总福利。
冯.威克泽对进入壁垒的福利效应进行开创研究，将福利
分析引入到“进入壁垒”中，指出如果市场上的进入壁垒是由
规模经济或者产品本身的差异造成的，这时进入壁垒不仅不
.
28
.
29
.
19
第二节非合作性其他策略
一、掠夺性定价模型
掠夺性定价模型是指在位企业针对已经在市场上的竞争对手而采取的非合作性策略。 ◆假设条件
1、厂商1两种可能的边际成本，高边际成本和低边际成本。厂商1知道自己的成本类型，但厂商2不知道，认定厂商1为高成本的概率为x，低成本概率为1-x。
2、厂商1知道厂商2以概率x进行推测。厂商2的成本为C2。
如果k2>0，则表示厂商2进入行业中，此时需要付出固定进入成本f；如果k2=0，则不进入。
假设该行业具有线性需求函数p=1-q，贴现率为1。
.
8
厂商2的利润函数为：
k2(1-k1-k2)-f，如果k2>0
∏2(k1,k2)=
0,
如果k2=0
当厂商2进入市场时，利润最大化一阶条件是：
2 k k1 2,k21k12k20

厂商研发地非合作和合作博弈模型分析报告材料

厂商研发的非合作和合作博弈模型分析1 引言研发对一个公司来说至关重要，它是公司能够持续发展的关键因素。

只有通过研发，公司才能推出新产品来保持和提高自己的市场份额。

因此几乎每个公司都对研发投入了大量资金，并且研发经费占公司利润的比例有不断提高的趋势。

但是，对每个公司来说，公司间的研发竞赛是次优的，这主要表现在：从社会经济总体发展来看，由于公司间研发的保密而使很多经费进行同样的研发，从而使社会资源产生浪费。

从单个公司来说，研发间的竞争导致了公司财务的沉重负担，甚至有的公司不堪重负而破产。

因此，公司间研发的合作是非常重要的，这不仅仅表现在社会资源的有效利用，而且表现在这种合作是一种双赢的结果。

本文通过一些合理的假设探讨了两个相同公司间研发的非合作和合作博弈模型，并分析这种现象给出评价标准来进行对比分析。

2 非合作博弈模型本模型是Cournot模型的一种推广，文中的许多假设和Cournot模型相同，所不同的是Cournot模型是一种完全信息静态博弈模型，而本文所给出的模型是一种两阶段博弈模型，即在Cournot模型的基础上加进了公司的研发投入阶段。

模型的若干假设：一个经济系统中只有两个相同的公司，也可以说这两个公司是对称的，即一个公司是另一个公司的复制，两个公司在投入成本，产出水平，以及发展战略上都是相同的，并设两个公司的初始单位成本为c，即没有进行研发时的成本，两公司所进行的两阶段博弈模型如下：在第一阶段，两个公司同时选择研发投入经费x1,x2后进行研发过程；在第二阶段，两个公司注意到研发投入经费x1,x2，生产出产品后在产品市场上进行竞争。

由于混合策略在公司进行决策时过于麻烦，并且公司的研发对于一个公司来说至关重要，有的研发一旦确定，就需要相当长的时间去完成，中途更改的机会成本很高，因此，本文只讨论纯策略时的情况，并且讨论的是一个一次博弈模型，而不考虑重复博弈时的公司行为，所以本文过多地关注纯策略子博弈完备均衡就不足为奇了。

非合作博弈经济管理学及财务知识分析理论

而且：不同的价格影响进入者的后验概率从而影响进入者的进入决策。
在均衡情况下，在位者究竟选择什么价格，不仅与成本函数有关，而且与进入者的先验概率x有关。
---这些都直接影响在位者和进入者的最终决策。
综合这些因素得到的均衡才是精练的均衡
基本思路-不完全信息动态博弈
在位者成本函数进入者先验概率
假定参与人的类型是独立分布的，参与人i有K个类型，有h个可能的行动，өk和ah分别代表一个特定的类型和一个特定的行动。
如果我们观察到i选择了ah，i属于өk的后验概率是多少？
p(ahk)p(k) p(ahk)p(k)
Por{b kah}
将每个信息集开始的博弈的剩余部分称为一个 “后续博弈”，一个“合理”的均衡应该满足如下要求：给定每一个参与人有关其他参与人类型的后验信念，参与人的战略组合在每一个后续博弈上构成贝叶斯均衡。
剔除这种不可信行为的方式是：假定参与人（在所有可能情况下）根据贝叶斯规则修正先验概念，并且，每个参与人都假定其他参与人选择的是均衡战略。
✓ 对于在位者：
价格在位者高成本时的利润在位者低成本时的利润
P=4 P=5 P=6 267 698
如何用扩展式表述两个企业的博弈过程？
基本思路-不完全信息动态博弈
进入者只有一种类型：进入成本为2，如果进入，生产成本函数与在位者高成本函数相同。
T=2，如果进入者已进入，在位者成本函数为共同知识，若在位者为高成本，企业企业成本函数相同，对称库诺特均衡产量下的价格p=5时，每个企业利润为3，扣除进入成本2，进入者利润为 1。若在位者为低成本，两个企业成本函数不同，非对称库诺特均衡产量下的价格p=4,在位者利润是5，进入者利润为1，扣除进入成本2，其利润为-1。

非合作博弈论的基本体系——博弈论简介(三)

— 17 —
★理论探讨★
略 ,从而没有任何人有积极性打破这种均衡。
合。
2、完全信息动态博弈—— 子博弈精练纳什均衡
有关非合作博弈论的基本内容的介绍到此结
( subgam e per fect Nash equilibrium): 这里先交代“子束。从表面上看 ,我们似乎是对每一个类型博弈创造
中 , 参与人在多节点信息处 ,按照贝叶斯法则选择某个战略 ,而该战略必须使参与人的支付或期望支付最大 (序列理性 ) , 由这样的混合战略组成的战略组
图 1. 1不同均衡概念之间的关系 (责任编辑: 薛金龙 )
— 18 —
他战略。
静态博弈和不完全信息动态博弈的范畴之内。
4、不完全信息动态博弈 —— 精练贝叶斯均衡
这里需要指出的一点是: 博弈分析的目的是预
( Pe rfect Bayesia n Nash equilibrium ): 给定每个人有测博弈的结果。一个比较简单的博弈中的合理行为关其他人类型的信念 (主观观率 )的情况下 ,他的战方式在一个较复杂的博弈中可能是完全不合理的。
★理论探讨★
《江苏统计》 1998. 3
非合作博弈论的基本体系
— — 博弈论简介 (三 )
□文 /朱震葆
博弈论 , 在非特指情况下 ,通常都是指非合作博
弈。根据 ( 1)由于参与博弈的人行动有先后顺序 ; ( 2) 后行动者在自己行动之前对其它参与人的先前行为是否完全了解 ; ( 3)参与人对有关其他参与人的特征、战略空间及支付函数的知识是否完全掌握 ; ( 4) 各参与人是否存在纯战略空间等四个不同的角度来划分 , 可以构造出至少八种不同类型的博弈问题 ,这就是: 完全信息静态博弈 ,完全信息动态博弈 , 不完全信息静态博弈 ,不完全信息动态博弈 , 完全且完美信息纯战略博弈 ,完全且完美信息混合战略博弈 ,完全但不完美信息纯战略博弈 ,完全但不完美信息混合战略博弈。与上述八类博弈相对应的是八个均衡概念即纳什均衡、子博弈精练纳什均衡、贝叶斯纳什均衡、精练贝叶斯纳什均衡、纯战略纳什均衡、混合战略纳什均衡、纯战略完美贝叶斯均衡、混合战略完美贝叶斯均衡。

博弈论-纳什均衡（非合作博弈均衡）

博弈论-纳什均衡（非合作博弈均衡）完全理性：理性指一种行为方式，它适合实现指定目标，而且在给定条件和约束的限度之内。

在不同的学科领域，理性所涵盖的内容存在着差异完全理性的内涵具有完全理性的行为人是个无所不知的超人，他具有纵向和横向方面完备的知识。

在纵向方面，他可以预测未来；在横向方面，他通晓资源、交易伙伴和环境等情况。

具体而言，行为人的完全理性包括以下隐含内容。

(1)不存在不确定性，即使存在不确定性，也可以预知不确定性的概率分布。

也就是说，对于具有完全理性的行为人来说，一切信息都是确定的。

(2)行为人具有可以确定的效用函数(消费者的效用函数和厂商的利润函数可以统称为效用函数)，同时行为人具有同质性以及一致性的偏好体系。

(3)选择结果具有描述不变性、程序不变性和前后关系独立性。

描述不变性要求行为人选择的先后顺序不应依赖于所描述或显示的选项，也就是说如果行为人经过再三思考，将两种描述视为同一问题的同义表达，那么它们必定导致相同的选择——即这种思考不存在异处；程序不变性要求不同方式的等价学说揭露相同的偏好次序；前后关系独立性指一项选择与其他替代方案互为独立的原则，它要求在给定Z而不提供有关X或Y 的新的信息的情况下，X 与Y的优先权顺序不应该依赖于Z是否有效。

(4)行为人具备完备的计算和推理能力，可以像计算机一样在数秒内从事无穷尽的计算步骤，同时也不存在感性因素对选择的干扰。

(5)选择意味着在各种方案或选择集中进行比较和挑选，因此完全理性的行为人可以设计出所有的被选方案，以及各项方案所产生的全部后果。

(6)一个确定的报酬函数，即行为人可以确定地赋予每项行动结果一个具体的量化价值或效用。

(7)确定性的结果，也就是行为人町以实现效用最大化或最优目标(消费者效用最大化和企业利润最大化)。

在上述条件下，建立在完全理性假设的基础上的主流经济学的方法论，即行为人的选择或决策意味着在资源约束的条件下实现效用最大化或利润最大化。

非合作博弈

美丽心灵
• 纳什：从利己目的出发，结果损人不利己，既不利己也不利他。（个体理性与集体理性的冲突）
普林斯顿的幽灵
• 孤独的天才
“孤僻，傲慢，无情，幽灵一般，古怪，沉醉于自己的隐秘世界，根本不能理解别人操心的世俗事务。”
• 妄想型精神分裂症
1958年，纳什得了妄想型精神分裂症。从此开始了与病魔长达25年之久的斗争
• 纳什的博弈论思路比冯诺依曼的合作博弈更能反映现实的情况。
• 反映了个体理性与集体理性的冲突，各人追求利已行为而导致的最终结局是一个“纳什均衡”，一个对所有人而言不一定是最优的的结局。
纳什均衡的意义
• “纳什均衡”动摇了西方经济学的基石。 • 斯密：“通过追求(个人的)自身利益，他常
常会比其实际上想做的那样更有效地促进社会利益。”（个体理性导致集体理性）
在这里：鼓励思考，异想天开被认为是天才的象征。
主要研究领域
• 对策论（博弈论）数学
冯诺依曼（1）对人类的最大贡献是对计算机科学、计算机技术和数值分析的开拓性工作；（2）创立了博弈论这一现代数学的又一重要分支． 1944年发表了奠基性的重要论文《博弈论与经济行为》．
冯诺依曼
• 一位有着传奇人生的数学天才 • 诺贝尔经济学奖获得者
人生轨际
• 1928年6月13日出生； • 1945年，卡内基理工
学院（卡内基大学） • 1948-1950年，普林斯
顿大学，获博士学位； • 1950-1954年，在普林
斯顿大学和兰德研究所工作
普林斯顿大学
著名的相对论大师爱因斯坦、“原子弹之父” 奥本海默、数学大师冯·诺依曼等都在这里从事过研究。历届诺贝尔物理奖得主中，有20 多位是这所学校的教授。著名的科学家华罗庚、姜伯驹、中国科学院外籍院士陈省身、李政道、杨振宁都曾担任过普林斯顿大学的高级研的诺贝尔奖

信息与非合作博弈理论

信息与非合作博弈理论第三章信息与非合作博弈理论3.1 博弈论概述3.1.1 什么是博弈论博弈论（game theory）定义：研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的，是专门研究博弈如何出现均衡的规律的学科。

博弈论的相关概念包括：参与人、行动、战略、信息、共同知识、支付函数、结果、均衡。

3.1.2 博弈的分类3.1.3 博弈论的发展简述3.2 完全信息静态博弈3.2.1 博弈的战略式表述3.2.2 纳什均衡1、占优战略均衡一个参与人的最优战略并不依赖于其他参与人的战略选择，即不论其他参与人选择什么战略，他的最优战略是唯一的，这样的最优战略被称为“占优战略”（dominant strategy）。

2、重复剔除的占优均衡战略组合s*= (s1*,…,sn*)称为重复剔除的占优均衡，如果它是重复剔除劣战略后剩下的唯一的战略组合。

如果这种唯一的战略组合是存在的，我们说该博弈是重复剔除占优可解的显然，（上，中）就是该博弈唯一的均衡解。

这种方法在博弈论中被称为重复剔除严格劣战略。

在两人有限博弈中，求解纳什均衡有一种简单的方法：划线法3、纳什均衡(定义)纳什均衡有强弱之分。

上述定义中给出的是弱纳什均衡,一个纳什均衡是强的,如果给定其他参与人的策略,每一个参与人的选择是唯一的。

即,s*是一个强Nash均衡,当且仅当对每一个i，si′≠si*，总有ui (si*,s-i*)>ui (si′,s-i*)。

在有些博弈中，纳什均衡存在，但它不是强纳什均衡。

如表3.8的博弈中，（U,L）和(U,R)都是纳什均衡，但没有一个是强纳什均衡。

本实验的启示有三：1、当大家都想免费搭便车的时候，车子便会停滞不前；2、一个完全平均主义社会（初始资本相同、收益平分），如果成员完全大公无私，可以获得最好的发展效率（80元），如果成员自私，则效率最慢（原地踏步）；3、有大猪和小猪的社会，大猪将承担责任，至少不会停滞不前。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1)参与人：博弈中的决策主体，他的目的是通过选择行为（或战略）以最大化自己的收益（支付）。
自然(Nature)作虚拟参与人处理，即决定外生的随机变量的概率分布的机制。
根据参与人数量分单人博弈两人博弈多人博弈
最常见的是两人博弈，单人博弈是退化的博弈
2) 博弈中的策略
策略：博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同，而且可选策略数量也可不同有限博弈：每个博弈方的策略数都是有限的无限博弈：至少有某些博弈方的策略有无限多个
非合作博弈模型及分析
1.典型博弈及纳什均衡 2.博弈的分类 3.古诺的寡头竞争模型 4.斯坦克伯格寡头竞争模型
1 典型博弈及纳什均衡
（1）囚徒困境
两个犯罪嫌疑人甲和乙联手作案，被警方逮住但未掌握足够证据。警方将两人分别置于两间房间分开审讯，政策是若一人招供但另一人未招，则招者立即被释放，未招者判入狱5年；若二人都招则两人各判刑3年;若两人都不招则因证据不充分，只能各拘留1年。
3) 博弈中的支付
支付：各博弈方从博弈中所获得的利益得益对应博弈的结果，也就是各博弈方策略的组合得益是各博弈方追求的根本目标及行为和判断的主要依据根据得益的博弈分类：零和博弈、常和博弈、变和博弈

零和博弈：也称“严格竞争博弈”。博弈方之间利益始终对立，偏好通常不同 —猜硬币，田忌赛马，石头-剪刀-布常和博弈：博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系 —分配固定数额的奖金、利润，遗产官司变和博弈：零和博弈和常和博弈以外的所有博弈。合作利益存在，博弈效率问题的重要性。 —囚徒困境、产量博弈等
Q q1 q2 P P(Q) 8 Q
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12
u2 q2 P(Q) c2 q2 q2 [8 (q1 q2 )] 2q2
拿钱
拿钱
拿钱
拿钱
（2，0）
（0，4）
（6，0）
（0，8）
（b）“你死我活”的抓钱博弈
甲不拿乙不拿甲不拿乙不拿（6，4）
拿钱
拿钱
拿钱
拿钱
（2，0）
（1，3）
（4，2）
（3，5）
（c）“温和对抗”的抓钱博弈
2
博弈的分类
1) 博弈中的参与人 2) 博弈中的策略或行动 3) 博弈中的支付（得益） 4) 博弈的过程 5) 博弈的信息结构 6) 参与人的能力和理性
6q2 q1q2 q22
古诺模型的反应函数
max u1 max( 6q1 q1q2 q12 )
q1
q2
(0,6) (0,3)
理性局限和古诺调整
q1 R1 (q2 ) 1 (6 q2 ) 2 q2 R2 (q1 ) (6 q1 )
1 2
R1 (q2 )
常见博弈分类
决策信息
静态
完全信息静态博弈纳什均衡纳什（1950、51年）不完全信息静态博弈贝叶斯纳什均衡海萨尼（67、68年）
动态
完全信息动态博弈子博弈精炼纳什均衡泽尔腾（65年）不完全信息动态博弈精炼贝叶斯纳什均衡泽尔腾等（75年）
完全
不完全
3 古诺的寡头竞争模型
寡头产量竞争——以两厂商产量竞争为例
小猪按大猪等待 9, -1 0,0 按 5,1 等待 4,4
它的纳什均衡是(大猪按，小猪等）。
（3）夫妻博弈
丈夫喜欢看足球，妻子喜欢看芭蕾舞。他们都宁愿在一起，也不愿分开行动。
妻子
足球
足球丈夫芭蕾
芭蕾
2,1 0,0
0,0 1,2
本例有两种纳什均衡结果会出现，要么一起去看足球，要么一起去看芭蕾舞，但在一次博弈中究竟会出现哪一种？？？
2
运用逆向归纳法，先分析企业2的最优产量，是企业1产量的函数
2 max u2 max( 6q2 q1q2 q2 ) q2
q2 R2 (q1 ) 1 (6 q1 ) 2
代入企业1的收益函数
企业1预测到企业2将根据
q2 R2 (q1 ) 1 (6 q1 ) 2
来选择产量，则
4) 博弈的过程
博弈过程：博弈方选择行为的次序，包括是否多次重复选择行为。

博弈过程对博弈结果也有重要影响。根据博弈的过程，博弈可分为静态博弈、动态博弈、重复博弈。
静态博弈：所有博弈方同时或可看作同时选择策略的博弈 —田忌赛马、猜硬币、古诺模型动态博弈：各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场结构
B.关于博弈过程的信息动态博弈中在轮到行为时对博弈的进程完全了解的博弈方，称为具有“完美信息”(Perfect Information)的参与人，如果动态博弈的所有参与人都有完美信息，则称为 “完美信息的动态博弈”。动态博弈中轮到行为的参与人不完全了解此前全部博弈的进程时，称为具有 “ 不完美信息 ” (Imperfect Information) 的参与人，有这种参与人的动态博弈则称为 “不完美信息的动态博弈”。 C.共同知识（common knowledge）与信息有关，指的是 “所有参与人知道，所有参与人知道所有参与人知道，所有参与人知道所有参与人知道所有参与人知道……”
（4）社会福利博弈
博弈方是政府和流浪汉，流浪汉的有两个策略：找工作或游荡，政府的策略是：救济或不救济。
流浪汉找工作游荡政府源自救济不救济3,2-1 , 1
-1 , 3
0,0
假设政府救济的概率为；流浪汉找工作的概率为；则
max u1 [3 (1 )] (1 )( )
重复博弈：同一个博弈反复进行所构成的博弈，提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题有限次重复博弈无限次重复博弈
5）博弈的信息结构
A、关于支付的信息
若各博弈方完全了解所有博弈方在各种情况下的支付，称为“完全信息(Complete Information)博弈”。若至少部分各博弈方不完全了解其它博弈方的得益情况，称为“不完全信息(Incomplete Information)博弈”。又称 “不对称信息(Asymmetric Information)博弈”。
R2 (q1 )
q q
1
*
* 2
2; u1 u 2 4
* *
q1
(3,0) (6,0)
若两者联合，形成垄断，则
max u max( 6Q Q ) Q 3 q q 4
1 2 * * 2
古诺模型的反应函数图示
U 9 u1 u 2 8
* *
4 斯坦克伯格（Stackelberg）寡头竞争模型
混合策略博弈下各自最优化自己的期望收益函数
完全信息动态博弈子博弈精炼纳什均衡分析方法
逆向归纳法（倒推法）
（2）智猪博弈
猪圈中有一头大猪和一头小猪，在猪圈的一端设有一个按钮，每按一下，位于猪圈另一端的食槽中就会有10单位的猪食进槽，但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽，则大猪吃到9单位食物，小猪仅能吃到1单位食物；如果两猪同时到食槽，则大猪吃7单位，小猪吃3单位食物；如果小猪先到，大猪吃6单位而小猪吃4单位食物。请问：大猪和小猪如何选择？

max u 2 [2 (1 )] 3(1 )

则 0.5, 0.2
（5）抓钱博弈
甲不拿乙不拿甲不拿乙不拿（5，5）
拿钱
拿钱
拿钱
拿钱
（1，1）
（2，2）
（3，3）
（4，4）
（a）“利益一致”的抓钱博弈
甲
不拿
乙
不拿
甲
不拿
乙
不拿
（10，0）
问题：甲、乙如何选择？
乙
招招甲不招
不招
-3,-3
-5,0
0,-5
-1,-1
它的纳什均衡是(坦白，坦白）。
纳什均衡：通俗的讲是指参与人（局中人）单独改变策略不会得到好处的对局（策略组合），就叫做纳什均衡。
完全信息静态博弈纳什均衡分析方法
针对矩阵表达的形式一般采用相对优势策略划线法连续策略的情况下各自最优化自己的收益函数
在第一阶段，企业1最大化自己的收益函数，有
max u1 max( 6q1 1 (6 q1 )q1 q12 ) 2
q1 *
q
因此
1
3
q
* 2
R2 (q1 ) 1 (6 q1 ) 1.5 2
两企业收益分别为
u u
* * 2
1
4.5 2.25
古诺模型与斯坦克博格模型的比较
静态博弈静态合作动态博弈
q q
1
2 2 4
4
1.5 1.5 4.5 4.5 5
3 1.5 4.5 2.25 3.5
先行优势
2
u u
p
1
2
4

两企业先后选择产量的竞争博弈把古诺模型改为厂商1先选择，厂商2后选择，而非同时选择即可。
Q q1 q2 , P P(Q) 8 Q
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12 u2 q2 P(Q) c2 q2 q2 [8 (q1 q2 )] 2q2 6q2 q1q2 q2