最新博弈论公开课1~5节笔记

合集下载

博弈论的读书笔记

博弈论的读书笔记

博弈论的读书笔记博弈论,这一高深又充满智慧的学问,仿佛是一场思维的盛宴,让我在探索的过程中不断领略到人类决策与互动的奇妙之处。

在接触博弈论之前,我对人与人之间、组织与组织之间的竞争与合作的理解相对简单和直观。

然而,当我真正踏入博弈论的世界,才发现其中蕴含着极其复杂而又富有逻辑的规律。

博弈论的核心概念在于参与者的策略选择以及这些选择所导致的结果。

它并不是单纯地研究竞争,而是深入探讨在各种情境下,参与者如何通过理性的思考和策略的制定来实现自身的最优目标。

比如经典的“囚徒困境”,两个嫌疑人被分别审讯,如果两人都保持沉默,可能都会受到较轻的处罚;但如果一人背叛另一人保持沉默,背叛者将获得从轻处理,而沉默者将受到重罚。

在这种情况下,从个体角度出发,背叛似乎是最优选择,但最终结果往往是双方都选择背叛,导致整体的结果并非最优。

这个简单的例子深刻地揭示了个体理性与集体理性之间的矛盾。

再来看“斗鸡博弈”,两个实力相当的对手相向而行,如果双方都不让步,就会两败俱伤;但如果一方让步,另一方胜利,让步的一方虽然有所损失,但避免了更严重的后果。

这就需要参与者在权衡利弊后,根据对对方的判断来决定自己的策略。

这种博弈让我明白,在某些情况下,适度的妥协和退让并非懦弱,而是一种明智的选择。

博弈论中的“零和博弈”和“非零和博弈”也给我带来了深刻的启示。

零和博弈指的是一方的收益必然导致另一方的损失,总和为零。

例如赌博,一方赢的钱就是另一方输的钱。

然而,在现实生活中,更多的是“非零和博弈”,即双方的合作可能会带来共同的收益,或者通过合理的分配,实现双方都能获利的局面。

这让我意识到,在很多情况下,合作比竞争更能带来良好的结果。

在商业领域,博弈论的应用无处不在。

企业之间的竞争、价格战、市场份额的争夺,都可以用博弈论的思维来分析。

企业需要预测竞争对手的行动,制定自己的策略,以在激烈的市场竞争中获得优势。

例如,当一家企业决定推出新产品时,它需要考虑竞争对手可能的反应,是跟风推出类似产品,还是采取差异化策略。

「算法笔记」博弈论入门

「算法笔记」博弈论入门

「算法笔记」博弈论⼊门⼀、公平组合游戏 ICG1. 公平组合游戏的定义若⼀个游戏满⾜:1. 游戏有两个⼈参与,⼆者轮流做出决策。

2. 在游戏进程的任意时刻,可以执⾏的合法⾏动与轮到哪名玩家⽆关。

3. 不能⾏动的玩家判负。

则称该游戏为⼀个公平组合游戏。

2. ⼀些说明我们把游戏过程中⾯临的状态称为局⾯,整局游戏第⼀个⾏动的为先⼿,第⼆个⾏动的为后⼿。

我们讨论的博弈问题⼀般只考虑理想情况,即两⼈均⽆失误,都采取最优策略⾏动时游戏的结果。

定义必胜态为先⼿必胜的状态,必败态为先⼿必败的状态。

注意,在⼀般确定操作状态的组合游戏中,只会存在这两种状态,如果先⼿和后⼿都⾜够聪明,不会出现介于必胜态和必败态之间的状态。

⼀个重要的性质:⼀个状态是必败态当且仅当它的所有后继都是必胜态。

⼀个状态是必胜态当且仅当它⾄少有⼀个后继是必败态。

特别地,没有后继状态的状态是必败态(因为⽆法操作则负)。

⼆、Nim 博弈\(\text{Nim}\) 游戏是⼀个公平组合游戏。

⼤概是这样的:现在有 \(n\) 堆⽯⼦,第 \(i\) 堆有 \(a_i\) 个。

两⼈轮流操作,每⼈每次可以从任选⼀堆中取⾛任意多个⽯⼦,但是不能不取。

取⾛最后⼀个⽯⼦的⼈获胜(即⽆法再取的⼈就输了)。

结论:\(\text{Nim}\) 博弈先⼿必胜,当且仅当 \(a_1\oplus a_2\oplus \cdots \oplus a_n\neq 0\)。

证明:为了证明这个结论,我们需要证明:1. 所有⽯⼦都被取⾛是⼀个必败局⾯。

2. 对于任意⼀个局⾯,若 \(a_1\oplus a_2\oplus \cdots \oplus a_n\neq 0\),⼀定能得到⼀个 \(a_1\oplus a_2\oplus \cdots \oplusa_n=0\) 的局⾯。

3. 对于任意⼀个局⾯,若 \(a_1\oplus a_2\oplus \cdots \oplus a_n=0\),⼀定不能得到⼀个 \(a_1\oplus a_2\oplus \cdots \oplusa_n=0\) 的局⾯。

博弈论笔记

博弈论笔记

活学活用博弈论威胁,承诺与序惯博弈1 要使威胁与承诺可信的方法:切断退路交出控制权切断联系建立起一致的诚实信用按顺序各个击破的威胁非理性的疯狂和精神失常。

2 重复博弈的长期性与多阶段对于背叛很有帮助。

3 可置信的问题总是使截止期限很难确定。

4 人们一旦受到伤害就很难恢复,不过如果继续与违背交往对于自己有所补偿的话,那么最好的做法就是宽恕。

但是那些被宽恕的人很可能在将来对你或者别人造成更大的伤害,所以法律对于那些伤害别人的人进行强制性制裁反而会降低对人们的伤害。

5 公司并购的毒丸:当并购者对标的公司的控股达到一定比例时,标的公司让原有股东(不包括并购者)拥有额外购股权或者发放红利给员工,以增加并购者的成本,确保自己的经营权。

6 阻止竞争对手进入的价格门槛:高于自己的成本同时低于对手的成本,让对手进入后没有利润而自己有微薄的利润。

7 连锁店悖论:第十个连锁店如果不会降价,那么第九个就不会降价,第九个不会降价,那么第八个也不会降价,如此类推:第一个连锁店也不会降价。

所以进入者不会对连锁店的降价威胁置信。

8 对于一个理性的竞争对手来说,他不会通过对你的印象来判断你所说的话,而是从你的威胁和承诺是否对于你的将来有利来判断你是否可信。

9 只关心自己的收益是否最大化,不要因为对手比自己赚的多而心生烦恼。

10 除非你选择退出游戏,否则不要考虑自己的沉没成本。

在有沉没成本的时候做的决策时考虑的成本有且只有自己的边际成本。

11 靠降价来阻止对手进入并非上策,因为价格易变。

价格竞争的危险1 要使报复有效,那么就要迅速做出反应并且采取切实的行动。

当对手相信你会全力以赴时他就会因为担心你的报复而不采取行动了。

2 采用复杂的定价策略可以有效的避免价格竞争。

3 如果采用价格竞争那么就会对服务打折,如果采用服务竞争那么就会避免价格竞争。

4 对于商家来说服务,品质,商品颜色,商标品牌都可以竞争,尽可能避免价格竞争。

但是即使没有价格竞争也会有竞争者进入从而引起价格竞争,此时对于商家来说把价格定得比较复杂可以避免价格竞争。

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。

本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。

关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。

博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。

本文将对博弈论的相关知识进行详细的总结和归纳。

一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。

博弈的基本要素包括:参与者、策略、收益和信息。

1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。

参与者的目标是实现自身利益的最大化。

1.3 策略策略是指参与者在博弈中所能采取的行动或选择。

通常分为纯策略和混合策略。

1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。

收益可以用来衡量参与者的利益大小。

1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。

信息可以分为对称信息和非对称信息。

二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。

常见的均衡概念有纳什均衡、帕累托最优和博弈解。

2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。

2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。

帕累托最优是一种资源分配的有效方式。

2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。

博弈解往往是均衡的特殊情况。

三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。

耶鲁大学开放课程博弈论笔记

耶鲁大学开放课程博弈论笔记

耶鲁大学开放课程博弈论笔记博弈论,是一门研究决策者之间互动行为的学科,它在经济学、政治学、社会学等多个领域发挥着重要作用。

耶鲁大学开放课程中的博弈论课程为我们提供了深入理解和掌握博弈论的机会。

在本篇文章中,我将分享我在学习耶鲁大学开放课程博弈论时所做的笔记和心得体会。

一、博弈论的基本概念和原理1.1 构成博弈论的基本要素博弈论研究的基本要素包括玩家、策略和支付。

玩家是博弈中的决策者,策略是玩家可选择的行动方案,支付是博弈的结果对玩家所产生的效用。

1.2 纳什均衡纳什均衡是博弈论中最重要的概念之一。

在一个博弈中,若每个参与者选择了一个策略,并且没有一个参与者愿意改变自己的策略,那么这种策略组合就被称为纳什均衡。

纳什均衡是一个非合作博弈中的稳定状态。

1.3 合作博弈与非合作博弈博弈论可分为合作博弈和非合作博弈两大类。

合作博弈强调玩家之间的合作与协调,而非合作博弈中玩家之间是相互独立的,没有直接的合作关系。

二、博弈论的应用领域2.1 经济学中的博弈论应用在经济学中,博弈论被广泛应用于市场竞争、拍卖、企业策略等方面。

通过博弈论的模型和方法,我们能够更好地理解各种经济行为和市场现象,并提供决策方案。

2.2 政治学中的博弈论应用政治学中,博弈论主要应用于研究选举、政策制定等政治行为。

博弈论揭示了政治参与者之间的互动关系和利益博弈,为我们分析政治决策提供了一种新的视角。

2.3 社会学中的博弈论应用博弈论在社会学中的应用主要涉及合作与互助、社会规范等方面。

通过博弈论的分析,我们能够更好地理解人类社会中的合作关系、道德行为和社会规范的形成。

三、耶鲁大学开放课程博弈论学习心得在学习耶鲁大学开放课程博弈论的过程中,我深刻体会到博弈论的重要性和应用广泛性。

通过学习博弈论,我不仅了解了博弈论的基本概念和原理,还学会了运用博弈论的方法分析和解决实际问题。

耶鲁大学开放课程博弈论课程的教学内容十分丰富,通过生动的案例分析和实践操作,课程帮助我更好地理解了博弈论的核心思想和应用方法。

博弈论读书笔记

博弈论读书笔记

1、 人面对自然物时如何行为?寻找人类如何最大化的使用自然物的途径,主要借鉴自然科学所积累的知识及其提升的工具理性。

2、 人面对着他人或社会时如何行为?探究如何充分运用人的理性以及实现社会需求的最大化,需啊哟分析具体环境下人的行为方式和偏好。

3、 博弈思维的联合理性就具有双重特性:一是相互依存,即博弈中的任何博弈方都受到其他博弈方行为的影响;二是理性行为,即博弈方的决策必定建立在预测其他博弈方的行动之上。

4、 非合作的纳什均衡存在以下问题:纳什均衡的非唯一性;不考虑博弈方的策略选择如何影响对手的策略;允许不可信威胁的存在。

5、 完美信息是指一个博弈方对其他博弈方的行动都有准确的了解,即么个信息集只包含一个值。

完全信息则是指自然不首先行动和自然地初始行动被所有博弈方准确观察到,即没有事前的不确定性。

不完全信息意味着不完美信息,但不完美信息并不意味着不完全信息。

6、 在不完全信息博弈中,首先行动的是“自然”,“自然”决定了博弈方以多大的可能性采取某种行动,由“自然”决定的每个博弈方以多大的可能性采取某种行动的情况只有每个博弈方个人知道,其他博弈方都不知道。

确定博弈是指不存在由“自然”作出行动的博弈,否则就是不确定博弈。

7、 严格占优均衡是指无论对手选择何种策略,均衡状态时的策略都是博弈方的最好选择;纳什均衡则是指在对手不改变当前策略的条件下,均衡状态时的策略是博弈方的最好选择。

8、 在对策G 中,如果策略组合1(,,)n s s **是一个纳什均衡,那么它的严格占优策略在重复剔除过程中就不会被剔除掉。

如果策略组合是剔除的严格占优策略均衡,那么他一定是一个纳什均衡。

9、 一般地,要使得任何有限博弈都存在纳什均衡这一命题,就必须有个前提条件:允许博弈方选择混合策略,即博弈方以一定的概率选择某种策略。

设想在多次反复博弈中,博弈方的最终收益状况可以从平均得益上表现出来。

一般地,如果一个策略规定博弈方在每个给定的信息情况下只选择一种特定的行动,就称该策略为纯策略;相反,如果一个策略规定博弈方在每一个给定的信息情况下以某种概率分布随机地选择不同的行动,就称为混合策略。

《博弈论基础》读书笔记(一)博弈标准式与纳什均衡

《博弈论基础》读书笔记(一)博弈标准式与纳什均衡

《博弈论基础》读书笔记(⼀)博弈标准式与纳什均衡在之前⼀个⽼师的安利下,还是开了这个博弈论的坑。

书是:这本书本⾝写的⾮常棒,⽽且很易懂,强烈安利。

顺便⾃⼰记录下读书的笔记和⼀些想法,同时也把书中⽐较难理解的地⽅⽤⾃⼰的理解说⼀下,希望能帮到⼤家。

第⼀章 1完全信息静态博弈在本章,我们来讨论如下简单形式的博弈(包含如下特点):1. 静态博弈:所有游戏的参与者同时选择⾏动,然后根据⾏动每个参与者得到各⾃的结果2. 完全信息博弈:即每⼀个参与者的收益函数在所有参与者之间是共同知识,即不存在信息的不对称性,也就是说每个参与者对游戏规则以及游戏演化机理完全明⽩。

关于本章的结构:在1.1节中我们先会介绍两个问题:1. 如何描述⼀个博弈问题2. 如何求得博弈问题的解在1问题中我们定义了博弈的标准式表述和严格劣战略的概念,在2问题中我们根据前⾯的介绍引出了纳什均衡的概念。

在1.2节中我们会运⽤前⾯的⼯具来分析古诺(Cournot,1838)的不完全竞争模型,使⽤纳什均衡的⽅式对之进⾏求解,之后我们将重回理论知识,我们将会定义混合战略,它可以理解为⼀个参与者并不能确定其他参与者会如何⾏动时应该选的战略,之后会引出纳什定理。

1.1节博弈的标准式和纳什均衡1.1.A 博弈的标准式表述⾸先举⼀个⼤家都⽐较熟悉的、很经典的例⼦:囚徒困境警⽅逮捕甲、⼄两名嫌疑犯,但没有⾜够证据指控⼆⼈⼊罪。

于是警⽅分开囚禁嫌疑犯,分别和⼆⼈见⾯,并向双⽅提供以下相同的选择:若⼀⼈认罪并作证检控对⽅(相关术语称“背叛”对⽅),⽽对⽅保持沉默,此⼈将即时获释,沉默者将判监10年。

若⼆⼈都保持沉默(相关术语称互相“合作”),则⼆⼈同样判监1年。

若⼆⼈都互相检举(相关术语称互相“背叛”),则⼆⼈同样判监8年。

对于这个博弈我们可以来使⽤如下矩阵来进⾏描述对于这个矩阵,其横纵轴分别为囚徒1、2所对应的选择。

⽅框⾥的值第⼀项代表在此选择下,囚徒1 的收益情况,第⼆项代表囚徒2的收益情况。

博弈论读书笔记(五)重复博弈

博弈论读书笔记(五)重复博弈

博弈论读书笔记(五)重复博弈2.3重复博弈从这⾥开始,就进⼊博弈论⽐较难以理解的地⽅了。

我也不跟着书上的章节⾛,根据⾃⼰的理解和书上的例⼦来写,如果理解有什么不对的地⽅,欢迎各位⼤佬的指正。

⾸先我们来明晰博弈论到底在讨论些什么:对于这个问题,前⾯⼏章的内容可能对⼤家会造成⼀定的误导。

因为根据前⾯⼏章的例⼦,我们可以很容易地认为,博弈论就是在讨论在某个规则下,参与者最优的策略和参与者之间达到的平衡。

这句话本⾝没有错误,但是我们很容易理解为:这个平衡是像最开始那两个囚徒⼀样,选择“保证对⽅不会背叛并且⾃⼰在此情况下能获得最⼤利益”的战略所达到的平衡(这句话有点难以理解,不过我相信你能明⽩我的意思)。

例如第⼀章第⼀节中囚徒困境双⽅都选择招认(因为选择合作即不招认,结果可能是被背叛)。

但是⼀旦进⼊了重复博弈那么我们就不能只考虑眼前的利益(即保守地只去选择单次博弈的纳什均衡),⽽要考虑多次重复博弈的总收益。

这个时候就需要参与双⽅共同商定⼀个“协议”(例如双⽅说好都选择不招认),这个协议必须是对于双⽅都有利的(⾄少由于选择单次博弈的纳什均衡,例如双⽅不招认总⽐双⽅都招认要好),并且协议中会对不遵守规则的进⾏惩罚,以便于对每个⼈来说选择合作是最好的结果。

从这⾥我们就可以理解“博弈论教你如何制定规则的”这句话了。

好了,这⼀章最核⼼的思想在这⾥已经讲完了,虽然我可能说的不是那么清晰,不过还是希望你能认真理解上⾯所说的,这会对下⾯的概念理解有很⼤帮助。

2.3.A两阶段重复博弈先给出⼏个先⾏的定义和定理:定义:对个定的阶段博弈G,令G(T)表⽰G重复T次的有限重复博弈,并且在下⼀次博弈开始前,所有以前的博弈都可以被观测到。

G(T)的收益为T次阶段博弈收益的简单相加。

这个定义最重要的是引出⼀个重复博弈中收益的概念,即T次博弈的收益简单相加,后⾯我们会提到贴现的概念,不过到这⾥先理解到简单相加就⾏。

定理:如果阶段博弈G有唯⼀的纳什均衡,则对任意有限的T,重复博弈G(T)有唯⼀的⼦博弈精炼解:即G的纳什均衡结果在每⼀阶段重复进⾏。

博弈论 耶鲁公开课 笔记及扩展

博弈论 耶鲁公开课  笔记及扩展

#共谋和防共谋均衡Coalition and Coalition-proof Equilibrium:在多人(大于两人)博弈中,可能存在部分博弈者追逐小团体利益而 影响纳什均衡的稳定性,与之相对防共谋均衡是指,多人博弈中,任 意n(n=1,2,3.....n)人的串通都不会改变博弈的结果
完美信息指参与者对其他参与者行动action的完全知识的状态,并随信息的出现而更新。比如下象棋中你不可能知道对手下一手棋是 为了吃马还是吃兵或者其他的什么,但是你确确实实知道对手下了一手棋
4.严格劣策略strictly dominated strategy
完全信息动态博弈------------------------------------------------------------------------------------------------------------
5.动态博弈Dynamic Games(序列博弈Sequential Games 多阶段博弈Multistage Games 扩展形博弈Extensive Form Games)
a.基本分析方法(适用范围由小至大):
&1 上策(占优策略Dominant strategy)均衡 :在某个博弈中,不管其他博弈者如何选择,一博弈方的策略带来的效益永远优于选择其 他策略的效益,至少不低于(如囚徒困境中选择坦白)
#帕累托上策均衡Pareto Dominant Equilibrium:在某个博弈当中可能有多个纳什均衡,但这些均衡明显具有优劣差异,所有的博弈方都 倾向于同一个纳什均衡,即其中一个纳什均衡带来的效益优于其他均衡带来的效益(例 如两国交战模型中有两个纳什均衡(战争,战争)(和平,和平)后者明显优于前者)

博弈论的读书笔记

博弈论的读书笔记

博弈论的读书笔记博弈论,这一充满智慧和策略的领域,如同一个神秘的棋局,每一步决策都可能影响最终的胜负。

通过对相关书籍的研读,我仿佛走进了一个充满谋略与思考的世界。

博弈论研究的是在互动情境中,参与者如何做出最优决策。

这里的“最优”并非单纯的自身利益最大化,而是在考虑其他参与者行动的基础上,寻求相对最优的结果。

让我们从一个简单的例子说起——“囚徒困境”。

两个犯罪嫌疑人被分别审讯,如果两人都保持沉默,那么每人判刑一年;如果一人坦白而另一人沉默,坦白者将被释放,沉默者判刑十年;如果两人都坦白,则每人判刑五年。

在这种情况下,从个体角度看,坦白似乎是最优选择,因为无论对方如何选择,坦白都能带来相对较轻的刑罚。

但如果两人都这样想,最终的结果却是两人都判刑五年,这并非整体的最优结果。

这个例子深刻地揭示了个体理性与集体理性之间的冲突。

在现实生活中,类似的情况屡见不鲜。

比如企业之间的价格战,每家企业都想通过降低价格来吸引更多客户,获取更大的市场份额。

但当所有企业都这样做时,整个行业的利润都会下降,大家都受到损失。

博弈论中的另一个重要概念是“纳什均衡”。

以“斗鸡博弈”为例,两个司机相向而行,如果都不让路,就会发生碰撞,双方都受损;如果一方让路,让路的一方会觉得丢面子,不让路的一方则会顺利通过。

在这个博弈中,存在两个纳什均衡,即一方让路,另一方不让路。

这种均衡状态一旦达到,任何一方单方面改变策略都不会使其受益。

在博弈中,信息的掌握程度也至关重要。

如果一方拥有更多或更准确的信息,就可能在博弈中占据优势。

比如在拍卖中,知道其他竞拍者的心理价位和出价策略,就能更好地决定自己的出价。

同时,博弈的类型也多种多样。

有完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。

每种类型都有其独特的特点和分析方法。

完全信息静态博弈中,参与者同时做出决策,且对彼此的策略和收益都了如指掌。

而完全信息动态博弈则是参与者依次做出决策,后面的参与者能够看到前面参与者的决策。

(完整版)耶鲁公开课--博弈论笔记

(完整版)耶鲁公开课--博弈论笔记

耶鲁公开课—博弈论笔记第一节、名词解释优势策略(Dominant strategy ):不论其他局中人采取什么策略,优势策略对一个局中人而言都是最好的策略。

即某些时候它胜于其他策略,且任何时候都不会比其他策略差。

注:1、“优势策略”的优势是指你的这个策略对你的其他策略占有优势,而不是无论对手采用什么策略,都占有优势的策略。

2、采用优势策略得到的最坏的结果不一定比采用另外一个策略得到的最佳的结果略胜一筹。

严格劣势策略(strictly dominated strategy):被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。

弱劣势策略:原来不是严格劣势策略,但是经过剔除严格劣势策略后,这个策略就成了严格劣势策略。

例:囚徒困境囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。

就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。

试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。

若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。

背叛是两种策略之中的支配性策略。

因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

例:协和谬误20世纪60年代,英法两国政府联合投资开发大型超音速客机,即协和飞机。

该种飞机机身大、装饰豪华并且速度快,其开发可以说是一场豪赌,单是设计一个新引擎的成本就可能高达数亿元。

难怪政府也会被牵涉进去,竭力要为本国企业提供更大的支持。

项目开展不久,英法两国政府发现:继续投资开发这样的机型,花费会急剧增加,但这样的设计定位能否适应市场还不知道;但是停止研制也是可怕的,因为以前的投资将付诸东流。

随着研制工作的深入,他们更是无法做出停止研制工作的决定。

《博弈论-最高级的思维和生存策略》读书笔记

《博弈论-最高级的思维和生存策略》读书笔记

《博弈论-最⾼级的思维和⽣存策略》读书笔记⼀、博弈论是什么博弈论:是指双⽅或者多⽅在竞争、合作、冲突等情况下,充分了解各⽅信息,并依此选择⼀种能为本⽅争取最⼤利益的最优决策的理论。

博弈四要素:1. ⾄少两个参与者2. 利益3. 策略4. 信息博弈论基本前提:博弈的所有参与者都是“理性⼈”。

就是指参与者全是利⼰的。

博弈论的核⼼:参与者通过制定策略为⾃⼰争取最⼤利益。

博弈的分类:根据参与者之间是否有⼀个具有约束⼒的协议合作博弈(利益分配)和⾮合作博弈(个⼈利益最⼤化)根据参与者选择策略、做出决定的先后顺序静态博弈(参与者同时决策)和动态博弈(⼀⽅在已知另⼀⽅的⼀个决策后做出⾃⼰的决策)根据对其他参与者的信息掌握程度完全信息博弈和不完全信息博弈根据博弈的结果划分负和博弈、零和博弈、正和博弈⼆、纳什均衡是什么2.1、纳什均衡:多⼈参加的博弈中,每个⼈根据他⼈的策略制定⾃⼰的最优策略。

所有⼈的这些策略组成⼀个策略组合,在这个策略组合中,没有⼈会主动改变⾃⼰的策略,那样会降低他的收益。

只要没有⼈做出策略调整,任何⼀个理性的参与者都不会主动改变⾃⼰的策略。

2.2、纳什均衡带给我们的启⽰:个体的最优决策不⼀定能带来最⼤化的社会利益,唯有找出这些决策之间的均衡才可以做到。

三、囚徒博弈1. 组织垄断的最有效⼿段是⿎励竞争,只有通过竞争,商家才能提供更优质的服务和物美价廉的商品。

2. 好⼈之间是互惠互利的,坏⼈之间是互相算计的。

好⼈遇到坏⼈⾃⼰的优势就会变成劣势,只有好⼈遇到好⼈才会体现出⾃⼰的优势。

3. 博弈双⽅是否选择合作取决于双⽅是否存在共同利益。

4. 重复性博弈促成了⼈与⼈之间的信任与合作,不要让对⼿看到尽头,⾛出囚徒困境。

5. 囚徒博弈揭⽰了个⼈利益和集体利益的关系,在不对等信息的前提下,设置奖励,双⽅为了获取奖励进⼊两难境地进⽽展开博弈。

四、智猪博弈1. 占便宜2. 抱⼤腿3. 名⼈效应4. 设置奖励机制可以拒绝搭便车五、猎⿅博弈1. 合作取得利益最⼤化:每个⼈都是独⽴的个体,在决策时只从⾃⾝的利益出发进⾏考虑,与别⼈缺少必要的沟通和协调。

最新博弈论公开课1~5节笔记

最新博弈论公开课1~5节笔记

第四节:足球比赛与商业合作之最佳对策 伐点球问题:
Goaler
l
r
Shooter
L
4,-4
9,-9
M
6,-6
64
U1(L,l)=4——射进的概率为 40% 结论:无论如何千万不要从中路射门。
不要选择任何信念下都非最佳对策的策略。 我们忽略了什么?
…… Definition3(最佳对策): (1)Player i’s strategy si is a best response(BR) to the strategy s-i of the players
例:
II
I
L
T
5,-1
C
R
11,3
0,0
B
6,4
0,2
2,0
Players:I and ii Strategy alternatives: S1={T,B} S2={L,C,R} Payoffs: Ui(T,C)=11 Uii(T,C)=3 博弈分析: 不管 i 怎么选,中间总是优于右边(center strictly dominates right),得出结论,参与者 ii 不应 该选右。
Definition1:Player I’s strategy “s’i” ,is strictly dominated by player i’s strategy “si” ,if “Ui” from choosing “s-i”, is strictly bigger than UI(si) when other people choose “s’i”,forall”s-i”.(参与者 i 的策略 s’i,严格劣于参与者 i 的另一个策略 si,在其他参与者选择 s-i 时,此情况下选 s’i 的收 益 UI(s’i),对所有的 s-i 均成立。)

耶鲁大学公开课博弈论笔记(博弈论24讲)

耶鲁大学公开课博弈论笔记(博弈论24讲)

博弈论作业(博弈论24讲)数应专业一、1、理性人:指代这一类人,他们只关心自己的利益。

2、如果选择a的结果严格优于b,那么就说a相对于b来说是一个严格优势策略。

结论:不要选择严格略施策略。

3、理性人的理性选择造成了次优的结果4、举例:囚徒困境、宿舍卫生打扫问题、企业打价格战等5、协和谬误收益很重要,“如欲得之,必先知之”6、要学会换位思考,站在别人的立场上看别人会怎么做,在考虑自己受益的同时,要注意别人会怎么选择二、1、打渔问题、全球气候变暖与碳排放问题2、博弈的要素:参与人、策略集合、收益3、如果策略a严格劣于策略b,那么不管他人怎么选择,b总是更好的选择4、军队的入侵与防卫问题5、所有人都从1到100中选个数字,最接近所有人选的数字的均值的2/3者为胜,这个数字是多少呢?作为理性人,每个人都会选择67(100*2/3)以下的数,进一步假设你的对手也是理性的,你会选择45(100*4/9)以下的数……依据哲学观点,如果大家都是理性程度相当的,那么最后数字将为1,然而结果却是9,这说明博弈的复杂性6、共同知识与相互知识的区别三、1、利用迭代剔除法领悟中间选民问题2、迭代剔除法就是严格下策反复消去法,不断地把劣势策略剔除出去,最后只剩下相对优势的策略3、中间选民问题就是,在两党制中,政党表述施政纲领要吸引位于中间位置的选民,他们认为在选举中处于中间标度可以吸引左右两边的选民,并以此获得胜利。

4、中间选民问题理论成立的条件是有两个参与人;政治立场能使选民相信。

5、由此延伸出来的还有加油站选址问题,两家加油站不是在不同的路口选址,而是在不确定哪个位置较佳的时候会选在同一处,这也是“中间选民定理”的凸显6、在迭代剔除法不能运用时,比如说该博弈中博弈方1和2均没有严格下策,可以用二维坐标系画出选择策略之后的收益分布四、1、罚点球:一个经过模型简化的点球模型:罚球者可以选择左路,中路,右路3种路线去踢点球,门将可以选择向左扑救或者向右扑救(门将没有傻站着不动的option)。

耶鲁博弈论24讲全笔记

耶鲁博弈论24讲全笔记

耶鲁博弈论24讲全笔记第一部分:博弈论的基础知识1、博弈论的定义及其在现实生活中的应用《耶鲁博弈论24讲全笔记》“1、博弈论的定义及其在现实生活中的应用”博弈论,这个引人入胜的学科,是一门研究决策问题的独特学科。

它的基本思想在于,把复杂多变的真实世界简化为具有明确规则和目标的多人决策问题。

在这个世界里,每一个参与者都需要根据其他参与者的策略来调整自己的决策,以期达到各自的目标。

博弈论起源于棋类游戏,如国际象棋和围棋,这些游戏的规则明确,且每个玩家都有可能成为赢家或输家。

然而,博弈论的应用远不止于此。

在现实世界中,博弈论的原理被广泛应用于政治、经济、生物、国际关系等多个领域。

在政治领域,博弈论可以帮助我们理解权力平衡和国际关系。

例如,囚徒困境就是一个经典的博弈论模型,它描述了两个囚犯因共同犯罪而受审的情况。

在这个情境中,两个囚犯都需要做出决策,是否选择揭发对方。

这个模型不仅可以解释为什么有时候合作会带来更大的利益,也可以揭示为什么有时候,即使个人利益最大化的选择也会导致集体的非最优结果。

在经济领域,博弈论更是具有广泛的应用。

例如,拍卖中的博弈论可以帮助我们理解为什么拍卖可以带来高昂的成交价,以及为什么有时候最低价拍卖可以带来最大的社会利益。

此外,博弈论还可以帮助我们理解市场垄断、价格竞争等复杂的市场行为。

在生物学领域,博弈论被用来解释生物种群的进化策略,如猎物的捕食者与被捕食者之间的动态关系。

在医学领域,博弈论也被用来理解和预测疾病的发展和传播。

总的来说,博弈论是一种独特的思考方式,它可以帮助我们理解真实世界中的决策和策略行为。

它的应用广泛,无论是在政治、经济、生物还是其他领域,都可以找到博弈论的应用实例。

通过学习博弈论,我们可以更好地理解真实世界中的决策过程,并找到更优的决策策略。

2、博弈的参与者、策略和结果《耶鲁博弈论24讲全笔记》是一本介绍博弈论的经典教材,第二讲“博弈的参与者、策略和结果”是其中的重要部分。

《博弈论:每个人都能成为决策高手》笔记

《博弈论:每个人都能成为决策高手》笔记

《博弈论:每个人都能成为决策高手》读书随笔目录一、内容综述 (2)二、博弈论基础知识 (3)1. 博弈论的起源与发展 (4)1.1 古代博弈思想 (6)1.2 现代博弈论的诞生 (7)1.3 博弈论的发展及现状 (7)2. 博弈论的核心概念与分类 (8)2.1 博弈论的定义 (9)2.2 博弈的要素 (10)2.3 博弈的分类 (12)三、博弈论在生活中的实际应用 (13)1. 竞争与合作 (14)1.1 市场竞争策略 (16)1.2 个人与团队的合作博弈 (17)1.3 竞争与合作的心理博弈 (18)2. 决策过程中的应用 (19)2.1 决策前的信息收集与分析 (20)2.2 基于博弈论的决策模型建立 (21)2.3 决策执行与调整策略 (22)四、博弈论在职场中的应用分析 (24)一、内容综述《博弈论:每个人都能成为决策高手》为我们揭示了博弈论的奥秘与魅力。

在这本书中,作者深入浅出地阐述了博弈论的基本原理和策略思维,通过丰富的案例和实验,引导读者理解如何在复杂的社会环境中做出明智的决策。

作为一门研究决策主体之间相互依赖和竞争行为的学科,为我们提供了全新的视角来分析问题。

它教会我们如何在有限的信息和资源下,通过合理的策略选择来实现自身利益的最大化。

博弈论也强调了合作与竞争之间的微妙平衡,引导我们在追求个人利益的同时,也要考虑到他人的利益,实现共赢。

这本书的内容丰富而实用,涵盖了博弈论的各个方面,包括囚徒困境、纳什均衡、重复博弈、信号博弈等。

通过这些章节的学习,我们可以掌握博弈论的核心思想和分析方法,从而在日常生活和工作中更加自信地面对各种决策挑战。

值得一提的是,这本书的语言生动、有趣,使得原本枯燥的博弈论变得易于理解和接受。

作者运用通俗易懂的文字和生动的案例,将复杂的理论概念一一化解,让我们在轻松愉快的阅读中收获知识和思考。

这种深入浅出的表达方式,使得每一个读者都能从中受益,无论是在学术研究还是实际应用上都具有重要的参考价值。

博弈论的读书笔记

博弈论的读书笔记

博弈论的读书笔记博弈论,听起来似乎是一门高深莫测的学问,但实际上,它与我们的日常生活息息相关。

当我们在菜市场与摊主讨价还价、在工作中与同事竞争合作、在家庭中与亲人协商决策,都在不知不觉中运用着博弈论的智慧。

博弈论研究的是在互动情境中,参与者如何做出最优决策。

这里的“互动”意味着每个参与者的决策都会影响到其他参与者的收益,而“最优决策”并非仅仅是对自己最有利的选择,而是要考虑到对手可能的反应和整个局面的变化。

在博弈论中,有一个经典的例子——“囚徒困境”。

假设警察抓住了两个嫌疑犯,分别关在不同的房间进行审讯。

如果两人都保持沉默(即合作),那么每人都只会被判刑 1 年;如果一人坦白而另一人沉默,坦白者将被释放,沉默者则会被判刑 3 年;如果两人都坦白(即背叛),则每人都会被判刑 2 年。

在这种情况下,从个体角度出发,每个嫌疑犯都会发现,无论对方如何选择,自己坦白总是更有利。

但最终的结果却是两人都坦白,都被判刑 2 年,这并不是整体的最优结果。

这个例子深刻地揭示了个体理性与集体理性之间的冲突。

在现实生活中,类似的情况也屡见不鲜。

比如在企业竞争中,各个企业为了争夺市场份额,可能会采取过度的价格战,导致大家的利润都受损。

另一个重要的概念是“纳什均衡”。

它指的是在一个博弈中,每个参与者的策略都是对其他参与者策略的最佳回应,从而没有任何一个参与者有动力单独改变自己的策略。

以“斗鸡博弈”为例,两个司机开车相向而行,谁先转向谁就被视为胆小鬼,但若都不转向就会发生碰撞。

在这个博弈中,存在两个纳什均衡,即一个司机转向,另一个司机不转向。

博弈论不仅在经济学中有广泛的应用,在政治学、社会学、生物学等领域也发挥着重要作用。

在政治选举中,候选人的策略选择往往是一种博弈;在社会交往中,人们之间的互动也可以用博弈论来分析;甚至在生物进化中,物种之间的竞争和合作也可以看作是一种博弈。

了解博弈论对于我们的生活有着诸多启示。

它让我们更加理性地看待竞争与合作。

《博弈论基础》学习笔记

《博弈论基础》学习笔记
针对图445而在高能力工人随机选择信号的杂合均衡中混同均衡必然在红色阴影区域中此区域中低能力工人可以获益而高能力工人得到的工资少于其为教育而付出的成本故在低能力工人随机选择信号的杂合均衡中混同均衡必然在蓝色阴影区域中此区域中高能力工人可能仅仅是可能如在点是他的严格劣信号所以这一杂合均衡不符合要求5
《博弈论基础》学习笔记
间的概率分布为 { p(t 2 CH | t1 ) , p(t 2 CL | t1 ) 1 }。 14、仔细理解课本 P118 中的一、二两段内容。需知在 求解贝叶斯纳什均衡的时候,参与人的类型空间很重要(比
其他参与人的推断还重要) ,因为要根据它来确定战略空间。而
一个参与人的类型是根据他的私人信息划分的,因此明确一 个贝叶斯博弈中各参与人的私人信息非常重要。例如,在不 完全信息古诺模型中,企业 1 知道企业 2 的类型空间为 { C H , C L },而 { C H , C L }正是企业 2 的私人信息。 15、 “不完全信息静态博弈纳什均衡( BNE) ”概念理解 的要点:首先,一个 BNE 是将参与人 i 在所有类型下的最优 反应集合起来,假如参与人 i 有三个可能类型(即类型为离散
八、2.4 节“完全非完美信息动态博弈”要放在 2.3 节 “重复博弈”之前学习,同时配合 MIT 的 Yildiz 讲义的 “ Lectures3-6”学习。这样安排不仅符合博弈理论发展逻 辑,也利于学习和理解。 九、3.3 节属于微观经济学中的机制设计理论,跳过不 看。而且,吉本斯的书也没有把这个定理讲清楚,看它纯属 浪费时间。以后在高级微观经济学中学习即可。 十、在学习第四章的内容时,不要因为沉溺于对某一个 均衡的论证细节而忽略对该类博弈均衡的整体论证思路。例 如,通过劳动力市场学习“信号博弈”的时候,除了要理解 (注意是理解,它比“掌握”要低一层)信号博弈的分离均 衡、混同均衡和杂合均衡的具体证明思路之外,更关键的是 要掌握论证信号博弈的三个要求: 1、信号接收者的最优行 为方程是什么?如何找出? 2、信号发送者的最优信号是什 么?如何确定? 3、信号接收者的推断如何根据贝叶斯法则、 信号发送者行为来得到? 只有掌握了这些纲领性的东西,才能在日后的建模、解 题中做到以不变应万变。 十一、学习第四章的信号博弈模型时, 4.2.D 节可以跳 过不看。事实上,只要熟练掌握了斯彭斯的就业市场模型, 就基本达到信号博弈的学习要求了。另外,4.3.C 节讲的是 “合作博弈” 。 “合作博弈”是博弈论的一个研究方向,在本
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
存在的问题:外部性 博弈论学习笔记(一)四个入门结论
题目一
情景一: 在不被你对手看到的情况下,选择 α 或者 β,我们会按以下方式给出你们的成绩:
如果你选择 α 而你对手选 β,那么你得分+3 而你的对手得分-1 如果你们都选 α,那么你门的得分都+0 如果你选择 β 而你对手选 α,那么你得分-1 而你的对手得分+3 如果你们都选 β,那么你们的得分都+1
表达:s’i 严格劣于 si,Ui(si,s-i)>Ui(s’i,s-i) for all “s-i”.
文字表述:如果 si 总是更好的选择,即总能给参与人 i 带来更高的收益,而无论其他参与人 怎么选。
例:防线布置问题
入侵者打算入侵一个国家,有两条路,必须通过其一才能进入,你是这个国家的防御者, 要决定在哪个路口布置防线,只能防守二者之一。一条路崎岖(途中会损失一个营的兵力), 另一条路平坦,如果入侵者遇到了你布置的防线,不管哪条路都要再损失一个营的兵力。
Yale students are evil.
第二节:学会换位思考 博弈的要素有哪些?
要素 参与人 players
表述法(Notation) i,j
The Number game You all
策略 strategies
si(参与人 i 的某个策略)
13
Si(表示策略集合 Strategy alternatives) 1,2,3……100
S(表示某一次博弈)——一个策略组合(a strategy profile profile)
每个参与者对应一个策略组合(或是电 子表格的一个样本)
s-i(表示除了 i 外其他参与人的策略)
收益 payoffs
Ui(1,2……N)——所有参与人的策略决定 简写:Ui(s)
Payoffs=5dollars-mistakens 0dollars (otherwise)
αβ
α 0,0 +3,-1
β -1,3 +1,+1
这种情况下不管我的对手选择什么,我选 α 得到的结果总是最优的。
情景二: 在不被你对手看到的情况下,选择 α 或者 β,我们会按以下方式给出你们的成绩:
如果你选择 α 而你对手选 β,那么你得分-1 而你的对手得分-3 如果你们都选 α,那么你门的得分都+0 如果你选择 β 而你对手选 α,那么你得分-3 而你的对手得分-1 如果你们都选 β,那么你门的得分都+1
第四节:足球比赛与商业合作之最佳对策 伐点球问题:
Goalerlr源自ShooterL4,-4
9,-9
M
6,-6
6,-6
R
9,-9
4,-4
U1(L,l)=4——射进的概率为 40% 结论:无论如何千万不要从中路射门。
不要选择任何信念下都非最佳对策的策略。 我们忽略了什么?
…… Definition3(最佳对策): (1)Player i’s strategy si is a best response(BR) to the strategy s-i of the players
例:
II
I
L
T
5,-1
C
R
11,3
0,0
B
6,4
0,2
2,0
Players:I and ii Strategy alternatives: S1={T,B} S2={L,C,R} Payoffs: Ui(T,C)=11 Uii(T,C)=3 博弈分析: 不管 i 怎么选,中间总是优于右边(center strictly dominates right),得出结论,参与者 ii 不应 该选右。
αβ α 0,0 -1,-3 β -3,-1 +1,+1
这种情况下,当对手选 α,我选 α 较优;当对手选 β,我选 β 较优。-- 协和谬误(Coordination problem)
Test does 2 dominate 1? vs 1: U1(1,1)=50% < U1(2,1)=90% vs 2: U1(1,2)=10% < U1(2,2)=50% vs 3: U1(1,3)=15% < U1(2,3)=20% vs 4: U1(1,4)=20% < U1(2,4)=25% …… 结论:立场 2 严格优于立场 1
结论:入侵者不会采取“弱劣势策略”崎岖之路是弱劣势策略,应在平坦之路设防。
Definition2(弱劣势策略):Player I’s strategy “s’i” is weakly dominated by her strategy “si” if player i’s payoff from choosing “si” against “s-i” is always as big as or equal to payoff from choosing “s’i” against “s-i” for all things that anyone else could do.(参与者的策略 s’i 弱劣于其 他策略 si 当且仅当在对手选 s-i 的情况下,参与人 i 选择 si 的收益等于对手选 s-i 下她选 s’i 的收益。而且在任何情况下此条件均成立)
入侵者
e
h
防守者
E
1,1
1,1
H
0,2
2,0
入侵者收益为攻入国家时还剩多少兵力,防守者的收益为入侵者损失多少兵力。
分析:如果入侵者走 eazy pass,你应防守 eazy pass(优于 hard pass);
如果入侵者走 hard pass,你应防守 hard pass(优于 eazy pass)
Definition1:Player I’s strategy “s’i” ,is strictly dominated by player i’s strategy “si” ,if “Ui” from choosing “s-i”, is strictly bigger than UI(si) when other people choose “s’i”,forall”s-i”.(参与者 i 的策略 s’i,严格劣于参与者 i 的另一个策略 si,在其他参与者选择 s-i 时,此情况下选 s’i 的收 益 UI(s’i),对所有的 s-i 均成立。)
2.并非人人都在投票,有人不投票也是一种策略 3.实际上有多位候选人,不只有两个 4.候选人未必能坚定他的立场,也就是说选民未必相信你的立场 5.其他(党内初选,多维度问题) 『最佳对策』:Best response
2
l
r
1
u
5,1
0,2
m
1,3
4,1
d
4,2
2,3
选上是对手选左时的最佳对策 选中是对手选右时的最佳对策 上中下三个策略中对手选左或选右的可能性都为 1/2 Choosing upper:expacted payoff of U is (1/2,1/2)=1/2*5+1/2*0=2.5 Choosing middle: expacted payoff of M is (1/2,1/2)=1/2*1+1/2*4=2.5 Choosing down:expacted payoff of D is (1/2,1/2)=1/2*4+1/2*2=3 模型解法: 画坐标图,假设选左概率为 X,选右概率为(1-X),解出各自区域的概率面积,联立方程, X=1/3.
表达:s’i 弱劣于其他策略 si,Ui(si,s-i) >=Ui(s’i,s-i)
第三节:迭代剔除和中位选民定理 『迭代剔除』: 例:政治模型案例 假设有两个候选人,他们为了选举必须确定自己的政治立场,他们要从一系列政治主张中选 择一个政治立场。一共有 10 个立场, 1,2,3,4,5,6,7,8,9,10 最靠近左边的(1)代表左翼分子的立场,最靠近右边的(10)代表右翼分子的立场,现假 设每一个立场都会得到 10%的选票,选民们会投票给离他们最近的候选人,出现平局时选 票会分摊,收益为:候选者希望尽可能最大化获得的选票。 分析:1 为严格劣势策略,因为 2 优于 1,意味着选择立场 2 会比立场 1 获得更多选票,无 论另一个候选人如何选择。
Ui(si,s-i)>=Ui(si’,s-i) for all si’ vssi 参与人 i 的策略 si,是一个最佳对策 BR,是对手的策略 s-i 的最佳对策,如果参与人 i 在对 手的策略 s-i 下,选 si 的收益弱优于其他策略 si’,这对于参与人 i 的所有 si’都适用。 OR Si’ slove max Ui(si,s-i) (2) Player i’s strategy si is a best response(BR) to the strategy s-i of the players Eui(si,p)>=Eui(si’,s-i) for all si’ vssi 例:Eui(L,p)=p(l)*Ui(L,l)+p(r)*Ui(L,r) 合伙人博弈: 有两个实体共同完成一个协作项目,这两家公司平分利润,即各自持有 50%股份,每个股 东都要选择为公司投入多少精力,S=[0,4](连续的),假设这个企业的利润是已知的,计算 方式为:4*[s1+s2+b*s1*s2],0<=b<=1/4, 参与人 1 的收益 U1(s1,s2)=1/2*4*[s1+s2+b*s1*s2]-s1^2, 参与人 2 的收益 U2(s1,s2)=1/2*4*[s1+s2+b*s1*s2]-s2^2, 求参与人 1 的最佳策略。 分析:Max(s1) 2(s1+s2+b*s1*s2)-s1^2 一阶求导:2*(1+b*s2)-2*s1=0 二阶求导:s1=1+b*s2 =BR1(s2) S1 是参与人 1 的最佳对策 同理,s2=1+b*s1=BR2(s1) S2 是参与人 2 的最佳对策 由 S1=S2 得 S1=S2=1/(1-B)
相关文档
最新文档