博弈论(复旦大学 王永钦)

合集下载

复旦大学经济博弈论课件--经济博弈论242页PPT

复旦大学经济博弈论课件--经济博弈论242页PPT

30.11.2019
课件
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
课件
17
竞争:个体利益最大化
q1R 1(q2,q3)4 81 2q21 2q3
11 q2R 2(q 1,q3)4 82q 12q3 q 3R 3(q 1,q2)4 81 2q 11 2q2
q1 *q2 *q3 *24 u1*u2 *u3 *576
Q*72
u*1728
21
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈G {S1, Sn;u1, un中},博弈方 i的策略
空间为 Si {si1, sik},则博弈方 i以概率分布 pi (pi1, pik)
随机在其 k个可选策略中选择的“策略”,称为一个“混合策
略”,0其p中ij 1 j1, 对,k
u 1 u 1 ( P 1 ,P 2 ) P 1 q 1 c 1 q 1 ( P 1 c 1 ) q 1 (P 1 c 1 )a 1 ( b 1 P 1 d 1 P 2 )
u 2 u 2 ( P 1 ,P 2 ) P 2 q 2 c 2 q 2 ( P 2 c 2 ) q 2 (P 2 c 2 )a 2 ( b 2 P 2 d 2 P 1 )
上策均衡不是普遍存在的
30.11.2019
课件
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略

博弈论_读后感

博弈论_读后感

重复博博弈, 是 重复 次的重复博弈, ,如果 有唯一的纳什均衡,那么重复博弈 的唯一的子博弈精练纳什均衡结果,是阶段博弈 的纳什均衡重复 次,即在每个阶段博弈出现的都是一次性博弈的那个均衡结果。
对于无限次重复的囚徒困境博弈,存在触发策略,两个着名的触发策略分别是冷酷策略和礼尚往来策略。冷酷策略:指双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛,这个策略之所以冷酷,是因为任何局中人的一次性背叛将触犯永远的不合作。礼尚往来策略:开始的时候和冷酷策略一样,即双方都选择合作,在以后的每个阶段,如果你的对手在最近的一次博弈采取合作策略或者在最近联系k次策略中都选择合作策略,则你继续合作,如果你的对手在上一个阶段的博弈中采取背叛策略,则你在下一阶段博弈中采取背叛策略报复,或者在以后k次策略中选择背叛进行报复。
序贯决策博弈
序贯决策博弈的一个重要特征是总有一个局中人率先采取行动,因此衍生出先动优势和后动优势。先动优势:虽然双方都得到好处,但是先决策先行动的一方得益多一些(比如情侣博弈)。后动优势:虽然双方都得到好处,但是后决策后行动的一方得益多一些(比如分蛋糕、产品定价)。在这一节中,要准确把握了先动优势和后动优势的概念,摒弃先动者得益大于后动者得益即为先动优势和后动者得益大于先动者得益即为后动优势的观念。
混合策略纳什均衡:是指给定对方选择该相对最优混合策略的条件下,能使局中人自身的期望支付达到最大的混合策略,必须满足的条件如下:
利用反应函数法和直线交叉法,寻找同时决策有限博弈的混合策略纳什均衡。当存在多重纳什均衡时,需要用帕累托优势标准或者风险优势标准来筛选。
帕累托效率标准:经济的效率体现在配置社会资源以及改善人们的情况,主要看资源是否被充分利用,要想再改善某个人的利益,就必须损害其他局中人的利益,这时候就说一个经济已经实现了帕累托效率,相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未被充分利用,就不能说经济已达到帕累托最优。

博弈论 SPE 复旦大学 王永钦PPT课件

博弈论 SPE 复旦大学 王永钦PPT课件

Player H
1
T
HH -1 , 1
1 , -1
Player 2
HT
TH
-1 , 1 1 , -1
-1 , 1 1 , -1
TT 1 , -1 -1 rium
• The set of Nash equilibria in a dynamic game of complete information is the set of Nash equilibria of its normal-form.
8
Game tree
• If a node x is a
successor of another
node y then y is called a predecessor of x.
• In a game tree, any node other than the root has a unique predecessor.
Definition: extensive-form representation
• The extensive-form representation of a game specifies:
➢ the players in the game ➢ when each player has the move ➢ what each player can do at each of his or her
• Player 2’s strategies
➢H if player 1 plays H, H if player 1 plays T ➢H if player 1 plays H, T if player 1 plays T ➢T if player 1 plays H, H if player 1 plays T ➢T if player 1 plays H, T if player 1 plays T

基于博弈论的组合赋权评价方法研究

基于博弈论的组合赋权评价方法研究

基于博弈论的组合赋权评价方法研究全文共四篇示例,供读者参考第一篇示例:基于博弈论的组合赋权评价方法研究一、引言随着社会的发展和经济的不断增长,人们对于如何进行合理有效的评价和决策变得越来越重要。

组合赋权评价方法是一种常用的评价方法,其可以通过对各项指标进行加权,从而得到综合评价结果。

在现实生活中,由于各种因素的复杂性和变化性,传统的组合赋权评价方法可能存在一定的局限性。

如何利用博弈论的思想和方法来改进组合赋权评价方法成为了研究的一个热点问题。

二、博弈论的基本原理博弈论是研究冲突和合作的一种数学分支,它的基本原理是假设存在多个决策者,这些决策者之间存在利益冲突或者合作的关系。

在博弈过程中,每个决策者都会根据自身利益和对其他决策者的评价来进行决策。

博弈论通过建立数学模型来描述决策者之间的关系,并得出最优的决策方案。

基于博弈论的组合赋权评价方法可以将决策者看作是各项指标,他们之间存在着相互影响和相互制约的关系。

通过建立博弈模型,可以考虑到不同指标之间的关联性,从而更加客观和全面地评价事物的综合价值。

1.建立博弈模型在建立博弈模型时,首先需要确定各项指标之间的关系以及各指标的重要性。

可以利用专家咨询、数据分析等方法来确定各项指标的权重。

然后,利用博弈论的方法来描述不同指标之间的博弈关系,分析各指标之间的影响和制约关系。

2.求解最优解在得到博弈模型后,可以通过博弈论的求解方法来求解最优解。

通过分析各个决策者的策略和利益,可以确定最优的权重分配方案,从而得出最优的评价结果。

四、实例分析为了说明基于博弈论的组合赋权评价方法的有效性,我们以某公司的绩效评价为例进行分析。

假设该公司的绩效评价包括财务绩效、客户满意度、员工满意度和社会责任等四个指标,我们可以建立一个博弈模型来评价公司的绩效。

我们确定四个指标的权重分别为0.3、0.2、0.3和0.2。

然后,我们利用博弈论的方法来描述这四个指标之间的博弈关系。

我们发现,财务绩效和客户满意度存在正相关的关系,员工满意度和社会责任存在正相关的关系,但财务绩效和员工满意度之间存在负相关的关系。

博弈论讲义-概述1

博弈论讲义-概述1

第一章 概述-人生处处皆博弈
注意两点: 注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 概述-人生处处皆博弈
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
参与人
ห้องสมุดไป่ตู้
第一章 概述-人生处处皆博弈-基本概念
博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动: 行动:参与人的决策变量 战略: 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和 行动的知识 支付函数: 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡: 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈 规则决定均衡。
完全信息静态博弈 纳什均衡
第一章 概述-人生处处皆博弈
纳什(1950,1951)
分析:上述博弈属于何种类型的博弈?
囚徒困境 坦白
囚徒 B 囚徒A
抵赖
坦白 抵赖 行动
-8,-8 -10,0
0,-10 -1,-1
支付函数
完全信息静态博弈 纳什均衡
纳什(1950,1951)
第一章 概述-人生处处皆博弈-智猪博弈
第一章 概述-人生处处皆博弈-囚徒困境 亚当斯密在1776年发表的经典之作《原富》中认为: 亚当斯密在1776年发表的经典之作《原富》中认为: 1776年发表的经典之作

复旦大学经济博弈论课件--经济博弈论536页

复旦大学经济博弈论课件--经济博弈论536页
以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
d d x tx ( u y u ) x (x x 2 ) x 2 ( 1 x ) x 2 x 3
22.03.2020
课件
14
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
22.03.2020
其中abcd可以是任何得益,根据问题设定。
22.03.2020
课件
17
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
d d x tx(u 1 u )x[u 1x1u (1x)u 2] x(1x)u (u) x(1x)x[(ac)(1x)b (d)]
复制动态 相位图
22.03.2020
x 课件
1
x
18
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
d x F (x ) x (1 x )x [ (a c ) (1 x )b ( d )] dt
22.03.2020
课件
3
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群0
课件
4
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型

博弈论讲义

博弈论讲义

1.4.2博弈论的形成
冯.诺伊曼和摩根斯坦《博弈论和经济行为》 Theory of Games and Economic Behavior 1944 引进扩展形(extensive form)表示和正规形 (normal form)或称策略形(strategy form)、 矩阵形(matrix form)表示 提出稳定集(stable sets)解概念 正式提出创造博弈论一般理论的主意 给出博弈论研究的一般框架、概念术语和表述 方法
一、基本模型
囚徒 2 坦 白 囚 坦 白 徒 1 不坦白 囚徒1:坦白 囚徒2:坦白 -5, -5 -8, 0 不坦白 0, -8 -1, -1
两个罪犯的得益矩阵
二、双寡头削价竞争
寡头2 高 价 寡 头 1 高 价 低 价 100,100 150,20 低 价 20,105 70,70
双寡头的得益矩阵
1.3.3 博弈中的得益
得益:各博弈方从博弈中所获得的利益 得益对应博弈的结果,也就是各博弈方策 略的组合 得益是各博弈方追求的根本目标及行为和 判断的主要依据 根据得益的博弈分类:零和博弈、常和博 弈、变和博弈



零和博弈:也称“严格竞争博弈”。博弈方之 间利益始终对立,偏好通常不同 —猜硬币,田忌赛马,石头-剪刀-布 常和博弈:博弈方之间利益的总和为常数。博 弈方之间的利益是对立的且是竞争关系 —分配固定数额的奖金、利润,遗产官司 变和博弈:零和博弈和常和博弈以外的所有博 弈。合作利益存在,博弈效率问题的重要性。 —囚徒困境、产量博弈、制式问题等
1.1.2 一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定 的环境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。

《复旦大学--经济博弈论》-公开课件

《复旦大学--经济博弈论》-公开课件

n 克劳鳆和索贝尔采用的一种随机选择的混合策 略可以克服这种问题。
1/26/2020
复旦大学经济博弈论课件
部分合并完美贝叶斯均衡的区间划分和数量
n两区间部分合并均衡区间长度不等长, =0.5-2b,前一 个区间的长度是 -0 = 0.5-2b,后一个区间的长度为1- = 0.5+2b,后一个区间长4b。 n结论对更多区间的部分合并均衡也成立。n区间,[ , ) 是之一,长度为c,行为方对该区间类型最优行为( + )/2 ,对后一区间[ , )类型的最佳行为( + )/2。两个区间 交界处类型声明方偏好的行为,须在( + )/2和( + )/2 间无差异:
1/26/2020
复旦大学经济博弈论课件
8.1.1 不完全信息动态博弈问题
n 古玩市场等各种议价博弈 n 不完全信息先后选择产量的寡头市场产量博弈 n 彩礼问题 n 广告对消费者的影响 n 学历、成绩在招聘人才、员工中的作用 n 投保人寿保险前的体检 n 学生考试前和毕业论文中的诚信承诺
1/26/2020
声明方 类型
2,0 1,1 1,1 2,0
不能传递信息(声明方 与行为方偏好相反)
1/26/2020
1. 不同类型的声明方必须偏好行为方不同行为 2. 对应声明方不同类型行为方必须偏好不同行为 3. 行为方的偏好必须与声明方具有一致性
复旦大学经济博弈论课件
离散型声明博弈模型
1/26/2020
复旦大学经济博弈论课件
第八章 不完全信息动态博弈
本章讨论不完全信息动态博弈,也就是动 态贝叶斯博弈。动态贝叶斯博弈与静态贝叶斯 博弈在许多方面是相似的,差别只是动态贝叶 斯博弈转化成的不是两阶段有同时选择的特殊 不完美信息动态博弈,而是更一般的不完美信 息动态博弈,因此可以直接利用不完美信息动 态博弈的均衡概念进行分析。本章主要介绍信 息传递条件、机制和效率方面的模型。

博弈论在企业经营管理中的应用研究——以Q_公司为例

博弈论在企业经营管理中的应用研究——以Q_公司为例

A案例分享NLIFENXIANG博弈论在企业经营管理中的应用研究以Q公司为例王蕴恺1㊀㊀姜圣业2(1.青岛啤酒股份有限公司ꎬ山东㊀青岛㊀266000ꎻ2.山东科技大学ꎬ山东㊀济南㊀250031)摘㊀要:全球融合的市场竞争带给经济发展新的趋势和特点ꎬ企业间经济行为的相互融合和影响也越来越深入ꎮ高效竞争促使企业经营管理要跟上国际化㊁科学化ꎬ这对企业提出新的挑战ꎮ博弈论思想倡导的面对竞争和冲突ꎬ实施策略行动ꎬ实现 竞争 合作 共赢 的思路也正是企业应深入研究和应用的实用管理学科ꎮ企业在经营管理中应创新应用博弈论思维㊁建立完善博弈信息㊁做到迅速科学决策ꎬ以适应市场化的需要ꎬ不断提升核心竞争力ꎮ文章通过引入博弈论思想ꎬ分析企业经营管理中面对外部竞争环境与发展趋势ꎬ内部各种管理领域和管理关系ꎬ结合Q公司实际探讨博弈论在经营管理中的实际应用案例ꎬ提出推进博弈论在企业经营管理中应用的建议ꎬ为促进博弈论在管理学科的实践应用提供了建设性的参考思路ꎮ关键词:博弈论ꎻ经营管理ꎻ策略思维ꎻ竞争 合作 共赢中图分类号:F272㊀㊀㊀㊀文献标识码:A㊀㊀㊀㊀文章编号:1671-6728(2023)20-0010-04㊀㊀博弈论思想从20世纪40年代问世以来ꎬ迄今接近70多年历史ꎬ目前为止共有16位大师因为研究博弈论而获得诺贝尔奖ꎮ博弈论是研究策略性决策行为的社会科学分支ꎬ是一门关于策略艺术的科学ꎮ博弈论主要研究竞争者如何根据环境和竞争对手的情况变化ꎬ采取最优策略的问题ꎮ博弈论中的 博弈 范围涵盖广泛ꎬ几乎无所不包ꎬ影响到人们事业㊁生活的各个方面ꎮ博弈论思想经过多年的发展ꎬ在社会各学科都有涉猎应用ꎮ但博弈论受到源于数学ꎬ广泛发展于经济学的特点ꎬ其在企业管理学科中的研究应用不及其他学科的发展迅速ꎮ借鉴博弈论在其他学科的成功经验ꎬ深入研究和发展博弈论在企业经营管理中实施应用将对企业发展具有重要推动作用ꎮ一㊁博弈论思想及发展博弈论最早是由约翰 冯 诺依曼提出ꎮ早期博弈论的研究重点是纯冲突博弈ꎬ即零和博弈:参与博弈的双方ꎬ在严格竞争下ꎬ一方的收益必然意味着另一方的损失ꎬ博弈各方的收益和损失相加总和永远为 零 ꎬ双方不存在合作的可能ꎮ但现实中的大部分博弈并非零和博弈ꎬ1994年诺贝尔奖获得者约翰 纳什提出纳什均衡理论ꎬ突破纯冲突博弈ꎬ研究同时存在冲突与合作的一般博弈ꎬ奠定了现代主流博弈理论和经济理论的根本基础ꎮ由于早期博弈论几乎都采取数学模型与理论形式ꎬ使得博弈论在很长时间里是象牙塔中的学科ꎮ直至经济学大师迪克西特教授将博弈论的重要洞见ꎬ用日常直观的案例讲解与分析ꎬ取代了原来的理论化叙述ꎬ用博弈论的概念和逻辑帮助大家策略性地进行思考ꎬ引导人们在日常社会中用博弈论思想观察和认识世界ꎮ博弈论是一门策略艺术科学ꎬ主要研究竞争者如何根据环境和竞争对手的情况变化ꎬ采取最优策略的问题ꎮ其所带来最重要的启示是:人们不能仅囿于以自我为中心ꎬ而是要理解他人的立场㊁观念ꎬ并以此指导行动ꎬ很好地把竞争和合作结合起来ꎬ实现 竞争 合作 共赢 的思路ꎮ二㊁博弈论在企业经营管理中应用环境分析(一)企业外部竞争环境随着新冠疫情影响的逐渐结束ꎬ全球被破坏的经济环境和经济秩序正在演变ꎬ世界大小经济体之间不断融合ꎬ经济相互影响日益显著ꎮ各国之间呈现出多层次多维度的竞争与合作ꎬ使各国在政治和经济之间的持续博弈成为一种新常态的现实ꎮ博弈论将在国际政治㊁经济合作竞争中大有用武之地ꎮ中国仍然面临严峻的经济挑战ꎬ深入推进中国经01A案例分享NLIFENXIANG济高质量发展是全面建设中国社会主义现代化国家的必然要求ꎬ也是遵循经济规律发展的必然要求ꎮ国内区域经济与产业经济竞争发展出现新的趋势和特点ꎬ企业间经济行为的相互融合和影响也越来越深入ꎮ为应对新形势下面临的新困难㊁新挑战ꎬ博弈论思想倡导的 竞争 合作 共赢 的思路也正是企业应深入研究和应用的实用学科ꎮ(二)企业内部管理环境企业内部管理环境优劣直接影响到企业经营效益和效率ꎮ企业内部涉及各个管理领域:战略管理㊁营销管理㊁供应链管理㊁生产运营管理㊁人力资源管理㊁财务管理等ꎮ各管理领域都深受博弈论的影响:战略管理是博弈论应用最早最多的领域ꎬ营销管理中最常见的就是博弈论中的竞争策略ꎮ在人力资源管理上ꎬ博弈论对激励机制的研究㊁团队管理的研究等都具有深远的影响意义ꎮ企业内部管理实质是组织中人与人之间的关系管理:领导与被领导㊁管理与被管理㊁竞争与合作㊁分工与协调等ꎮ管理关系中会存在大量的利益相关问题ꎬ存在对抗或合作ꎬ存在各种博弈ꎮ合理规划和协调利益分工与合作都是管理者要深入研究的课题ꎮ因此博弈论在企业内部管理环境中有着广阔的研究和应用空间ꎮ三㊁博弈论在企业经营管理中应用案例企业无论是面对外部环境中的市场竞争还是内部经营活动中的管理行为ꎬ都充满了竞争与合作关系ꎬ竞争者如何根据环境和竞争对手的情况变化ꎬ采取最优的策略ꎬ如何使用策略艺术开展有效竞争与合作ꎬ正是博弈论的魅力所在ꎮ企业在日常经营管理过程中体现出博弈论思想的案例几乎无处不在ꎬ博弈论的基本思想和应用方法也都深度渗透和融合在企业经营管理的实践工作中ꎬ企业管理者们也在有意识或无意识间实施了单个或多个博弈思维和策略艺术ꎮ以下以Q啤酒公司为例进行分析研究ꎮQ公司是国内一家具有国际品牌影响力的食品饮料生产企业ꎮ公司在国内拥有57家全资和控股的生产企业ꎬ其规模㊁市场份额㊁经营管理水平均居国内同行业领先地位ꎮ其生产的产品为国际市场上最具知名度的中国品牌ꎬ已行销世界一百余个国家和地区ꎮ(一)囚徒困境囚徒困境是博弈论理论和实践中最为经典的案例ꎬ也是最广为人知且最令人棘手的问题:即个人理性与集体理性的冲突ꎬ每个人都在追求自己利益最大化的情况下ꎬ集体的利益受到了损失ꎮ现实中囚徒困境理论的例子比比皆是ꎬ根据Q啤酒公司的现实销售业务ꎬ结合销售模式中的 买店 策略ꎬ就是一场啤酒厂商间的囚徒困境实例运用ꎮ啤酒行业竞争异常激烈ꎬ各啤酒品牌为了抢占终端ꎬ会加大销售资金投入力度ꎬ不惜花费重金买断餐饮终端ꎮ所谓 买店经营 ꎬ就是指某种品牌啤酒厂商出资 买断 某酒店的啤酒经营权ꎬ被买断的酒店必须专卖其啤酒品牌ꎬ不得引入其他啤酒品牌销售ꎻ作为回报ꎬ啤酒厂商则给予这些酒店高额的财物返利ꎬ从几万元到几十万元甚至到几百万元ꎮ这种状况持续了很多年ꎬ愈演愈烈ꎮ现将Q啤酒与最大竞争者X啤酒的买店竞争模式用博弈论的矩阵图ꎬ如图1所示ꎮ图1中数字表示收益程度从低到高(若买店ꎬ双方受益以0表示ꎻ若不买店ꎬ双方受益以1表示ꎻ若一方买店ꎬ一方不买店ꎬ则不买店一方将损失市场份额ꎬ收益以-1表示ꎬ买店一方将收益整个市场份额ꎬ收益以3表示)ꎮ图1㊀Q啤酒与X啤酒买店竞争矩阵图图1中ꎬ对Q啤酒优势策略是买店ꎬ因为第一行买店的收益大于第二行不买店的收益ꎻ同样道理ꎬ对X啤酒ꎬ第一列买店的收益大于第二列不买店的收益ꎬ所以X啤酒优势策略也是买店ꎬ所以最终双方都买店成为一个纳什均衡策略ꎮ本来两家啤酒公司维持都不买店策略是集体优势策略ꎬ对双方都受益ꎬ但两家都在最大化自己的利益ꎬ都想从市场占取更大份额ꎬ获取更高收益ꎬ最终走入了囚徒困境ꎮ从啤酒厂商间竞争的实际情况看ꎬ囚徒困境给市场和厂商造成了很大困扰:厂商不受益:要维持高投入㊁减少了利润空间ꎻ消费者不受益:减少了品牌选择ꎬ消费价格也没有优势可言ꎮ要走出囚徒困境ꎬ博11A案例分享NLIFENXIANG弈论告诉我们可以试着运用 以牙还牙 的策略ꎬ实行胡萝卜加大棒的原则ꎮ或许依靠政府行为的强行介入ꎬ或许需要建立像卡特尔这样的一种企业联合组织ꎬ确保在反复博弈中有达成合作的可能ꎮ这都是企业间可以借鉴探索的合作共赢博弈模式ꎮ(二)随机策略随机策略也是企业经营管理中广泛使用的策略ꎮQ啤酒一直以高质量标准而闻名ꎮQ啤酒公司对产品技术质量要求和管理非常严格ꎬ除了各子公司日常自行抽取生产样品进行质量检验ꎬ还有一项市场检验指标的随机策略ꎮ技术质量管理总部会定期从市场上随机抽取各子公司生产的啤酒ꎬ带回总部由专业品评人员在隐匿了子公司生产信息情况下ꎬ统一进行啤酒质量鉴定ꎬ据此对各家子公司生产的啤酒质量进行打分排序ꎬ并将该指标作为各子公司啤酒质量考核标准之一ꎮ由于市场抽样的随机性ꎬ使各子公司都高度重视啤酒质量ꎬ对质量标准严抓不懈ꎮ如此以较低的监管成本促使人们遵守规则ꎬ胜过了有规则的行动ꎬ同时将该指标纳入业绩考核ꎬ这种预期的惩罚达到了事半功倍的效果ꎮ(三)小步前进的可信策略企业经营管理中有大量的策略属于小步前进的案例ꎬ如 以点带面ꎬ全面铺开 就是常用的管理方法ꎮQ啤酒作为国内同行业领先地位的公司ꎬ为提高企业的核心竞争力ꎬ支持企业高质量跨越式发展的战略实施ꎬ经常要在经营管理过程中推行新的管理工具和管理方法ꎮ新项目本身设计能否成功实施充满未知和不确定性ꎬ同时员工对新事物的陌生及不理解ꎬ也会导致新项目推进过程遭遇各种不支持ꎮ这时选择小步前进的可信策略就成为最佳方案ꎬ具体如下ꎮ通常Q公司先在几个管理规范㊁基础业务成熟的子公司进行新项目实施试点ꎬ在此过程中不断纠错和更正ꎬ待试点取得了成功ꎬ再召集交流学习ꎬ在各子公司范围内广泛推广ꎮ若新项目确实不适合推广实施ꎬ则重新审视和评估项目本身ꎮ如此推行新项目的可信度问题就能迎刃而解了ꎬ办法正是借鉴了小步前进的可信策略ꎮ(四)跟随领头羊在产业和技术竞争中会经常应用到的 跟随领头羊 两种策略ꎬ一是一旦看出别人的策略ꎬ立即模仿ꎻ二是再等一等ꎬ直到这个策略被证明成功或者失败ꎻ在技术竞争中ꎬ后发的新企业总是倾向于采取更具创造性的策略ꎬ而龙头企业则宁愿模仿自己的追随者ꎮ例如ꎬQ公司研发的新产品上市不久ꎬ无论是产品品类的升级与丰富ꎬ还是包装形式的更新换代ꎬ竞争对手的同质化产品随即出现ꎬ整个啤酒市场都会迅速予以模仿响应ꎬ借此也不断推进行业产品的更新换代ꎮ再如在经营管理指标竞争中ꎬQ公司在集团内部建立各子公司数据指标体系ꎬ形成比较和考核标准ꎮ并在集团内树立先进标杆ꎬ运用领头羊策略ꎬ带领其他子公司通过学习先进㊁自我改进提升㊁不断自我赶超ꎬ提升了集团整体管理水平ꎮQ公司还会收集市场上各个竞争对手的数据指标作为参考ꎬ先进的竞品数据指标会成为Q公司领头羊指引ꎬ随之学习㊁模仿㊁超越ꎮ在激烈的市场竞争中ꎬ新的行业标杆指标也被不断推陈出新ꎬ通过持续的改进提升ꎬQ公司的规模㊁市场份额㊁运营管理水平均居国内同行业领先地位ꎬ在国内外市场具有强大的影响力和较高的知名度ꎮ跟随领头羊策略也带动了整个啤酒行业不断采取创新及精益运营管理ꎬ提升整个行业的管理水准ꎮ在企业实际经营管理过程中ꎬ面对问题和困难ꎬ管理者们更多的是将策略混合运用ꎮ比如ꎬ在行动中可以率先出招ꎬ抢占先机ꎬ获得策略上的优势ꎻ即使并未先行ꎬ也可以通过建立威胁与许诺的回应规则ꎬ获得可信的策略优势等ꎮ四㊁博弈论在企业经营管理中应用建议企业在日常的经营管理过程中ꎬ处处渗透着博弈论的思想ꎬ并且越来越深刻地影响到企业的经营与发展ꎮ然而博弈论在企业经营管理中推广应用尚不够成熟广泛:一方面由于受早期博弈论研究对象和方法的限制ꎬ使得博弈论更多体现在数学模型及理论研究领域ꎮ随着经济学迪克西特教授用现实的案例让博弈论离开了学术界的理论探讨ꎬ才开始让博弈论的洞见能够逐渐在日常社会中有了现实的应用ꎮ另一方面企业管理者们受传统管理思维影响ꎬ更倾向于采取管理学科的成熟管理工具ꎬ应对企业战略㊁公司治理ꎬ所以企业管理者们有意识地将博弈论当成管理学科21A案例分享NLIFENXIANG进行研究应用还不够深入和广泛ꎮ如何建立健全并研究推进博弈论在企业经营管理中应用ꎬ使企业管理者深刻认识到博弈论在企业竞争决策中发挥的重要作用ꎬ认识到企业自身可以通过调整决策ꎬ实现 竞争 合作 共赢 的企业策略ꎬ引导博弈论在企业管理的各个领域发挥越来越大的作用ꎮ(一)创新思维新的历史时期ꎬ企业面临加快实施创新驱动发展战略ꎬ以引领企业高质量发展道路ꎮ管理者要创新原有的管理思路ꎬ积极推动管理变革㊁效率变革㊁质量变革ꎬ提升全要素生产率ꎬ以适应社会迅速发展和商业环境快速变化的需要ꎮ创新是企业发展的动力源泉ꎮ创新体现在公司的战略㊁经营㊁管理等全方位ꎮ企业管理中先进的管理思想㊁模式㊁工具都可以借鉴使用ꎮ企业管理者们需要积极学习博弈论思想ꎬ辩证应用博弈论方法ꎬ掌握企业管理中的经济活动规律ꎬ提高经济决策的效率ꎬ实现在外部市场竞争和内部经营管理中保持持续发展优势ꎮ(二)加强信息化建设博弈论的应用主要是有效解决信息不对称问题ꎬ以此实现各方利益的最大化ꎮ在企业经营活动中ꎬ博弈各方获得及时有效的信息ꎬ才能做出适当的决策ꎬ并能根据形势发展变化随时调整ꎬ洞察应对ꎮ因此企业能否掌握博弈的充分信息ꎬ对企业高质量参与竞争ꎬ提高经营管理具有重要意义ꎮ企业可借助信息化手段及时收集国内外政治经济形势㊁行业资讯㊁企业内部信息等ꎬ通过专业人员的信息分析和评估ꎬ做到信息充分传递与沟通ꎬ为企业经营管理决策提供有效支持ꎬ不断提升企业管理效率和效果ꎮ(三)建立综合评价体系企业任何一种管理思想㊁管理工具的有效应用都应结合实际效果进行评估和评价ꎮ企业需要对博弈论管理学科的实践应用建立综合评价体系ꎮ评价标准可以包括财务与非财务指标ꎬ长期与短期指标㊁竞争者与合作者指标㊁公司整体与部门指标㊁部门与员工指标等ꎬ站在公司可持续发展的视角ꎬ审视和评价博弈论的有效应用ꎬ才能综合统筹公司长远发展利益与短期管理需求的平衡ꎮ(四)持续改进完善应用针对内外部环境的变化ꎬ企业需要及时评估博弈论在经营管理中应用的适配性㊁可接受性和可行性ꎮ借鉴国内外优秀的实践经验ꎬ紧跟实际及时进行调整ꎬ审时度势ꎬ适应新环境新发展的要求ꎮ企业所有的经营管理活动都离不开合作和协调ꎬ企业在持续改进和完善博弈论应用的道路上努力实现合作共赢的目标ꎬ也是促进企业创造价值和实现社会和谐的有效途径ꎮ五㊁结论博弈论从产生到现在ꎬ经过学科实践的发展和演变ꎬ博弈论的思想㊁方法㊁模型等已经深入渗透覆盖到企业内外部环境及运营管理的全过程ꎮ它为企业运营管理提供了更多的策略空间ꎮ博弈论的精髓在于:基于策略性互动依赖基础上的理性换位思考ꎬ使利益关联的各方在竞争活动中制定最优策略ꎮ博弈论强调的并不仅仅限于击败对方ꎬ这个理论同时解释了建立合作与战而胜之两方面的策略ꎮ其研究成果ꎬ提高了人们对竞争和冲突这一社会现象的认识ꎻ其实践应用ꎬ促进了企业更多运用合作的理念ꎬ实现企业经营竞争 合作 共赢 的管理思路ꎬ对促进企业创造价值和创建和谐社会具有重要的推动作用ꎮ参考文献:[1][美]阿维纳什.K.迪克西特ꎬ巴里.J.奈尔伯夫.妙趣横生博弈论[M].董志强ꎬ王尔山ꎬ李文霞ꎬ译.北京:机械工业出版社ꎬ2022.[2][美]阿维纳什.K.迪克西特ꎬ巴里.J.奈尔伯夫.策略思维[M].王尔山ꎬ译.北京:中国人民大学出版社ꎬ2023.作者简介:王蕴恺(1974 ㊀)ꎬ女ꎬ汉族ꎬ山东青岛人ꎮ主要研究方向:财务与管理ꎮ31。

复旦大学经济博弈论经济博弈论6

复旦大学经济博弈论经济博弈论6

2020/4/4
课件
4
6.1.2 不完美信息动态博弈的表示
多节点信息集扩展形表示
0 1
(-7000) (-10000) (-16000) (-10000)
好1差
1 不卖 1


不卖
2
(0,0) (0,0)
买 不买 买 不买
运输路线扩展形
(2,1) (0,0) (1,-1) (-1,0)
二手车交易扩展形
课件
6
6.2 完美贝叶斯均衡
6.2.1 完美贝叶斯均衡定义 6.2.2 均衡要求的初步解释 6.2.3 关于判断形成的进一步解释
2020/4/4
课件
7
6.2.1 完美贝叶斯均衡定义
在不完美信息动态博弈中纳什均衡和子博弈完 美纳什均衡都不能解决问题,需要引进新的均 衡概念
纳什均衡和子博弈完美纳什均衡分析方法,反 应函数和逆推归纳法等同样也要改进、变化
2020/4/4

课件
8
一个策略组合和相应的判断满足下列4个要求, 称为一个“完美贝叶斯均衡”:
要求1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到 该信息集中每个节点可能性的“判断”。对非单节点信息集,一个“判 断”就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信 息集,则可理解为“判断达到该节点的概率为1”
p(s | g) 1 p(s b) 0.5
p(g) p(b) 0.5
p(g | s) p(g) p(s | g)
p(g) p(s | g)
0.51
2
p(s)
p(g) p(s | g) p(b) p(s | b) 0.51 0.5 0.5 3

博弈论1

博弈论1
博弈论
Game theory
主讲教师:王愚 联系方式:yzdxwangyu@
参考教材
• 谢识予,《经济博弈论》,复旦大学出版社。 • 谢识予,《纳什均衡论》,上海财经大学出版社。 • 王则柯、李杰,《博弈论教程》,中国人民大学 出版社。 • 张维迎,《博弈论与信息经济学》,上海三联书 店、上海人民出版社。 • Gibbons, Robert, Game Theory for Applied Economists, Princeton University Press, 1992. 中文版,博弈论基础,中国社会科学出版社 1999。
• [英]Adam Smith——博弈是个体参与人从各自 的动机出发生相互作用的一种状态。
• 教材——博弈即一些个人、队组或其他组织, 面对一定的环境条件,在一定 规则下,同时或 先后,一次或多次,从各自允许选择的行为或 策略中进行选择并加以实施,各自取得相应结 果的过程。
博弈的四要素
• 博弈的参加者(Players)或称为博弈方
1. 囚徒困境博弈的基本模型
得益矩阵(Payoff Matrix)
囚徒2 坦 囚 坦 白 徒 不坦白 1 白 不坦白 0,-8 -1,-1
为什么要学习博弈论-1
• 决策的相互影响
在人与人的博弈中,你必须意识到,你的商业对手、 未来伴侣乃至你的孩子都是聪明而有主见的人,是 关心自己利益的活生生的人,而不是被动的和中立 的角色。一方面,他们的目标常常与你的目标发生 冲突;另一方面,他们当中包含着潜在的合作因素。 在你作决定的时候,必须将这些冲突考虑在内,同 时注意发挥合作因素的作用。
第二节 几类经典博弈模型
• 囚徒困境(Prisoners’ dilemma) • 赌胜博弈 • 产量决策的古诺(Cournot)模型

3博弈论第三讲 SPE 复旦大学 王永钦

3博弈论第三讲 SPE 复旦大学 王永钦

game is identical to the game as a whole.
5
Example: strategy
A strategy for a player is a complete plan. It
can depend on the history of the play. A strategy for player i: play Li at every stage (or at each of her information sets) Another strategy called a trigger strategy for player i: play Ri at stage 1, and at the tth stage, if the outcome of each of all t-1 previous stages is (R1, R2) then play Ri; otherwise, play Li.
11
1 4
Stage t-1: (R1, R2) Stage t: (R1, L2) Stage t+1: (L1, L2) Stage t+2: (L1, L2)
1 4
1 4
Trigger strategy: step 2
Stage 1: (R1, R2) Stage 2: (R1, R2)
Step 2: check whether the
complete information in which a (simultaneous-move) game called the stage game is played infinitely, and the outcomes of all previous plays are observed before the next play. Precisely, the simultaneous-move game is played at stage 1, 2, 3, ..., t-1, t, t+1, ..... The outcomes of all previous t-1 stages are observed before the play at the tth stage. Each player discounts her payoff by a factor , where 0< < 1. (detour: two ways to model people’s patient) A player’s payoff in the repeated game is the present value of the player’s payoffs from the stage games.

阅读博弈论类书籍的心得体会

阅读博弈论类书籍的心得体会

阅读博弈论类书籍的心得体会图书情报宋静思最近阅读的书目主要围绕在博弈论领域,由浅入深的从博弈论平话类书籍到博弈论的理论应用类书籍都有一些涉猎。

近一个月来我所阅读的书目主要有王则柯的《新编博弈论平话》、高志明的《生存博弈》、黄涛的《博弈论教程—理论、应用》以及张维迎的《博弈论与信息经济学》。

由于个人能力与知识储备的限制,对以上书目的认识理解和心得也是有限的,下面我仅对上述书目中能够引起我思考的一些理论和案例展开分析并阐述我的一点见解,以及提出我所认为的这些博弈理论可以分析的社会现象。

一、对博弈论平话类书籍的心得首先从王则柯教授的《新编博弈论平话》和高志明教授的《生存博弈》这两本书使我我深刻的认识到博弈论作为一种科学的思维方法对我们在日常生活中科学的做出决策有重大的意义。

它们都是以比较浅显的例子和故事普及博弈论的一些知识和方法,阐发博弈论的一些思想和观念。

从囚徒困境、情侣博弈、诺曼底登陆模拟和慕尼黑谈判模拟等能够引起读者兴趣的故事入手,介绍静态博弈、动态博弈、纳什均衡、零和博弈、双赢对局、帕累托优势、子博弈精炼纳什均衡等博弈论的基本概念,以及劣势策略消去法、相对优势策略下划线法、确定混合策略纳什均衡的反应函数法、动态博弈的倒推法等博弈论基本方法,在以上两本书的论述中很少使用到高等数学的知识,这两本书是使我对博弈论产生兴趣的启蒙老师,帮助我了解博弈论的若干初步知识。

从最初对这两本书的阅读我真正理解了什么是博弈决策,就拿我们生活中报考什么学校、从事什么职业、选择何种方式度过周末闲暇时光等这些例子来说,之所以称之为博弈决策,是因为在这些例子当中,我的身边往往存在和我情形相似的决策者,我们的思维和行动相互之间产生着很微妙的互动影响。

博弈论研究的目的,就是要清晰地揭示蕴涵于这种互动影响中的基本概念和原理,从而帮助我们建立策略思维的意识。

看过囚徒困境后,我明白了为什么寡头企业不选择在市场上结盟而是竞相采取低价策略企图抢占更多的市场份额;又为什么多数情形是非合作博弈。

博弈论(复旦大学 王永钦)复旦大学研究生一年级博弈论课程讲义,英文

博弈论(复旦大学 王永钦)复旦大学研究生一年级博弈论课程讲义,英文

q1 q2 , and
Cont’d
We solve this game with backward induction
q2 arg max 2 (q1 , q2 ) q2 (a q1 q2 c) a q1 c q R2 (q1 ) 2
* 2
(provided that
Implications for social and economic systems (Coase Theorem)
2. Dynamic Games of Complete Information


2.1 Dynamic Games of Complete and Perfect Information 2.1.A Theory: Backward Induction Example: The Trust Game General features:
Two firms quantity compete sequentially. Timing: (1) Firm 1 chooses a quantity q1 (2) Firm 2 observes (3) The payoff to firm
0 ;
q1 and then chooses a quantity q2 0 ;
* * * * (s1 ,..., si*1, si* , si*1,..., sn ) ui (s1 ,..., si*1, si , si*1,..., sn )
Cont’d
Proposition B In the n -player normal form game
G {S1 ,..., Sn ; u1 ,..., un }

博弈论 复旦大学 王永钦

博弈论 复旦大学 王永钦
Introduction to games Normal-form (or strategic-form)
representation Iterated elimination of strictly dominated
strategies Nash equilibrium Applications of Nash equilibrium Mixed strategy Nash equilibrium
The meaning of symmetry
Single population dynamics Evolutionary game theory
Smith(1982)
Fall, 2007, Fudan University
Game Theory--Lecture 1tle of the sexes
➢ Before the meal, every person agrees to split the bill evenly among them – a game
Fall, 2007, Fudan University
Game Theory--Lecture 1
4
What is game theory?
scientists
Fall, 2007, Fudan University
Game Theory--Lecture 1
5
Classic Example: Prisoners’ Dilemma
Two suspects held in separate cells are charged with a major crime. However, there is not enough evidence.

《西方经济学第二版》第九章博弈论

《西方经济学第二版》第九章博弈论
外部性使竞争市场资源配置的效率受到损失, 因此外部性是导致市场失灵的一个重要原因 。
图10-2 生产的外部不经济
二、政府干预
政府干预的方法主要有两种, 一种是对 污染的企业征收排污费, 另一种方法是 颁布污染物排放标准。
对于整个社会而言, 产出的最优条件是 边际社会成本等于边际社会收益。
污染所造 成的边际社会 成本与降低污 染所产生的边 际社会利益相 等时的污染程 度就是最优污 染程度。
第十章 市场失灵与政府调节
第一节 第二节 第三节 第四节
非对称信息 外部性与政府干预 公共产品 政府对完全垄断的调节
市场机制在某些领域不能起作用或不 能起有效作用的情况,称为市场失灵
(market failure)。市场失灵是指 市场在这种场合不能提供符合社会效率条 件的商品或劳务。导致市场失灵的原因主 要有这样几种: 非对称信息(asymmetric
假定消费者在交易前只知道所交易的轿车的平均质 量,只有在购进后才确切知道所购买车的质量,那么请 分析一下三个月内轿车市场的交易情况
(包括购进新车后转手的交易),什么样的轿车会 成交? 按照什么样的价格成交?
如果买者与卖者都知道每一辆二手车的质量,消费 者的状况是否比问题(1)中的状况好些?
6. 假定按照消费者对于公共电视服务的偏好将消费者分为三 组,三组消费者从公共电视服务中所能获得的边际收益为:
图10-1 劳动力市场发送信号
三、败德行为
败德行为也称为道德公害, 指在协议达成 后, 协议的一方通过改变自己的行为, 来 损害对方的利益。败德行为产生的原 因 是非对称信息。
败德行为是在承保人无法觉察或监督投 保人行为的情况下所发生的。解决的办 法只能是通过某些制度设计使投保人自 己约束自己的行动。

2博弈论第二讲 Mixed Strategies 复旦大学 王永钦

2博弈论第二讲 Mixed Strategies 复旦大学 王永钦

Player 2’s expected payoff from her mixed strategy: v2((r, 1-r),(q, 1-q))=qEU2(s21, (r, 1-r))+(1-q)EU2(s22, (r, 1-r))
Fall, 2007, Fudan 13
Expected payoffs: example
Fall, 2007, Fudan
5
Solving matching pennies
Player 2 Head Tail Expected payoffs
Head
Player 1 Tail
-1 ,
1
1 , -1
-1 , 1
r 1-r r
1-2q 2q-1
1 , -1
q
Player 1’s best response
Head
Player 1 Tail
-1 ,
1
1 , -1
-1 , 1
r 1-r
1-2q 2q-1
1 , -1
q
1-q
Player 1’s expected payoffs If Player 1 chooses Head, -q+(1-q)=1-2q If Player 1 chooses Tail, q-(1-q)=2q-1
Fall, 2007, Fudan
10
Mixed strategy: example
Player 2
L (0)
T (3/4) Player 1 M (0) B (1/4) 0 , 4 , 3 , 2 0 4
C (1/3)
3 , 0 , 5 , 3 4 1
R (2/3)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

G = {S1 ,..., S n ; u1 ,..., un }
if the strategies
* ( s1* , ..., s n )
are a NE, then they survive
iterated elimination of strictly dominated strategies.
Having more information may be a bad thing
Exercise: Extend the analysis to
n firm case.
2.2 Two stage games of complete but imperfect information 2.2.A Theory: Sub-Game Perfection
gi
).
Cont’d
His payoff is
giv(g1 +... + gi1 + gi + gi+1 +... + gn ) cgi
In NE
* * ( g1 ,..., g n ) , for each i , gi* must maximize
(1)
(1), given
that other farmers choose * * 1 i 1
Proposition A
In the
n -player normal form game
G = { S1 ,..., S n ; u1 , ..., u n }
if iterated elimination of strictly dominated strategies eliminates all but the strategies
( g ,..., g , g , g )
* i +1
* n
Cont’d
First order condition (FOC):
* * v( gi + g i ) + gi v '( gi + g i ) c = 0
* * * g i ≡ g1 + ... + gi*1 + gi*+1 + ... + g n
≥0;
q1 and then chooses a quantity q2 > 0 ;
(3) The payoff to firm
i is given by the profit function
π i (qi , q j ) = qi [ P (Q ) c]
P(Q) = a Q is the inverse demand function, Q = q1 + q2 , and
1.Static Game of Complete Information
1.3 Further Discussion on Nash Equilibrium (NE) 1.3.1 NE versus Iterated Elimination of Strict Dominance Strategies
c is the constant marginal cost of production (fixed cost being zero).
Cont’d
We solve this game with backward induction
q2 ∈ arg max π 2 (q1 , q2 ) = q2 (a q1 q2 c) a q1 c q = R2 (q1 ) = 2
1.3.2 Existence of NE
Theorem (Nash, 1950): In the
n -player normal form game
G = {S1 ,..., S n ; u1 ,..., un }
if
n is finite and S i is finite for every i , then there exist at
Then
a1 ∈ arg max u1 (a1 , R2 (a1 ))
“People think backwards”
2.1.B An example: Stackelberg Model of Duopoly
Two firms quantity compete sequentially. Timing: (1) Firm 1 chooses a quantity q1 (2) Firm 2 observes
competing firms? (Convergence to Competitive Equilibrium)
1.4.2 The problem of Commons
David Hume (1739): if people respond only to private incentives, public goods will be underprovided and public resources overutilized.
Here the information set is not a singleton. Consider following games (1)Players 1 and 2 simultaneously choose actions
a1
and
a2
from feasible sets A1 and A2, respectively. (2) Players 3 and 4 observe the outcome of the first stage ( a1, a2) and then simultaneously choose actions and from feasible sets A3 and A4, respectively. (3) Payoffs are ui ( a1 , a2 , a3 , a4 ) , i = 1, 2,3, 4
( s ,..., s ) , then these
* 1
* n
strategies are the unique NE of the game.
A Formal Definition of NE
In the n-player normal form G = {S1 ,..., Sn ; u1 ,..., un } the strategies
max Gv ( G ) Gc
FOC:
v(G**) + G**v '(G**) c = 0
(4)
Comparing (3) and (4), we can see that
G* > G **
Implications for social and economic systems (Coase Theorem)

n farmers’ FOC and then dividing by n yields
(3)
1 v (G * ) + G * v '( G * ) c = 0 n
Cont’d
In contrast, the social optimum G ** should resolve
Hardin(1968) : The Tragedy of Commons
Cont’d
There are
n
farmers in a village. They all graze their goat on the
village green. Denote the number of goats the i th farmer owns by
Cont’d
A maximum number of goats : for Also
Gmax : v(G) > 0
for
,
G < G max
but
v (G ) = 0
G ≥ Gmax
v '(G ) < 0, v ''(G ) < 0
The villagers’ problem is simultaneously choosing how many goats to own (to choose
* 2
(provided that
q1 < a c
).
Cont’d Now, firm 1’s problem
q1 ∈ arg max π 1 (q1 , R2 (q1 )) = q1[a q1 R2 (q1 ) c] ac q = 2
* 1
so,
ac q = 4
* 2
.
Cont’d
Compare with the Cournot model.
gi
, and the total number of goats in the village by
G = g1 +... + gn
Buying and caring each goat cost grazing each goat is
c and value to a farmer of
v (G ) .
2. Dynamic Games of Complete Information
2.1 Dynamic Games of Complete and Perfect Information 2.1.A Theory: Backward Induction Example: The Trust Game General features: (1) Player 1 chooses an action (2) Player 2 observes the feasible set (3) Payoffs are
a1
from the feasible set
相关文档
最新文档