博弈论PPT课件
合集下载
博弈论非常好的讲解ppt课件
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选 择。
但真正起作用的是你的朋友是否使用同样的 逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。
也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
获奖原因:“通过博弈论分析加强了 我们对冲突和合作的理解”所作出 的贡献而获奖。
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
1994年诺贝尔经济学奖获得者
美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.) 以及德国人莱因哈德-泽尔腾(Reinhard Selten)
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
ቤተ መጻሕፍቲ ባይዱ
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
“乘客侧前轮”看起来是一个合乎逻辑的选 择。
但真正起作用的是你的朋友是否使用同样的 逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。
也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
获奖原因:“通过博弈论分析加强了 我们对冲突和合作的理解”所作出 的贡献而获奖。
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
1994年诺贝尔经济学奖获得者
美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.) 以及德国人莱因哈德-泽尔腾(Reinhard Selten)
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
ቤተ መጻሕፍቲ ባይዱ
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
博弈论PPT课件
有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
《博弈论》课程ppt课件
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
博弈论PPT课件
第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······
精品课程《博弈论》PPT课件(全)
人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
博弈论与竞争策略ppt课件
结局(outcome):对参与人的不同行动,这场博弈 的结果或结局是什么
报酬(payoff)(支付)与报酬函数(payoff function):博弈的结果给参与人带来的好处。可 以用报酬矩阵(支付矩阵、得益矩阵、赢得矩阵)
3
2、博弈均衡的基本概念
(1)占优策略均衡 占优策略:无论其他参与者采取什么策略,
博弈论就是用数学方法研究决策相互影响的理性人是 如何进行决策以获取最大收益的。
博奕:多人决策过程 引例:田忌赛马
2
1、博奕论的基本要素
参与者(player)(博奕方、局中人、对局者):即 有哪些人参与博弈。一般至少有两个参与者。
策略(strategy)与策略空间(strategy set):什么人 在什么时候行动;当他行动时,他具有什么样的信 息;他能做什么,不能做什么。
-1 -12
不坦白
-12 -1
-2 -2
5
• 如果两个疑犯都能够选择不坦白的话,他们 将明显地得到一个更大的收益,但由于两人 的信息无法沟通,选择不坦白并不是两人的 理性选择。对于两人而言,不管对方坦白或 是不坦白,自己选择坦白都是更优的选择, 因而,{坦白,坦白}就是均衡战略。
6
占优策略均衡
犯人招供与黑社会制裁
嫌犯B
坦白
嫌犯A
坦白
-∞ -∞
不坦白
-12 -∞
不坦白 -∞ -12 -2 -2
7
(2)纳什均衡
纳什均衡:在一个纳什均衡里,任何一个 参与者都不会改变自己的策略,如果其他 参与者均不改变各自的策略。
博弈中双方都没有绝对的最优策略,一方 的最优策略取决于对方的选择。
占优策略均衡一定是纳什均衡,但纳什均 衡不一定是占优策略均衡。
报酬(payoff)(支付)与报酬函数(payoff function):博弈的结果给参与人带来的好处。可 以用报酬矩阵(支付矩阵、得益矩阵、赢得矩阵)
3
2、博弈均衡的基本概念
(1)占优策略均衡 占优策略:无论其他参与者采取什么策略,
博弈论就是用数学方法研究决策相互影响的理性人是 如何进行决策以获取最大收益的。
博奕:多人决策过程 引例:田忌赛马
2
1、博奕论的基本要素
参与者(player)(博奕方、局中人、对局者):即 有哪些人参与博弈。一般至少有两个参与者。
策略(strategy)与策略空间(strategy set):什么人 在什么时候行动;当他行动时,他具有什么样的信 息;他能做什么,不能做什么。
-1 -12
不坦白
-12 -1
-2 -2
5
• 如果两个疑犯都能够选择不坦白的话,他们 将明显地得到一个更大的收益,但由于两人 的信息无法沟通,选择不坦白并不是两人的 理性选择。对于两人而言,不管对方坦白或 是不坦白,自己选择坦白都是更优的选择, 因而,{坦白,坦白}就是均衡战略。
6
占优策略均衡
犯人招供与黑社会制裁
嫌犯B
坦白
嫌犯A
坦白
-∞ -∞
不坦白
-12 -∞
不坦白 -∞ -12 -2 -2
7
(2)纳什均衡
纳什均衡:在一个纳什均衡里,任何一个 参与者都不会改变自己的策略,如果其他 参与者均不改变各自的策略。
博弈中双方都没有绝对的最优策略,一方 的最优策略取决于对方的选择。
占优策略均衡一定是纳什均衡,但纳什均 衡不一定是占优策略均衡。
博弈论ppt课件
精选课件ppt
7
囚徒B 坦白
不坦白
囚徒A
坦白 -8,-8 0,-10
不坦白 -10,0 -1,-1
精选课件ppt
8
博弈的分类
ห้องสมุดไป่ตู้
1、从行动的先后次序来分,博弈可以分为 静态博弈 和 动态博弈。 静态博弈指在博弈中,参与人同时选择行动,或虽非同 时但后行动者并不知道前行动者采取了什么具体行动;
动态博弈指的是参与人的行动有先后顺序,且后行 动者能够观察到先行动者所选择的行动的博弈。
21世纪,应站在博弈论的前沿。尽管博弈经济学家很少,但其获诺贝尔
奖的比例最高。最能震动人类情感的是博弈,对未来最有影响力的还是
博弈。
精选课件ppt
6
著名的“囚徒困境”的例子
警察抓住了两个罪犯,但是警察局却缺乏足够的证据 指证他们所犯的罪行。如果罪犯中至少有一人供认犯 罪,就能确认罪名成立。为了得到所需的口供,警察 将这两名罪犯分别关押防止他们串供或结成攻守同盟, 并分别跟他们讲清了他们的处境和面临的选择:如果 他们两人都拒不认罪,则他们会被以较轻的妨碍公务 罪各判一年徒刑;如果两人中有一人坦白认罪,则坦 白者立即释放而另一人将重判10年徒刑;果两人都坦 白认罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是抵赖)?
不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放 弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说 比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分 配。这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0) 或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时 给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号) 来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己 的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号 能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分 给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2, 0)或(97,0,1,0,2)。
西方经济学博弈论全解ppt课件.ppt
小猪的最优策略:等待 大猪无最优策略:即大猪的最优策略是依赖于 小猪的策略
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
这是一个“多劳不多得,少劳不少得”的均衡
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论与主流经济学的发展
传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略
博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论:专门研究博弈如何出现均衡的规 律的学问
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用)
博弈有不同的种类:
从行动顺序角度:
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
这是一个“多劳不多得,少劳不少得”的均衡
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论与主流经济学的发展
传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略
博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论:专门研究博弈如何出现均衡的规 律的学问
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用)
博弈有不同的种类:
从行动顺序角度:
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
《博弈论教程》课件
博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
《博弈论经典案例》课件
打破囚徒困境的方法
通过建立信任、合作和持续沟 通等方式,决策者可以尝试打 破囚徒困境,从而达到互利互 惠的结果。
囚徒困境的应用场景
囚徒困境类似于商业谈判和竞 争中的情景,通过分析博弈模 型可以帮助决策者制定更优的 策略。
小结
博弈论的重要性
博弈论帮Байду номын сангаас我们理解和分析决策者之间的相互 作用,是现实生活中许多场景的有效工具。
《博弈论经典案例》PPT 课件
博弈论是研究决策者在特定环境中进行决策时的数学模型。了解博弈论对于 全面理解人类行为、经济学和政治科学等领域至关重要。
什么是博弈论
博弈论的定义
博弈论研究决策者之间相互作用和竞争的数 学模型。
博弈论的应用领域
博弈论应用于经济学、政治科学、生物学等 领域,帮助分析和预测决策者的行为。
竞价拍卖
竞价拍卖的定义
竞价拍卖是一种决策者通 过提交最高报价来争夺物 品或服务的方式。
一元拍卖
一元拍卖是指每次增加一 元的拍卖方式,最后报价 最高的决策者获得物品。
二元拍卖
二元拍卖是指每次报价至 少高于上一次报价一定金 额的拍卖方式,最后报价 最高的决策者以报价支付。
囚徒困境
囚徒困境的定义
囚徒困境是博弈论中的一个例 子,两个决策者在缺乏合作的 情况下最终陷入一种互相损害 的状态。
本次课程的收获
通过经典案例的学习,我们深入了解了博弈论 的概念、应用和解决方法。
经典博弈案例
纳什均衡
纳什均衡是博弈论中的一种稳 定状态,每个决策者在给定其 他决策者的策略时,没有更好 的选择。
概率博弈
概率博弈是博弈论中,决策者 在面对不确定性情况下,通过 设定概率来制定决策策略。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
乙 甲
认罪
认罪 (-5,-5)
不认罪 (0,-10)
不认罪
(-10,0) (-1,-1)
理性的人是自私自利的; 理性选择不是全局最优。
2019/9/19
可编辑
6
经济合作:
乙 甲
合作
欺骗
合作 (2,2) (4,-2)
欺骗 (-2,4) (0,0)
诚信的价值; 一报还一报策略; 人类生存环境启示。
2019/9/19
大学出版社,2003。 (8) [美]弗登博格:《博弈论》,中国人民大学出版
社,2002。
2019/9/19
可编辑
4
第一讲 博弈现象与基本概念
1.博弈现象 2. 博弈概念 3. 博弈描述 4. 博弈练习 5. 关于博弈论
2019/9/19
可编辑
5
1.博弈现象
田忌赛马:正确的策略可以反败为胜。
囚徒困境:
可编辑
7
长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
资源浪费还是理性的必然?
其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
2019/9/19
可编辑
8
狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
2019/9/19
可编辑
14
策略(战略)strategies: 采取行动的规则; 可以是一次行动也可以是一个行动序列; 可以是纯策略也可以是混合策略; 分为有限和无限。
支付(盈利函数)payoff: 对应于某策略组合的局中人利益或损失; 确定的或是期望的; 分为零和和非零和。
2019/9/19
可编辑
指定n个局中人,以及他们各自的纯策略空间
S i , i 1,2,, n
和这些局中人各自的支付(盈利)函数
ui (S1, S2 ,, Sn ), i 1,2,, n
我们将该博弈表示为:
G {S1 , S2 ,, Sn ; u1 , u2 ,, un }
2019/9/19
可编辑
17
低需:0.7亿元(两栋),1.1亿元(一栋)。
2019/9/19
可编辑
19
结果:高需,(开,不开), (0.8,0) 高需,(不开,开), (0,0.8) 高需,(开,开), (0.4,0.4) 高需,(不开,不开),(0,0) 低需,(开,不开), (0.1,0) 低需,(不开,开), (0,0.1) 低需,(开,开), (-0.3,-0.3) 低需,(不开,不开),(0,0)
2019/9/19
可编辑
20
策略型表述: (两人有限博弈;矩阵形式)
高需求情况
B 开发
不开发
开发 (0.4,0.4) (0.8,0) A
不开发 (0,0.8) (0,0)
低需求情况?
2019/9/19
可编辑
21
房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
京交通大学出版社。 (3) 张维迎:《博弈论与信息经济学》,上海三联书
店,上海人民出版社,2004。 (4) 施锡铨,《博弈论》,上海财经大学出版社,
2002。
2019/9/19
可编辑
3
(5) 张守一,《现代经济对策论》,高等教育出版社, 1998。
(6) 钱颂迪,《运筹学》,清华大学出版社,1996。 (7) [美]艾里克.拉斯缪森:《博弈与信息》,北京
如两人写的一样,就认为他们讲真话,并按 所写数额赔偿;如果两人写的不一样,就认定低 者讲真话,并照此价格赔偿。同时,对讲真话的 旅客奖励2元钱,对讲假话的旅客罚款2元。
理性原则下,他们会写多少价格呢?
2019/9/19
可编辑
11
2. 博弈概念
什么是博弈:
个人或团体间在依存和对抗、合作和冲突 中的决策问题。
博弈论研究博弈过程中的理性行为。
2019/9/19
可编辑
12
如何理解理性行为:
自身利益最大; 持续地有意图的行动;
不对动机妄加猜测; 不考虑道德问题; 只研究合法问题; 盈利函数有多重标准。
2019/9/19
可编辑
13
博弈三要素
局中人(参与人)players: 决策主体; 自然人、团体或“虚拟局中人”; 有可供选择的策略和明确定义的利益函数; 分为两人和多人
博弈论
the Theory of Games
可编辑
1
主要内容
一、博弈现象及基本概念 二、完全信息静态博弈 三、完全信息动态博弈 四、不完全信息静态博弈 五、不完全信息动态博弈 六、不完全信息专题
2019/9/19
可编辑
2
主要参考书
(1) 姚国庆:《博弈论》,高等教育出版社,2007. (2) 罗云峰:《博弈论教程》,清华大学出版社、北
15
ቤተ መጻሕፍቲ ባይዱ
扩展术语:
信息:信息集; 完全信息(complete); 完美信息(perfect)。
共同知识:双方可能获取的相同信息; 彼此都能算清楚。
博弈结果:均衡策略组合;均衡行动组合。 均衡:所有局中人最优策略的组合。
2019/9/19
可编辑
16
3. 博弈描述
博弈的策略型(标准型、正则型)表述:
例:寡头竞争问题
G {q1 0, q2 0;1 (q1, q2 ), 2 (q1, q2 )}
策略型表述多适用于静态博弈。
另一种表述方式是扩展式表述,两种表述形式几 乎是完全等价的,但是扩展式表述更适合于讨论 动态博弈。
2019/9/19
可编辑
18
房地产开发实例
双方:A,B 策略:开发投资1亿元;不开发,投资0 售价:高需:1.4亿元(两栋),1.8亿元(一栋);
例:P=0.5,最坏情况期望盈利500万元,开发。 P=0.3,对方开发概率<31/40时,开发;否
则,不开发。(?)
2019/9/19
他们会坚持猎鹿还是去抓兔子?
2019/9/19
可编辑
9
共同投资:
双方共同投资一个大项目,可期望有较大 收益。此时如某方抽出资金去进行小项目投资, 必可成功获小利,但会使共同项目陷入困境, 使对方蒙受损失。
投资者会如何选择?
2019/9/19
可编辑
10
旅行者困境
两个旅行者花瓶被摔坏,向航空公司索赔。 航空公司知道价格约为八九十元,但不知道确切 价格。于是请两位旅客在100元以内自己写下花 瓶的价格。