教育博弈论与知识管讲义理(1).ppt
博弈论PPT课件
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
第六讲博弈论课件
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪
踩
踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。
博弈论完整版PPT课件
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
《博弈论》课程ppt课件
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
博弈论讲义完整PPT课件
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
博弈论最全完整-讲解PPT课件
王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
.
32
导论
四、主要参考文献
.
33
张维迎著,《博弈论与信息经济学》,上海三联书店、 上海人民出版社,1996年版。
Roger B. Myerson著:Game Theory(原文版、译文 版),中国经济出版社,2001年版。
是关于动态博弈进行过程之中面临决策 或者行动的参与人对于博弈进行迄今的 历史是否清楚的一种刻划。
如果在博弈进行过程中的每一时刻,面 临决策或者行动的参与人,对于博弈进 行到这个时刻为止所有参与人曾经采取 的决策或者行动完全清楚,则称为完美 信息博弈;否则位不完美信息。
.
30
零和博弈与非零和博弈
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
.
4
如何在博弈中获胜?
…… 真的能在博弈中(总是)获 胜吗?
对手和你一样聪明! 许多博弈相当复杂,博弈论并不
施锡铨编著,《博弈论》上海财大出版社,2000年版。
谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。
博弈论入门PPT课件
基于对其他参与 者信息的了 解程度
完全信息博 弈
不完全信息 博弈
负和博弈
根据结果
零和博弈
正和博弈
特征 合作中如何分配利益,使大家都满意。 只考虑自己的利益,不考虑对方的利益。 做出策略虽然有先后,但每一方都不知
道对方的策略。 做出策略虽然有先后,但参与者对对方
做出的策略是知道。(例如下象棋) 博弈中对其他参与者的各方面信息、可
最理想的结局:双赢
一、正和博弈各方本着相互合作,公平公 正,互利互惠的原则分配利益,让每一 个人参与者都满意的博弈。
案例:鳄鱼鸟与鳄鱼和谐相处,生存搭档 的典型。凶恶的鳄鱼可以容忍鳄鱼鸟清 理它牙缝里的残肉,因为这样可以避免 滋生细菌,它的牙就不会生虫了。
二、博弈中发生冲突的时候,充公了解对 方、取长补短,各取所需,往往会使双 方走出负和博弈和零和博弈的误区,实 现合作共赢。
一年轻人在酒吧喝酒,中途去厕所。一美女尾随 他打劫,对他说:将钱和手机都交出来,否则 我说你非礼我。年轻人转念一想,计上心来, 用手指自己的嘴和耳朵。美女误以为他是聋哑 人,想放弃。年轻人掏出一支笔和一张纸在上 面写上:你说什么呀?
美女见状拿过笔来也在纸上写了:将钱和手机都 交出来,否则我说你非礼我。这时年轻人一把 抓住美女的手,大声喊道:我要送你去派出所 。
最坏的结果:两败俱伤
战争是典型的负和博弈:二战共有61个国 家卷入,涉及人口20亿以上。二战中军 民伤亡1.9亿,其中死亡6000万,受伤 1.3亿。其中死亡的平民有2730万。盟 军中苏联军队伤亡最为惨重,死亡890 万,中国军队死亡148万,英国与美国 各死亡38万。法西斯德国军队伤亡人数 1170万,军队死亡600万,日本军队伤 亡216万。
《博弈论的基本概念》课件
智猪博弈
• 总结词:描述大猪和小猪在食槽附近争夺食物的策略博弈。
• 详细描述:在智猪博弈中,一个大猪和一个小猪共同生活在一个猪圈里,食槽位于猪圈的一端。每次食物被放入食槽时 ,大猪和小猪都有两种选择:冲向食槽或继续等待。如果大猪选择冲向食槽,小猪的最佳策略是等待,因为大猪吃掉大 部分食物后,小猪可以享用剩余的食物。相反,如果小猪选择冲向食槽,大猪的最佳策略也是等待,因为小猪可能无法 抢到任何食物。因此,无论大猪如何选择,小猪的最佳策略都是等待;同样地,无论小猪如何选择,大猪的最佳策略也 是等待。
合作博弈
特征
强调合作、协议和联盟,目标是实现共同利益。
应用领域
国际关系、商业合作、团队协作等。
非合作博弈
特征
强调竞争、自利和策略互动,目标是实现个人利益。
应用领域
市场竞争、个人决策、政治选举等。
动态博弈
特征
强调行动的顺序和信息传递,策略和 行动需考虑时间因素。
应用领域
商业竞争、投资决策、谈判策略等。
《博弈论的基本概念》ppt课件
目录
• 博弈论简介 • 博弈论的基本类型 • 博弈论的基本概念 • 博弈论的经典案例 • 博弈论的未来发展
01
博弈论简介
博弈论的定义
01
博弈论:研究决策主体在相互影 响、相互作用的环境中如何进行 决策,以及这种决策的均衡结果 的学科。
02
博弈论强调参与者之间的互动关 系,通过数学模型和理论分析来 研究策略选择和均衡结果。
应用领域:拍卖机制设计、保险市场 分析、医疗资源分配等。
03
博弈论的基本概念
参与者
01
02
03
参与者
在博弈中,参与者是决策 的主体,可以是个人或组 织。
博弈论 PPT资料整理
第一章博弈是一场至繁至简的游戏•1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。
•1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。
•2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。
博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。
于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。
中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。
博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。
生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。
而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。
特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。
由此可见,博弈论是适合所有人的科学。
在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。
博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。
可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。
从围棋定式谈纳什均衡•过分的骗着与本手、缓手之间•一般以本手应对•着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损•如果势均力敌,则应考虑到对手的反击手段。
博弈论专题PPT课件
流浪汉 找工作 游荡
B 正面 反面
政 救济 3,2 -1,3 A 正面 -1,1 1,-1 府1,-1 -1,1
(一) 完全信息静态博弈:纳什均衡
----混合战略纳什均衡
• 纯战略: • 参与人在每一个给定信息的情况下只选择一个特定的行动 • 混合战略: • 参与人在每一个给定信息的情况下以某种概率分布随机地选
博弈信息:影响最后博弈结局的所有参与人的情报 “完美信息”-确定的结果 “不完美信息”-概率期望
依据支付结果分为零和博弈、常和博弈以及变和 博弈
非合作博弈理论
完全信息
静态 完全信息静态博弈
纳什均衡 纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡 海萨尼 (1967-1968)
such that no player has incentive to unilaterally change her action. Players are in
equilibrium if a change in strategies by any one of them would lead that player to earn
动态
完全信息动态博弈 子博弈精炼纳什均衡
泽尔腾(1965) 不完全信息动态博弈 精炼贝叶斯纳什均衡
泽尔腾(1975) Kreps和Wilson(1982)
Fudenberg和Tirole (1991)
(一)完全信息静态博弈:纳什均衡 Nash Equilibrium
A Nash equilibrium, named after John Nash, is a set of strategies, one for each player,
《博弈论入门》PPT课件
在不同博弈中可供博弈方选择的策略或行为的数量 很不相同,在同一个博弈中,不同博弈方的可选策 略或行为的内容或数量也常不同,有时只有有限的 几种,甚至只有一种,而有时又可能有许多种,甚 至无限多种可选策略或行为。
精选PPT
男人无所谓忠诚,忠诚是因为背叛的砝码太低; 女人无所谓忠贞,忠贞是因为受到的引诱不够.
某个综艺节目现场,女主持人气势咄咄的问一个男嘉宾,你 为什么那么在乎钱,男嘉宾说:“钱能买到一切!” 现场的观 众哗然了。
男嘉宾微笑的说:“我们做个测试吧。”
一个很简单的主题,你的一个仇人爱上了你的女友,现在
局中人所选择的策略构成的组合(招,招)被称为 博弈均衡。
精选PPT
21
参与人(Players)
即在所定义的博弈中究竟有哪几个独立决策、独立 承担结果的个人或组织。
对我们来说,只要在一个博弈中统一决策,统一行 动、统一承担结果,不管一个组织有多大,哪怕是 一个国家,甚至是由许多国有组成的联合国,都可 以作为博弈中的一个参加方。并且,在博弈的规则 确定之后,各参加方都是平等的,大家都必须严格 按照规则办事。
人,也许是在权衡什么。一半的男人沉默了,另一半
的男人怯生生的说:“我要爱情。”身边的女友也有点
呆住了,一个女孩子站起来说:“如果一个男人肯出
五百万,我想我没有理由拒绝他。”沉默..................
精选PPT
26
男人选择了金钱,500万可以买一套房子,一部车子,全家 过上好曰子,甚至可以开始自己的事业。一个男人说:“他是 我的仇人,我有了这个500万,我可以含辛茹苦,我可以报仇 ,我可以计划我所有的未来,当个真正主宰自己的男人。”一 些女人看着身边的男人,若有所思。
《博弈论与管理》PPT课件
• 一.组织风险(fēngxiǎn)分析 • 二.企业制度与风险分散 • 三.业务模式 • 四. 沟通与深入一线 • 五.规范化与团队思维趋同化,反对派。
第一页,共86页。
“钓鱼 工程” (diào yú)
• 国内有许多“钓鱼工程”,有些部门(地方政府) 在项目论证初期压低工程预算,诱导上级同意开工。 等到开工后,再以情况变化为由,要求追加预算, 置上级于两难境地,上级往往因顾虑“沉淀成本” 造成的损失而不得不同意。如果下级竟相攀比,上 级就难以承受,不得不痛下决心,断然处置,损失 惨重。许多经济“过热”就是这样形成的,中央政 府最后不得不“宏观调控(hónɡ ɡuān diào kònɡ)”,一刀切 地收紧财政、货币政策。留下“胡子工程”(如海 南等地的“烂尾楼”)。试解释这种现象盛行的心 理、行为机制。
• 5 .制度法律合同不完备性(外部性) , 硬信息:
Observable, verifiability. Private, common, public
information
品牌、信誉; 文化,
价值观
权威管理,控制;
• 6.不定性----(交易风险,例外管理 ),信息完备性, 调查、计划、预测(定战略) ,保险 服务(fúwù),营销;供应链、一体化、联盟;经营风 质量控制,制度,
l表现出对对方的兴趣。目光接触,给出非言语反应。
l在行为上证明对他人兴趣。别人讲话时不要看自己的信。
l努力倾听,去理解对方,而不是想办法反驳对方。
第二十二页,共86页。
4.去除各种干扰。
l不乱写乱画,不拍打手脚,不折叠纸张。
l交谈时关上门。
5.与讲话者交流。