第1章 博弈论基本模型

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0
一,从三国演义谈起
绪 论
1,曹操走华容道,有一条大路和一条小路,走哪条路呢? 2,田忌与齐王赛马,孙膑出主意. 3,三个和尚没水喝,为什么? 4,一个村子里,道路泥泞,村子里一家很富有,其他贫穷, 该修一条好路,能修成吗? 5,剪刀-石头-布,为什么成为猜先的选择? 6,黔驴是如何技穷的? 7,A,B,C三人去钓鱼,A钓了5条,B钓了3条,C没钓着, 中午一起吃饭,把钓的鱼吃完了,C不好意思,就给了A和B 共8元钱,A和B如何分配?
田忌将军每次输掉三千金 上马 ∨ 下马 中马 ∧ 上马 下马 ∧ 中马
田忌将军胜二负一赢一千金
博弈论的创立与发展
2,博弈论的发展阶段 , 第一阶段:萌芽期(20世纪 年代前). 世纪40年代前 第一阶段:萌芽期 世纪 年代前 .利益冲突的研究是分散和初 步的,带有很大程度的随意性. 孙子兵法:古诺(Cournot,1883)—古诺的"双寡头垄断"模型;艾 奇 沃 思 (F.Y.Edgeworth , 1925)——" 双 寡 头 等 分 市 场 " ; 霍 特 林 (H.Hotelling,1929)——产品差异而引起的"价格竞争"模型;斯塔克 尔伯格(H.V.Stackelberg,1934)——"领导——跟随(leader—follower)" 模 型 ; 斯 威 齐 (P.M.Sweezy , 1939)——" 折 弯 的 需 求 曲 线 (Kinky Demand Curve)"模型等等. 第二阶段:创立期(20世纪 年代). 世纪40年代 第二阶段:创立期 世纪 年代 .博弈论首次系统地被引入经济 学. 1944年冯诺依曼(Von.Neuman)和摩根斯坦恩(Morgen Stlern)合作 出版了《对策论与经济行为》,从而奠定了合作博弈的理论与方法.
例1.1 考虑按以下步骤进行的博弈活动. 第1步 局中人1从字母T,H中选一个; 第2步 局中人2不知第1步的选择,再从H,T中选一字母; 第3步 局中人知道1,2两步的选择,又从T,H中选一字母; 第4步 局中人2不知第3步的选择,但知1,2两步的选择,最后 从T,H中选一字母,博弈结束.按照每步选择的结果,每个局 中人各得一笔报酬(略). 该博弈的局中人集合 N = {1,2.} 该博弈的信息集合分别为I = {I1 , I 2 } ,其中 I1 = {I11 , I12 , I13,I14 , I15 }, I 2 = {I 21 , I 22 , I 23,I 24 , I 25 } .
1.1 有限扩展型博弈模型
博弈模型的构建 应用博弈论方法分析研究问题,首先要构造出博弈模型来,因 而需要从大量的博弈活动中抽象出博弈模型的基本要素,对这 些要素进行严格,准确的刻画后,形成博弈模型. 将博弈活动构造成博弈模型,需要了解以下6个方面的情况: 1.局中人; 2.外生事件的概率分布; 3.局中人选择行动的次序; 4.局中人所能选择的行动; 5. 局中人在选择行动时所了解的信息. 6.局中人的支付.
1.局中人集合 局中人集合
2.行动集合 行动集合
称参与人 i ∈ N在博弈中所有可能选择的行动构成的集合 A i 为局中人i的行 行 动集合. 行动. 动集合 A i 中的元素 a i 称为局中人i 的行动 行动 局中人的行动集合可能是有限集,也可能是无限集.如果博弈活动中每个 局中人的行动集合都是有限集,且每个局中人行动的次数也是有限的,称 该博弈为有限博弈 有限博弈. 有限博弈
博弈论的创立与发展
第三阶段:大发展期(20世纪 世纪50's—90's).非合作博弈以及合作博弈的理论获得了 第三阶段: 大发展期 世纪 . 空前的发展. 纳什(Nash,1950)——n人非合作博弈及提出博弈均衡的定义 塔克(A Tucker)——提出"囚徒困境"(prisoner's dilemma)模型 泽尔腾(Selten,1965)——提出精练子博弈纳什均衡概念,并把这一概念引入到了 动态分析之中 海萨尼(J.Harsnyi,1967~1986)——提出贝叶斯纳什均衡概念,并把这一概念引入 不完全信息博弈模型研究 泽尔腾(Selten ,1975),克瑞普斯(Kreps,1982)和威尔森(Wilson,1982). 弗得伯格(Fudenberg,1991)和泰勒尔(Tirole,1991)研究了精练贝叶斯纳什均衡, 解决动态不完全信息博弈.泽尔腾定义了"颤抖手均衡"(trembling hand equilibrium); 克瑞普斯和威尔森定义了"序贯均衡"(Sequential equilibrium)并提出了著名的"信誉" 问题模型;弗得伯格和泰勒尔给出了"精练贝叶斯均衡"的正式定义. 颤抖手均衡>序贯均衡>精练贝叶斯均衡(但在许多情况下,三个概念是一致的) 博弈论近期发展:除了博弈论与信息经济学的结合外,还出现了新的理论与应用分 支诸如博弈学习理论,进化(演化)博弈论,博弈论与新制度经济学,博弈论与行为科学, 博弈论与实验经济学,博弈论与组织管理的结合.
第1章 博弈论基本模型 章
(Game Theory)
ຫໍສະໝຸດ Baidu
华侨大学商学院
什么是学习? 什么是学习?
大学之道, 学习的三个层次(大学之道,在明明德,在亲民,在止于至善 大学之道 在明明德,在亲民,在止于至善) 专业学习: 专业学习:谋职,谋生(身无长物,何以生存). 事理学习: 事理学习:明白事理,懂得分析生活中的很多问题.(崔琦: 明白这个世界是一个什么样子,这很重要).一个人,其实只 要懂得了加减乘除四则运算,就可以挣到钱买房买车,在物质 世界中生活的很好.但这只是像一个盲人一样在生活,"春天 来了,但我却看不到" .(明明德) 人生学习: 人生学习:充实人生,提高人生的境界,把学习融入人的生活 中.人不是做事和挣钱的工具,而是宇宙中的有血有肉的生灵, 需要提高生活的趣味,享受趣味化的人生,这就需要学习.一 个人,不会欣赏《二泉映月》,不会感受过禅宗的静谧,从来 也不思考什么是天行健,好像也是在生活.看看很多人下班后 在做什么?打牌,或者歌厅洗脚房等,当衣食住行解决了之后, 就不知怎么过了,只有赌博和玩乐,却找不到真正的趣味. (身体在成长,心灵也在成长吗?)(新民) 仰望星空
二,什么是博弈论
1,安踏的广告是什么? 2,一般人平时的思维是怎么样的? (决策,只知其一不知其二)("我以为…","我觉得…") 3,博弈论的思想是什么?(对策) 博弈,就是对手之间的游戏(game),在游戏中如何做到立 于不败之地. 博:? 弈:? 下棋的最高享受是什么? 囚徒困境(Prisoner's dilemma) 囚徒困境
为什么学习? 为什么学习?
从学习中获得心灵的提高,获得心灵的享受. 学习,其实就为自己创造一个美丽的心灵世界的过程. 有人说,我也没什么追求,就学一点实用知识就行,但问题是, 你没有那些"无用"的知识,你怎么驾驭哪些实用的知识呢? "世人只知有用之用,而不知无用只用". 很多人30岁后就不再读书,到60岁还是30年前的思维;很多人感 慨"现在一读书就头痛";农村现在不要为生存而挣扎了,那做 什么呢?"我不打牌又做什么呢?" 每个人都生活在现实的物质世界和心灵的精神世界中,但很多人 只知现实世界的繁华,却不知心灵世界的清新和高远.行万里路, 读万卷书,就是为追求心灵世界.这些年我深刻体会到:生活的 基础是衣食住行,但生活的重点在于文化和精神.我不知道文化 有什么用,我只知道一个人没有了文化还有什么用呢? 教师的功能:催化剂(使学生更快速更深入地学习) 教师的功能:催化剂(使学生更快速更深入地学习) 大医医心:能医心者,才是大医. 大医医心:能医心者,才是大医.
构造博弈模型所需要的要素
N = {0,1,2, L, n} ,称 N 为局中人或参与人集合.N 中元素称为参与人或局 中人.参与人不专指人,它泛指参与博弈活动的政府,企业,地区,国家, 个人……等决策主体.通常用"0"表示虚拟局中人,它的行为是以确定的 概率分布进行随机选择, i = 1,2, L , 表示实际参与人. n
U : Z → R n , U ( z ) = (u1 ( z ),u 2 ( z ), L , u n ( z )), z ∈ Z
5. 信息集与信息集分割 信息集由同一个局中人,在相同的时点上的具有相同信息 的决策节点组成.用 I ik (i = 0,1,2, L , n, k = 0,1,2, L , ri )表示局中 人i的第k个信息集.它满足 I (1) ik ≠ Φ ( Φ 表示空集); (2)从博弈起始点到任一终点的路径至多与 I ik 交一点 (描写同一信息集中的节点处于同一时点上); (3)从 I ik 中的任一节点出发,局中人i可能选择的行动集 合都相同(因为局中人在同一信息集的不同节点上具有相 同的信息). 在博弈树上,将属于同一信息集的节点用虚线框在一起. 称 I i = {I i1 , I i 2 , L,I ir } 为局中人 i(= 0,1,2, L , n) 的信息集类 信息集类(在数 信息集类 学上,称以集合为元素的集合为类). 称 I = {I 0 , I 1 , I 2 , L,I n } 为信息集分割 信息集分割. 信息集分割
博弈论的创立与发展
1,博弈论思想最早产生于我国古代 ,
2000多年前的春秋时期孙武在《孙子兵法》中论述的军事思想和治 国策略,就蕴育了丰富和深刻的博弈论思想. 田忌赛马:齐威王的上,中,下马分别优于大将田忌的上,中,下, 但田忌上马,中马分别优于齐威王的中,下马.比赛规则:每次双方各 出三匹马,一对一比赛三场,第一场的输方要赔一千金给赢方. 齐 田忌策略: 田忌策略: 田 结 果: 齐 谋士孙膑 策略: 策略: 田 结 果: 上马 ∨ 上马 中马 ∨ 中马 下马 ∨ 下马
i
有限扩展型博弈模型的定义 定义1.1 称 G = N, Y, U, I, q 为有限扩展型博弈模型.其中N为参与 有限扩展型博弈模型. 定义 有限扩展型博弈模型 人集合,Y为博弈树,U为支付向量,I为信息集分割,q为外生事件的 概率分布. 完全信息博弈与不完全信息博弈 如果所有的局中人对构成G的元素N,Y,U,I,q都完全了解,称G为完全 完全 信息博弈,否则为不完全信息博弈 不完全信息博弈. 信息博弈 不完全信息博弈 静态博弈与动态博弈 如果所有的局中人都同时选择行动,称G为静态博弈 静态博弈,否则,称G为 静态博弈 动态博弈.静态博弈 动态博弈 静态博弈更本质的特征是所有局中人在选择行动时不知道 静态博弈 对手选择了什么行动.
3.博弈树 博弈树
对于有限博弈,可用博弈树直观地刻画它,市场进入问题的博弈树如图1-1 所示(见p2上的例子).
旺 盛
I ① 01
疲软

进 入② 容 许 不 进 容 许 进 入②

不 进 抵 制
图1-1 市场进入博弈树
4. 支付向量 博弈树中终点Z下面的向量 u = (u1,u 2 , L , u n ) 称为支付向 支付向 i(= 1,2, L , n) 个分量表示博弈结束于Z时,局中 量,它的第 人i所得的支付.支付可表示参与人的某种收益或损失.本书 中的支付指收益,效用,利润等.正式地,支付向量是终点 集合Z到n维向量集合R n 的映射.
T ② T ① I12 T ② I 22 T H T H ② HT T ② H H ① ①
I11
H ② T H ① I15 T ② H T ② I 25 H T H ② H
I 21
I13
H T ② T H ② T
① I14 H
I 23
I 24
H T
图1-2
信息集可以告诉我们以下4点 信息集可以告诉我们以下 点 1.在一个信息集上应由哪个参与人选择行动. 2.从一个信息集出发,局中人可能选择哪些行动. 3.局中人在一个信息集上选择行动时已知道了哪些信息. 4.单点信息集表明相应的局中人完全了解博弈从开始到该信息 集的博弈历程. 完美信息博弈 如果G的每个信息集都是单点信息集.表明博弈的每个参与人 在选择行动时对博弈到现在为止的历程都完全了解,这时称G 为完美信息博弈 完美信息博弈. 完美信息博弈 扩展型博弈不仅能刻画动态博弈, 扩展型博弈不仅能刻画动态博弈,也能刻画静态博弈
相关文档
最新文档