博弈论基础与应用概述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0,-5 , -1,-1 ,
囚徒困境( 囚徒困境( Prisoners’Dilemma ) 只达到效率很差的个体理性解, 只达到效率很差的个体理性解,没有实现团体 理性解。 理性解。 前者是稳定的,是自动实施的; 前者是稳定的,是自动实施的;尽管团体理性 解对大家都好,但它是不能自动实施的, 解对大家都好,但它是不能自动实施的,需要改变 条件。 条件。 提示: 提示:该博弈揭示了个体理性与团体理性之间的矛 盾。——从个体利益出发的行为往往不能实现团体的 最大利益,同时也揭示了个体理性本身的内在矛盾— —从个体利益出发的行为最终也不一定能真正实现个 体的最大利益,甚至得到相当差的结果。
博弈论基础与应用
“要想在现代社会做 一个有文化的人, 一个有文化的人,你 必须对博弈论有一个 大致了解。 大致了解。”
保罗. 保罗.萨缪尔森
教材
博弈论基础与应用》 《博弈论基础与应用》 吴广谋 吕周洋 东南大学出版社
考试成绩
平时----30%(出勤、作业、报告) (出勤、作业、报告) 平时 笔试----70% 笔试
效用函数和支付(Payoffs function) :参与人行动 效用函数和支付 及其他人行动组合实施时所产生结果的评价, 及其他人行动组合实施时所产生结果的评价,它反 映了参与人的偏好。各博弈方从博弈中所获得的利 映了参与人的偏好。 益。 参与人的支付函数不仅取决于自己的策略选择, 参与人的支付函数不仅取决于自己的策略选择,而 且取决于所有其他参与人的策略选择, 且取决于所有其他参与人的策略选择,即参与人的 利益是相互制约的。 利益是相互制约的。 支付对应博弈的结果, 支付对应博弈的结果,也就是各博弈方策略组合的 结果。 结果。 支付是各博弈方追求的根本目标及行为和判断的主
军事模型的应用; 军事模型的应用; 和其他的数学分支发生联系。 和其他的数学分支发生联系。
博弈论发展的里程碑之二---博弈论发展的里程碑之二 “纳什均衡”的提出 纳什均衡” 纳什均衡 纳什,美国数学家、经济学家, 他在1950年和1951年发表了两篇 关于非合作博弈的论文《n人博 弈中的均衡点》和《非合作博弈》 定义了“纳什均衡”的概念,与 Tucker于1950年定义的“囚徒困 境”一起奠定了非作博弈论的基 石。
企业2 企业
成绩博弈例子
博弈论方法是在决策中互动关系 不可忽略情况下的可选用的工具之一。 不可忽略情况下的可选用的工具之一。
第二节 博弈论的基本概念
参与人或局中人(Players) 独立决策、 参与人或局中人(Players) :独立决策、独 立承担博弈结果的个人或组织 博弈规则面前博弈方之间平等, 博弈规则面前博弈方之间平等,不因博弈方 之间权利、 之间权利、地位的差异而改变 博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、 根据博弈方数量分单人博弈、两人博弈、多 人博弈等。最常见的是两人博弈, 人博弈等。最常见的是两人博弈,单人博弈 是退化的博弈
单人博弈——只有一个博弈方的博弈 一、单人博弈 只有一个博弈方的博弈
例一: 例一:单人迷宫
入口 A,1 右 A B
扩展形 左 B,1 0 出口(奖金M) M 0 右

二、两人博弈 两人博弈即有两个博弈方的博弈 两人博弈最常见,研究最多, 两人博弈最常见,研究最多,是 最基本和有用的博弈类型 两人博弈有多种可能性, 两人博弈有多种可能性,博弈方 的利益方向可能一致, 的利益方向可能一致,也可以不 一致
John Nash
1994年三位获诺奖的博弈论学者 1994年三位获诺奖的博弈论学者
John Nash
John Harsany
Reihaden Selten
20世纪 年代末期到 年代中期 世纪40年代末期到 世纪 年代末期到50年代中期
非合作博弈----纳什提出了“纳什均衡”的概 非合作博弈 念;Tucker于1950年定义的“囚徒困境” 。 合作博弈----1953年,纳什和夏普利 (Shapley)提出的讨价还价模型;Gillier和 Shapley提出的合作博弈中“核”(Core) 的概念。
均衡
均衡是经济学中的重要概念。 均衡是经济学中的重要概念。 均衡即是平衡的意思,英文是: 均衡即是平衡的意思,英文是:equilibrium 。在 经济学中,均衡意即相关量处于稳定值。 经济学中,均衡意即相关量处于稳定值。在供求关 系中,某一商品市场如果在某一价格下,想以此价 系中,某一商品市场如果在某一价格下, 格买此商品的人均能买到, 格买此商品的人均能买到,而想卖的人均能将商品 卖出去。此时我们就说,该商品的供求达到了均衡。 卖出去。此时我们就说,该商品的供求达到了均衡。 此时的价格可称之为均衡价格,产量称之均衡产量。 此时的价格可称之为均衡价格,产量称之均衡产量。 均衡分析是经济学中的重要分析。 均衡分析是经济学中的重要分析。
第三节 应用与例子
1.3.1 囚徒困境
囚徒的困境是图克( 年提出的。 囚徒的困境是图克(Tucker)1950年提出的。 ) 年提出的 该博弈是博弈论最经典、著名的博弈。 该博弈是博弈论最经典、著名的博弈。 该博弈本身讲的是一个法律刑侦或犯罪学方面的问 但可以扩展到许多经济问题, 题,但可以扩展到许多经济问题,以及各种社会问 可以揭示市场经济的根本缺陷。 题,可以揭示市场经济的根本缺陷。
博弈定义: 博弈定义:博弈就是参与人(可能是个人,也可能是 团体,如国家、企业、国际组织等)在一定得规则下, 同时或先或后,一次或多次,从各自允许选择的行动 或战略中进行选择并加以实施,而取得相应结果(支 付函数)的过程。 博弈论:博弈论就是系统研究具有上述特征的博弈问 题,寻求各博弈方合理选择战略情况下博弈的解,并 对这些解进行讨论分析的理论。
行动 参与人在某个决策时点选择的方案。 参与人在某个决策时点选择的方案。
企业的例子
互动
望文生义说“博弈”
“博彩” 博彩” 博彩 弈秋” “弈秋”
从游戏到博弈
博弈就是策略对抗,或策略有关键作用的游戏 博弈Game,博弈论 ,博弈论Game Theory,Game即游戏、竞 即游戏、 博弈 , 即游戏 技
问题
选择有几种、结局有几种? 选择有几种、结局有几种? 结局和谁有关? 结局和谁有关? 如果你,如何选择? 如果你,如何选择? 为什么这么选择;如何考虑的? 为什么这么选择;如何考虑的?
囚徒困境
坦白是B 坦白是B的 占优战略 囚徒A 坦白是A 坦白是A的
坦白
抵赖
占优战略
囚徒 B
坦白 抵赖
-3,-3 , -5,0 ,
支付矩阵
1.3.4 赛马博弈的动态结构
第四节 博弈方法的思维逻辑
建模
求解
解释
“单个”的参与人----国家、团体、企业 单个”的参与人 国家 团体、 国家、 单个 参与人是“个人理性” 参与人是“个人理性”的----有限理性 有限理性 个人理性与集体理性是两个层次的问题
第五节 博弈论的发展简史及分类
一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定的环境 :博弈就是一些个人、队组或其他组织, 条件,在一定的规则下,同时或先后,一次或多次, 条件,在一定的规则下,同时或先后,一次或多次,从各自允 许选择的行为或策略中进行选择并加以实施, 许选择的行为或策略中进行选择并加以实施,各自取得相应结 果的过程。 果的过程。 四个核心方面 博弈的参加者(Player)——博弈方 博弈的参加者 博弈方 各博弈方的策略(Strategies)或行为 或行为(Actions) 各博弈方的策略 或行为 博弈的次序(Order) 博弈的次序 博弈方的得益(Payoffs) 博弈方的得益
博弈在中国
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
巴比伦法典》 《巴比伦法典》中的婚姻契约问题
博弈论发展的里程碑之一---博弈论发展的里程碑之一 博弈论的开山之作 1944年,冯·诺依曼和奥·摩 根斯顿发表《博弈论与经济 行为》的一书,标志着博弈 论作为一门独立科学的开始, 也标志着新古典经济学进入 极小极大值理论的不同方法的证明; 极小极大值理论的不同方法的证明; 了一个新的发展阶段。
第二节 博弈论的基本概念
参与人
考试游戏 做两次, 做两次,三次看结果
博弈方:独立决策、 博弈方:独立决策、独立承担博弈结果的个人或组 织 博弈规则面前博弈方之间平等, 博弈规则面前博弈方之间平等,不因博弈方之间权 利、地位的差异而改变 博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、 根据博弈方数量分单人博弈、两人博弈、多人博弈 最常见的是两人博弈, 等。最常见的是两3 齐威王与田忌赛马的博弈
田 忌 上 中 下 齐 威 王 上中下 上下中 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上 下 中 1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1 中 上 下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中 下 上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下 上 中 -1,1 1,-1 1,-1 1,-1 3,-3 1,-1 下 中 上 1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
经典(古典) 经典(古典)博弈论
有约束力的协议
非合作博弈
合作博弈
演化(进化) 演化(进化) 博弈论
完全信息静态博弈
静态博弈
不完全信息静态博弈
完全信息动态博弈
动态博弈
不完全信息动态博弈
主要内容
博弈论概论 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈 博弈论在管理问题中的应用举例
坦白? 抵赖?
基本模型
经典的囚徒困境如下: 经典的囚徒困境如下: 警方逮捕A 警方逮捕A、B两名嫌疑犯,但没有足够证据指控二人入 两名嫌疑犯, 于是警方分开囚禁嫌疑犯,分别和二人见面, 罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方 提供以下相同的选择: 提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称“背叛”对方), 若一人认罪并作证检举对方(相关术语称“背叛”对方), 而对方保持沉默,此人将即时获释,沉默者将判监5 而对方保持沉默,此人将即时获释,沉默者将判监5年。 若二人都保持沉默(相关术语称互相“合作”),则二人同 若二人都保持沉默(相关术语称互相“合作”),则二人同 样判监1 样判监1年。 若二人都互相检举(互相“背叛”),则二人同样判监3 若二人都互相检举(互相“背叛”),则二人同样判监3年。 则二人同样判监
第一章 博弈论概论
决策与互动 博弈论的基本概念 应用与例子 博弈方法的思想逻辑 博弈论的发展简史及分类 博弈论在企业经营管理中的应用
第一节 决策与互动
决策? 决策? ----实现目标的方案选择 实现目标的方案选择 决策中的互动
例子--决策的互动与非互动 例子--决策的互动与非互动 --
企业1 企业
第一个研究高潮,本世纪40年代末和 年代末和50年代初 一、第一个研究高潮,本世纪 年代末和 年代初
1950年纳什提出“纳什均衡”(Nash equilibrium)概念和证明 年纳什提出“纳什均衡” 年纳什提出 ) 纳什定理,发展非合作博弈的基础理论。 纳什定理,发展非合作博弈的基础理论。 1950年Melvin Dresher和Merrill Flood在兰德公司(美国空军) 年 在兰德公司( 和 在兰德公司 美国空军) 囚徒的困境” ,(Howard “囚徒的困境”(Prison’s dilemma)博弈实验,( )博弈实验,( Raiffa)独立进行这个博弈实验; )独立进行这个博弈实验; 1952-1953年期间(L. S. Shapley)和(D. B. Gillies)提出“核” 年期间( 年期间 ) )提出“ (Core)作为合作博弈的一般解概念 ) Shapley提出了合作博弈的“Shapley值”(Shapley value)概念 提出了合作博弈的“ 提出了合作博弈的 值 ) 等。 奥曼( 年代末50年代初是博弈论历史上令 奥曼(R. J. Aumann)“40年代末 年代初是博弈论历史上令 ) 年代末 人振奋的时期,原理已经破茧而出,正在试飞它们的双翅, 人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活 跃着一批巨人。 跃着一批巨人。”
相关文档
最新文档