05博弈论—多重均衡与制度和文化

合集下载

(完整版)博弈论知识点总结

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述:1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设:1、 决策主体是理性的,最大化自己的收益。

2、 完全理性是共同知识3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。

行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。

信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。

完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。

不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。

支付:决策主体在博弈中的收益。

在博弈中支付是所有决策主题所选择的行动的函数。

从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别:1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。

可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。

2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。

但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。

4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。

战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

博弈论视角下制度的设计与演化

博弈论视角下制度的设计与演化

是 动 态 的 , 而 是 演 化 的 , 这 就 属 于 超 博 弈
众 多理 论分歧 的原点 。从 博弈 论 的视角 来看 ,制 度 的产生 背景 涉及 到博 弈 的三个 基本 要素 :信 息 、参
与人 、战略 。 在机 制设 计理 论 中 ,博弈 中 的主体分 两类 :机
(ue a e o所 以这种博弈行 为被抽象到演化博 spr m s g 弈 模 型 中。制度 产生 的经 济背 景可 以用 四个 问题来
‘ 一 个 问题 都 产生 了对 某 种适 应 性 特 征 的 需要 , 每 那就 是社会 制度 。相类 似地 ,社会科 学家所 面对 的
均衡 是制 度 的 内容 、但不是 全部 。另外 ,制度 总是 相 对 于一定 的规范标 准而 言的 ,比如资 源 的帕累托 配置 、收入 的公平分 配等 。也就 是说 ,制度不 仅涉 及 到参 与人 的行为策 略 、还 涉及 到参 与人 的行 为及 其结果 。 因此 ,从 总体而 言 ,制 度是博 弈 的形 式 。
突 出的表现 就是部分 研究 仅仅把 制度作 为一 种理论
时 尚用 语 。比如 ,有 些金 融制度 研究 完全是 金融学
典 博弈 在参 与人完 全理性 等约束 条件 的放宽 。制度 研 究 中一个经 常要 面对 的问题 就是制 度是演 化 的还
是 构建 的④ ,对这一 问题 的 回答 包含 了对经济 现实 、 活动 主体能 动性 、人 的理 j 生、社 会经 济运行 机制等
比较 制度分析理论 主观博弈模 型 综合 博弈 均衡 的概要表征 、信息浓缩 因域 而异 、刻点均衡 所有制度 所有制度及其演化
主要分析对象 具体 、微观 、短期的制度 习俗惯例等基本制度
资料 来源: 肖特. 会制度 的经济理论 . 社 上海:上 海财经大学出版社 ,P 4 4

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。

它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。

下面是博弈论中的一些重要知识点的总结。

1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。

-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。

-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。

2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。

-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。

3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。

-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。

-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。

4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。

-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。

-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。

5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。

-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。

-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。

6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。

-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。

-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。

7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。

-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。

博弈均衡和机制设计_概述解释及说明

博弈均衡和机制设计_概述解释及说明

博弈均衡和机制设计概述解释及说明1. 引言1.1 概述博弈均衡和机制设计是博弈论和经济学中的两个重要概念,它们在分析和解决各种经济、社会和政治问题中起着关键作用。

博弈均衡是指在多方参与者之间进行策略选择时达到一种相对稳定状态的理论概念,而机制设计则是为了实现特定目标而设计出合适的规则和激励机制。

本文将对博弈均衡和机制设计进行总结、解释和说明。

1.2 文章结构本文将分为六个部分进行讨论。

首先,在引言部分对博弈均衡和机制设计进行介绍,并说明它们的关系。

接着,我们将详细探讨不同类型的博弈均衡及其特点,包括完全信息博弈和不完全信息博弈,以及纳什均衡与其他类型的博弈均衡之间的比较。

然后,我们将深入研究机制设计的原理与方法,包括契约理论在机制设计中的应用、声明式机制设计与计算式机制设计的对比分析,以及公共品和外部性问题中的机制设计策略。

接下来,我们将探讨博弈论在经济领域中的应用实例以及社会公共资源配置中的机制设计案例,并讨论机制设计在社会政策决策中的意义和作用。

最后,我们将给出结论部分对全文进行总结。

1.3 目的本文的目的是介绍和解释博弈均衡和机制设计的概念,并探讨它们之间的关系。

通过对不同类型博弈均衡及其特点、机制设计的原理与方法以及应用案例进行分析,我们希望读者能够更好地理解博弈论和机制设计,并认识到它们在经济、社会和政治问题中起到的重要作用。

同时,本文还旨在提供一些思考和启发,为相关领域研究者提供理论依据和实践指导。

2. 博弈均衡和机制设计2.1 博弈均衡的概念博弈均衡是博弈论中一个重要的概念,指的是在一个博弈过程中,各参与者通过采取最佳策略而达到的一种稳定状态。

在博弈均衡中,不存在任何一个参与者可以通过改变自己的策略来获取更好的结果,即没有人单方面改变策略可以获得更高效益。

博弈均衡可以分为纯策略均衡和混合策略均衡两种形式。

2.2 机制设计的概念机制设计是经济学中研究如何设计合适机制以实现某种特定目标或解决某个问题的理论框架。

从博弈论重新理解中华文明

从博弈论重新理解中华文明

不管一种文明的内部具体如何,封建主义也好,资本主义也好,专制也好,民主也好,科学也好,愚昧也好,有宗教也好,无信仰也好,黑人种也好,白人种也好,大陆型也好,海洋型也好,内省文化也好,外向文化也好,窝里斗也好,不窝里斗也好,其他种种也好,我们完全可以对这一些纷争置之不理,但我们都可以肯定,该一文明的总格局是人与人的博弈——只要是人的文明,任一文明的总格局都是人与人的博弈;这一总格局与任何其他因素无关,唯一只与人性人心人情紧密相关。

如果我们从外部看到某一文明长时间大体稳定,甚至一直处于大体稳定的状态,那我们应该可以肯定,该一文明内部格局已经达到博弈均衡,要不然,它不可能老是大体稳定!对这样的文明,我们应该表示尊重!而如果这样的文明不属于小文明——小文明可能会存在特殊性——而是巨型文明,甚至是超巨型文明,那我们更应该表示尊重!中华文明正是这样的文明,一者五千年绵延不绝,大体一直稳定;一者超巨型,人口和面积都是超巨型的——所以我们绝对应该尊重中华文明!按:在“中外名家系列讲座”第191讲上,着名环保活动家廖晓义女士除了振聋发馈的“谁更需要脱贫”的质问之外,饭间还提到一个鲜明的观点:“气候变化标志西方文化的破产!”深表赞同,在“全球变暖”成为舆论热点的2007年中,曾撰写《气候变暖:中国软崛起的重大契机》的专门文章,内中有这样一段话:全球变暖正可能意味着“风水轮流转”的时候到了,它从最高也最硬的层面反映了西方文化的危机,再不深刻反省西方文化已经不行了,它已经触底!中华文明或许“古道西风瘦马,小桥流水人家”,物质上不怎么让人刺激,但中华文明经受了时间和历史的考验——五千年延绵不绝,是古代文明中惟一幸存下来的超巨型文明!仅仅凭这一点,就值得今天陷于天诛地灭之境的人类深刻反思和借鉴。

鸦片战争以来,特别是五四运动以后,一部分国人,而且多为精英分子,开始对自己的文化失去自信。

首先得承认,这是完全可以理解的,毕竟“落后就要挨打”的达摩克利斯剑高悬在我们的头上。

从博弈论谈制度建设

从博弈论谈制度建设

从博弈论谈制度建设戴兴邦(中国人寿保险股份有限公司研发中心,北京,100033)摘要博弈论是现代数学的一个新分支,是运筹学的重要组成内容,是研究理性人的互动(interactive)决策理论。

本文从博弈论基本思想出发,对纳什均衡、智猪博弈、猎鹿博弈、七人分粥案例进行了深入阐述分析,指出了制度建设中所涉及的激励策略、分配合作、可操作的重要性。

最后,深入分析了制度建设和博弈论之间的关系,提出了基于博弈论思想进行制度建设的实施方法和策略。

关键词博弈论;纳什均衡;智猪博弈;猎鹿博弈;七人分粥;制度建设中文分类号:文献标识码:1前言博弈论(Game Theory)是现代数学的一个新分支,是运筹学的重要组成内容。

按照Robert Aumann 教授的说法(注:2005年其因对博弈论的贡献而获得诺贝尔经济学奖),博弈论就是研究理性人的互动(interactive)决策理论,即各行动方的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑纳入决策依据之中,迭代考虑情形进行决策,选择最有利于自己的战略。

`与博弈论密切相关的一个经济学理论为纳什均衡(Nash Equilibrium),纳什均衡即在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

任何改变策略的人其收益将会降低。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

制度,是国家机关、社会团体、企事业单位,为了维护正常的工作、劳动、学习、生活的秩序,保证各项政策的顺利执行和各项工作的正常开展,依照法律、法令、政策而制订的具有法规性、指导性以及约束力的文件总称。

制度建设是抓好工作的根本,其在企业发展中起着举足轻重的作用。

随着企业规模发展壮大,受到管理者自身管理幅度的限制,企业只能依靠制度来管理,也籍此,才能实现由“人治”向“法治”的转变。

制度建设和博弈论有什么关系?制度是政策(制度设计者)、制度参与人相互博弈的结果。

博弈论混合策略纳什均衡

博弈论混合策略纳什均衡

博弈方1 (0.8,0.2) 2.6
博弈方2 (0.8,0.2) 2.6
夫妻之争的混合策略纳什均衡
看看这个博弈有几个均衡?
时装 妻 子
足球
时装 2, 1
丈夫
足球 0, 0
0, 0
1, 3
夫妻之争
存在两个纯策略均衡
时装 妻 子
足球
时装 2, 1
丈夫
足球 0, 0
0, 0
1, 3
夫妻之争
还存在混合策略纳什均衡
vL1,13vL0, 0.5
政府和流浪汉的博弈
• 如果政府救济的概率小于0.5; • 则流浪汉的最优选择是寻找工作; • 如果政府救济的概率大于0.5; • 则流浪汉的最优选择是游闲等待救济。 • 如果政府救济的概率正好等于0.5; • 流浪汉的选择无差异。
讨论
• 上面的均衡要求每个参与人以特定的概率选择纯策略。也就是说,一个参与人选择不同策略 的概率不是由他自己的支付决定的,而是由他的对手的支付决定的。
n
• 证明过程省略,主要根据是布鲁威尔和角谷i 的不动点定理。
• 纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。
§扑克牌对色游戏
• 甲乙玩扑克牌对色游戏,每人都有红黑两张扑克牌,约定如果出牌颜色一样,甲输乙赢,如果 出牌颜色不一样,则甲赢乙输。
• 找到这个博弈的纳什均衡。
字母说明
• 此博弈不存在纯策略纳什均衡。 • 我们用p代表税收机关检查的概率;q代表纳税人逃税的概率。
求解:混合战略纳什均衡之一
• 假定纳税人采用混合策略达到最优选择时,则税收机关在检查和不检查两种策略的期望收益 相等:
• (a-C+F) q+(a-C)(1- q)=a(1- q) • q*=C/(a+F)

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。

即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。

1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。

1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。

倘若不能,则称非合作博弈(Non-cooperative game)。

合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。

把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。

博弈论四种类型

博弈论四种类型
贝叶斯纳什均衡
贝叶斯纳什均衡
混合战略(不完全信息情况下纯战略均衡的极限)
对原混合战略加入少许不确定性因素,求极限。
性别战
1、均衡存在性
2、不确定性体现为类型的不确定性
一般贝叶斯均衡
Harsanyi转换
机制设计
不完全信息动态博弈
在博弈开始前参与人之间的信息存在不确定性,同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。
无限次重复博弈均衡(无名氏定理)
与贴现因子有关
囚徒困境(冷酷战略)
无限期轮流讨价还价模型
一般博弈
逆向归纳法求解
斯坦科尔伯格寡头竞争
雇主与公会之间的竞争
不完全信息静态博弈
在博弈开始之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
不确定是参与人的了性的不确定性
精炼贝叶斯纳什均衡
信号传递博弈
分离均衡
根据所得信息修正判断概率,根据收益最大化决策
信号传递博弈
不完全信息重复博弈与声誉
Milgrom-Roberts垄断限价模型
不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
混同均衡
准分离均衡
类型
信息和行动特点
均衡
均衡类型
特别均衡
求解方法
学过的例子
性质
完全信息静态博弈
每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。
纳什均衡
纯战略纳什均衡(PNE)

制度变迁过程中主观博弈论的均衡

制度变迁过程中主观博弈论的均衡

理论探讨摘要:制度的诞生都与博弈论的出现息息相关。

主观博弈论是制度赖以生存的规则,其将制度与参与者之间的默契配合联合,形成一套行之有效的共同遵守规则。

制度变迁过程中产生的激励约束与共同塑造两种功能时刻调整与完善参与者自身的主观博弈论。

通过学习与反学习两种驱动力共同作用下,使得参与者自身主观博弈论的均衡,最终达到共同信念。

关键词:制度变迁;主观博弈论;均衡一、制度产生与主观博弈论的关系制度常被称作博弈的原则,甚至说是博弈之后的产物,因此,很多制度的诞生都与博弈论的出现息息相关,或是博弈的结果,或是博弈的平衡点。

在博弈论的视觉下,制度更像是博弈的一种规则。

黄凯南等认为,制度的产生过程是博弈的结果,这也是为何制度的变化过程中需要多方主观博弈斗争而来。

这个观点解释了制度产生已经发展的问题[1]。

制度在表面上的理解更多是传统的规则的延续,包括信念的存续、习俗的继承和组织的形成等系统组合,是一种规则制定的规律社会行为。

实际上,主观博弈论更多是将博弈作为制度赖以生存的规则,将制度与参与者之间的默契配合联合,形成一套行之有效的共同遵守规则,共同描述博弈进行的场景与内在联系。

无论是主观博弈论还是博弈均衡观都追求制度由内而外的相生,共同描述制度进行及施放的基本原则。

主观博弈论本身在制度变迁过程中着重均衡制度[2]。

每个博弈论参与者其实际都是制度变化的参与人,若将制度作为一个独立的参与者融会其中,就会改变其他参与者的参与行为,例如策略适应、支付集合、信息集合等等,随之改变的是制度的外在规则,重新形成一套新的制度。

这也就是制度变迁过程中的体现。

在主观博弈之中,参与者无论针对的是客观还是主观的博弈场景都会依靠自身主观的博弈模型,这种模型是由参与者自发内在生成的博弈模型,来源于参与者本身。

因此,制度变迁过程中也是参与者自身调整模型的过程,是将博弈内生规则外表露的一种方式。

在参与过程中会形成一种针对于博弈环境的共同认知行为,共同施行同等概念,逐步形成博弈的均衡,这也是主观博弈论均衡原理的体现之一。

博弈论-第五章

博弈论-第五章

第五章重复博弈在这一章中,我们将围绕着人类的合作为什么产生这一命题来展开。

人与人之间合作生产的一个原因(从经济学的角度来看)是这种做法对于参与者双方而言是一个有利可图的事,为什么说明这一点我们将用到重复博弈。

另一个解释合作生产的方法就是引入信息不对称,在这种情况下,一个人装作是好人是有利可图的(因为好名声能够给他带来收益),这在信息不对称中会加以介绍。

第一节 重复博弈的定义及扩展式 给出重复博弈定义之前,需要做若干准备,一个准备就是由于重复博弈有可能会进行一个很长的时期,甚至是无穷期,因而必须考虑收益的时间价值。

相应的表达偏好的收益函数也需要给出一定的限制。

一、贴现因子与偏好明天的一元钱和今天的一元钱价值是不一样的,最简单的理由是今天的一元钱如果存入银行那么在明天会变成1+ r ,所以明天的一元钱只相当于今天的1/(1+ r )元钱,1/(1+ r )实际上就是经济学中的贴现率。

如果假设未来没有不确定性,定义11r δ=+,未来存在收益流R 1,R 2,R 3,…,那么这个未来收益流的贴现值之和就为V =211231t t t R R R R δδδ∞-=+++=∑L(5-1)其中(0,1)δ∈称为贴现因子(Discount factor)。

严格讲,贴现因子并不等于贴现率,但贴现因子与贴现率一定是同方向变动的。

例如,我们考虑一个特殊的重复博弈,其结束之前重复进行的次数是随机的,即在博弈的每一阶段完成之后,都要通过抛若干枚(加权的)硬币的方式来决定博弈是否结束,如果硬币朝上那么博弈结束(即概率为p),如果是其他情况,那么博弈继续(即概率为1 –p)。

如果下一阶段能得到的收益为R1,那么在当前阶段硬币未抛之前的价值(即贴现后的期望值)为(1 –p)R1/(1+ r);如果下两阶段能得到的收益为R2,在当前阶段硬币未抛之前的价值为(1 –p)2R2/(1+ r)2;下三阶段、四阶段等等的收益,照此类推。

博弈论最全完整-讲解

博弈论最全完整-讲解
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的
逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
例3:为什么教授如此苛刻?
问题是,一个好心肠的教授如何维持如 此铁石心肠的承诺?
他必须找到某种使拒绝变得强硬和可信 的方法。
拿行政程序或者学校政策来做挡箭牌 在课程开始时做出明确和严格的宣布 通过几次严打来获得“冷面杀手”的声

导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型 主要参考文献
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
按照大家是否清楚对局情况下每个 局中人的得益。
“各种对局情况下每个人的得益是 多少” 是所有局中人的共同知识 (common knowledge)。
据“共同知识”的掌握分为完全信 息与不完全信息博弈。
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。

10520-博弈论简介

10520-博弈论简介
理性人行为假设:
个人利益最大化 机会主义
14
了解博弈论的目的

近几十年来,经济学一直在为其他学科 提供武器,但恐怕没有任何其他工具比 博弈论更有力了。博弈论可以:
1. 2. 3.
4.
5.
引导我们运用理论分析现实的经济现象 扩大知识面, 开阔思路和思维模式 人生是永不停歇的博弈过程,博弈意略达到 合意的结果 个人的最佳策略是最大限度地利用游戏规则, 最大化自己的利益 社会的最佳策略,是通过规则使社会整体福 利增加。
11
为什么会造成囚徒困境
亚当斯密在1776年发表的经典之作《国富论》中认为:
我们的晚餐不是来自屠夫、酿酒的商人或面包师傅 的仁慈之心,而是因为他们对自己的利益特别关注。 每个人都会尽其所能,运用自己的资本争取最大的 利益,一般而言,他不会有意图为公众服务,也不自知 对社会有什么贡献,他关心的仅仅是自己的安全、自己 的利益,但如此一来,他就好象被一只无形的手引领, 在不知不觉中对社会改进尽力而为。。。
3
社会交换的组织形式及新制度经济学
交换的组织形式 – 市场 – 企业 – 关系(供应链伙伴,渠道伙伴关系,联盟关系等) 新制度主义经济学:用主流经济学方法分析制度的经济学 – 交易成本理论 – 委托代理理论 – 产权理论 – 不完全契约理论
4
交易成本理论(Transaction Cost Theory)
少数交易(Small Numbers):某些交易过程过于专属性Proprietary),或因为异质性 (Idiosyncratic)信息与资源无法流通,使得交易对象减少及造成市场被少数人把持, 使得市场运作失灵。 信息不对称(Information Asymmetric):因为环境的不确定性和自利行为产生的机会 主义,交易双方往往握有不同程度的信息,使得市场的先占者(First Mover)拥有较多 的有利信息而获益,并形成少数交易。

博弈论与制度

博弈论与制度

三种均衡制度观(2):机制设计观点
• 将制度看作是不断重复的社会环境中的博弈规则。
– 已有学者利用重复博弈的方法来解释惯例和规范 (Lewis,1969;UllmannMargalit,1977;Taylor,1982;Axcelrod,1984)。 – Schotter(1981)更一般地将博弈论推广倒制度分析, 并将制度解释为重复博弈的均衡。
三种制度观(1):efficient institution view
• • • • 它认为社会将选择最大化其总剩余的制度。至于剩余如何在不同的行为主体 (agent)之间进行分配,并不会影响制度的选择。 这种观点背后的推理是科斯定理(Coase,1960)在政治市场的应用 这种观点认为,无效率的制度将不能长期存在 从效率制度观出发,我们易得到结论:制度差异是不重要的,也是没有意义 的,因为不同的制度一定都是其所处社会环境中最有效率的制度。或者说, 制度演化的结果一定是好的。但这个结论现在日益被人们反对。
– Aoki(2001:p14)写道:“一种具体的(规则)表现 形式只有当参与认相信它时才能成为制度…… 举例来说,政府根据某项法令进口某些物品, 但如果人们相信贿赂海关官员可以绕开此项法 令,而且这是普遍现象,那么与其把这项法令 视为制度,还不如把贿赂现象视为制度更合 适……如果参与人对它们的信念动摇了,它们 就不再作为制度存在了”。
• 从结构上而言可分为
– “建制的制度”(organic institution) – “认知的制度”(epistemic institution)
• 从影响的深远程度,可分为
– “创立性制度”(constitutive institution)[如新货币、新金融市场或者原创 技术语言] – “调节性制度”(regulative insitution)。[只是既存行为之间的调停者,如专 利、商业合同、交通规则等]

多重均衡与制度和文化

多重均衡与制度和文化
• 为什么没有被采用?最初的打字员不选择学习Dvorak,因为 Dvorak机器很难找到;办公室不原配置Dvorak,因为找不到打字 员;也就是说,由于协调的问题,人们仍然使用低效率的键盘, 出现了“锁定效应”
• 但这些说服并不成立:(1)支持Dvorak更好的论点证据不足,许 多是猜测;(2)人体过程学方面的研究发现,它没有任何在科学 上可靠、重要的优势;(3)打字机市场上的竞争要比通常报告的 要激烈的多;(4)其他许多比赛证明其他键盘的优越性。
• 中国特定 “入乡随俗”,就是一个协调规则的社 会规范
一致与冲突
进门博弈
每个人都希 望有个规则 协调他们的 预期,否则 对双方都没 有好处。
先走 先 走 -1,-1
后 走 1,2
女士优先
尊老爱幼
后走 2,1
-1,-1
文化既解决冲突又协调预期
• 尊老爱幼; • 妇幼保护; • 遵师重教; • 先来后到; • 社会分层与非对称权力(排位问题;黑社会组
交通规则的演变
• 在多个纳什均衡之间不存在优劣之分时,偶然事件对 选择具有重要意义;
• 从历史上来考察,许多交通规则一开始并不体现为法 律,而是长期演化而来的。
• 在欧洲大陆的早期,道路行走规范是非常地方化的, 有些地方采用靠左走的习惯,有些地方采用靠右走的 习惯,是不统一的。只是随着道路的增加和地区间交 往的扩大,地方性的习惯才逐步演变为区域性的规范, 然后有演变为全国性的规范。
个纳什均衡;廉价交谈(cheap talking) • 文化与制度或行业组织;
聚点均衡
• 2005年诺贝尔经济学奖获得者马斯.谢林 • 于1960年出版《冲突的分析》一书中提
出了聚点均衡的概念。 • 聚点均衡就是在多重纳什均衡中人们预

博弈论在企业文化中的应用分析

博弈论在企业文化中的应用分析
博弈论在企业文化分析中的 应用举例
经济组织创新与控制实验室 张学林
典型的协调博弈——Ⅰ
员工
A
B
A
2,1
0,0
B
0,0
1,2
老板
特点:1.有两个纯策略纳什均衡存在; 2.两个均衡对于博弈双方存在显著的差异。
典型的协调博弈——Ⅱ
员工
A
B
A
1,1
0,0
B
0,0
1,1
老板
特点:1.有两个纯策略纳什均衡存在; 2.两个均衡对于博弈双方是无差异的。
作业标准记得牢,驾轻就熟除烦恼。 2020年 10月3 1日星 期六2 时17分5 0秒14 :17:5 031 October 2020
好的事情马上就会到来,一切都是最 好的安 排。下 午2时1 7分50 秒下午 2时17 分14:1 7:502 0.10. 31
专注今天,好好努力,剩下的交给时 间。20 .10.31 20.10 .3114 :1714 :17:5 014:1 7:50Oct-20
加强交通建设管理,确保工程建设质 量。14 :17:5 014:1 7:501 4:17Saturda y, October 31, 2020
安全在于心细,事故出在麻痹。20.1 0.312 0.10.3 114:1 7:501 4:17: 50Oct ober 31, 2020
踏实肯干,努力奋斗。2020年10月3 1日下 午2时1 7分20. 10.31 20.10 .31
追求至善凭技术开拓市场,凭管理增 创效益 ,凭服 务树立 形象。 2020年 10月3 1日星 期六下 午2时1 7分50 秒14:1 7:502 0.10. 31
严格把控质量关,让生产更加有保障 。2020 年10 月下午2 时17 分20.10 .3114 :17Oc tober 31, 2020
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1936年Dvorak发明简化键盘(DSK,Dvorak Simplified Keyboard):认为这一键盘通过平衡双手和更有力的手指之间的工作 量,极大地减少了打字产生的手指运动,其优势在于提高速度、 减少疲劳,以及更容易的学习。
为什么没有被采用?最初的打字员不选择学习Dvorak,因为 Dvorak机器很难找到;办公室不愿配置Dvorak,因为找不到打字 员;
二是建立全新的规则,如中国人和德国人在一起 交流时都用英语,而不是中文,也不是德文;
三是建立协调规则的规则。如“入乡随俗”, “客随主便”。
究竟哪一种,与规则要解决的问题有关,也与其 他因素有关。
一致与冲突
进门博弈
先 走
先走 -1,-1
后 走 1,2
后走 2,1
-1,-1
文化既解决冲突又协调预期
帕累托最优均衡
产品标准博弈
(3.5“,3.5”) 帕累托优于(5.5“,5.5”)
3.5“
5.5“
3.5“
8, 8
3, 2
5.5“
2, 3
6, 6
Cheap talk 可以 帮助协调到一个 帕累托最优均衡
为什么要相信?
C
R1 R
R2
C1 9,9 8,0
C2 0,8 7,7
不论C选择什么,他都有积极性告诉R他将选择C1; 所以没有理由认为R应该相信C的话。
为什么制度要有稳定性?
制度是为了稳定预期,频繁的变化会打乱人们 的预期;
希思罗机场的Meeting Point;
文化的冲突与协调
为什么欧洲大陆的交通规则收敛于一致? 英国将如何办? 文化冲突,无论是组织和组织之间的,还是国
家和国家之间的,大部分不过是游戏规则―― 社会规范和法律的冲突,用博弈论的话来说, 是一个均衡的选择问题; 全球化意味着资源的重新分配。
解决规则冲突的三个方式
一是一个规则取代其他的规则,让一部分人改变 行为规范适应另一部分人,也就是所谓的“接 轨”,如前面讲的欧洲大陆交通规则的演变所显 示的。
风险与均衡
实验:请同学选择?
B


A
上 8, 10 -1000,9

7, 6
6, 5
风险与均衡
由于纳什均衡要求理性共识和一致预期,当人们可能 犯小小的错误时,纳什均衡不一定被选择。如下面这 个博弈中,多数人将选择“下”而不是“上”。
B


只要B有千分之一的
A
概念错误地选择右,

8, 10 -1000,9
交通规则的演变
在法国大革命以前,贵族的马车习惯上是靠左行的,穷 人在路上看到富人的马车来了,要站在马路的右边。因 此,靠左行与“特权阶级”相联系,而靠右行被认为更 为“民主”。随着法国大革命,作为一个革命的象征, 规定所有的车都要靠右走。随着拿破仑对欧洲大陆的征 服,拿破仑将法国的规则带给了欧洲,也包括靠右行驶 的规则。当然,在地域上这个规则的转变也是从西到东 逐步完成的。比如说,与靠右行的西班牙接壤的葡萄牙 是在一战之后才转为靠右行,奥地利是从西到东一个省 一个省逐步转变的,匈牙利、捷克和德国是在二战前才 由左行转向右行的。瑞典,一直到1967年,才通过法 律宣布从靠左行改为靠右行。
请两个团体的每个同学分别独立作出自己的选择, 不允许商议;
统计各团体选择两种策略的人数
协调与“风险优势”
这个博弈有两个纳什均衡,(A,A)和(B,B),显 然前一个均衡比后一个均衡的支付大
(A,A)是否可以达到? B具有风险优势(risk dominance, B risk-
dominates A)
A将选择下;如果B怀疑
A怀疑自己可能犯错误,

7, 6
6, 5
B将选择右。所以,出现
的不是纳什均衡
协调与“风险优势”
参与人1 A
B
参与人2 A
9, 9 8, -15
B -15, 8 7, 7
协调与“风险优势”
课堂实验
所有同学分为两个团体,其中一个团体的同学扮演 此协调博弈的参与人1,另一个团体的同学扮演参 与人2;
交通规则的演变
在多个纳什均衡之间不存在优劣之分时, 偶然事件对选择具有重要意义;
从历史上来考察,许多交通规则一开始并不体现为法 律,而是长期演化而来的。在欧洲大陆的早期,道路 行走规范是非常地方化的,有些地方采用靠左走的习 惯,有些地方采用靠右走的习惯,是不统一的。只是 随着道路的增加和地区间交往的扩大,地方性的习惯 才逐步演变为区域性的规范,然后有演变为全国性的 规范。但直到19世纪前,道路规则也仅仅是作为规 范而得到遵守,而不是作为交通法律而得到执行。现 在欧洲大陆的靠右走的规则是在法国兴起的。
专题:多重均衡与制度和文化
多重纳什均衡:交通博弈
甲方 左L 右R
乙方
左L
右R
1,1
0,0
0,0
1,1
这个博弈被称为 “协调博弈”:有 两个纯战略纳什均衡, 一个混合战略均衡。 哪一个将出现呢?
路上有两辆车迎面而行,此时,两个司机各 有两个选择:走路的左侧和走路的右侧
进门博弈
先进 后进
先进 -1,-1 1,2
每个人发现遵守规则是自己的利益所在,也希望别人能遵守这个 规则。任何不守规则的行为都会使守规则的人受到损害或者感到 威胁,从而引起后者的愤怒;任何其他人也因此会觉得自己未来 的利益受到威胁,对此种行为表示不满,对受害人表示同情; 少数人不守规则并不会导致规则的消失; 但如果规则总是偏向于某一组特定的人群,受到不公正对待的人 并不会蔑视不守规则的人,规则就容易被违反。 罗尔斯(Rawls)的正义论
但这些说服并不成立:(1)支持Dvorak更好的论点证据不足,许 多是猜测;(2)人体过程学方面的研究发现,它没有任何在科学 上可靠、重要的优势;(3)打字机市场上的竞争要比通常报告的 要激烈的多;(4)其他许多比赛证明其他键盘的优越性。
法律和社会规范如何协调预期
法律和社会规范就是这种协调预期的规则,帮助人们 在多个纳什均衡中筛选一个特定的纳什均衡。社会规 范是通过习惯、长期的交互博弈产生的行为规则,法 律是立法机关制定的行为规则,但不论是法律还是社 会规范,它们的功能都是协调预期。
身份是传递信息的重要工具; 身份的外在化:服饰,车座,秘书; 学界的官本位问题;
高尚是高尚者的墓志铭 卑鄙是卑鄙者的通行证
资源争夺博弈(chicken)
Hawk Dove
Hawk -1,-1 0,10
Dove 10,0 5,5
产权的பைடு நூலகம்占规则
人们为什么遵守这个规则? 人们希望得到别人认可的愿望: 一旦规则建立,每个人都预期其他人会遵守规则;给定这个预期,
聚点均衡
• 聚点均衡: Schelling(1960)认为,在现实生活中,参与人可 能使用某些被博弈模型抽象掉的信息来达到一个 “聚点”(focal point)均衡。这些信息可能与社 会文化习惯、参与人过去博弈的历史等有关。
聚点均衡
乙方
左L
右R
甲方
左L
1,1
0,0
右R
0,0
1,1
如果在中国,出现(R,R),如果在英国,出现(L,L)
后进 2,1 -1,-1
分蛋糕博弈
x2
1
任何满足x1+x2=1的点都是
纳什均衡。
1
x1
多个纳什均衡 --------无法形成一致的预期
如何协调?
仅仅“理性”是不够的; 聚点均衡:Schelling(1960); 帕累托最优均衡:可以通过协商选择一个纳什
均衡;cheap talking; 文化与制度; 行业组织;
这常被用来作为市场失灵的理论证据; 经验证据:QWERT vs Dvorak键盘;Beta vs VHS录象
机;MAC与IBM计算机软件;Vista 但最新的研究似乎正在推翻这些广泛流行的结论。
键盘的寓言
1868年Christopher L. Stoles发明QWERT键盘;由Remington公 司生产;
锁定效应与路径依赖
如果博弈参与人很多,达成协议的成本很高,最初的非 帕累托均衡可以被锁定(lock-in), 导致路径依赖(path dependence):每个人多偏好于新产品(或标准),如 果其他人都选择新产品的话;但由于每个人都预期其他 人不会选择新产品,所以每个人的最优选择是不转向新 产品,结果是整个社会被锁定在现有的产品(标准) (非帕累托最优);
尊老爱幼; 妇幼保护; 遵师重教; 先来后到; 社会分层与非对称权力(排位问题;黑社会组织); 公平观念(如分蛋糕博弈); 抓阄;
文化既解决冲突又协调预期
分蛋糕问题与公平观念 x2
0.5
0.5
x1
信息与身份(identity)
信息对预期的协调很重要:如果不知道谁是谁, 协调就很困难;
相关文档
最新文档