第七章 博奕论(Game Theory教材课程
博弈论PPT课件
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
博弈论完整版PPT课件
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
《西方经济学》第七章 博弈论
21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼 精炼 贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡 这个概念是完全信息动态博弈的子博弈精炼纳 什均衡与不完全信息静态均衡的贝叶斯纳什均 衡的结合.具体来说,精炼贝叶斯均衡是所有 参与人战略和信念的一种结合.它满足如下条 件:第一,在给定每个参与人有关其他参与人 类型的信念的条件下,该参与人的战略选择是 最优的.第二,每个参与人关于其他参与人所 属类型的信念,都是使用贝叶斯法则从所观察 到的行为中获得的.
22
贝叶斯法则 贝叶斯法则是概率统计中的应用所观察 到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23
习
题
1. 什么是占优策略均衡?什么是重复剔除的占优策 略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性 博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品 的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产 多少产量?各获得多少利润?
25
�
第七章
第一节 第三节 第四节 第五节
博弈论
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
第一节 博弈问题概述
一,博弈的基本概念 二,博弈的分类
2
一,博弈的基本概念
博弈论 博弈论(game theory)是研究决策主体的 行为发生直接相互作用时候的决策以及这 种决策的均衡问题的. 博弈论的基本概念包括:参与人 行动 参与人,行动 参与人 行动, 战略,信息 支付函数,结果 均衡. 信息,支付函数 结果,均衡 战略 信息 支付函数 结果 均衡
博弈论 Game theory (全)
博弈论 Game Theory博弈论亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学,经济学,国际关系,计算机科学, 政治学,军事战略和其他很多学科都有广泛的应用。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。
其中一个有名有趣的应用例子是囚徒困境(Prisoner's dilemma)。
具有竞争或对抗性质的行为称为博弈行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。
比如日常生活中的下棋,打牌等。
博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
生物学家使用博弈理论来理解和预测演化(论)的某些结果。
例如,约翰·史密斯(John Maynard Smith)和乔治·普莱斯(George R. Price)在1973年发表于《自然》杂志上的论文中提出的“evolutionarily stable strategy”的这个概念就是使用了博弈理论。
其余可参见演化博弈理论(evolutionary game theory)和行为生态学(behavioral ecology)。
博弈论也应用于数学的其他分支,如概率,统计和线性规划等。
历史博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
game theory lecture7博弈论
behavioral strategy in Extensive-Form Games
a behavioral strategy is more in tune with the dynamic nature of the extensive-form game. When using such a strategy, a player mixes among his actions whenever he is called to play.
Normal-Form Representation of Extensive-Form Games
• Any extensive-form game can be transformed into a normal-form game by using the set of pure strategies of the extensive form (see definition 7.4) as the set of pure strategies in the normal form, and the set of payoff functions is derived from how combinations of pure strategies result in the selection of terminal nodes. • Therefore the normal-form representation of an extensive form will suffice to find all the Nash equilibria of the game.
game theory 教材
Game Theory 教材一、介绍Game Theory是一种研究决策问题的数学理论,它关注的是理性行为体在面临复杂互动环境时的选择和行动。
Game Theory可以广泛应用于经济学、政治学、社会学等领域,帮助人们理解和解释现实世界的各种互动现象。
本教材旨在介绍Game Theory的基本概念、方法和应用,为读者提供一种理解和分析现实世界中复杂问题的工具。
二、内容第一章:Game Theory概述本章将介绍Game Theory的基本概念、发展历程和应用领域。
我们将探讨理性行为体的假设、互动决策的基本模式以及Game Theory 的主要研究问题。
第二章:策略博弈本章将介绍策略博弈的基本概念和方法,包括策略博弈的定义、纳什均衡、零和博弈和囚徒困境等。
我们将通过实例和分析来理解和应用这些概念和方法。
第三章:非策略博弈本章将介绍非策略博弈的基本概念和方法,包括非策略博弈的定义、优势策略和劣势策略、不完全信息博弈和拍卖理论等。
我们将通过实例和分析来理解和应用这些概念和方法。
第四章:演化博弈本章将介绍演化博弈的基本概念和方法,包括演化博弈的定义、演化稳定性和动态演化博弈等。
我们将通过实例和分析来理解和应用这些概念和方法。
第五章:应用案例本章将介绍Game Theory在经济学、政治学和社会学等领域的应用案例,包括市场交易、政治选举和社会规范等。
我们将通过案例分析和讨论来深入理解和应用Game Theory的概念和方法。
三、结论本教材旨在介绍Game Theory的基本概念、方法和应用,帮助读者理解和分析现实世界中各种复杂的互动现象。
通过阅读和实践,读者可以更好地理解和掌握Game Theory,并应用于解决现实问题中。
《博弈论》课程教学大纲
《博弈论》课程教学大纲一、课程名称(中英文)中文名称:博弈论英文名称:Game Theory二、课程代码及性质ECN5011 学科(大类)基础课必修三、学时与学分总学时:40(理论学时:40学时;实践学时:0学时)学分:2.5四、先修课程先修课程:《中级微观经济学》五、授课对象本课程面向经济学院经济各专业的二年级本科生六、课程教学目的(对学生知识、能力、素质培养的贡献和作用)《博弈论》课程的教学目的是在学生了解、认识和掌握博弈论基本理论和基本分析方法的基础上,培养和提高学生运用所学博弈论分析方法来分析经济领域相关问题的能力。
通过博弈论的学习,使学生掌握影响策略互动的主要因素、以及机制设计的基础知识。
牢固掌握的内容包括:纳什均衡,混合策略均衡,完全信息展开型博弈,贝叶斯均衡,动态博弈,可理性化,动态博弈等。
七、教学重点与难点:课程重点:均衡解的概念、求解、刻画与运用。
课程难点:运用合理的均衡解概念分析策略互动场景。
八、教学方法与手段:教学方法:课堂讲授为主。
辅以讨论、辩论环节。
教学手段:主要课程内容采用幻灯片演示的方法。
九、教学内容与学时安排(一)教学内容1(教师课堂教学4学时+ 学生课后学习4学时)教学内容:占优均衡课后文献阅读:无.课后作业和讨论:课后作业(二)教学内容2(教师课堂教学8学时+ 学生课后学习8学时)教学内容:纳什均衡(纯策略与混合策略)、以及在产业组织中的应用课后文献阅读:无课后作业和讨论:课后作业(三)教学内容3(教师课堂教学8学时+ 学生课后学习8学时)教学内容:不完全信息博弈与贝叶斯均衡课后文献阅读:无课后作业和讨论:课后作业四)教学内容4(教师课堂教学8学时+ 学生课后学习8学时)教学内容:序贯博弈与子博弈精炼均衡课后文献阅读:无课后作业和讨论:课后作业五)教学内容5(教师课堂教学4学时+ 学生课后学习4学时)教学内容:委托代理模型等课后文献阅读:无课后作业和讨论:课后作业六)教学内容6(教师课堂教学8学时+ 学生课后学习8学时)教学内容:信息经济学课后文献阅读:无课后作业和讨论:课后作业十、教学参考书及文献博弈论基础,罗伯特·吉本斯著,高峰译,中国社会科学出版社。
博弈论教案
讲
都是坦白。
授
这就是我们将在以后要学习的博弈论。
讲 简单了解什么是博弈论
在激发
过授
博弈论(Game Theory),也称对策论,是描述和 了学生学习
程 新 研究行为者之间策略相互依存和相互作用的一种决策 兴趣之后,
3
课 理论。它是现代数学的一个新分支,博弈论的应用领 给出“博弈
域十分广泛,在经济学、政治科学(国内的以及国际 论”的定
学 2. 让学生掌握占优策略均衡和纳什均衡的基本原理
目 3. 使学生明确区分占优策略均衡和纳什均衡
标
重 1. 在支付矩阵中找出处于均衡状态的最佳策略组合
点 2. 掌握两类均衡的相互关系
难 掌握占优策略均衡与纳什均衡的内在联系和区别
点
教 1.采用情景教学法和案例教学法,以教师的讲授为主 学 2.通过对比教学引导学生掌握占优策略均衡和纳什均衡的相互关系 方 3.结合生动有趣的案例分析和简单示意图帮助学生了解博弈分析过程
每个人各判刑 2 年。
该案例将贯
如图 1 的支付矩阵
穿于后面的
乙
理论讲解
坦 白 不坦白
中,也为教
坦白
-5 -5 -1 -7
学节约了时
甲
-7 -1
不坦白
-2 -2
导 入 新 课
图1 这两个囚犯之间的博弈过程如下:先考虑囚犯甲 的选择。甲要决定自己的选择,他必须要先考虑乙的 选择,即甲是在考虑了乙的选择的前提下来决定自己 的选择。那么,甲一定是这样思考的:
间。
简单向 学生介绍支 付矩阵图的 具体含义。
1. 如果乙选择坦白,则甲选择坦白,会判 5 年;选择
不坦白,会判 7 年。于是甲选择坦白。(因为
博弈论game theory
1.2.4石头、剪刀、布
A
石头 剪刀
布
石头 0,0 1,-1 -1,1
B
剪刀 -1,1 0,0 1,- 1
布
1,-1 -1,1 0,0
§1.3按局中人的数量对博弈分类
1.3.1单人博弈 退化为一般的最优化问题 (1)单人迷宫
入口
A左B左
0
局
A左B右
M
A
B
中
A右B左
0
人
出口(奖金M)
A右B右
0
单人迷宫
田忌 上中下 上下中 中上下 中下上 下上中 下中上 上中下 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 上下中 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 齐 中上下 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 威 王 中下上 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 下上中 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 下中上 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
局中人的得益(payoffs)——支付 博弈结果的量化 局中人在博弈中得到的效用 策略组合的函数
博弈的次序(orders) 局中人决策是否同时
1.1.3博弈的表示方法 (1)正规型(策略型)——Payoff Matrix
A坦 B
白不 坦 白
坦
白 -8,-8
0,-10
不 坦 白 -10,0
-1,-1
例子 三人决斗,开枪射杀对手,以保存自己。命中率和
每一轮的开枪次序如下。
命中率
次序
A
30%
1
B
70%
2
C
game theory博弈论
game theory博弈论
游戏理论,也被称为博弈论,是一种研究人类决策和行为的数学框架。
它旨在理解在人类决策中存在的不确定性和竞争条件下,每个参与者的决策如何影响整个系统的结果。
从二战后的经济学开始,游戏理论已经成为经济学、政治学、心理学、哲学和博弈理论的重要研究领域。
它也成为了解决现实生活中许多社会问题的一种有力工具,例如市场竞争、调解博弈、投票、拍卖、国际贸易等。
游戏理论中的核心概念包括博弈、策略、收益和均衡等。
博弈是指参与者之间的相互作用,策略是指参与者制定的行动计划,收益是指参与者对于结果的评价,均衡是指没有参与者有动机改变他们的策略的状态。
在游戏理论中,有许多不同的博弈模型,例如零和博弈、合作博弈、非合作博弈等。
在每种模型中,参与者的决策和行为都会受到不同的影响和限制。
通过了解游戏理论,我们可以更好地理解许多人类行为的原理和动机,同时也可以更好地理解和预测许多社会问题的发展趋势。
- 1 -。
博弈论课程教学大纲
一、课程基本信息 课程代码: 16043802 课程名称: 博弈论 英文名称: Game Theory 课程类别: 专业课 学 时: 48 学 分: 3 适用对象: 经管类专业大二、大三年级学生 考核方式: 考试 先修课程: 微积分、概率论、微观经济学、宏观经济学
二、课程简介 博弈论是研究决策主体的行为在相互影响时的最优决策以及相应的均衡结
果,它的出现改变了传统经济学的许多固有看法,有助于人们更好的理解和认识 社会现象。目前,博弈论已经成为微观经济学中最重要的组成部分,是经济研究 中重要的研究工具,亦是经济学专业的核心专业课之一。
一般认为,最早始于 1944 年冯诺伊曼和摩根斯坦的《博弈论与经济行为》 一书的出版。博弈论分为合作博弈与非合作博弈,本课程将主要介绍非合作博弈 部分,非合作博弈按信息是否完全可分为完全信息博介绍四种基本的博弈 模型,分别为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不 完全信息动态博弈,学习这些博弈模型将有助于我们理解现实经济现象。
三、课程性质与教学目的 (一)课程性质 博弈论为财经类专业本科生的专业限选课,讨论在行为主体在相互影响下的
最优决策及其均衡结果。博弈论已经成为微观经济学的重要组成部分,以及经济 学标准的分析工具,在经济学的各个领域具有广泛的应用。本课程的学习需要具 有经济学、微积分和概率论的基础。
(二)教学目的 通过本课程的教学,使学生掌握经济博弈论的基本理论知识,理解博弈论的 思想与逻辑,在此基础上,运用博弈论知识,正确分析现实问题,做出理性决策。 要求理解信息在决策中的作用,掌握完全信息静态博弈、完全信息动态博弈、不 完全信息静态博弈和不完全信息博弈四种基本博弈类型的逻辑、分析方法以及求 解均衡的技术方法。在现实经济中运用博弈的思想来看待和解决问题。
管理经济学讲义(新)管理经济学第七章博弈论与竞争策略
四.博弈的分类
• (1)合作博弈与非合作博弈根据参与者之间能否通过谈判达成
具有约束力的协议或合同来划分。
• 可以达成协议的为合作博弈cooperative game,合作博弈强调集 体理性和整体最优。如买卖双方讨价还价后成交。
• 不能达成协议的为非合作博弈non-cooperative game,非合作博 弈强调个体理性和局部最优。如寡头之间的竞争博弈,双方的 利益和目标有冲突,难以达成可以实施的协议,双方都有欺骗 和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领 域。
• 在有些情况下,为了避免陷入被动,采取最大最小策略十分 必要。在下图的博弈中,乙方采取“右”是一个支配性策略。
因为不管甲方选什么,乙方采取右的策略都比左的策略好,
可以得到1的收益。在期望乙方采取右的情况下,甲方应该采
取“下”,并得到2的收益。这样,支配性策略均衡为(下,
右)。
• 如果甲方比较慎重,考虑到乙方可能不一定理性,或者可能 故意捉弄甲方,则应该采取最大最小策略,形成(上,右) 的博弈结果。
甜 20,10 -8,-8
2.对社会有害的合作,设法制止
• 在囚徒的困境博弈中,如果两个囚徒可以互相协商, 并形成攻守同盟,则罪犯得到好处,对社会不利。 例如在寡头厂商的定价博弈中,勾结定高价对双方 都有好处,但对社会不利,因此受到反垄断法的严 密监控。
• 寡头厂商的价格博弈收益矩阵如下:
厂商2
高价
二.支配性策略dominant strategy均衡
• 支配性策略均衡也称上策均衡或优势策略均衡。在博弈中,对 有些参与者来说,不管对手采取什么策略,他的策略都保持不 变。这种不取决于对手选择的最优策略称为支配性策略(上策 或优势策略)。
博弈论全套课件
三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础,经济学家们已经 把研究策略相互作用的博弈论当作最合适的分 析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学 、国际关系、计算机科学、政治学、军事战略 和其他很多学科都有广泛的应用。现在已经有 愈来愈多的人开始关注、了解并学习博弈理论 。
博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。
博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。
博弈论game theory ppt课件
按产品性质:
纯粹寡头垄断
P=f(Q1+Q2)
差别寡头垄断
P1=f(Q1,Q2) P2=f(Q2,Q1)
按决策变量 :
联合定产模型(Cournot) 联合定价模型(Bertrand)
Cournot模型的假定:同时决策;决策变量是产量;对手 的反应方式保持不变;产品相同,线性需求曲线,MC=0。
ppt课件
智猪博弈(剔除博弈)
大猪 小猪 按钮 不按
按钮 4,8 -4,20 不按 10,6 0,0
ppt课件
18
2.1.3划线法
A 坦 白不 坦 白 B
坦
白 -8,-8 0,-10
不 坦 白 -10,0 -1,-1
猜硬币者
正 盖硬币者
面反 面
正
面 -1,1 1,-1
反
面 1,-1 -1,1
注A:并非所有的博弈均有稳定的解。如右图所示抛硬币博弈
R2 q1
q1
30
2.3.4公地的悲剧 (1968年,哈丁) 外部性往往是产权界定不清的结果 一个乡村,村民在公地上放牛。两种放牧机制: (1)让私人拥有这块土地;私人决定放牧规模 (2)让村民共同拥有这块地免费放牧没有限制 结论:公共牧地一定是过度放牧。 例子:土地承包责任制,永佃权
ui qiV Q qiC
A坦 B
白不 坦 白
坦
白 -8,-8
0,-10
不 坦 白 -10,0
-1,-1
(2)扩展型——博弈树 由棱和节点构成
outcome
B
A
root
ppt课件
5
§1.2一些典型博弈
1.2.1 Tucker的囚徒困境
B
第七章 博弈论
第七章 教学要求
1、概念:博弈论、占优策略、占优策略 均衡、纳什均衡 2、理解占优策略均衡与纳什均衡的关系。 3、掌握支付矩阵表,能够准确找到博弈 均衡的解。 4、掌握序贯博弈的博弈树均衡解法。 5、理解经典案例的启示。
其实,世上最温暖的语言,“ 不是我爱你,而是在一起。” 所以懂得才是最美的相遇!只有彼此以诚相待,彼此尊重, 相互包容,相互懂得,才能走的更远。 相遇是缘,相守是爱。缘是多么的妙不可言,而懂得又是多么的难能可贵。否则就会错过一时,错过一世! 择一人深爱,陪一人到老。一路相扶相持,一路心手相牵,一路笑对风雨。在平凡的世界,不求爱的轰轰烈烈;不求誓 言多么美丽;唯愿简单的相处,真心地付出,平淡地相守,才不负最美的人生;不负善良的自己。 人海茫茫,不求人人都能刻骨铭心,但求对人对己问心无愧,无怨无悔足矣。大千世界,与万千人中遇见,只是相识的 开始,只有彼此真心付出,以心交心,以情换情,相知相惜,才能相伴美好的一生,一路同行。 然而,生活不仅是诗和远方,更要面对现实。如果曾经的拥有,不能天长地久,那么就要学会华丽地转身,学会忘记。 忘记该忘记的人,忘记该忘记的事儿,忘记苦乐年华的悲喜交集。 人有悲欢离合,月有阴晴圆缺。对于离开的人,不必折磨自己脆弱的生命,虚度了美好的朝夕;不必让心灵痛苦不堪, 弄丢了快乐的自己。擦汗眼泪,告诉自己,日子还得继续,谁都不是谁的唯一,相信最美的风景一直在路上。 人生,就是一场修行。你路过我,我忘记你;你有情,他无意。谁都希望在正确的时间遇见对的人,然而事与愿违时, 你越渴望的东西,也许越是无情无义地弃你而去。所以美好的愿望,就会像肥皂泡一样破灭,只能在错误的时间遇到错的人。 岁月匆匆像一阵风,有多少故事留下感动。愿曾经的相遇,无论是锦上添花,还是追悔莫及;无论是青涩年华的懵懂赏 识,还是成长岁月无法躲避的经历……愿曾经的过往,依然如花芬芳四溢,永远无悔岁月赐予的美好相遇。 其实,人生之路的每一段相遇,都是一笔财富,尤其亲情、友情和爱情。在漫长的旅途上,他们都会丰富你的生命,使 你的生命更充实,更真实;丰盈你的内心,使你的内心更慈悲,更善良。所以生活的美好,缘于一颗善良的心,愿我们都能 善待自己和他人。 一路走来,愿相亲相爱的人,相濡以沫,同甘共苦,百年好合。愿有情有意的人,不离不弃,相惜相守,共度人生的每 一个朝夕……直到老得哪也去不了,依然是彼此手心里的宝,感恩一路有你!
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
max
是
u1
即该博奕的纳什均衡解
max u 2
maxu1 maxu2
U1 Uq12
q2
6q2 6q1
2q1 2q2
0 0
的解,
求解上述方程组:
q 1 * q 2 * 2 , Q 4 u 1 1 , u 2 4 , u 1 u 2 8
标志着博奕论的初步形成。 50年代,合作博奕发展到鼎盛阶段,非合作博奕开始出现 纳什和夏普里的讨价还价模型, 塔克的“囚徒困境” 60年代以后,selten,Haysany,Krops,Wilseen
“信誉问题模型” (动态不完全信息博弈) 最近十多年,博弈论几乎贯穿了整个微观经济学,产业组
织理论和企业制度理论,并扩展到宏观经济学,环境、劳动、 福利经济学等领域。
新厂商的市场进入问题
B
打入
A
打击
(0,10)
和平共处
(-2,3)
(5,5)
6.博奕进程的信息
完美信息博奕:在动态博奕中,博弈方对博弈的进程, 即次此行为前各博奕方的行为完全了解
非完美信息博弈:
完全信息博弈:博奕各方完全了解所有博奕方各种策 略组合下得益情况 非完全信息博弈:
7.2.2博弈的主要分类
1 3、赢得(利益):参加博奕各方从博奕中所获得的 利
益 支付矩阵,博弈树
零和博奕:各博奕方赢得的代数和为零 非零和博奕:各博奕方赢得的代数和不为零
4.均衡:所有博奕方的最优策略的组合
博奕分析的目的是使用博奕规则决定均衡
5.得益的信息
完全信息博奕:博奕各方完全了解所有博奕方各种策略 组合下得益情况的博奕,如囚徒困境和田忌赛马。
7。3 完全信息静态博奕——纳什均衡
7.3.1 有限策略完全信息静态博奕(划线法,……)
囚徒困境
乙囚徒
甲
囚 坦白
徒
不坦白
坦白
不坦白
-8, -8
-10, 0
0, -10 -1, -1
有限策略划线法的原理:寻找针对其他博奕方每种
策略的最佳策略,即在其他博奕方的一定策略下本方 能实现自身最大得益的策略(极值问题),而纳什均 衡就是双方都能接受的策略组。
第七章 博奕论(Game
7.1 导言
Theory)
7.1.1 博奕与博奕论
博奕:一些个人、队组或其他组织,面对一定的环境条件, 在一定的规则下,同时或先后,一次或多次,从各自允许 选择的行为或策略中进行选择并加以实施,并从中各自取 得相应结果的过程。
(具有竞争或斗争性质的现象)
博奕论:研究博奕现象中的各方是否存在最合理的行动方案, 以及如何找到合理行动方案的数学理论和方法
不完全信息博变:博奕各方不完全了解其他博奕方得益 的博奕,如讨价还价,招、投标
6.博奕的次序
静态博奕: 博弈双方同时决定各自的策略,不存在博弈的 次序问题
动态博奕:博弈双方的博弈行为是交替进行的,前博弈 方的行动影响后博弈方的行动乃至整个策略,如:奕 棋,商业大战
重复博奕:数次静态博奕,工会与雇主的工资谈判合约 谈判
7.2 博奕的要素与分类
7.2.1 博弈的要素
1.博奕方(局中人):理性假定、独立决策、独立
承担博奕结果的个人或组织
囚徒困境
因忌赛马
警察 齐王:i= 1
孙膑 因忌: i= 2
两人博奕、多人博奕
注意:(1)博奕双方利益并不总对抗的;
(2)博奕双方中信息较多者并不总是得益
(3)个人理性与集体理性的矛盾
1、博奕论与新古典经济学
价格制度
非价格制度(参与人之间行为的相互作用)
新古典经济
博奕论
三个假定:
Байду номын сангаас
1 A.理性人:给定约束条件下,
个人效用的最大化
完全一致
B.市场参与者数量足够多从而 市场参与者是有限的
市场是完全竞争性的
市场是非完全竞争性的
个体理性与集体理性的一致性
个体与集体理性的矛盾
解决方法: 价格制度 , 市场
博奕论适用于一切通过策略进行对抗或合作的人类活动和行为, 它在军事、法律、政治、国际关系和外交、环保、体育竞技 等诸多领域都有广阔的应用。尤其是经济,如信誉模型、委 托代理机制,次品车问题,OPEC,寡头垄断等等。
7.1.2 博奕论与主流经济学
博奕论是现代经济研究的先进工具,也是经济学科的一个分支
1994年,Nobel经济学奖授予三位对博奕论和博奕论的经济 应用的发展作出了杰出贡献的学者,纳什、塞尔顿和海萨尼。
1996年,Nobel经济学奖授予詹姆斯·莫里斯、威廉·维克瑞表 彰其对非对称信息条件下经济激励的理论研究(信息经济学)
2001年,诺贝尔经济学奖被授予三位信息经济学家阿克洛夫 (次品车模型)、斯宾塞(信号传递模型)和斯蒂格利茨 (保险市场模型和信贷配给模型),以表彰他们在非对称信 息市场分析方面的杰出贡献。
从各自可能出现的最不利的情形中选择一个最有利的情 形作为决策依据(理性)。最后的结局就是双方均可 接受的,对双方来说都是最稳妥的结果。
又例:
妻 电影
子
足球
电影
2,1 0,0
丈夫
足球
0,0 1,3
二、无限策略完全信息静态博奕(古诺模型)
1.古诺模型 (1)两寡头古诺模型的描述和求解 1.2 两厂商 假设:1厂商产量 2厂商产量 总产量
q 1 q 2
Q q 1 q 2
价格是总产量的减函数, 无固定成本,可变成本
PP(Q)8Q
c1 c2 2
则:厂商1的利润:
同理,厂商2的利润:
U1 q1(p(Q)c1) q1(8(q1q2)2)
U 26q2q1q2q2 2
q1(6(q1q2))6q1q1q2 q12
两厂商最终的产量组合 (q1*,q2*)
2.策略:一次博奕中,博奕方可选择的一个行 动方案(或者一个行动序列)
博弈方1的一个策略a1=(上、中、下)
博弈方1的策略集合 S1 {(上、中、下),(上、下、中),(中、上、下),
(中、下、上),(下、中、上),(下、上、中)}
策略组
齐
田
a1 =(上、中、下) 有限策略,无限策略
a2 =(下、中、上)
解决办法: 非价格制度 传:政府干预
现:制度安排
C.参与者之间不存信息不对称的问题
非对称信息
价格制度→非价格制度→弥补了经济模型脱离实际的缺 陷,所得出的结论更符合经济现实更有实际应用性和指导性。
7.1.3 博弈论的发展
18世纪初,零星的研究 1838年,关于寡头垄断的产量决定模型---古诺模型 1883年,关于寡头垄断的价格决定模型-----Bertrand模型 1944年,冯·诺依曼和摩根斯坦恩的《博奕论与经济行为》