北京大学博弈论课件第1章-博弈论概述
合集下载
张维迎《博弈论与信息经济学》讲义-第01章-博弈与社会
《博弈与社会》
导论:个人理性与社会效率
张维迎 教授 北京大学光华管理学院
本章目录
• • • • 社会问题; 理性人行为; 效率标准; 外部性与科斯定理。
社会的两个基本问题
• 社会是什么? • 协调(coordination) • 合作(cooperation)
协调问题:以交通为例
B
靠左行
靠 左 行
– Cognitive ability(limited computational skill and serious flawed memories)
• 有限毅力(bounded willpower);
– Present-biased preference
• 有限自利(bounded self-interest)
Homo economicus vs. Homo sociologicus
• Adam Smith vs. Emile Durkheim • Rational, outcome-oriented; social normoriented, not outcome-oriented:
• “the former is supposed to be guided by instrumental rationality, while the behavior of the latter is dictated by social norms. The former is „pulled‟ by the prospect of future rewards, whereas the latter is „pushed from behind by quasi-inertial forces.
社会问题及其解决办法
导论:个人理性与社会效率
张维迎 教授 北京大学光华管理学院
本章目录
• • • • 社会问题; 理性人行为; 效率标准; 外部性与科斯定理。
社会的两个基本问题
• 社会是什么? • 协调(coordination) • 合作(cooperation)
协调问题:以交通为例
B
靠左行
靠 左 行
– Cognitive ability(limited computational skill and serious flawed memories)
• 有限毅力(bounded willpower);
– Present-biased preference
• 有限自利(bounded self-interest)
Homo economicus vs. Homo sociologicus
• Adam Smith vs. Emile Durkheim • Rational, outcome-oriented; social normoriented, not outcome-oriented:
• “the former is supposed to be guided by instrumental rationality, while the behavior of the latter is dictated by social norms. The former is „pulled‟ by the prospect of future rewards, whereas the latter is „pushed from behind by quasi-inertial forces.
社会问题及其解决办法
《博弈论》课程ppt课件
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
北京大学博弈论课件第1章_博弈论概述
纳什的代表作
1.多人博弈的均衡(Equilibrium points in n-person games) 国家科学院学报(Proceedings National Academy of Sciences),36: 48 – 49,1950年。 2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。 3.讨价还价问题(The bargaining problem)。计量经济学杂志 (Econometrica)18: 155 – 162,1950年。 4.非合作博弈(Non-cooperative games)数学年报(Annals of Mathematics),54: 286 – 295,1951年。
第一章
博弈论概述
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
2012-8-28
博弈参与者(Player) 博弈策略(Strategy) 博弈的收益(Payoff) 博弈的均衡(Equilibrium)
一、博弈参与者(Player)
博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人
产量博弈模式 价格博弈模式 领先者、跟随者博弈模式
大国之间关于汇率政策的博弈 经典博弈实例:囚徒困境(Prisoner's Dilemma)
博弈论最全完整ppt-讲解
能提供万无一失的应对办法。
例1:无谓竞争(The GPA Rat Race)
你所注册的一门课程按照比例来给分:无论 卷面分数是多少,只有40%的人能够得优秀, 40%的人能得良好。
所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
约翰·纳什 1928年生于美国
莱因哈 德·泽尔 腾, 1930 年生于 德国
约翰· 海萨尼 1920年 生于美 国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
没有某个这样的暗示,默契的合作就完 全不可能。
例3:为什么教授如此苛刻?
许多教授强硬地规定,不进行补考,不 允许迟交作业或论文。
教授们为何如此苛刻? 如果允许某种迟交,而且教授又不能辨
别真伪,那么学生就总是会迟交。 期限本身就毫无意义了。 避免这一“滑梯”通常只有一种办法,
例1:无谓竞争(The GPA Rat Race)
你所注册的一门课程按照比例来给分:无论 卷面分数是多少,只有40%的人能够得优秀, 40%的人能得良好。
所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
约翰·纳什 1928年生于美国
莱因哈 德·泽尔 腾, 1930 年生于 德国
约翰· 海萨尼 1920年 生于美 国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
没有某个这样的暗示,默契的合作就完 全不可能。
例3:为什么教授如此苛刻?
许多教授强硬地规定,不进行补考,不 允许迟交作业或论文。
教授们为何如此苛刻? 如果允许某种迟交,而且教授又不能辨
别真伪,那么学生就总是会迟交。 期限本身就毫无意义了。 避免这一“滑梯”通常只有一种办法,
博弈论ppt课件
15
➢ 扩展术语:
信息:信息集; 完全信息(complete); 完美信息(perfect)。
共同知识:双方可能获取的相同信息; 彼此都能算清楚。
博弈结果:均衡策略组合;均衡行动组合。 均衡:所有局中人最优策略的组合。
博弈论2009
精选ppt课件
16
3. 博弈描述
➢博弈的策略型(标准型、正则型)表述:
33
博弈论2009Leabharlann 精选ppt课件34
毕业后先后在兰德研究所、普林斯顿大 学、MIT工作。
1957年他与MIT学生爱莉西娅结婚。
在而立之年患上了妄想型精神分裂症,九 十年代逐渐恢复了正常。
1994年纳什博士获诺贝尔经济学奖。
2002年来北京参加 “国际数学家大会”
博弈论2009
精选ppt课件
35
博弈论2009
则,不开发。(?)
博弈论2009
精选ppt课件
22
关键问题: 对自然状态的概率估计; 不同时间决策(决策顺序); 对对方先验信息的估计(即估计对方对信
息的掌握程度)。
现实困难: 对市场了解程度不同; 对对方了解程度不同; 如何向对方暗示自己的行动。
博弈论2009
精选ppt课件
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
乙 甲
理性的人是自私自利的; 理性选择不是全局最优。
博弈论2009
精选ppt课件
6
➢经济合作:
乙 甲
诚信的价值; 一报还一报策略; 人类生存环境启示。
博弈论2009
精选ppt课件
7
➢长街上的超市 (海滩占位模型)
*********************
博弈论课件
第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
博弈ห้องสมุดไป่ตู้分类
4 Part
课堂互动
假设我脸干净
A脸干净
如果我脸也干净
A
则
C一定知道自己脸脏 但C不知道
B
所以我脸脏
所以B一定知道自己脸脏 但B不知道,说明我的假设不正确 故我脸脏
第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
Static Game Perfect Information
教CO学NT要EN求TS:
NO.1 知 占识优目策标略均衡 NO.2 能 重力复目剔标除占优均衡 NO.3 情 纳感什目均标衡 NO.4 重混点合难策点略均衡
Static Game Perfect Information
通过经典案例分析,掌握重复剔除的占优策略、纳什均 衡与混合策略均衡理论。 培养分析问题、解决问题的能力。 体会博弈论的应用价值,开拓视野,激发学习兴趣。
自测题目
教学大纲
教学课件
相关视频 参考书目
教学课件
Teaching courseware
目录
• 第一章 博弈论概述
006
• 第二章 完全信息静态博弈
041
第一节 占优策略均衡
043
第二节 重复剔除的占优均衡
066
第三节 纳什均衡
088
第四节 混合策略均衡
106
第一章
教学要求
知识目标 掌握博弈论的概念、发展、分类与要素
42
第二章 完全信息静态博弈
1.1 博弈的策略式表述
在博弈论中,一个博弈可以用两种不同的方式来表达: 策略式表达 和 扩展式表达 。策略式表达更适合于静态 博弈,而扩展式表达更适合于讨论动态博弈。
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
博弈ห้องสมุดไป่ตู้分类
4 Part
课堂互动
假设我脸干净
A脸干净
如果我脸也干净
A
则
C一定知道自己脸脏 但C不知道
B
所以我脸脏
所以B一定知道自己脸脏 但B不知道,说明我的假设不正确 故我脸脏
第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
Static Game Perfect Information
教CO学NT要EN求TS:
NO.1 知 占识优目策标略均衡 NO.2 能 重力复目剔标除占优均衡 NO.3 情 纳感什目均标衡 NO.4 重混点合难策点略均衡
Static Game Perfect Information
通过经典案例分析,掌握重复剔除的占优策略、纳什均 衡与混合策略均衡理论。 培养分析问题、解决问题的能力。 体会博弈论的应用价值,开拓视野,激发学习兴趣。
自测题目
教学大纲
教学课件
相关视频 参考书目
教学课件
Teaching courseware
目录
• 第一章 博弈论概述
006
• 第二章 完全信息静态博弈
041
第一节 占优策略均衡
043
第二节 重复剔除的占优均衡
066
第三节 纳什均衡
088
第四节 混合策略均衡
106
第一章
教学要求
知识目标 掌握博弈论的概念、发展、分类与要素
42
第二章 完全信息静态博弈
1.1 博弈的策略式表述
在博弈论中,一个博弈可以用两种不同的方式来表达: 策略式表达 和 扩展式表达 。策略式表达更适合于静态 博弈,而扩展式表达更适合于讨论动态博弈。
博弈论1精品PPT课件
经济学越来越转向对人与人之间关系的研究,特别 是人与人之间行为的互相影响、利益冲突与一致、 竞争与合作等。
经济学越来越重视对信息的研究,特别是信息不对 称对个人选择及制度安排的影响。
16
博弈论的发展
思想萌芽
2000年多年前我国《孙子兵法》、“田忌赛马” 1500年前巴比伦犹太教法典中的“三妾争产” 1838年古诺寡头模型 1883年伯川德寡头模型 1913年齐默罗象棋博弈定理——“逆向归纳法” 1921-1927年波雷尔给出混合战略的第一个现代表述
,并给出有数种战略两人博弈的极小化极大解 1928年冯•诺伊曼和摩根斯坦扩展式博弈定义,证明
有限策略两人零和博弈有确定性的结果
17
形成 冯•诺伊曼和摩根斯坦《博弈论和经济行为》
(Theory of Games and Economic Behavior,1944) ——奠定经济博弈论的基础
引进博弈的扩展式(Extensive Form)表述和标准式 (Normal Form)[或称战略式(Strategy Form)、 矩阵式(Matrix Form)]表述
决策者间的相互依存正是博弈(Game) 的实质。
经济——寡头企业决策、市场阻止、 招标拍卖
军事、政治——中日关系、朝核问题、 叙利亚危机
88
博弈论:以数学为基础,研究对抗冲突中 问题最优解决方案的方法。
“博弈论是研究决策主体的行为发生直接相 互作用时的(最优)决策以及这种决策的均衡 问题的”
——张维迎《博弈论与信息经济学》
提出稳定集(Stable Sets)解概念 正式提出构建博弈论一般理论的想法
18
博弈论的成长
第一个研究高潮(20世纪40年代末50年代初)
1950年Nash提出“纳什均衡” 概念和证明纳什定理 ,发展非合作博弈的基础理论。
经济学越来越重视对信息的研究,特别是信息不对 称对个人选择及制度安排的影响。
16
博弈论的发展
思想萌芽
2000年多年前我国《孙子兵法》、“田忌赛马” 1500年前巴比伦犹太教法典中的“三妾争产” 1838年古诺寡头模型 1883年伯川德寡头模型 1913年齐默罗象棋博弈定理——“逆向归纳法” 1921-1927年波雷尔给出混合战略的第一个现代表述
,并给出有数种战略两人博弈的极小化极大解 1928年冯•诺伊曼和摩根斯坦扩展式博弈定义,证明
有限策略两人零和博弈有确定性的结果
17
形成 冯•诺伊曼和摩根斯坦《博弈论和经济行为》
(Theory of Games and Economic Behavior,1944) ——奠定经济博弈论的基础
引进博弈的扩展式(Extensive Form)表述和标准式 (Normal Form)[或称战略式(Strategy Form)、 矩阵式(Matrix Form)]表述
决策者间的相互依存正是博弈(Game) 的实质。
经济——寡头企业决策、市场阻止、 招标拍卖
军事、政治——中日关系、朝核问题、 叙利亚危机
88
博弈论:以数学为基础,研究对抗冲突中 问题最优解决方案的方法。
“博弈论是研究决策主体的行为发生直接相 互作用时的(最优)决策以及这种决策的均衡 问题的”
——张维迎《博弈论与信息经济学》
提出稳定集(Stable Sets)解概念 正式提出构建博弈论一般理论的想法
18
博弈论的成长
第一个研究高潮(20世纪40年代末50年代初)
1950年Nash提出“纳什均衡” 概念和证明纳什定理 ,发展非合作博弈的基础理论。
博弈论完整版PPT课件
ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
北京大学博弈论课件第1章-博弈论概述
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第一章 POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
二、博弈的分类
❖ 根据博弈参与者能否达成相互合作的和约束性协议
合作博弈(Cooperative Games) 非合作博弈(Non-Cooperative Games)
完全信息静态博弈(Static Game with Complete Information)
完全信息动态博弈( Dynamic Game with Complete Information)
第一节:博弈的定义和实例
❖ 博弈论(Game Theory)又名对策论 ❖ 博弈理论原本是运筹学的一个重要分支。 ❖ 目前博弈论已发展为一门备受关注的独立学科。 ❖ 博弈的定义
“博弈”指当两个或多个决策主体之间存在相互作用,任何一方 的决策策略(Strategy)都不能完全独立于其他各方策略时, 各方的决策过程及均衡问题。
20 世纪 70 年代,约翰 ·海萨尼(John Harsanyi)和莱因 哈德 ·泽尔腾(Reinhard Selten)等将不完全信息理论融入 到博弈论的研究中。
20 世纪 90 年代之后,博弈论作为一种方法被普遍运用到经济 学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
第一章 POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
二、博弈的分类
❖ 根据博弈参与者能否达成相互合作的和约束性协议
合作博弈(Cooperative Games) 非合作博弈(Non-Cooperative Games)
完全信息静态博弈(Static Game with Complete Information)
完全信息动态博弈( Dynamic Game with Complete Information)
第一节:博弈的定义和实例
❖ 博弈论(Game Theory)又名对策论 ❖ 博弈理论原本是运筹学的一个重要分支。 ❖ 目前博弈论已发展为一门备受关注的独立学科。 ❖ 博弈的定义
“博弈”指当两个或多个决策主体之间存在相互作用,任何一方 的决策策略(Strategy)都不能完全独立于其他各方策略时, 各方的决策过程及均衡问题。
20 世纪 70 年代,约翰 ·海萨尼(John Harsanyi)和莱因 哈德 ·泽尔腾(Reinhard Selten)等将不完全信息理论融入 到博弈论的研究中。
20 世纪 90 年代之后,博弈论作为一种方法被普遍运用到经济 学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
博弈论讲义-概述1
第一章 概述-人生处处皆博弈
注意两点: 注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 概述-人生处处皆博弈
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
参与人
ห้องสมุดไป่ตู้
第一章 概述-人生处处皆博弈-基本概念
博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动: 行动:参与人的决策变量 战略: 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和 行动的知识 支付函数: 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡: 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈 规则决定均衡。
完全信息静态博弈 纳什均衡
第一章 概述-人生处处皆博弈
纳什(1950,1951)
分析:上述博弈属于何种类型的博弈?
囚徒困境 坦白
囚徒 B 囚徒A
抵赖
坦白 抵赖 行动
-8,-8 -10,0
0,-10 -1,-1
支付函数
完全信息静态博弈 纳什均衡
纳什(1950,1951)
第一章 概述-人生处处皆博弈-智猪博弈
第一章 概述-人生处处皆博弈-囚徒困境 亚当斯密在1776年发表的经典之作《原富》中认为: 亚当斯密在1776年发表的经典之作《原富》中认为: 1776年发表的经典之作
1经济博弈论概述
合作博弈的概念是冯·诺依曼(John von Neumann)和摩根 斯顿( Oskar Morgenstern)在他们的《博弈论与经济行为》 (1944)一书中首次提出。到50年代,合作博弈理论的发展 到达鼎盛时期,其中包括纳什(Nash,1950)和夏普利 (Shapley,1953)的“讨价还价模型”,Gillies和 Shapley(1953)关于合作博弈中的“核”的概念,以及其他 一些人的贡献。
著名经济学家泰勒尔(Jean Tirole)说: “正 如理性预期使宏观经济学发生革命一 样,博弈论广泛而深远地改变了经济学 家的思维方式”
如果情况确实如此,对今天的经济学家来说 ,不懂得博弈论显然是不行了。
博弈论为何如此热门?
诺贝尔经济学奖偏爱博弈论研究
1994年诺贝尔经济学授予 约翰·纳什 约翰·海萨尼 莱因哈德·泽尔腾
但是有一些市场里头,价格的作用受到多种限制 ,可能是来自法律等正式规则的限制,也可能是 来自习俗或伦理道德等非正式制度的限制。
例如:找对象,不是价高者得,而是情投意合
才能结成夫妻。
问题是情投意合这种分配方式讲究“配对”, 而且这种配对最好还需要“稳定”,麻烦的是 还不能依靠传统的价格机制,在这种情况下经 济学应该怎么办呢?
发表了一篇关于实习医生的文章,将夏普利的 理论应用到解释实际经济问题中。
在医学领域,学生通常在后几年学习生涯中需 要去医院实习。
40年代,美国的医院系统开始大规模发展,但 医学院学生的数量很少,医院之间的竞争导致 对医学院学生需求的急剧增加,于是很多医院 就让学生提前实习,甚至在这些学生还没有选 定专业领域的情况下就参加实习。
2012年的诺贝尔经济学奖就授给了夏普利(L. S. Shapley)和罗斯(A. E. Roth),表彰他 们在“for the theory of stable allocations and the practice of market design”
北京大学博弈论课件第1章博弈论概述
博弈参与者可能是单个的个人,也可能是组织或集体
企业、社会团体、国家
博弈参与者可能多于两方,三方或多方博弈参与者
二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中,博弈参与者所能采取的博弈策略
均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中,博弈参与者所能采取的博弈策
博弈参与者:两个人 博弈过程:
两人在校门口集合,一起逛博物馆
博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
博弈双方策略相互依赖,不独立。
其他博弈实例
棋类比赛:象棋、围棋等。古人“对弈”。 寡头市场:
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
“坦白”或“不坦白”
三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。
企业、社会团体、国家
博弈参与者可能多于两方,三方或多方博弈参与者
二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中,博弈参与者所能采取的博弈策略
均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中,博弈参与者所能采取的博弈策
博弈参与者:两个人 博弈过程:
两人在校门口集合,一起逛博物馆
博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
博弈双方策略相互依赖,不独立。
其他博弈实例
棋类比赛:象棋、围棋等。古人“对弈”。 寡头市场:
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
“坦白”或“不坦白”
三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。
博弈论全套课件
三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础,经济学家们已经 把研究策略相互作用的博弈论当作最合适的分 析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学 、国际关系、计算机科学、政治学、军事战略 和其他很多学科都有广泛的应用。现在已经有 愈来愈多的人开始关注、了解并学习博弈理论 。
博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。
博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。
《博弈论教程》课件
博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
博弈论概述.ppt
Glossary
Payoff支付
A payoff is a number, also called utility, that reflects the desirability of an outcome to a player, for whatever reason. When the outcome is random, payoffs are usually weighted with their probabilities. The expected payoff incorporates the play’s attitude towards risk.
Glossary
Mixed strategy混合战略 A mixed strategy is an active randomization,
with given probabilities, that determines the player’s decision. As a special case, a mixed strategy can be the deterministic choice of one of the given pure strategies.
know it, and know that they all know it, and so on. The structure of the game is often assumed to be common knowledge among the players.
如果一个事实被所有的参与人知道,并且每个参与 人都知道所有的人都知道,并且每个参与人都知道每 个参与人都知道所有的人都知道,如此等等,以致无 穷,那么,这个事实就是共同知识。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
❖ 博弈参与者可能多于两方,三方或多方博弈参与者
❖ 二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中去相约去博物馆博弈中,博弈参与者所能采取的博弈策
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
❖ 一、博弈参与者(Player)
博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人
❖ 博弈参与者可能是单个的个人,也可能是组织或集体
企业、社会团体、国家
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
❖ 参考教材 ❖ 博弈论教程
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
❖ 岳昌君主审;沈琪编PO著WERPOINT TEMPLATE
“坦白”或“不坦白”
❖ 三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
❖ 甲、乙二人独立决策
对甲而言,不管乙选择坦白还是不坦白,甲的最优策略都是坦白。 对乙而言,不管甲选择坦白还是不坦白,乙的最优策略都是坦白。
❖ 结果:甲、乙均选择坦白,分别被判处 5 年有期徒刑 ❖ 甲、乙如均不坦白,则分别被判处 2 年有期徒刑 ❖ 个体理性与集体理性的冲突 ❖ 囚徒困境
中国古人思想中的“博弈”智慧
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第一章 POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
❖ 中国人民大学出版社POWERPOINT TEMPLATE
❖ 博弈论教程
POWERPOINT TEMPLATE
❖ 王则柯、李杰编著 POWERPOINT TEMPLATE ❖ 中国人民大学出版社
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
第一节:博弈的定义和实例
❖ 博弈论(Game Theory)又名对策论 ❖ 博弈理论原本是运筹学的一个重要分支。 ❖ 目前博弈论已发展为一门备受关注的独立学科。 ❖ 博弈的定义
“博弈”指当两个或多个决策主体之间存在相互作用,任何一方 的决策策略(Strategy)都不能完全独立于其他各方策略时, 各方的决策过程及均衡问题。
❖ 博弈参与者:两个人 ❖ 博弈过程:
两人在校门口集合,一起逛博物馆
❖ 博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
❖ 博弈双方策略相互依赖,不独立。
其他博弈实例
❖ 棋类比赛:象棋、围棋等。古人“对弈”。 ❖ 寡头市场:
产量博弈模式 价格博弈模式 领先者、跟随者博弈模式
❖ 大国之间关于汇率政策的博弈 ❖ 经典博弈实例:囚徒困境(Prisoner's Dilemma)
囚徒困境
❖ 警方逮捕了甲、乙两名犯罪嫌疑人 ❖ 警方分开审讯两人 ❖ 根据“坦白从宽、抗拒从严”的原则:
如甲、乙均坦白,则两人将分别被判处 5 年有期徒刑 如甲坦白、乙不坦白,则甲被判 1 年、乙被判 10 年徒刑 如甲不坦白、乙坦白,则甲被判 10 年、乙被判 1 年徒刑 如甲、乙均不坦白,则两人将分别被判处 2 年有期徒刑
博弈论概述 POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
博弈实例1:锤头、剪刀、布
❖ 博弈参与者:两名同学 ❖ 博弈过程:
两人在“锤子、剪刀、布”三种策略中选择一种。 如果两人的策略一样,则平局。 出“锤子”一方胜过出“剪刀”一方。 出“剪刀”一方胜过出“布”一方 出“布”一方胜过出“锤子”一方
❖ 博弈双方策略相互依赖,不独立。
博弈实例2:聚会
❖ 《战国策》:田忌赛马 ❖ 马分为上、中、下三等
我方上等马 vs. 对方中等马 我方中等马 vs. 对方下等马 我方下等马 vs. 对方上等马
❖ 三局两胜,田忌胜出 ❖ 正确运用战略,也是取胜的重要因素之一
第二节:博弈的构成要素
❖ 完整的博弈通常包含四个构成要素
博弈参与者(Player) 博弈策略(Strategy) 博弈的收益(Payoff) 博弈的均衡(Equilibrium)
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
2020/4/16
POWERP金OI融NT TEMPLATE
引言
❖ 博弈的思想古已有之 ❖ 博弈理论是当代经济学不可或缺的重要组成部分 ❖ 博弈思想及理论已被广泛应用于对各类经济和社会现象的
分析中 ❖ 博弈理论丰富了人们认识世界的角度和工具
❖ 二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中去相约去博物馆博弈中,博弈参与者所能采取的博弈策
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
❖ 一、博弈参与者(Player)
博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人
❖ 博弈参与者可能是单个的个人,也可能是组织或集体
企业、社会团体、国家
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
❖ 参考教材 ❖ 博弈论教程
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
❖ 岳昌君主审;沈琪编PO著WERPOINT TEMPLATE
“坦白”或“不坦白”
❖ 三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
❖ 甲、乙二人独立决策
对甲而言,不管乙选择坦白还是不坦白,甲的最优策略都是坦白。 对乙而言,不管甲选择坦白还是不坦白,乙的最优策略都是坦白。
❖ 结果:甲、乙均选择坦白,分别被判处 5 年有期徒刑 ❖ 甲、乙如均不坦白,则分别被判处 2 年有期徒刑 ❖ 个体理性与集体理性的冲突 ❖ 囚徒困境
中国古人思想中的“博弈”智慧
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第一章 POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
❖ 中国人民大学出版社POWERPOINT TEMPLATE
❖ 博弈论教程
POWERPOINT TEMPLATE
❖ 王则柯、李杰编著 POWERPOINT TEMPLATE ❖ 中国人民大学出版社
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
第一节:博弈的定义和实例
❖ 博弈论(Game Theory)又名对策论 ❖ 博弈理论原本是运筹学的一个重要分支。 ❖ 目前博弈论已发展为一门备受关注的独立学科。 ❖ 博弈的定义
“博弈”指当两个或多个决策主体之间存在相互作用,任何一方 的决策策略(Strategy)都不能完全独立于其他各方策略时, 各方的决策过程及均衡问题。
❖ 博弈参与者:两个人 ❖ 博弈过程:
两人在校门口集合,一起逛博物馆
❖ 博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
❖ 博弈双方策略相互依赖,不独立。
其他博弈实例
❖ 棋类比赛:象棋、围棋等。古人“对弈”。 ❖ 寡头市场:
产量博弈模式 价格博弈模式 领先者、跟随者博弈模式
❖ 大国之间关于汇率政策的博弈 ❖ 经典博弈实例:囚徒困境(Prisoner's Dilemma)
囚徒困境
❖ 警方逮捕了甲、乙两名犯罪嫌疑人 ❖ 警方分开审讯两人 ❖ 根据“坦白从宽、抗拒从严”的原则:
如甲、乙均坦白,则两人将分别被判处 5 年有期徒刑 如甲坦白、乙不坦白,则甲被判 1 年、乙被判 10 年徒刑 如甲不坦白、乙坦白,则甲被判 10 年、乙被判 1 年徒刑 如甲、乙均不坦白,则两人将分别被判处 2 年有期徒刑
博弈论概述 POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
博弈实例1:锤头、剪刀、布
❖ 博弈参与者:两名同学 ❖ 博弈过程:
两人在“锤子、剪刀、布”三种策略中选择一种。 如果两人的策略一样,则平局。 出“锤子”一方胜过出“剪刀”一方。 出“剪刀”一方胜过出“布”一方 出“布”一方胜过出“锤子”一方
❖ 博弈双方策略相互依赖,不独立。
博弈实例2:聚会
❖ 《战国策》:田忌赛马 ❖ 马分为上、中、下三等
我方上等马 vs. 对方中等马 我方中等马 vs. 对方下等马 我方下等马 vs. 对方上等马
❖ 三局两胜,田忌胜出 ❖ 正确运用战略,也是取胜的重要因素之一
第二节:博弈的构成要素
❖ 完整的博弈通常包含四个构成要素
博弈参与者(Player) 博弈策略(Strategy) 博弈的收益(Payoff) 博弈的均衡(Equilibrium)
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
2020/4/16
POWERP金OI融NT TEMPLATE
引言
❖ 博弈的思想古已有之 ❖ 博弈理论是当代经济学不可或缺的重要组成部分 ❖ 博弈思想及理论已被广泛应用于对各类经济和社会现象的
分析中 ❖ 博弈理论丰富了人们认识世界的角度和工具