博弈论讲义-概述1
01 第一讲 博弈论的基本概念
信息是参与者有关博弈的知识。如在“囚徒困境”中,
甲乙两个小偷彼此都不知道对方的选择,这就是他们所有拥 有的信息,信息对博弈的结果有很大的影响。 当然,博弈者掌握的信息有时候不一定是真的,但无论 真的或是假的,信息对博弈的结局都有影响。 例如,两军对垒,双方都有可能制造一些假情报,假情 报是一种假的信息,但如果敌方信以为真,胜负的天平可能 会倾向自己这边。
第三,博弈涉及到行动者存在着策略选择的可能,博 弈论用策略空间来表示参与者可以选择的策略。 策略是参与者在给定信息集(即参与者所知道的信息) 的情况下的行动规则。 赤壁一战,曹兵大败,曹操落荒而逃,在选择是走通 往华容道的小路,还是选择大路时,他面临着在两个策略 之间进行选择。
在囚徒困境中,小偷面临着“招认”还是“不招认”
得最大利益,经济学和博弈论就认为他会那样做。
§3 博弈涉及的内容
第一,博弈涉及到至少两个独立的博弈参与者。 参与者指(或参与人)的是一个博弈中的决策主体。他 的目的是通过选择行动(或战略),努力使自己的效用或利 益最大化。 但是,他的行动的好处(称为“支付”)取决于另外的 参与者。参与者可能是自然人,也可能是团体,如企业、部 门、国家,等等。 这里,重要的是,每个参与者必须有可供选择的行动和 一个很好定义的偏好函数——他喜欢什么和不喜欢什么。 例如,下围棋时参与者是对弈的两个人——两人博弈, 高考填报志愿时的参与者是填报志愿的人——多人博弈。
你和这群人构成一个博弈。生活中博弈的案例很多, 你会见到很多例子,只要涉及到人群的互动就有博弈。
§2 博弈论的基本假定
博弈论对人的基本假定是:人是理性的——
这也是经济学最基本的假设。
Байду номын сангаас
所谓理性的人,是指他在具体策略选择时的
博弈论PPT课件
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
博弈论本科讲义
在中观经济研究中,劳动力经济学和金融理 论都有关于企业要素投入品市场的博弈模型, 即使在一个企业内部也存在博弈问题:工人之 间会为同一个升迁机会勾心斗角,不同部门之 间为争取公司的资金投入相互竞争;从宏观角 度看,国际经济学中有关于国家间的相互竞争 或相互串谋、选择关税或其他贸易政策的模型; 至于产业组织理论更是大量应用博弈论的方法 (见Jean Tirole的《产业组织理论》)。
如果n个参与人每人从自己的Si中选择一个策略 siategy profile),参与人i之外的其他参 与人的策略组合可记为s-i=( s1,s2,﹍,si-1 , si+1 ,﹍, sn)。
例如田忌的某个策略s田忌=上中下,或中下上, 等等;S田忌={上中下,上下中,中上下,中下 上 ,下上中,下中上}
贷市场的过高利息。此外,阿克尔洛夫还把信 息不对称运用于解释各种社会问题,比如因为信 息不对称,医疗保险市场上,老年人、个体劳动 者的医疗保险利益得不到保障。
三、基本概念
1、参与人Players:一个博弈中的决策主体, 他们各自的目的是通过选择行动(策略)以最 大化自己的目标函数/效用水平/支付函数。他们 可以是自然人或团体或法人,如企业、国家、 地区、社团、欧盟、北约等。 那些不作决策或虽做决策但不直接承担决 策后果的被动主体不是参与人,而只能当做环 境参数来处理。如指手划脚的看牌人、看棋人, 企业的顾问等。 对参与人的决策来说,最重要的是必须有
教材——P5 博弈论就是系统研究各种各 样博弈中参与人的合理选择及其 均衡的理论。
关于“经济博弈论”:
博弈论是研究人们在利益相互影响的格局 中的策略选择问题、是研究多人决策问题的理 论。而策略选择是人们经济行为的核心内容, 此外,经济学和博弈论的研究模式是一样的: 即强调个人理性,也就是在给定的约束条件下 追求效用最大化。可见,经济学和博弈论具 有内在的联系。在经济学和博弈论具有的这 种天然联系的基础上产生了经济博弈论。
第六讲博弈论课件
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪
踩
踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。
第一章 博弈论概述PPT课件
Game Theory and Information Economics 天津大学管理与经济学部
授课:XXX
1
第一章 博弈论概述 (Game Theory)
授课:XXX
2
一、博弈论的定义
又称对策论,是研究决策主体的行为发生直 接相互作用时的决策以及这种决策的均衡问 题的学科。
➢ 博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
授课:XXX
12
坦白 抵赖
➢ 博弈问题的基本要素
坦白
(1)局中人(Players)
抵赖
参与对抗的各方;不一定指自然人
若二人均不坦白,则只能因藏有枪支而被判刑1年; 若有一人坦白而另一个不坦白,则坦白者无罪释放,
不坦白者 被判刑10年; 若二人都坦白了,则同判8年。 此二人确系抢劫犯,请分析他们的抉择。
Ⅱ
坦白
Ⅰ
抵赖
坦白 -8,-8 -10,0
抵赖 0,-10 -1,-1
授课:XXX
均衡解: 二人均坦白
11
相关概念介绍
他的故事被好莱坞拍成了电影《美丽心灵》,该影片获 得了2002年奥斯卡金像奖的四项大奖
授课:XXX
7
2002年 北京国际数学家大会(ICM)
授课:XXX
8
• 主演
罗素·克劳,Russell Crowe
詹妮弗·康纳利, Jennifer Connelly
授课:XXX
9
1. 囚犯困境(Prisoners’ dilemma
博弈论概述
博弈论与企业决策博弈论与企业决策第一章概述第二章博弈论的非技术描述第三章完全信息静态博弈第四章完全信息动态博弈第五章不完全信息静态博弈第六章不完全信息动态博弈第一章概述第一节博弈论与企业决策第二节博弈论的基本概念第三节博弈的分类第四节博弈论的发展简史第五节本课程基本内容第一节博弈论与企业决策一、市场结构与企业决策1、完全竞争市场1.市场特点:厂商假设产品假设信息假设要素假设2.厂商关系:相互独立影响极小3.厂商决策:MP=P P市场均衡价格4.市场性质:理论标尺第一节博弈论与企业决策2、完全垄断市场1.市场特点:一个厂商无相近替代品市场不可进入2.厂商关系:完全独立3.厂商决策:MR=P P由市场需求曲线决定4.市场性质:理论标尺注意:1.竞争和垄断的两重含义:市场状态和行为2.垄断厂商的需求曲线弹性不是无穷大的,而是有一定的弹性,弹性越小越可能垄断。
第一节博弈论与企业决策 3、垄断竞争市场1.市场特点:厂商众多产品差异自由进退2.厂商关系:相互影响,不易觉察3.厂商决策:MR=P P受厂商相互行为影响4.市场性质:现实市场第一节博弈论与企业决策4、寡头垄断市场1.市场特点:厂商数量不多产品同质或差异需求曲线不确定2.厂商行为:相互依赖,相互依存3.厂商决策:MR=P P可能是决策变量4.市场性质:现实市场第一节博弈论与企业决策二、企业决策特点1、现实市场是垄断竞争和寡头垄断市场2、现实市场上企业之间的决策是相互依赖,相互影响的3、传统的自我决策是不行的,企业之间的决策是策略性决策举例:二食堂一楼的盖饭(垄断竞争)一般两荤一素6.5元,有一家涨到10元,结果冷冷清清汽车制造企业的决策(寡头垄断)见:《中国企业企业广告行为》第一节博弈论与企业决策三、博弈论与企业决策1、博弈论就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。
2、现实中企业就是相互依赖、相互影响的关系。
3、因此,企业决策必须有博弈论的思想和方法。
北京大学博弈论课件第1章-博弈论概述
❖ 二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中去相约去博物馆博弈中,博弈参与者所能采取的博弈策
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
❖ 一、博弈参与者(Player)
博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人
❖ 博弈参与者可能是单个的个人,也可能是组织或集体
企业、社会团体、国家
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
❖ 参考教材 ❖ 博弈论教程
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
❖ 岳昌君主审;沈琪编PO著WERPOINT TEMPLATE
“坦白”或“不坦白”
❖ 三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
❖ 甲、乙二人独立决策
对甲而言,不管乙选择坦白还是不坦白,甲的最优策略都是坦白。 对乙而言,不管甲选择坦白还是不坦白,乙的最优策略都是坦白。
❖ 结果:甲、乙均选择坦白,分别被判处 5 年有期徒刑 ❖ 甲、乙如均不坦白,则分别被判处 2 年有期徒刑 ❖ 个体理性与集体理性的冲突 ❖ 囚徒困境
博弈论课件
博弈论强调参与者之间的互动关系,通过数学模型和理论分析来研究 策略选择和均衡结果。
博弈论的发展历程
博弈论的起源可以追溯到20世纪初,当时数学家和经 济学家开始研究游戏中的策略和均衡。
1944年,冯·诺依曼和摩根斯坦合著的《博弈论与经济 行为》标志着博弈论的诞生。
随后,纳什、泽尔腾和哈萨尼等学者进一步发展了博弈 论,形成了现代博弈论的基础。
商业竞争与合作
商业竞争
博弈论可以用于分析商业竞争中的策略和行为,例如价格战、广告战等。通过 博弈论,企业可以更好地理解竞争对手的策略,制定出更有效的竞争策略。
商业合作
博弈论也可以用于分析商业合作中的策略和行为,例如供应链管理、合资企业 等。通过博弈论,企业可以更好地理解合作伙伴的需求和期望,制定出更有效 的合作策略。
贝叶斯纳什均衡
在不完全信息博弈中,如果所有参与 者都根据自己掌握的信息选择最优策 略,则所有参与者都能获得最大收益 。
静态博弈与动态博弈
01
静态博弈
02
动态博弈
所有参与者在同一时间点选择策略并获得收益。
参与者的选择有先后顺序,后选择的参与者可以观察到先选择的参与 者的策略和收益。
03
纳什均衡
纳什均衡的定义
博弈优化方法
线性规划
线性规划是一种数学优化方法, 用于找到在满足一组约束条件下 最大化或最小化目标函数的最优
解。
非线性规划
非线性规划是数学优化的一种方 法,用于找到一组变量的最优值 ,使得一个或多个目标函数达到
最优。
动态规划
动态规划是一种通过将问题分解 为相互重叠的子问题来解决问题 的方法,每个子问题的解被保存
博弈论课件
汇报人:
汇报时间:202X-01-04
北京大学博弈论课件第1章-博弈论概述
第一章 POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
二、博弈的分类
❖ 根据博弈参与者能否达成相互合作的和约束性协议
合作博弈(Cooperative Games) 非合作博弈(Non-Cooperative Games)
完全信息静态博弈(Static Game with Complete Information)
完全信息动态博弈( Dynamic Game with Complete Information)
第一节:博弈的定义和实例
❖ 博弈论(Game Theory)又名对策论 ❖ 博弈理论原本是运筹学的一个重要分支。 ❖ 目前博弈论已发展为一门备受关注的独立学科。 ❖ 博弈的定义
“博弈”指当两个或多个决策主体之间存在相互作用,任何一方 的决策策略(Strategy)都不能完全独立于其他各方策略时, 各方的决策过程及均衡问题。
20 世纪 70 年代,约翰 ·海萨尼(John Harsanyi)和莱因 哈德 ·泽尔腾(Reinhard Selten)等将不完全信息理论融入 到博弈论的研究中。
20 世纪 90 年代之后,博弈论作为一种方法被普遍运用到经济 学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
博弈论教学课件(全)
二、博弈论的经济学渊源
经济学的一些思想为博弈论提供了基础,其中最 重要的就是所谓的“理性人”。
描述理性人的工具就是所谓的理性偏好。为了方便, 我们又用效用函数(在博弈论中称为收益函数)来 表示偏好。
构成博弈论基础的一个重要的经济定理就是所谓的 理性选择原理:如果决策主体的偏好是理性的,那 么(有限)选择集中就一定存在最优选择,这个选 择可能是唯一的,也可能是多个。
定义2.1 博弈表达的基本式(或策略式)由博弈的参 与者N,策略空间S和收益函数u三个要素组成,即G = {N, S, u}。
这里需要注意的是,完全信息静态博弈在多数情况 下,策略就等同于行动,所以G={ A,u}。但严格来 讲,策略并不是行动。
我们可以通过一个例子来加以说明。
[例1] 进攻与防守
对称博弈和对称均衡能够大大节省工作量,这也是博弈论中所举例子通常为对 称博弈的原因。
对称博弈通俗说就是代表参与者身份的下标,在分析中可以省略掉而没有关系。
四、混合策略
博弈论里面最根本的问题是什么?就是均衡 的存在性。如果均衡不存在,所有的工作都 成了无用功,之所以引入混合策略,意义就 在这里,因为如果仅仅限制在纯策略的范围 内讨论博弈的话,均衡有可能是不存在的。
双方争夺一个据点,有两条进攻路线X和Y,攻方有 两个军,而防守方也有两个军,只有当守方的兵力 不少于攻方时,才能击退进攻,否则据点将会失守。
首先可知守方的防守方案(即策略)为(0,2),(1,1),(2,0),即在X线路和Y线路驻扎 军队数,同样可以到的攻方的进攻方案(0,2),(1,1)和(2,0)。容易看出,行动并非策 略,策略是行动方案。
需要注意的几个问题:
(1)表达同一个偏好的收益函数不唯一,但在 单调变换下却是唯一的。
1 博弈论概述
Glossary术语
Common knowledge共同知识 A fact is common knowledge if all players know it, and know that they all know it, and so on. The structure of the game is often assumed to be common knowledge among the players. 如果一个事实被所有的参与人知道,并且每个参与 人都知道所有的人都知道,并且每个参与人都知道每 个参与人都知道所有的人都知道,如此等等,以致无 穷,那么,这个事实就是共同知识。
Glossary
Strategic form战略式 A game in strategic form, also called normal form, is a compact representation of a game in which players simultaneously choose their strategies. The resulting payoffs are presented in a table with a cell for each strategy combination. 一个战略式博弈也称为标准式博弈,它用紧凑的形式来 表示博弈,博弈中参与人同时选择战略。作为结果的 支付用表格的形式来表示,每一个单元格表示一个战 略组合。
History and impact of game theory 博弈论的历史及其影响
The earliest example of a formal game-theoretic analysis is the study of a duopoly by Antoine Cournot in 1838. The mathematician Emile Borel suggested a formal theory of games in 1921, which was furthered by the mathematician John von Neumann in 1928 in a “theory of parlor games.” Game theory was established as a field in its own right after the 1944 publication of the monumental volume Theory of Games and Economic Behavior by von Neumann and the economist Oskar Morgenstern. This book provided much of the basic terminology and problem setup that is still in use today.
博弈论最全完整-讲解课件
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
• 因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
学习交流PPT
17
约翰· 海萨尼 1920年 生于美 国
约翰·纳什 1928年生于美国
莱因哈 德·泽尔 腾, 1930 年生于 德国
学习交流PPT
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和 美国人威廉-维克瑞(William Vickrey)
托马斯·谢林
学习交流PPT
24
导论
三、博弈论的基本类型
学习交流PPT
25
合作博弈与非合作博弈
• 合作博弈(cooperative game) 达成有约束力的协议(binding
agreement),强调团体理性,强调效率、公 正、公平 • 非合作博弈(non-cooperative game)
强调个人理性,其结果可能有效率,也可能 无效率。
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进行分 析”领域做出了重要贡献。
学习交流PPT
21
迈克尔·斯彭斯 1948年生于美国的 新泽西,1972年获 美国哈佛大学博士 头衔,现兼任美国 哈佛和斯坦福两所
• 也就是说,需要的是对这样的情况下该选什么 的预期的收敛。这一使得参与者能够成功合作 的共同预期的策略被称为焦点。心有灵犀一点 通。
博弈论
博弈与决策讲义一:绪论Game Theory(结合耶鲁课程)一、博弈论的概念博弈论(Game Theory),有时也称为对策论,或者赛局理论,应用数学的一个分支, 目前在生物学,经济学,国际关系,计算机科学, 政治学,军事战略和其他很多学科都有广泛的应用。
主要研究公式化了的激励结构(游戏或者博弈(Game))间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。
其中一个有名有趣的应用例子是囚徒困境(Prisoner's dilemma)。
博弈论研究策略形势。
经济学中有这样的案例,如完全竞争企业,这些企业是价格的接受者,他们不必担心竞争对手的行为;又比如完全垄断企业,他没有竞争对手,所以这些都不是策略形势。
他们不是价格接受者,但需要面对需求曲线,对于学过经济学的应该不陌生。
而介于这两种情况之间的就是策略形势,不完全竞争情况就是策略形势,比如汽车企业,在汽车产业里,福特关注通用和丰田的行为,可能还得关注克莱斯勒的行为,少数几家公司的决策会相互影响。
策略形势书面定义就是行为影响结果,而结果不仅取决于自己的行为,还取决于其他人的行为。
具有竞争或对抗性质的行为成为博弈行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。
比如日常生活中的下棋,打牌等。
博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
生物学家使用博弈理论来理解和预测演化(论)的某些结果。
例如,John Maynard Smith 和George R. Price 在1973年发表于《自然》杂志上的论文中提出的“evolutionarily stable strategy”的这个概念就是使用了博弈理论。
《博弈论》精品讲义
Si,i1 ,2, ,n
和这些局中人各自的支付(盈利)函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为:
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明 公正無私
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
20
策略型表述: (两人有限博弈;Fra bibliotek阵形式)高需求情况
B
A
低需求情况?
博弈论20092009
正大光明 公正無私
21
➢房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
博弈论20092009
正大光明 公正無私
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
意5个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?
博弈论20092009
《博弈论教程》课件
博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 概述-人生处处皆博弈
注意两点: 注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 概述-人生处处皆博弈
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
参与人
ห้องสมุดไป่ตู้
第一章 概述-人生处处皆博弈-基本概念
博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动: 行动:参与人的决策变量 战略: 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和 行动的知识 支付函数: 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡: 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈 规则决定均衡。
完全信息静态博弈 纳什均衡
第一章 概述-人生处处皆博弈
纳什(1950,1951)
分析:上述博弈属于何种类型的博弈?
囚徒困境 坦白
囚徒 B 囚徒A
抵赖
坦白 抵赖 行动
-8,-8 -10,0
0,-10 -1,-1
支付函数
完全信息静态博弈 纳什均衡
纳什(1950,1951)
第一章 概述-人生处处皆博弈-智猪博弈
第一章 概述-人生处处皆博弈-囚徒困境 亚当斯密在1776年发表的经典之作《原富》中认为: 亚当斯密在1776年发表的经典之作《原富》中认为: 1776年发表的经典之作
我们的晚餐不是来自屠夫、酿酒的商人或面包师傅的仁 慈之心,而是因为他们对自己的利益特别关注。。。 每个人都会尽其所能,运用自己的资本争取最大的利益, 一般而言,他不会有意图为公众服务,也不自知对社会有什 么贡献,他关心的仅仅是自己的安全、自己的利益,但如此 一来,他就好象被一只无形的手引领,在不知不觉中对社会 改进尽力而为。。。
参与人对其他参与人(对手)的特征、战略空 间及支付函数的知识:完全信息博弈和不完全 信息博弈。 完全信息:每一个参与人对所有其他参与人的 (对手)的特征、战略空间及支付函数有准确 的 知识,否则为不完全信息。
第一章 概述-人生处处皆博弈-基本概念
博弈的划分:
行动顺序 信息 完全信息 静态 完全信息静态博弈 纳什均衡
第一章 概述-人生处处皆博弈-博弈的划分 博弈的划分: 从参与人行动的先后顺序:静态博弈和动态博 弈 静态博弈:参与人同时选择行动或非同时行动 但后行动者并不知道前行动者采取了什么具体 行动; 动态博弈:参与人行动有先后顺序,且后行动 者能够观察先行动者选择的行动。
第一章 概述-人生处处皆博弈-博弈的划分
第一章 概述-人生处处皆博弈-囚徒困境
第一章 概述-人生处处皆博弈-智猪博弈
案例2-智猪博弈
第一章 概述-人生处处皆博弈-智猪博弈
案例2-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 0,0 4大于1 0大于-1
纳什均衡:大猪按,小猪等待 各得四个单位(4,4) 多劳者不多得
第一章 概述-人生处处皆博弈-囚徒困境
两个寡头企业选择产量的博弈:
如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的 利润。给定对方遵守协议的情况下,每个企业都想 增加产量,结果是,每个企业都只得到纳什均衡产 量的利润,它严格小于卡特尔产量下的利润。
请举几个囚徒困境的例子
第一章 概述-人生处处皆博弈-定义 博弈论(game theory,又译为对策论,游戏论)
定义:研究决策主体的行为在直接相互作用时,人 们如何进行决策、以及这种决策如何达到均衡。 开始于-冯.诺曼(Von Neumann)与摩根斯坦 (Morgenstern)在1944年合作的《博弈论与经济行为》 (The Theory of Games and Economic Behaciour)
智猪博弈
囚徒困境 按 大猪 按 5,1 等待 9,-1 行动 小猪 等待 4,4 0,0 支付函数 4大于1 0大于-1
完全信息动态博弈-子博弈精练纳什均衡 (举例)泽尔腾(1965)
行动 默许(40,50) 进入
进入者
在位者
斗争(-10,0)
不可置信威胁
不进入(0,300) 市场进入阻挠博弈树 特点:剔除博弈中包含的不可置信威胁; 承诺行动-破釜沉舟 给定进入者进入,剔除(进入,斗争),(进入,默许) 是唯一的子博弈精练纳什均衡-举例(结婚-反对) 支付函数
第一章 概述-人生处处皆博弈-智猪博弈
请举类似的例子
第一章 概述-人生处处皆博弈-智猪博弈 大猪 股份公司中大股东 大企业 小猪 小股东 小企业 博弈 监督 技术创新 改革
纳什均衡:大股东担当监督经理的责任,小股东搭便车 纳什均衡:大企业技术创新,小企业模仿
精英 平民 天塌下来有高个子顶着。
第一章 概述-人生处处皆博弈-智猪博弈 改变博弈规则: 1、减量方案:投食为原来的一半。 2、增量方案:投食为原来的一倍。 3、减量加移位方案:投食为原来的一半,但将 投食口移到踏板附近。
第一章 概述-人生处处皆博弈-囚徒困境
同样的情形发生在: 公共产品的供给 美苏军备竞赛 价格/广告竞争 中小学生减负 ……
第一章 概述-人生处处皆博弈-囚徒困境 囚徒困境的性质: 囚徒困境的性质: 个人理性和集体理性的矛盾; 个人的“最优策略”使整个“系统”处于不 利的状态。 思考: 思考:为什么会造成囚徒困境 是否由于“通讯”问题造成了囚徒困境? “要害”是否在于“利己主义”即“个人理 性”? 是否囚徒困境的结果就一定不利?
第一章 概述-人生处处皆博弈-性别战
案例3-性别战
女 足球 男 足球 芭蕾 2,1 0,0 芭蕾 0,0 1,2
纳什均衡: 足球,足球;芭蕾,芭蕾 先动优势
第一章 概述-人生处处皆博弈-斗鸡博弈
案例4-斗鸡博弈
进 进 A 独木桥 纳什均衡:A进,B退;A退,B进 退 -3,-3 0,2 B 退 2,0 0,0
第一章 概述-人生处处皆博弈-斗鸡博弈 村子里有两户富户,有两种可能:一家修,另 一家就不修;一家不修,另一家就得修。 冷战期间美苏抢占地盘:一方抢占一块地盘, 另一方就占另一块。 夫妻吵架,一方厉害,另一方就出去躲躲。 注意:在混合战略纳什均衡条件下,也可能两 败俱伤。
第一章 概述-人生处处皆博弈-斗鸡博弈
囚徒困境
第一章 概述-人生处处皆博弈-囚徒困境 案例1-囚徒困境-纳什均衡
囚徒A
坦白
囚徒 B
抵赖
坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
-8大于-10 0大于-1
坦白,坦白) (坦白,坦白)是纳什均衡
第一章 概述-人生处处皆博弈-囚徒困境 设定: (1)每个局中人都知道博弈规则和博弈结 果的支付矩阵; (2)每个局中人都是理性的(个人理性和 个人最优决策); (3)不能“串通”
第一章 概述-人生处处皆博弈-囚徒困境
通俗地讲:
纳什均衡的含义是:给定别人战略情况下,没 有任何单个参与人有积极性选择其他战略,从而没 有人有积极性打破这种均衡。
第一章 概述-人生处处皆博弈-囚徒困境 一只河蚌正张开壳晒太阳,不料,飞来了 一只鸟,张嘴去啄他的肉,河蚌连忙合起两张 壳,紧紧钳住鸟的嘴巴,鸟说:“今天不下雨, 明天不下雨,就会有死蚌肉。”河蚌说:“今 天不放你,名天不放你,就会有死鸟。”谁也 不肯松口,有一个渔夫看见了,便过来把他们 一起捉走了。
第一章 概述-人生处处皆博弈-囚徒困境
人类自私的天性,使他们陷入“囚徒困境”,难以自拔。
解决囚徒困境问题的“出路” 解决囚徒困境问题的“出路”
“解决个人理性和集体理性之间冲突的办法不是否认个人 理性,而是设计一种机制,在满足个人理性的前提下达到 集体理性”; “一种制度安排,要发生效力,必须是一种纳什均衡。否 则,这种制度安排便不能成立”。 囚徒困境的效果在不同情况下对社会而言可能是“负面” 的,也可能是“正面”的。
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
行动 接受 求爱博弈: 品德优良者求爱 求爱者 求爱
100,100
你 不接受
-50,0 0,0
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱 求爱者 你 接受 不接受
100,-100 -50,0 0,0
贝叶斯规则是概率统计中应用所观察到的现象修 正先验概率的一种标准方法。 例如:给定张三干了X这件事的条件下张三属于 类型A的概率等于张三属于类型A的先验概率乘 以A类型人干X这件事的概率,再除以张三可能 干这件事的“边际”概率。
纳什(1950,1951)
动态 完全信息动态博弈 子博弈精练纳什均衡 泽尔腾(1965) 不完全信息动态博弈 精练贝叶斯纳什均衡 泽尔腾(1965) Kreps 和Wilson(1982) Fudenberg 和Tirole(1991)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡 海萨尼(1967-1968)
主要内容简介
第一章 概述-人生处处皆博弈 非合作博弈理论 第二章 第三章 第四章 第五章 完全信息静态信息博弈-纳什均衡 完全信息动态搏弈-子博弈精炼纳什均衡 不完全信息静态博弈-贝叶斯纳什均衡 不完全信息动态博弈-精练贝叶斯纳什均衡
第一章 概述-人生处处皆博弈
人生是永不停歇的博弈过程, 博弈意味着通过选择合适的 策略达到合意的结果。 作为博弈者,最佳策略是最 大限度地利用游戏规则,最 大化自己的利益; 作为社会最佳策略,是通过 规则使社会整体福利增加。