博弈论的要素
博弈论
博弈论是一种建立在抽象推理基础之上“研究处于利益冲突的各方在竞争性活动中制定最优化胜利的策略”的理论。
作为科学行为主义学派的重要一支,博弈论不仅是研究国际冲突的策略理论,而且还是处理国际关系问题的实际手段。
(二)、博弈论的要素
1、弈者(想获得最优结果的参与者);
双方让路
(最保险、最可靠选择) A让B不让
(B的最佳方案)
A不让B让
(A的最佳方案) 相撞
(最差的结果)
双方零合博弈的典型事例是:冷战时期的美苏争夺格局。
②、多方零合博弈
多方零合博弈的典型事例是:国际关系中的领土或资产纠纷。
(3)、零合博弈强调冲突的可能性以及解决冲突的机制。
(结构现实主义理论强调国际结构中冲突的可能性,认为国际结构中的国家为了获取自己的相对收益,常常是以牺牲别国为代价的(零合博弈))。
双方变数博弈的典型即,长期以来美苏之间的军备竞赛政策的运用。
②、多方变数博弈
它是“有三方以上参与者的博弈,并且一方所得并非其他方所失,得失之和并不等于零”。
该博弈与两方变数博弈特点相似。但由于独立决策者的增多,策略的相互依存关系也就更为复杂,策略的数目按几何级数上升(2的n次方),因此目前学术界并没有关于多方非零和博弈的成熟理论。尽管如此,政治学家还是指出,该类博弈的“关键问题就是如何能够实现让所有博弈者都满意的合理的收益分配”。
(二)、支持
博弈论提出假设的有效方法,为对外政策决策者说面临的战略选择作出了解释。
博弈论是国际关系和外交决策研究的“思想发动机”,有助于一国实现最佳的策略选择,有助于认识国际冲突的性质、动力和结果,不失为一种具有实用价值的关于对策的研究方法。
博弈论-博弈分类
各博弈方的选择和行动有先后次序且后选择、后行动的博弈 方在自己选择行动之前可以看到其他博弈方选择的行动
如弈棋、市场进入、领导——追随型市场结构等 重复博弈
➢ 同一个博弈反复进行所构成的博弈,提供了实现更有效率博弈 结果的新可能
➢ 长期客户、长期合同、信誉问题 ➢ 有限次重复博弈、无限次重复博弈
2023/1/4
覃燕红——重庆理工大学
20
4、博弈分类区分 III :课程涉及的4种博弈类型
4种基本的博弈类型
完全信息
静态 完全信息静态博弈
纳什均衡
动态 完全信息动态博弈 子博弈精炼纳什均衡
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
不完全信息动态博弈 精炼贝叶斯纳什均衡
➢ 完全信息:每个参与人都拥有所有其他参与人的特征、策略及支付 函数等方面准确信息的博弈。
• 人们在决策时遵循最大化原则 • 选择最优方案,谋求最大效益 • 作为决策的主体,始终坚持理性化活动,不存在任何非理性成分。
✓ 不完全理性:
• 有限理性 • 有限理性决策的前提是现实生活过于复杂,人们只能遵循满意原则 • 受到情感、偏好(如公平、互惠、利他)的影响 • 中国人:不患寡,患不均;滴水之恩,涌泉相报;以牙还牙等
的掠夺式使用、森林砍伐、实际和网络上的牛皮广告等
坦白 囚徒 A
抵赖
囚徒 B
坦白
抵赖
-8,-8 0,-10
-10,0 -1,-1
2023/1/4
覃燕红——重庆理工大学
6
2、博弈模型示例II
剪刀-石头-布
博 石头
弈 剪子
方
布
1
石头
0, 0 -1, 1 1, -1
博弈论的基本要素
图1-2 囚徒问题的支付矩阵
不坦白 (0, -10) (-1, -1)
坦白总是占优策略
占优均衡
囚
徒
坦白
1 不坦白
图1-2 囚徒问题的支付矩阵
囚徒2 坦白 (-8, -8) (-10, 0)
不坦白 (0, -10) (-1, -1)
占优均衡 由于矩阵的对称性,对囚徒2来说亦可得出类似结论
囚
坦白
博弈论对参与人做两个基本假设
1 理性的(rational)?
1—如果一个决策者在追逐其目标时能前后一致地做决策,就称他为rational。Roger B·Myerson (P2)
2—广义而言指的是一种行为方式,他同在给定条件或约束下最有效地实现预期目标相关。 具体地讲,理性含义如下:
博弈论对参与人做两个基本假设
博弈的策略式表述
常用G表示一个博弈 博弈模型的两种表示形式
❖ 策略式表述 (Strategic form), ❖ 扩展式表述(Extensive form) 本章主要介绍博弈的策略式表述
博弈的策略式表述
参与人集合 ❖ N人博弈的参与人集合,往往也记为N。参与人则记为i, i∈ N ❖ 参与人i的策略集,记为Si ,其中的一个特定策略,可记为si.有si ∈ Si.
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 机制设计 合作博弈
课程主要内容
完全信息静态博弈概念
概念:各参与人对彼此的策略集、支付函数有准确了解 博弈行为同时进行 一些实例
❖ 石头、剪子、布游戏 ❖ 彼此了解的两个厂商的价 ❖ 虽然决策不是在绝对时间意义上的“同时”, ❖ 但决策的时间先后差别跟博弈结果没有关系,也可看成是“同时进行的博弈”。 ❖ 如不同竞标单位作出的工程投标决策
《博弈论》知识点总结归纳
《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。
本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。
关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。
博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。
本文将对博弈论的相关知识进行详细的总结和归纳。
一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。
博弈的基本要素包括:参与者、策略、收益和信息。
1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。
参与者的目标是实现自身利益的最大化。
1.3 策略策略是指参与者在博弈中所能采取的行动或选择。
通常分为纯策略和混合策略。
1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。
收益可以用来衡量参与者的利益大小。
1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。
信息可以分为对称信息和非对称信息。
二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。
常见的均衡概念有纳什均衡、帕累托最优和博弈解。
2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。
2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。
帕累托最优是一种资源分配的有效方式。
2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。
博弈解往往是均衡的特殊情况。
三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。
博弈论策略组合
博弈论策略组合博弈论是一门研究决策问题的数学学科,它的应用范围涵盖了经济、政治、生物学等领域。
在博弈论中,最基本的要素是博弈者和策略。
博弈者可以是个人、组织或国家等,而策略则是博弈者在决策过程中所采取的行动方式。
在本文中,我们将会深入探讨博弈论中的策略组合问题。
一、博弈论中的基本概念1.博弈者博弈者是指参加博弈的个人、组织或国家等。
在博弈理论中,每个博弈者都是理性的决策者,他们会根据自己的利益来进行决策。
2.策略策略是博弈者在决策过程中所采取的行动方式。
每个博弈者都有多种策略可供选择,每种策略都有其对应的利益和风险。
3.收益矩阵收益矩阵是博弈论中的一种重要工具,它用于描述博弈者选择不同策略时所能够得到的收益。
在收益矩阵中,通常用数字来表示博弈者的收益,而这些数字的大小则取决于博弈者所采取的策略以及其他博弈者所采取的策略。
二、博弈论中的策略组合在博弈论中,不同的博弈者之间往往会采取不同的策略,而这些策略的组合则会影响整个博弈的结果。
为了让自己在博弈中获得最大的利益,博弈者需要仔细考虑不同策略的组合方式以及其所带来的收益。
以下是一些常见的博弈论策略组合:1.纳什均衡纳什均衡是博弈论中最常见的策略组合之一。
它指的是一种状态,在这种状态下,每个博弈者都采取了最优的策略,而且不存在任何一方可以通过改变自己的策略来获得更大的收益。
在纳什均衡状态下,博弈者的利益最大化,同时也最小化了风险。
2.优势策略组合优势策略组合是一种博弈者采取的策略组合,可以使博弈者在任何情况下都能够实现最大利润。
也就是说,无论其他博弈者采取什么样的策略,这种策略组合都能够保证博弈者在经济上最为稳定。
3.混合策略组合混合策略组合指的是博弈者在选择策略时,同时采取多种策略。
这种策略组合可以帮助博弈者避免对手的预测和防御,同时也能够增加博弈者获胜的机会。
4.反攻策略组合反攻策略组合是一种博弈者在面对挑战时采取的策略组合。
在这种情况下,博弈者不会采取防御性的措施,而是会采取积极的反攻策略。
博弈论模型简介
博弈论的基本概念
(二)博弈的组成要素
• • •
•
一个博弈一般由以下几个要素组成,包括:参与 人、行动、信息、策略、得益、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体; 2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策; 3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
案例模型构建
要素
4)效用函数:参与人i的效用函数不但受其自身的行动影响, 还取决于对方的行动选择,U=(U1,U2,U3)为参与人 的效用函数组合。参与人1,即地方政府的效用U1主要取 决于集体建设用地交易过程中取得的收益.参与人2和3的 效用U2和U3也主要取决于三方面因素:一是集体建设用 地交易过程中取得的收益R;二是集体建设用地地下交易 的风险成本CR,即违反法律受到惩罚的风险;三是交易成 本CT。
案例-地方政府的战略选择
其二,建立集体建设用地公开流转市场,地方政府获得级差地租Ⅱ 和部分级差地租Ⅰ。(略)
博弈论在旅游学的应用
1.旅游企业之间博弈
张亚明、陈亮(2008) 以博弈论为视角分析网络经济下旅游企业 间的“竞—合”模式,通过运用博弈论对旅游企业间的合作竞争 策略进行了分析,进而确定对合作和竞争策略的选择以及实施次 序的活动运作战略。
案例-地下市场交易下的三方博弈分析
集体建设用地地下市场交易的动力来源
1
2
由于现行征地制度不 健全,造成农村集体组 织的权益受到侵害,农 民集体组织为了获取比 征地补偿更高的收益或 者说规避土地征收带收 的“产权侵害”问题,就 私下进行了集体建设用 地的各种流转
由于现行的征地上市 交易模式手续多、周期 长、成本高,往往出现 用地企业拿到土地时已 经错失投资良机的情况 ,而通过地下市场交易 获得土地的成本低,周 期短,成为用地企业获 取土地的一个捷径 。
《产业经济学》第五章--(博弈1)讲解
在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。
博弈论
人质困境
一场憋屈的博弈。抢打出头鸟,人质联合固然 可以制服歹徒,但是谁愿出头。这一点给了无 数处于劫持者地位的一方以机会,类似于秦的 远交近攻、各个击破的策略,将最终全盘赢下 。人质可有反制的策略,当然有,不过艰难至 极。人质可以选择沉默,这样他有一定时间苟 延残喘;或者联合劫持者对付人质,结局还是 取决于劫持者,万一他过河拆桥怎么办;同时 反抗,集体将获得左右策略,但是这需要壮士 断腕的勇气,部分人可能因此受伤。这里是实 力与勇何在?因为,小猪踩踏板将一无所获 ,不踩踏板反而能吃上食物。对小猪而言 ,无论大猪是否踩动踏板,不踩踏板总是 好的选择。反观大猪,已明知小猪是不会 去踩动踏板的,自己亲自去踩踏板总比不 踩强吧,所以只好亲力亲为了。 “小猪躺着大猪跑”的现象是由于故事中 的游戏规则所导致的。规则的核心指标是 :每次落下的食物数量和踏板与投食口之 间的距离。
囚徒困境 (一)
在博弈论中,含有占优战略均衡的一个著名例子是由塔 克给出的“囚徒困境”(prisoners’ dilemma)博弈模型 。该模型用一种特别的方式为我们讲述了一个警察与小 偷的故事。假设有两个小偷A和B联合犯事、私入民宅被 警察抓住。警方将两人分别臵于不同的两个房间内进行 审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果 两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据 确凿,两人都被判有罪,各被判刑8年;如果只有一个犯 罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍 公务罪(因已有证据表明其有罪)再加刑2年,而坦白者 有功被减刑8年,立即释放。如果两人都抵赖,则警方因 证据不足不能判两人的偷窃罪,但可以私入民宅的罪名 将两人各判入狱1年 .
(4)策略(strategies):一局博弈中,每个局中人都有选 择实际可行的完整的行动方案,即方案不是某阶段的 行动方案,而是指导整个行动的一个方案,一个局中 人的一个可行的自始至终全局筹划的一个行动方案, 称为这个局中人的一个策略。如果在一个博弈中局中 人都总共有有限个策略,则称为“有限博弈”,否则 称为“无限博弈”。 (5)得失(payoffs):一局博弈结局时的结果称为得失。 每个局中人在一局博弈结束时的得失,不仅与该局中 人自身所选择的策略有关,而且与全局中人所取定的 一组策略有关。所以,一局博弈结束时每个局中人的 “得失”是全体局中人所取定的一组策略的函数,通 常称为支付函数。
博弈论
厂商 B
做广告 不做 0 10, 2
完全信息静态对策
但不是每个博弈方都有 上策的,现在A没有上策。 A把自己放在B的位置, 厂商A B有一个上策,不管A怎 做广告 样做,B做广告。 若B做广告,A自己也 不做广告 应当做广告。
1, 0.5 2, 1
完全信息静态对策
最小得益最大化是一个保守的策略。 它不是利润最大化,是保证得到1而不会 损失10。 电力局选择建厂,也是得益最小最大化 策略。 如果港务局能确信电力局采取最小 得益最大化策略,港务局就会采用扩建的 策略。
完全信息静态对策
在著名的囚徒困境的矩 阵中,坦白对各囚徒来说 是上策,同时也是最小得 益最大化决策。坦白对各 囚徒是理性的,尽管对这 两个囚徒来说,理想的结 果是不坦白。
你有什么对策? 存在纳什均衡吗?
旅馆
超市
旅馆
-50, -80 900, 500
200, 800 60, 80
超市
企业1
案例分析
如果这两个经营者都是小心谨慎的决策者,都按 最小得益最大化行事,结果是什么?(60,80) 如果他们采取合作的态度 H S 结果又是什么? H -50, -80 900, 500 从这个合作中得到的 最大好处是多少?一方 S 200, 800 60, 80 要给另一方多大好处才 能说服另一方采取合作态度?
完全信息静态对策
如厂商A和B相互争夺领导 厂商 B 地位: 领导者 追随者 厂商A A考虑:不管B怎么决定, 争做领导都是最好。 领导者 220, 250 1000, 15 0 B考虑:也是同样的。 结论:两厂都争做领导者, 追随者 100, 950 800, 800 这是上策。
博弈论知识点总结完整版
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
博弈论简介
但并不是所有重复博弈都有事先确定的重复次数,也就是停止重复时间的, 有些重复博弈似乎是会不断重复下去的。我们称这样的重复博弈为“无限次重 复博弈”(Infinitely Repeated Games)
14
(六)博弈的信息结构
所谓信息,是指关于事物运动的状态和规律的表征,也是关
于事物运动的知识。 信息就是用符号、信号或消息所包含的内容,来消除对客观 事物认识的不确定性。它普遍存在于自然界、人类社会和人 的思维之中。 信息的概念是人类社会实践的深刻概括,并随着科学技术的 发展而不断发展。 这里,我们博弈中的信息,是指在博弈中博弈方对其他博弈
方的特征、战略空间及得益函数等的知识。
15
1.关于得益的信息
博弈中最重要的信息之一是关于得益的信息,即每个博弈方 在每种结果(策略组合)下的得益情况。在许多博弈问题中,各 个博弈方不仅对自己的得益情况完全清楚,而且对其他博弈方 的得益也都很清楚。如在囚徒的困境博弈中,因为两囚徒所处 的地位是相同的,而且警察把他们双方的处境给他们都交代清 楚了,因此两个博弈方都对双方在每种情况下的得益非常清楚。
11
2.动态博弈
除了各博弈方同时决策的静态博弈以外,也有大量现实决
策活动构成的博弈中,各博弈方的选择和行动不仅有先后次序,
而且后选择、后行动的博弈方在自己选择、行动之前,可以看 到其他博弈方的选择、行动,甚至还包括自己的选择和行动。
第04讲 博弈的基本框架 - 学生
1
·明确一个博弈的四大构成要素(完美信息、不完美信息)。 ·精确理解信息集与策略(纯策略、混合策略、浓缩策略)这 两个重要概念。
·能够用博弈的扩展式与规范式来描述一个博弈问题。
·了解划分博弈类型的基本方法:完全信息静态、完全信息动 态、不完全信息静态、不完全信息动态。
2
博弈论的基本框架
而象棋则是一个完美信息博弈。
17
信息集
定义 4.2.1 一个信息集 H 是以决策点为元素的集合。
信息集需满足以下两个条件:
(1) 同一个信息集中的所有决策点必须紧接着完全相同的 可选行动。 (2) 同一个信息集中的决策点不能出现一个先于另一个出 现的情况。
18
信息集判断
信息集判断
19
信息集
信息集设臵是正确的。 它表示甲无法判断自己处于信息集四个决策点中的哪一个。 一个博弈者如果总能记住她所经历过的所有博弈路径,我们称她 具有完美回忆(Perfect Recall)。 在图中,我们可以断定甲已经忘记了她自己以前采取的行动以及 其对手的反应,否则她不可能完全分不清四个决策点。 所以我们说在图中,甲没有完美回忆。
22
信息集判断
信息集判断
23
信息集
图中的信息集设臵也是错误的。 它不符合定义4.2.1中的条件(2)。
(2) 同一个信息集中的决策点不能出现一个先于另一个出现的情
况。 信息集只对应一个博弈者,甲乙两人的决策点在同一个信息集内 造成概念上的混乱。
24
信息集判断
信息集判断
25
信息集
在图中的信息集虽然都对应着乙,但它也违反了定义4.2.1中的 条件(2)。 (2) 同一个信息集中的决策点不能出现一个先于另一个出现的情 况。
博弈模型要素
博弈模型要素
博弈模型是用于描述在策略互动中理性参与者如何决策的数学框架。
其构成要素主要包括以下几个方面:
参与者(Players):博弈中的决策主体,他们可以是个人、组织或国家等。
每个参与者都有自己的利益和目标,并会根据自己的利益和目标进行决策。
策略(Strategies):参与者可选择的行动方案,策略的选择直接影响到参与者的收益。
每个参与者都有自己的策略集,即可以选择的所有策略的集合。
信息(Information):参与者在进行决策时所依赖的知识,包括关于其他参与者身份、策略和历史数据等方面的知识。
信息的完整性、准确性和及时性对博弈的结果具有重要影响。
收益(Payoffs):参与者从博弈中获得的利益或损失。
收益通常取决于参与者的策略选择以及对手的策略。
在非零和博弈中,各方的收益之和可能大于或小于零,体现了各方利益的相互影响。
结果(Outcome):博弈结束时各方的状态和利益分配情况。
每个结果都对应于一定的策略组合,是所有参与者策略选择的综合体现。
均衡(Equilibrium):当所有参与者都选择最优策略,并且该策略组合不再发生变化时,就达到了博弈的均衡状态。
均衡是博弈分析的重要概念,它描述了在给定他方策略的情况下,每个参与者的最优选择。
理解这些要素是建立和分析博弈模型的基础,有助于深入理解不同策略和信息条件下参与者的行为模式和博弈结果。
博弈论简介
经济学基础
8. 4
博弈举例1:囚徒困境
事件背景:甲乙两个嫌犯被警方抓到,但缺乏充分证据对他们 进行量刑,因此分别对两人进行审讯,不允许他们互通信息。 警方告知:1.两人都坦白,各判刑5年。2.其中一方坦白,另 一方不坦白,坦白者判刑3个月,不坦白者判刑10年。3.两 人都不坦白,只有部分证据,将会各判刑1年。 参与者:囚徒A、B 策略:A、B都是坦白、抵赖 得益:判刑的年数 囚徒B 坦白 抵赖 囚徒A 抵赖 坦白 5年 5年 3月 10年 10年 3月1年 1年
经济学基础
8. 11
考试题型
考试时间:2016年1月5日 (第十八周星期二) 考试题型: 1.单选题(40分) 2.判断题(10分) 3.简答题(15分) 4.计算题(20分) 5.综合题(15分)
经济学基础
8. 12
计算题考的类型
1、需求价格弹性、供给价格弹性 2、厂商利润最大化产量条件 3、完全竞争厂商停止营业点、收支平衡点 4、厂商利润最大化生产要素条件
8. 8划线法找博弈均衡乙 Nhomakorabea甲
进 退
进 -1 -1 0 1
退
1 0 -1 -1
经济学基础
8. 9
小结
1.博弈三要素: 参与人、策略、得益(支付) 2.博弈均衡:纳什均衡、占优均衡 占优均衡一定是纳什均衡,纳什均衡不一定是占优均衡 3.囚徒困境:个人理性与集体理性的矛盾
经济学基础
8. 10
练习题
教材255页 单选题 案例分析 第1题 方法一 第2题 方法二
经济学基础
8. 13
复习要点
抓住经济学概念:每一章课后练习题第一题:名词解释
经济学基础
8. 14
第10章 博弈论简介
博弈的构成要素
博弈(1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
(2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
(3)得失:一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。
(4)对于博弈参与者来说,存在着一博弈结果(5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。
在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。
所谓纳什均衡,它是一稳定的博弈结果。
纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的支付将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B 也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。
这一结果对局中人B 亦是如此。
这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。
博弈论知识点总结完整版
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论的要素
参与人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
得失:一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。
对于博弈参与者来说,存在着一博弈结果。
博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意
即相关量处于稳定值。
在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。
所谓纳什均衡,它是一稳定的博弈结果。
来源:招标师在线网(QQ学习群:244362119),欢迎分享本文!。