博弈论的基本要素
博弈论的要素
博弈论的要素
参与人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
得失:一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。
对于博弈参与者来说,存在着一博弈结果。
博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意
即相关量处于稳定值。
在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。
所谓纳什均衡,它是一稳定的博弈结果。
来源:招标师在线网(QQ学习群:244362119),欢迎分享本文!。
商务谈判中的博弈论原理及其应用实践
混合策略
定义:在商务谈判 中,混合策略是指 谈判者根据不同的 谈判情境和对手情 况,灵活运用多种 谈判策略和技巧, 以达到最佳的谈判
效果。
优势:混合策略 能够使谈判者在 不同情境下Βιβλιοθήκη 取 最优策略,提高 谈判的灵活性和
成功率。
应用实践:在商 务谈判中,混合 策略可以通过多 种方式实现,如 结合威胁与承诺、 使用模糊语言、 灵活调整报价等。
法律规范在商务谈判中的作用
保障谈判双方的权益 规范谈判行为,避免违法行为 促进谈判的公平公正 维护市场秩序,促进商业合作
避免不正当竞争与违法行为
遵守法律法规:在商务谈判中,必 须严格遵守相关法律法规,不得采 取任何违法手段获取利益。
保密义务:在谈判过程中,双方应 对涉及的商业机密、保密信息等履 行保密义务,防止泄露。
注意事项:混合策 略需要谈判者具备 较高的谈判技巧和 经验,同时要避免 过度使用或滥用, 以免影响谈判的公
平性和信誉。
博弈策略的调整与优化
根据谈判对手的情况,灵活调整博弈策略 结合实际情况,优化博弈方案 不断学习和掌握新的博弈策略 在实践中不断总结和改进博弈策略
价格谈判案例
案例背景:某公司与供应商就采购价格进行谈判 博弈过程:双方就价格进行多次交锋,运用博弈论原理制定策略 实战结果:最终达成双方都能接受的协议,实现共赢 案例分析:通过博弈论原理分析双方策略,总结经验教训
人工智能可以 通过大数据分 析,预测对手 的意图和策略
人工智能可以 协助制定谈判 策略,提供决
策支持
人工智能在商务 谈判中的应用前 景广阔,但仍需 克服技术、法律 和伦理等方面的
挑战
全球化背景下商务谈判的挑战与机遇
全球化带来的文化差异和语言沟通问题 跨国合作中的法律法规和商业惯例差异 应对国际政治经济环境变化的策略调整 利用全球化机遇拓展谈判资源和空间
《博弈论》知识点总结归纳
《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。
本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。
关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。
博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。
本文将对博弈论的相关知识进行详细的总结和归纳。
一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。
博弈的基本要素包括:参与者、策略、收益和信息。
1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。
参与者的目标是实现自身利益的最大化。
1.3 策略策略是指参与者在博弈中所能采取的行动或选择。
通常分为纯策略和混合策略。
1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。
收益可以用来衡量参与者的利益大小。
1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。
信息可以分为对称信息和非对称信息。
二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。
常见的均衡概念有纳什均衡、帕累托最优和博弈解。
2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。
2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。
帕累托最优是一种资源分配的有效方式。
2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。
博弈解往往是均衡的特殊情况。
三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。
博弈论的基本结构
博弈论的基本结构
博弈论的基本结构包括以下几个要素:
1.参与者(Player):博弈中的决策主体,他们可以是个人或组织,各自追求自己的利益。
2.策略(Strategy):参与者在给定信息结构下的选择空间或行动方案,也被称为纯策略或混合策略。
3.效用(Utility):可以定义或量化的参与者的利益,也是所有参与者的真正关心的东西,又称偏好或支付函数。
效用决定了参与者对博弈结果的满意程度。
4.信息结构(Information Structure):描述了参与者所拥有的信息,包括完全信息或不完全信息。
5.博弈的结局:反映了在每个可能发生的结果下,所有参与者的利益状态。
同时,根据合作与否,博弈可以分为合作博弈和非合作博弈;根据是否知晓对手的类型,博弈可以分为静态博弈和动态博弈;根据是否知晓所有参与者的类型,博弈可以分为完全信息博弈和不完全信息博弈。
以上内容仅供参考,建议查阅关于博弈论的书籍文献获取更多专业内容。
博弈的基本要素名词解释
博弈的基本要素名词解释引言:博弈论作为一门应用数学分支,用于研究决策制定者在面对不确定的情况下,如何做出最优决策的一种理论。
在博弈理论中,有一些基本概念和要素是必须理解的。
本文将对博弈的基本要素名词进行解释,使读者能够更好地理解和应用博弈论。
正文:第一部分:博弈博弈是指在一定规则和限制下进行的相互作用,涉及多个参与者,每个参与者通过采取策略来追求自身利益。
博弈的目标是找到最佳决策,并通过合理的策略选择获得最大利益。
第二部分:参与者(博弈人)参与者是指在博弈过程中有决策权和参与权的个体或组织。
他们通过制定和执行策略来实现自身的目标。
参与者可以是个人、企业、政府等,其利益冲突和合作构成了博弈论的基础。
第三部分:策略策略是参与者在博弈中制定的一系列行动方案,旨在最大化其利益。
策略可以是单一的,也可以是复杂的组合。
参与者根据对其他参与者的预测和判断,选择相应的策略以应对不同情况。
第四部分:收益收益是指参与者在博弈过程中获得的实际利益或报酬。
收益可以是经济利益、声誉、满足感等多方面的回报。
在博弈论中,收益通常被量化,以数字或数学模型表示参与者所获得的利益。
第五部分:信息信息是博弈论中至关重要的要素之一。
它涉及参与者对博弈环境和其他参与者的了解程度。
信息的不对称性会对博弈结果产生重要影响。
全面了解信息并能够准确预测对手行为的参与者通常具有较大的优势。
第六部分:博弈论的模型博弈论的模型是描述博弈过程和参与者决策的数学框架。
常见的博弈模型包括零和博弈、合作博弈、非合作博弈等。
博弈论的模型提供了分析和求解博弈问题的工具和方法,帮助参与者做出最佳决策。
结论:博弈论作为一门重要的决策理论,涉及诸多概念和要素的解释和应用。
通过理解博弈、参与者、策略、收益、信息以及博弈模型等基本要素,我们能够更好地应用博弈论,从而在面对不确定的情况下做出最优决策。
参考文献:1. Nalebuff, B.J., & Dixit, A.K. (2020).《Thinking Strategically: The Competitive Edge in Business, Politics, and Everyday Life》. W. W. Norton & Company.2. Myerson, R.B. (2013).《Game Theory: Analysis of Conflict》. Harvard University Press.3. Osborne, M.J., & Rubinstein, A. (1994).《A Course in Game Theory》. MIT Press.。
博弈论
厂商 B
做广告 不做 0 10, 2
完全信息静态对策
但不是每个博弈方都有 上策的,现在A没有上策。 A把自己放在B的位置, 厂商A B有一个上策,不管A怎 做广告 样做,B做广告。 若B做广告,A自己也 不做广告 应当做广告。
1, 0.5 2, 1
完全信息静态对策
最小得益最大化是一个保守的策略。 它不是利润最大化,是保证得到1而不会 损失10。 电力局选择建厂,也是得益最小最大化 策略。 如果港务局能确信电力局采取最小 得益最大化策略,港务局就会采用扩建的 策略。
完全信息静态对策
在著名的囚徒困境的矩 阵中,坦白对各囚徒来说 是上策,同时也是最小得 益最大化决策。坦白对各 囚徒是理性的,尽管对这 两个囚徒来说,理想的结 果是不坦白。
你有什么对策? 存在纳什均衡吗?
旅馆
超市
旅馆
-50, -80 900, 500
200, 800 60, 80
超市
企业1
案例分析
如果这两个经营者都是小心谨慎的决策者,都按 最小得益最大化行事,结果是什么?(60,80) 如果他们采取合作的态度 H S 结果又是什么? H -50, -80 900, 500 从这个合作中得到的 最大好处是多少?一方 S 200, 800 60, 80 要给另一方多大好处才 能说服另一方采取合作态度?
完全信息静态对策
如厂商A和B相互争夺领导 厂商 B 地位: 领导者 追随者 厂商A A考虑:不管B怎么决定, 争做领导都是最好。 领导者 220, 250 1000, 15 0 B考虑:也是同样的。 结论:两厂都争做领导者, 追随者 100, 950 800, 800 这是上策。
博弈论知识点总结完整版
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
高鸿业西方经济学-第10章博弈论初步dmqn.pptx
30
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
二、存在纯策略均衡时的混合策略均衡
求解混合策略纳什均衡的方法不仅适用于纯策略 纳什均衡不存在的情况,而且也适用于纯策略纳什均 衡存在的情况。在后面这种情况下,纯策略纳什均衡 将作为特例被包含在相应的混合策略纳什均衡之中。
2024年9月29日星期日
12
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第二,在甲厂商的支付矩阵中,找出每一列的最大者 (每列的最大者可能不只一个),并在其下划线
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
13
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
个厂商都不再有单独改变策略的倾向时,整个博弈就 达到了均衡,即博弈均衡。
博弈均衡是博弈各方最终选取的策略组合,是博 弈的最终结果,是博弈的解。
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
8
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
四、纳什均衡
2.纳什均衡的概念 第一,纳什均衡的概念
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
24
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
一、不存在纯策略均衡时的混合策略均衡
1.混合策略 第三,“混合”策略的概念
把甲厂商和乙厂商原来的策略叫做“纯”策略, 把赋予这些纯策略的概率向量叫做“混合”策略。
2024年9月29日星期日
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
23
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
博弈论中的纳什均衡-教案
博弈论中的纳什均衡-教案一、引言1.1博弈论的基本概念1.1.1博弈论的定义:博弈论是研究具有冲突和合作特点的决策制定过程。
1.1.2博弈论的应用:经济学、政治学、心理学等领域。
1.1.3博弈论的重要性:帮助理解竞争和合作中的决策行为。
1.1.4博弈论的局限性:假设理性人行为,实际中存在非理性行为。
1.2纳什均衡的提出1.2.2纳什均衡的意义:预测博弈结果,分析策略选择。
1.2.3纳什均衡的挑战:存在多个纳什均衡,选择合适的均衡。
1.2.4纳什均衡的应用:经济学、社会学、生物学等领域。
1.3教学目标和结构1.3.1教学目标:理解博弈论的基本概念,掌握纳什均衡的原理和应用。
1.3.3教学方法:讲授、案例分析、小组讨论。
1.3.4教学评估:课堂参与、案例分析报告、期末考试。
二、知识点讲解2.1博弈论的基本要素2.1.1参与者:博弈中的决策主体。
2.1.2策略:参与者可选择的行动方案。
2.1.3支付函数:参与者选择不同策略所得到的收益。
2.1.4结果:博弈的最终状态。
2.2纳什均衡的求解方法2.2.1纯策略纳什均衡:参与者选择确定的策略。
2.2.2混合策略纳什均衡:参与者以一定概率选择不同的策略。
2.2.3反复剔除劣势策略:通过剔除劣势策略找到纳什均衡。
2.2.4最佳响应动态:分析参与者对其他参与者策略的最佳响应。
2.3纳什均衡的应用实例2.3.1囚徒困境:两个囚犯选择合作或背叛的策略。
2.3.2鹰鸽博弈:参与者选择攻击或退让的策略。
2.3.3公地悲剧:多个参与者共享资源时的策略选择。
2.3.4供应链协调:供应商和零售商之间的策略选择。
三、教学内容3.1博弈论的基本模型3.1.1零和博弈:参与者的收益和损失相加为零。
3.1.2非零和博弈:参与者的收益和损失不相加为零。
3.1.3完美信息博弈:参与者了解其他参与者的策略和支付。
3.1.4不完美信息博弈:参与者不了解其他参与者的策略和支付。
3.2纳什均衡的性质和分类3.2.1稳定性:在纳什均衡下,参与者没有改变策略的动机。
博弈论简介
但并不是所有重复博弈都有事先确定的重复次数,也就是停止重复时间的, 有些重复博弈似乎是会不断重复下去的。我们称这样的重复博弈为“无限次重 复博弈”(Infinitely Repeated Games)
14
(六)博弈的信息结构
所谓信息,是指关于事物运动的状态和规律的表征,也是关
于事物运动的知识。 信息就是用符号、信号或消息所包含的内容,来消除对客观 事物认识的不确定性。它普遍存在于自然界、人类社会和人 的思维之中。 信息的概念是人类社会实践的深刻概括,并随着科学技术的 发展而不断发展。 这里,我们博弈中的信息,是指在博弈中博弈方对其他博弈
方的特征、战略空间及得益函数等的知识。
15
1.关于得益的信息
博弈中最重要的信息之一是关于得益的信息,即每个博弈方 在每种结果(策略组合)下的得益情况。在许多博弈问题中,各 个博弈方不仅对自己的得益情况完全清楚,而且对其他博弈方 的得益也都很清楚。如在囚徒的困境博弈中,因为两囚徒所处 的地位是相同的,而且警察把他们双方的处境给他们都交代清 楚了,因此两个博弈方都对双方在每种情况下的得益非常清楚。
11
2.动态博弈
除了各博弈方同时决策的静态博弈以外,也有大量现实决
策活动构成的博弈中,各博弈方的选择和行动不仅有先后次序,
而且后选择、后行动的博弈方在自己选择、行动之前,可以看 到其他博弈方的选择、行动,甚至还包括自己的选择和行动。
第04讲 博弈的基本框架 - 学生
1
·明确一个博弈的四大构成要素(完美信息、不完美信息)。 ·精确理解信息集与策略(纯策略、混合策略、浓缩策略)这 两个重要概念。
·能够用博弈的扩展式与规范式来描述一个博弈问题。
·了解划分博弈类型的基本方法:完全信息静态、完全信息动 态、不完全信息静态、不完全信息动态。
2
博弈论的基本框架
而象棋则是一个完美信息博弈。
17
信息集
定义 4.2.1 一个信息集 H 是以决策点为元素的集合。
信息集需满足以下两个条件:
(1) 同一个信息集中的所有决策点必须紧接着完全相同的 可选行动。 (2) 同一个信息集中的决策点不能出现一个先于另一个出 现的情况。
18
信息集判断
信息集判断
19
信息集
信息集设臵是正确的。 它表示甲无法判断自己处于信息集四个决策点中的哪一个。 一个博弈者如果总能记住她所经历过的所有博弈路径,我们称她 具有完美回忆(Perfect Recall)。 在图中,我们可以断定甲已经忘记了她自己以前采取的行动以及 其对手的反应,否则她不可能完全分不清四个决策点。 所以我们说在图中,甲没有完美回忆。
22
信息集判断
信息集判断
23
信息集
图中的信息集设臵也是错误的。 它不符合定义4.2.1中的条件(2)。
(2) 同一个信息集中的决策点不能出现一个先于另一个出现的情
况。 信息集只对应一个博弈者,甲乙两人的决策点在同一个信息集内 造成概念上的混乱。
24
信息集判断
信息集判断
25
信息集
在图中的信息集虽然都对应着乙,但它也违反了定义4.2.1中的 条件(2)。 (2) 同一个信息集中的决策点不能出现一个先于另一个出现的情 况。
市场分析博弈论与寡头市场分析
市场分析博弈论与寡头市场分析博弈论在市场分析中的应用寡头市场的政策分析博弈论的基本概念寡头市场的基本概念寡头市场的市场结构分析寡头市场的博弈分析博弈论的基本概念博弈论的定义l博弈论是一种研究策略性决策的数学理论。
l博弈论的基本概念包括参与者、策略、收益和均衡。
l博弈论研究参与者在特定情境下的策略选择和互动关系。
l博弈论的应用领域包括经济学、政治学、社会学等。
博弈论的基本要素参与者:博弈中的决策者,可以是个人、组织或国家策略:参与者在博弈中可选择的行动或方案收益:参与者在博弈中可能获得的结果或回报信息:参与者在博弈中掌握的关于其他参与者的策略和收益的信息规则:博弈进行的方式和条件,包括参与者的数量、策略和收益的设定等博弈论的应用领域l经济学:市场分析、寡头市场分析、拍卖理论等l政治学:国际关系、政治博弈、选举策略等l社会学:社会选择、社会福利、社会规范等l生物学:进化论、生态学、行为生物学等l计算机科学:人工智能、机器学习、多智能体等l心理学:决策心理学、行为经济学、社会心理学等博弈论在市场分析中的应用市场参与者的博弈行为博弈论的基本概念:策略、收益、均衡等市场参与者的博弈策略:合作、竞争、威胁等市场参与者的收益函数:利润、市场份额等市场参与者的均衡分析:纳什均衡、子博弈精炼等市场均衡与博弈策略添加标题添加标题添加标题添加标题囚徒困境:博弈论中的经典案例,揭示了合作与竞争的矛盾关系纳什均衡:博弈论中的核心概念,指参与者在策略选择上的稳定状态市场均衡:指市场在供求关系、价格等方面达到的稳定状态博弈策略:指参与者在博弈过程中采取的策略,包括合作、竞争、威胁等博弈论在市场预测中的应用添加标题添加标题添加标题添加标题囚徒困境:预测市场中的竞争与合作纳什均衡:预测市场中的均衡状态重复博弈:预测市场中的长期趋势信息不对称:预测市场中的信息传递与决策影响寡头市场的基本概念寡头市场的定义寡头市场是指由少数几家大型企业主导的市场。
博弈论基础 本讲要点博弈论的基本思想,博弈的构成要素,简单博弈的
博弈论基础本讲要点:博弈论的基本思想,博弈的构成要素,简单博弈的求解方法,纳什均衡的概念,博弈的分类,动态博弈与重复博弈,信息不对称,道德风险,逆向选择,信号传递。
重点:博弈论的基本思想,纳什均衡的概念,信息不对称。
难点:博弈的构成要素,纳什均衡的概念。
讲授时间:6学时一、博弈的基本要素1、博弈论与古典经济学的区别古典经济学的基本思路:给定约束条件,考虑行为主体的最优结果。
博弈论的基本思路:以行为主体之间的相互影响为前提,考虑行为主体的最优结果。
两者的根本区别:是否考虑对方的行为。
古典经济学中消费者行为理论:假定收入、商品价格以及效用函数给定,求最优消费组合。
消费者A不会考虑消费者B的影响。
古典经济学中的厂商理论:假定生产函数、成本函数、商品价格给定,求厂商的最优生产决策。
厂商A不会考虑厂商B的影响。
古典经济学中的宏观经济理论:假定一国的资源禀赋给定,考虑价格指数、利率等因素的变化对国民收入、就业等的影响。
国家A不会考虑国家B的影响。
博弈论:每个人要考虑别人的行为怎样影响自己的选择。
扑克牌游戏:一个人不可能只顾自己出牌,而不考虑别人怎么出牌。
下棋:无论中国象棋、国际象棋、围棋,一个人在走某一步之前,都要考虑对手是怎么走的,以及对手在我走了一步之后会怎么走,以及我又会在对手走了一步之后怎么走,以至无穷。
高手与俗手的区别也就在此。
高手往往能够考虑10步甚至20步以后的变化。
总之:你的输赢不仅取决于你的决策,而且取决于你对手的决策。
2、博弈论简史博弈论的思路在古诺(Cournot,Antoine Augustin,1801-1977)的双头垄断模型中最早提出,冯•诺伊曼(John von Neumann,1903-1957)和摩根斯坦恩(Oskar Margenstern, 1902-1977)在1944年出版了《博弈论与经济行为》(Theory of Games and EconomicBehavior)一书,最早提出了博弈论的概念。
博弈的构成要素
博弈(1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
(2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
(3)得失:一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。
(4)对于博弈参与者来说,存在着一博弈结果(5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。
在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。
所谓纳什均衡,它是一稳定的博弈结果。
纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的支付将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B 也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。
这一结果对局中人B 亦是如此。
这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。
博弈论知识点总结完整版
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
博弈论的基本要素
博弈论的基本要素
博弈论是研究各种决策情形下人们的行为和结果,并从中推断出
人们的行为规律和最优策略的一种数学理论。
博弈论不仅仅应用于经
济学领域,还被广泛运用于政治学、社会学、心理学、生物学等其他
领域。
博弈论的基本要素如下:
1. 博弈的参与者
博弈中的参与者可以是个人、团体、国家等等。
博弈论研究的是每个
参与者的决策和行动,以及相互之间的决策和行动的互动。
2. 博弈的规则
博弈中的规则包括参与者的行动、决策和结果等。
在博弈中,参与者
的决策和行动会影响到结果,结果反过来也会影响到参与者的决策和
行动。
3. 博弈的策略
博弈中的策略是指参与者针对不同的情况和目的所采取的行动和决策。
策略是参与者根据自身利益和对手行动的预期结果而确定的。
4. 博弈的收益
博弈中的收益指参与者针对不同的情况和目的所获得的利益或损失。
收益是参与者在决策和行动中所关注的重要因素。
5. 博弈的平衡
博弈中的平衡表示参与者在决策和行动中达成的一种状态,其中每个
参与者都采取最优策略,任何一方单方面的改变策略都无法获得更多
的收益。
总体而言,博弈论是通过推导各方当下的最优策略来解决博弈中
的问题,以实现各方的最大化利益,并在各方之间达成一种平衡状态。
一旦博弈中的各个要素都能够被充分了解和把握,那么就可以寻求最
优策略、制定适当的策略,并在不利局面下获得尽可能好的结果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图1-2 囚徒问题的支付矩阵
不坦白 (0, -10) (-1, -1)
坦白总是占优策略
占优均衡
囚
徒
坦白
1 不坦白
图1-2 囚徒问题的支付矩阵
囚徒2 坦白 (-8, -8) (-10, 0)
不坦白 (0, -10) (-1, -1)
占优均衡 由于矩阵的对称性,对囚徒2来说亦可得出类似结论
囚
坦白
博弈论对参与人做两个基本假设
1 理性的(rational)?
1—如果一个决策者在追逐其目标时能前后一致地做决策,就称他为rational。Roger B·Myerson (P2)
2—广义而言指的是一种行为方式,他同在给定条件或约束下最有效地实现预期目标相关。 具体地讲,理性含义如下:
博弈论对参与人做两个基本假设
博弈的策略式表述
常用G表示一个博弈 博弈模型的两种表示形式
❖ 策略式表述 (Strategic form), ❖ 扩展式表述(Extensive form) 本章主要介绍博弈的策略式表述
博弈的策略式表述
参与人集合 ❖ N人博弈的参与人集合,往往也记为N。参与人则记为i, i∈ N ❖ 参与人i的策略集,记为Si ,其中的一个特定策略,可记为si.有si ∈ Si.
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 机制设计 合作博弈
课程主要内容
完全信息静态博弈概念
概念:各参与人对彼此的策略集、支付函数有准确了解 博弈行为同时进行 一些实例
❖ 石头、剪子、布游戏 ❖ 彼此了解的两个厂商的价 ❖ 虽然决策不是在绝对时间意义上的“同时”, ❖ 但决策的时间先后差别跟博弈结果没有关系,也可看成是“同时进行的博弈”。 ❖ 如不同竞标单位作出的工程投标决策
博弈论的基本要素
通俗理解博弈论
博弈论是有关取舍策略的科学,它的方程式告诉你在与人接触中怎样得到最大的好处。 博弈论刚开始运用到经济领域,现在几乎在哪个科学领域都能看到它的身影,尤其是
那些涉及到人性与人的行为的科学。
博弈的基本要素
上述问题都有如下共同点 都有若干决策者,我们称之为参与人(players)
Consider a simple example of two allied armies situated on opposite hilltops waiting to attack their foe. Neither commander will attack unless he is sure that the other will attack at exactly the same time. The first commander sends a messenger to the other hilltop with the message "I plan to attack in the morning." The messenger's journey is perilous and he may die on the way to delivering the message.
博弈的策略式表述
❖ 对于给定的参与人i, i=1,2,…N, 卡氏积 S1×S2 … ×Si-1 × Si+1 …× Sn
❖ 表示除了参与人i外所有参与人所有策略的可能组合,通 常记为S-i; ❖ 于是所有参与人不同策略组合构成的策略空间可表示为 ❖ S=(Si , S-i)
博弈的策略式表述
❖ Si中的元素 si 表示参与人i的一个具体策略 ❖ 一旦确定了所有参与人的策略,便形成了一个博弈局势,表示为s=(s1, s2, … sN),
博弈的基本要素 参与人、各参与人的策略集、各参与人的支付函数,是博弈最重要的基本要素。
1:博弈的基本特征是一个参与人 的支付不仅取决于自己的策略选择,而且取决于所有其他参与人的策略选择;是策略组合的函 数。
2:效用是参与人真正关心的东西,参与人在博弈中的目标就是选择自己的策略以最大化 自己的效用函数。
博弈的策略式表述
❖ 实质上,图1-1已经完全表述了囚徒困境的策略式表述信息 ❖ 称图1-1为二人有限博弈的双矩阵 (bimatrix)表述
囚
坦白
徒
1
不坦白
囚徒2 坦白 (-8, -8) (-10, 0)
图1-1 囚徒问题的支付矩阵
不坦白 (0, -10) (-1, -1)
占优均衡
英文术语:Dominant-strategy Equilibrium 定义:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来
Definition of a Game
Must consider the strategic environment ➢ Who are the PLAYERS? ➢ What STRATEGIES are available? ➢ What are the PAYOFFS?
(Decision makers) (Feasible actions) (Objectives)
If he gets to the other hilltop and informs the other commander - can we be certain that both will attack in the morning? Note that both commanders now know the message, but the first cannot be sure that the second got the message. Thus, common knowledge implies not only that both know some piece of information, but can also be absolutely confident that the rest know it, and that the rest know that we know it, and so on.
❖ N-人博弈问题的决策者集合,习惯上也用N表示 ❖ 针对具体问题,参与人可以是
➢ 个人 ➢ 一个政府 ➢ 公司的整个董事会
对参与人的理解
博弈中的决策者。每个参与人的目标是选择一个期望最大化的策略, 要求博弈的决策主体具有行为选择能力,并且对博弈结果负责的能力,否则不是参与人。
众所周知的田忌赛马博弈,参与人是田忌和齐威王,孙膑仅仅是一个策略分析者。孙膑并 不是决策者,因而不是参与人. 虚拟参与人,又称为自然(nature)。自然在博弈的一些特定点按照给定的概率随机选择 行动。 虚拟参与人与正常的参与人之间在概念上的差异是:参与人有预先设定的效用函数,而虚 拟的参与人对于给定的结局,不存在任何效用感受。
博弈概念的理解
OPEC成员国选择其年产量; 两家制造商,一家做螺钉,一一家做螺帽,决定是采用美制标准还是公制标准; 公司董事会为其总经理设立一项期股安排; 一家电力公司在估计了未来10年对电力的需求后,决定是否购置一套新的发电机组; 明天出去玩,决定是否带伞; 诸葛亮和司马懿进行的空城计;
占优均衡 占优战略均衡:每个参与人的占优战略组合(如果存在的话)被称为占优战略均衡。
囚
坦白
徒
1
不坦白
囚徒2 坦白 (-8, -8) (-10, 0)
图1-2 囚徒问题的支付矩阵
不坦白 (0, -10) (-1, -1)
占优均衡 以囚徒1为例,无论囚徒2采取什么策略…
囚
坦白
徒
1
不坦白
囚徒2 坦白 (-8, -8) (-10, 0)
Rules of the game ➢ What is the time-frame for decisions? ➢ What is the nature of the conflict? ➢ What is the nature of interaction? ➢ What information is available?
博弈的基本要素
参与人都存在若干策略(strategies)或行动(actions) ❖ 参与人i的策略用si表示,参与人i的所有策略构成的集合称为策略集,记为Si , si∈ Si ❖ 注意行动与策略的区别
博弈的基本要素
支付(收益、效用)(payoff) ❖ 各参与人对所有参与人不同策略组合(strategy profile),构成了博弈的一个局势。 记为 s ❖ 参与人 i (i∈N)对局势s 有一个主观的偏好,可用一个函数表示这种偏好,这个 偏好函数称为参与人 i 的支付
共同知识趣题
有一群人围坐在一起,假定只有4个人,每人头上带着戴着一顶帽子,颜色为黑色和白色, 每个人看不到自己头上帽子的颜色,但能看到别人帽子的颜色. 为了分析的方便,我们 假定这四个人均戴的是黑色帽子。这时候,一个局外人来到他们集体当中,对他们说: “你们其中至少一个头戴的是黑色帽子。”当他说完这句话后,他问:“你们知道你 们头上的帽子颜色吗?”4个人都说不知道。这个局外人第二次问道:“你们知道你们 头上帽子的颜色吗?”4个人又都说不知道。局外人第三次问:“你们知道你们头上帽 子的颜色吗?”4个人又说不知道。局外人第四次问道:“你们知道你们头上帽子的颜 色吗?”这时4个人均说知道了。 你能知道这是为什么吗?
的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格 占优策略或占优策略。
占优策略 对于所有的s-i, si*称为参与人i的严格占优战略,如果满足: ui(si*,s-i)>ui(si',s-i) s-i, si' si*
占优均衡
占优均衡定义 ❖ 一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则 称该策略组合为该博弈的一个占优均衡。
s∈S。
博弈的策略式表述