博弈论1

合集下载

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论（Game Theory)，它是现代数学的一个新分支，也是运筹学的一个重要组成内容。

在《博弈圣经》中写到：博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法，博弈论就是研究互动决策的理论。

所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策，选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛，在经济学、政治科学（国内的以及国际的）、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外，它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法，标准的博弈论分析出发点是理性的，而不是心理的或社会的角度。

不过，近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。

1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。

博弈论第一章

1完整信息静态博弈1.0 对策论研究的内容与根本形式对策论研究的内容对策论研究多个行为主体的决议问题。

对策论研究的形式博弈 (game)，由多个行为主体组成的系统。

例Stackelberg modelCournot model博弈的种类参加者行动的时间与次序同时行动——静态博弈；先后行动——动向博弈。

参加者的信息多少信息同样——完整信息；信息不一样——不完整信息。

1.1 根本理论 : 博弈的标准式和纳什平衡例 1少儿游戏：“石头、剪刀、布〞。

博弈的准式表示(normal-form representation)(1) 参加人( player).n个参加人： 1, 2, ⋯, i, ⋯, n.(2)略 (strategy).一个参加人的略是他采纳的一个行。

参加人 i 的略： s i.参加人 i 的略空 : S i .略的一个合 : s ={s1，s2, ⋯, s n}.化表示： s-i ={ s1，⋯, s i -1， s i+1, ⋯ , s n }.(3)利润 (payoff).参加人i 的利润： u i= u i(s1，s2, ⋯, s n)n 个参加人博弈的准形式表示:G = {S1, S2,⋯S,n；u1, u2,⋯u,n}完整信息 (complete information) ：每个参加人知道其余人的略空和利润。

静博弈(static game)：全部的参加人同行。

每一个人行，不知道其余人的行。

例 1〔〕：博弈 {石、剪刀、布 } 的描绘：参加人：1，2。

略空：S1 = S2 = {石、剪刀、布 }利润：两人出手的函数u1 (石，石 ) = 0， u1 (石，剪刀 ) = 1， u1 (石，布 ) = -1⋯u2 (石，石 ) = 0， u2 (石，剪刀 ) = -1，u2 (石，布 ) = 1⋯⋯利润表：两个参加人，有限个略的博弈的表示方法。

P2石头剪刀布石头0 ， 01，-1-1 ，1P剪刀-1，10 ， 0 1 ，-11布 1 ，-1-1，10 ， 0博弈的：可否知道每个参加人的略？例 2: 囚犯窘境 (The Prisoner ’s Dilemma)囚犯2缄默招认缄默-1 ，-1-9 ，0囚犯1招认0 ，-9-6 ，-6囚犯 1 的考：无方缄默是招，自己“招〞好于“缄默〞。

博弈论公式(一)

博弈论公式(一)博弈论公式1. 最小最大定理（Minimax Theorem）最小最大定理是博弈论中的重要定理之一，用于描述两个参与者在零和博弈中的最佳策略选择。

公式：[minimax theorem formula](在公式中，a和b是参与者的策略选择，F(a, b)是参与者根据自己的策略选择所获得的收益。

例子：假设有两名囚犯A和B，他们被起诉犯有共同的罪行。

检察官为了尽可能追求公正，提供了以下交易：•如果A和B都选择保持沉默，则每人判刑1年。

•如果A和B都选择揭发对方，则每人判刑3年。

•如果A揭发B而B选择保持沉默，则A不被判刑而B被判刑6年。

•如果B揭发A而A选择保持沉默，则B不被判刑而A被判刑6年。

根据最小最大定理，囚犯A和B都会选择揭发对方，因为即使对方也选择揭发自己，判刑3年的收益仍然比判刑6年的收益更高。

2. 纳什均衡（Nash Equilibrium）纳什均衡是博弈论中的概念，用于描述参与者选择最优策略时的平衡状态。

公式：[nash equilibrium formula](在公式中，A是参与者的策略集合，a是参与者的策略选择，u是参与者的效用函数，i表示参与者的编号。

例子：考虑一个两人博弈，参与者A和B可以选择合作（C）或背叛（D），他们的效用函数如下：•A选择合作（C）且B选择合作（C）：A的效用=3，B的效用=3。

•A选择合作（C）且B选择背叛（D）：A的效用=0，B的效用=5。

•A选择背叛（D）且B选择合作（C）：A的效用=5，B的效用=0。

•A选择背叛（D）且B选择背叛（D）：A的效用=1，B的效用=1。

在这种情况下，合作（C）和背叛（D）是纳什均衡，因为任何一名参与者如果改变自己的策略选择，都无法获得更高的效用。

3. 马赛克文件公式（Blurred File Formula）马赛克文件公式是博弈论中用于保护数据隐私的方法之一，通过模糊化数据来限制敏感信息的泄露。

公式：[blurred file formula](在公式中，F是原始文件，K是用于模糊化的密钥，⊕表示按位异或运算。

博弈论百度百科

博弈论百度百科博弈论是一门研究决策制定和决策结果的学科，它是应用数学的一个分支，通过运用数学和逻辑工具，探讨参与者在互动决策中的最佳策略选择。

在博弈论中，参与者被称为玩家，他们根据自身利益和目标来做出决策。

博弈论适用于各种不同领域的情境，包括经济学、政治学、生物学等。

一、概述博弈论的研究对象是策略性互动。

在一个博弈中，每个玩家都会依据一定的策略选择进行行动，而这个选择可能会受到其他玩家的影响。

博弈论试图理解和分析在这种互动中，参与者如何做出决策，并找到最优的解决方案。

博弈论的核心概念是博弈，一个博弈可以用一个四元组表示：(N, A, U, F)，其中：- N表示参与博弈的玩家集合；- A表示每个玩家可选的行动集合；- U表示每个玩家的效用函数，用于衡量不同结果对该玩家的好坏程度；- F表示每个玩家的信息集合。

信息集合是指每个玩家在博弈过程中所了解的信息。

二、博弈论的重要概念1. 纳什均衡纳什均衡是博弈论中最重要的概念之一，指的是在一个博弈中，所有玩家选择的策略组合，使得任何玩家都没有动机单方面改变自己的策略。

纳什均衡是一个稳定状态，玩家之间不再有改变策略的动机。

2. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。

零和博弈是指参与博弈的玩家的收益之和为零，即一方获利必然导致另一方的损失。

非零和博弈是指参与博弈的玩家的收益之和不为零，即可以存在多方共同受益的情况。

3. 微观博弈与宏观博弈微观博弈是指研究个体玩家之间的策略性互动，关注的是个体决策的结果。

宏观博弈是指研究整体群体之间的策略性互动，关注的是全局结果。

三、应用领域博弈论的研究在众多领域中都具有广泛的应用。

以下是博弈论在一些领域的应用举例：1. 经济学博弈论在经济学领域中有着广泛的应用。

它可以用来研究市场竞争、合作与冲突、价格形成等经济问题。

例如，博弈论可以用来分析竞争市场中的价格战和垄断市场中的价格定价策略。

2. 政治学博弈论在政治学领域中也有着重要的应用。

博弈论-第一章

二、博弈的基本式
如何将博弈表示成一种便于研究和分析的形式显然是很重要的。如果用参与者、策略和收益函数来（科学）描述一个博弈，就称为博弈表达的基本式。
三、博弈的扩展式
博弈的扩展式就是非常详细地描绘出一个博弈的参与者、策略、行动顺序以及行动时拥有的信息、可能的结果和收益等细节就称为博弈的扩展式。
四、信息和顺序
完全信息和非完全信息，完全和非完全判断的标准就是如果有些信息只有一部分参与者知道，并不是所有的信息都是公共信息，那么博弈就是非完全信息博弈。
静态博弈和动态博弈，静态和动态的区别并不在于时间上是否同时，而是在信息上的一种同时行动。
公共知识与一般信息的区别。
定义1.2 博弈论是专门研究博弈如何出现均衡的规律的学科。
正是由于博弈论将博弈如何出现均衡列为核心，因而博弈论对于各门社会科学而言，就具有了方法论意义，成为各门学科的有力分析工具。
第二节博弈论的经济学渊源
博弈论与经济学存在着不解之缘，主要是由于下面几个方面：（1）博弈论的核心问题是经济学最早提出并加以系统研究的。（2）博弈论理论发展主要是经济学的需要推动的，也主要是由经济学家加以发展。（3）博弈论中的主要问题基本上都涉及到经济利益冲突问题。
定义1.1 博弈是指利益存在冲突的决策主体（个人，企业，集团，政党，国家等等）在相互对抗（或合作）中，对抗双方（或多方）相互依存的一系列策略和行动的过程集合。
在定义1.1中，我们最需要注意的就是策略的相互依存性。对于策略的相互依存性，传统的经济学不是不想研究，而是缺乏有效的工具。从这个意义上而言，博弈论正是为了解决这一问题而产生的。也是从这个意义上讲，我们有了博弈论的定义。
• • • •

博弈论(第一、二章)

游戏2：摘柿子
甲跑
摇跑
乙
摇跑
甲
摇
乙跑
摇跑
甲
不跑（2,2）
（0,0）
（0,1）（2,0）
（0,3）（4,0）
游戏3：免费彩票博弈
每个人可以免费购买任意数量彩票，随机抽取1张彩票中奖，奖金总额为1000万元/n，n 为彩票数量。
博弈论：研究理性人行为选择的理论
博弈论作用：帮助个人、组织等决策主体深刻理解策略并明智的选择行动。
第二章完全信息静态博弈
� 基本分析思路和方法 � 纳什均衡 � 混合策略 � 纳什均衡的选择
第一节基本分析思路和方法
行动或策略（acቤተ መጻሕፍቲ ባይዱion or strategy）
si：局中人i的一个特定策略 Si：局中人i的策略集（strategy set）或策略空间（strategy space），可以是离散的或连续的。
纳什的基本贡献是证明了非合作博弈均衡解及其存在性，建立了作为博弈论基础的“纳什均衡”概念；海萨尼则把不完全信息纳入到博弈论方法体系中；泽尔腾的贡献在于将博弈论由静态向动态的扩展，建立了“子博弈精练纳什均衡”的概念。
1996莫里斯（James A.Mirrlees）和维克瑞（William Vickrey）
游戏1：军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
C -1 +1 +1
游戏1：军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1

经济博弈论1

三、多人博弈

三个博弈方之间的博弈可能存在“破坏者”：其策略选择对自身的利益并没有影响，但却会对其他博弈方的利益产生很大的，有时甚至是决定性的影响。申办奥运会是典型例子。（竞选等。破坏者、
合作者——共谋）

多人博弈的表示有时与两人博弈不同，需要多个得益矩阵，或者只能用描述法
多个厂商（3厂商）采用新技术与老技术的博弈
“囚徒困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现整体、个体利益共同的最优。简单地说， “囚徒困境”问题都是个体理性和集体理性的矛盾引起的。
现实中“囚徒困境”类型的问题是很多的。例如厂商之间的价格大战、恶性的广告竞争、初等和中等教育中的应试教育、乱砍林木、生育、排污等，其实都是 “囚徒困境”博弈的表现形式。
1.3.2 博弈中的策略
策略：博弈中各博弈方的选择内容（每个博弈方的可选策略不一定完全相同，即不一定对称）策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同，而且可选策略数量也可不同有限博弈：每个博弈方的策略数都是有限的无限博弈：至少有某些博弈方的策略有无限多个（如连续产量的确定）
这是对称的零和博弈
其他几个典型的博弈问题
1、智猪博弈（Boxed Pigs）
猪圈里圈两头猪，一头大猪，一头小猪。猪圈的一边有一个猪食槽，另一边安装一个按钮，控制着猪食的供应。按一下按钮会有10个单位的猪食进槽，但谁按按钮谁就需要付2个单位的成本。若大猪先到，大猪吃到9个单位，小猪只能吃1个单位；若同时到，大猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃6个单位，小猪吃4个单位。最后结果如何呢？小猪按等按大猪等

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中，每个囚徒都有两种可选择的策略：坦白或抵赖。显然不论同伙选择什么策略，每个囚徒的最优策略是 “坦白”。如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。
在一个博弈里，如果所有参与人都有占优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人选择劣策略。所以在“囚徒困境”博弈里，“坦白、坦白”是占优策略均衡。
第五章博弈
第一节博弈论的基本概念与应用
一、博弈论的定义博弈论，英文为Game theory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈。博弈论研究的是存在相互外部效应条件下的主体的决策问题。
在寡头垄断的市场上，只有少数几家厂商在相互竞争，寡头们面对的市场环境或者说竞争对手的行为将随着他们本身的决策行为而变动，即寡头们的决策是相互作用的，每个企业的得益和利润不仅取决于自身的决策，也取决于其他厂商的决策。寡头厂商之间可能有激烈的竞争，这些竞争涉及价格、产量、广告、投资等许多方面的决策，在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略相互作用纳入到经济模型中，这就是一种博弈分析。
1．从行动的先后次序来划分，博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中，参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取了什么具体行动；动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。
2．从参与人对其他参与人的各种特征信息的获得差异来划分，博弈可分为完全信息博弈和不完全信息博弈。完全信息博弈指的是每一个参与人对所有其他参与人的特征，如策略集合及得益函数都有准确完备的知识；否则就是不完全信息博弈。

微观经济学第11章博弈论1

4.3 博弈论的成长和发展
一、第一个研究高潮，本世纪40年代末和50年代初

1950年纳什提出“纳什均衡”（Nash equilibrium）概念和证明纳什定理，发展非合作博弈的基础理论。 1950年Melvin Dresher和Merrill Flood在兰德公司（美国空军）“囚徒的困境”（Prison’s dilemma）博弈实验，（Howard Raiffa）独立进行这个博弈实验； 1952-1953年期间（L. S. Shapley）和（D. B. Gillies）提出“核”（Core）作为合作博弈的一般解概念 Shapley提出了合作博弈的“Shapley值”（Shapley value）概念等。奥曼（R. J. Aumann）“40年代末50年代初是博弈论历史上令人振奋的时期，原理已经破茧而出，正在试飞它们的双翅，活跃着一批巨人。”
1
运输路线得益矩阵
单人博弈实质个体最优化问题
-7000
-10000 -16000
运输路线扩展形
-10000
二、两人博弈

两人博弈即有两个博弈方的博弈两人博弈最常见，研究最多，是最基本和有用的博弈类型囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈两人博弈有多种可能性，博弈方的利益方向可能一致，也可以不一致
政府组织协调的必要性和重要性
寡头1：低价(70) 寡头2：低价(70)
2.2 赌胜博弈

赌博、竞技等构成的博弈问题，在经济中也有许多应用，赌胜博弈也是一类重要的博弈问题，对经济竞争和合作也有很大启示赌胜博弈的特点是一方得等于另一方失，不可能双赢，属于“零和博弈”

博弈论习题1

1、一逃犯从关押他的监狱中逃走，一看守奉命追捕。

如果逃
犯逃跑有两条可选择的路线，看守只要追捕方向正确就一定能抓住逃犯。

逃犯逃脱可少坐10年牢，但一旦被抓住则要
加刑10年；看守抓住逃犯能得1000元奖金。

请用得益矩阵表示该博弈。

2、你正在考虑是否投资100万元开设一家饭店。

假设情况是
这样的：你决定开，则0.35的概率你将收益300万元（包
括投资），而0.65的概率你将全部亏损掉；如果你不开，
则你能保住本钱但也不会有利润。

请你：
（1）用得益矩阵表示该博弈。

（2）如果你是风险中性者，你会怎样选择？
（3）如果你是风险规避者，且期望得益的折扣系数为0.9，你的策略选择是什么？
3、假设长虹和创维这两家彩电生产商都可以选择集中力量研
发生产低档产品或高档产品，但他们在选择时都不知道对方的选择。

假设他们在不同选择下的收益矩阵如下图所示。

请问：该博弈的均衡是什么？。

博弈论(一)

◆博弈论（game theory)是由美国数学家冯·诺依曼(Von. Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科，它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。

1994年，三位博弈论专家即数学家纳什(Nash，他的故事被好莱坞拍成电影《美丽心灵》，该影片获得了2002年奥斯卡金像奖的四项大奖)、经济学家海萨尼（Harsanyi）和泽尔滕（Selten）因在博弈论及其在经济学中的应用研究上所作出的巨大贡献而获得诺贝尔经济学奖。

◆1996年，两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。

2005年诺贝尔经济学奖由拥有以色列和美国双重国籍的经济学家罗伯特·奥曼和美国经济学家托马斯·谢林分享，两位经济学家获得诺贝尔经济学奖是因为“他们通过对博弈论的分析加深了我们对冲突与合作的理解” （瑞典皇家科学院评语）。

◆为什么博弈论在经济学领域会产生如此大的影响呢？这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象，并指导更加有效的经济政策制订。

一、什么是博弈论：从“囚徒困境”谈起1. 囚徒困境两个小偷甲和乙联手作案，私入民宅被警方逮住但未获证据。

警方将两人分别臵于两间房间分开审讯，政策是若一人坦白但另一人抵赖，则坦白者立即被释放，抵赖者判入狱10年；若二人都坦白则两人各判刑8年；若两人都不坦白则未获证据但因私入民宅各拘留1年。

表1 囚徒困境博弈乙坦白抵赖坦白甲抵赖（问题：甲、乙如何选择？）☐囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。

博弈论初步(1)

【例题１．１．１】出硬币博弈———硬币配对游戏
解甲、乙两人各拿一枚１元硬币，背靠背各自将硬币正面（１元币值面）或反向（菊花图案面）朝上置于手掌心中握紧。

然后，转身面对面，同时展开手掌。

游戏规则是，如果两人掌上硬币都是正面朝上或都是反面朝上，那么甲就赢了乙１元钱，或者说乙输给了甲１元钱；如果两人掌上硬币是一正一反，那么乙就赢了甲１元钱，或者说甲输给了乙１元钱。

【例题１．１．２】价格竞争博弈
解企业Ａ与企业Ｂ生产同一种商品在市场上形成双寡头垄断市场，它们对商品都可以选择三种价格（高价、中价或低价）投放市场。

市场规则：不管哪个企业开出较低价格，它就可以得整个市场；如果两个企业开价相同，它们将平分市场。

这里进一步给出企业Ａ，Ｂ选择不同价格获得的收益情况：企业Ａ选择“中价”，企业Ｂ选择“高价”，这时企业Ａ独占市场收益１０万元；企业Ａ选择“低价”，而企业Ｂ选择“高价”或“中价”，这时企业Ａ仍独占市场，但因定出“低价”，因此收益为８万元。

当企业Ｂ选择较低价格，情况类同。

当企业Ａ，Ｂ同时都选择“高价”，这时它们平分市场，各自收益为６万元；同时都选择“中价”，各自收益为５万元；同时都选择“低价”，各自收益为４万元。

博弈论(第一章)

博弈的表述方法的例题
例：囚徒困境博弈的集合表示：G=（（坦白，不坦白），（坦白，不坦白）；（-5，-5），（0，-8），（-8， 0），（-1，-1））例：在两个公司竞争出售同一产品的博弈中，两个公司是两个博弈方，两个公司的各自销售量q1，q2是策略空间，
两个公司的所获利润u1（q1，q2），u2（q1，q2）是得
①用损益矩阵表示例1：故事齐威王与大将田忌赛马，赛马的规则是这样的，每次双方各出三匹马，一对一比赛三场，每一场的输方要赔1000斤铜给赢方，齐威王的三匹马和田忌的三匹马按实力都可以分为上，中，下三等，但齐威王的上，中，下三匹马分别比田忌的上，中，下三匹马略胜一筹，由于总是同等次的马进行比赛，因此田忌都是连输三场。实际上，田忌的上马尽管不如齐威王的上马，却比齐威王的中马和下马要好，而田忌的中马比齐威王的下马要好一些。因此，田忌的谋士孙膑为田忌出了个主意，用自己的下马对齐威王的上马，上马对齐威王的中马，中马对齐威王的下马。这样，二胜一负，田忌反而能赢齐威王1000斤铜，试写出其标准式表述。
你能否写出上述问题的矩阵形式？
（3）囚徒困境的应用
③ 假定你是一个公司的采购人员，考虑向两家供应商采购100万只零件，每只零件的成本为6元。如果你分别向两家供应商各订购50万只，则每个供应商就会把价格定在10元。你可以设计一个采购策略，以便在两家供应商之间制造出囚徒困境的情形，从而给自己带来好处。如何取定这样的采购政策，并写出其矩阵的表达形式。同时，考虑你的采购策略的使用条件是什么？
低价
80， 80 100， 20
20， 100 50， 50
（3）囚徒困境的应用
② 公共产品的供给也可以看作是一个囚徒困境问题，如果大家都出钱兴办公用事业，所有的人福利都会增加。问题是，如果我出钱你不出钱，我得不偿失，而如果你出钱我不出钱，我可以占你的便宜。所以每个人的最优选择都是“不出钱”，但是这种状态使得所有人的福利得不到提高。

博弈论第一章

招认囚徒１沉默
囚徒２招认沉默 –5, -5 0, -8 -8, 0 -1 , -1
囚徒的困境
策略“沉默”严格劣于策略“招认”
博弈分析的目的：预测博弈的均衡结果，即给定每个参与人都是理性的是共同知识，什么是每个参与人的最优策略？什么是所有参与人的最优策略组合？
*肯定性（sure-thing）或替代性（substitution）公理：一个决策者在事件Ａ发生的偏好选项１胜于选项２，并且在事件Ａ不发生时也偏好选项１胜于选项２，那么就有，他在知道事件Ａ无论是发生还是不发生之前都应该偏好选项１胜于选项２。
Chapter 1 完全信息静态博弈 Static Games of Complete Information In this chapter we consider games of the following simple form: first, the players simultaneously choose actions; then, the players receive payoffs that depend on the combination of actions just chosen. Within the class of such static (or simultaneous-move) games,we restrict attention to games of complete information. That
招认
囚徒２招认沉默 –5, -5 0, -8
-8, 0 -1 , -1
囚徒１
沉默
囚徒的困境
We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game; (2)the strategies available to each player; (3)the payoff received by each player for each combination of strategies that could be chosen by the players.

MBA必修课程《博弈论》第一部分：典型案例及导论

弱者是如何胜出的？
Page 8
他就是枪手丙。是的，没错，他的枪法最差，怎么说也轮不到他胜利呀。但事实是，如果没有出现重大意外或者奇迹，这场对决中只有枪手丙能够活下来。
甲：向乙开枪100% 乙：向甲开枪80% 丙：向甲开枪60% 结局死的概率：
甲： 80%*40%+60%*20%+80%*60%=32+12+48=92%
乔治·阿克尔洛夫
乔治·阿克尔洛夫 (1940-)美国人，他对市场的不对称信息研究具有里程碑意义.引入信息经济学研究中的一个著名模型是“柠檬市场”（注：“柠檬”一词在美国俚语中表示“次品”或“不中用的东西”），主要用来描述当产品的卖方对产品质量比买方有更多的信息时，低质量产品将会驱逐高质量商品，从而使市场上的产品质量持续下降的情形.阿克尔洛夫的理论被广泛运用于一些完全不同的领域，如健康保险、金融市场和雇佣合同等.获得2001年诺贝尔经济奖.
2001诺贝尔经济奖
Page 21
2001年，三位经济学家阿克洛夫(G.A.Akerlof )、斯蒂格利茨 (J.E.Stiglitz)和斯彭斯(A.M.Spence)因运用博弈论研究信息经济学所取得的成就而成为这个年度的诺贝尔经济学奖得主.
迈克尔·斯彭斯
迈克尔·斯彭斯 (1948-)美国人，他认为，假如雇主不能区分高能力和低能力的劳动能力之间的区别，那么就会导致劳动力市场以低工资雇用低能力者，形成劳动力市场上“劣币驱逐良币”的现象.斯彭斯还发现一个现象，即高能力的男性预期获得比同等能力的妇女更高的学历.在这种均衡下，在男女之间的教育回报由于教育方面投资的不同而不同.另外，斯彭斯信号发送模型还对博弈论产生了深远的影响，他的专业竞争下的市场均衡模型已经影响到其他领域，比如增长理论和国际贸易.获得2001年诺贝尔经济奖.

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论
博弈论是研究两人或多人之间竞争合作关系的科学，使用严谨的数学模型来解决冲突问题。

冯诺依曼博弈论的创立者和现代计算机科学的奠基人。

同时决策或者同时行动或者局中人在决策时还不知道对手的决策是什么的叫做静态博弈。

决策或行动有先后次序的叫做动态博弈。

完全信息博弈：各种对局情况下每个局中人的得益多少，是所有局中人都清楚的。

完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈，一个比一个难，一个比一个精彩。

价格大战-----低价加低价，双方合作实行比较高的价格，获得双赢。

囚徒困境-----坦白加坦白
非合作博弈：处于相同困境状态下，不同的人面对同样的几种选择，最后必将背叛其他人，做出最利于自己的选择。

零和博弈：博弈者有输有赢，但是整个博弈的总成绩永远是零。

每个人都无限制的追求自身利益的最大化，从而毁灭将成为大家不能逃脱的命运。

比如人口爆炸，污染，过度捕捞，过度放牧。

哈丁公用地悲剧：所以有必要限制个人做出这些选择的自由，接受一致赞成的某种共同约束。

在非零和世界里，不要嫉妒，不要首先背叛，不要耍小聪明。

纳什均衡：（每个博弈方的策略都是针对其他博弈方策略的最佳策略。

）当其他人不改变策略时，他此时的策略是最好的。

如果他单独改变策略，他的收益将会降低。

在纳什均衡点上，理性参与者都没有单独改变策略的冲动。

纳什均衡不一定是博弈的最优结果，纳什均衡是博弈的最稳定结果。

纳什均衡并不能对所有的结果做出准确预测，因为有些博弈没有纳什均衡，还有些博弈有多重纳什均衡，还存在博弈方理性、能力等与假设不符合的情况。

纳什均衡具有一致预测性，如果所有的博弈方都预测一个特定的博弈结果会出现，那么每个博弈方都不会利用这个预测选择与之不同的策略，因此这个策略最终会成为真正的博弈结果。

纳什均衡是稳定的自我强制的，一致预测性决定了纳什均衡的价值—真正可预测。

杂货铺定位：两家都在中间
在博弈中纳什均衡点如果有两个或两个以上，结果就很难预料。

如情侣博弈。

任何非纳什均衡的结局要成为协定都需要外在强制力（道德法律）的帮
助，否则有的局中人将会有动机背叛协定，
强纳什均衡或者严格纳什均衡是指每个局中人对于对手的策略有唯一的最佳反应。

对称博弈：如果把博弈双方的位置对调，双方的支付数字都没有变化。

囚徒困境
严格优势策略：不论对方采取什么策略，我采取这个策略总比采取其他任何策略都好，而且要确实显示出其优势。

普通劣势策略消去法
普通纳什均衡指在均衡状态下单独改变策略不会有好处，但也不一定有坏处。

严格纳什均衡指在均衡状态下单独改变策略会有坏处。

帕累托效率：经济的效率体现在配置社会资源以改善人们的境况，主要看资源是否已被充分利用。

如果资源已经被充分利用，要想改善任何人就必须损害他人，就说一个经济实现了帕累托效率，否则不能说已经达到帕累托效率。

择优去劣，获得最佳行动策略，并且知道你的对手也将如此。

笼中猪
在你没有优势策略时，你要做的就是一步一步剔除所有劣势策略不予考虑。

不做任何策略：走为上。

后动优势：如果你已经领先，并获得后动优势，你就该跟你的对手做一样的决策。

在决策之前要做成本计算，得大于失才值得做。

皮诺斯的胜利指代价惨重，得不偿失的胜利。

焦土政策：战争时，一方撤退时把本方的建筑设施，资源等自行毁灭，不给对方留下任何有价值的东西。

这一方面显示自己不妥协的立场，同时增大对手的成本。

为达到己方利益，同时为不使对方破釜沉舟，拼死一战，使己方皮诺斯式胜利，博弈者应该考虑给对方一个台阶，一条生路。

悖论即自相矛盾，如果承认这个说法正确就能推出这个说法不正确；如果承认这个说法不正确就能推出这个说法正确。

我们的知识体系，我们对这个世界的认识也许并不是建立在一个唯一正确的基础上，而在这个基础上建立起来的认知世界的方式，既是一条道路，也是一个囚笼。

问题是，没有人可以离开惯常的知识结构，只要他活着，就必须找几条安身立命为人处世的原则和方法，而你自己，也就被这些原则和方法规定起来。

荷兰赌即大弃赌，丈夫赌下雨，不下雨就给智者200，下雨智者就给他
100。

妻子赌不下雨，同样。

这样算来，夫妻俩必输，智者一定能得到100。

由于赌场规则的特殊设计，如果把所有赌客当做一个群体，赌客与赌场之间的赌博就是一个大弃赌。

彩票利用群众以小博大的心理获利。

赌场彩票都是有科学做支撑的，理性的人不会为了金钱从事赌博行为。

理性的博弈思维从以下四个方面进行：1增强自己的分析力，做出正确的策略。

2进行信息战，知彼的同时让对方知道的错误或正确的信息，让对方做错误的决策。

声东击西，空城计，苦肉计。

3弱化对方的理性判断力，美人计。

4避免做出错误的决策，无法对抗时走为上。

使对方失去理性判断：1示弱，不会威胁对方2臣服，实力即使想当也会忠于对方。

在获得利益时人们愿意承担某些风险，但要付出代价时，人们倾向于回避风险。

在选择时，人们对较小的数额似乎觉得冒险的意义或者随机取胜的可能性较大，于是甘愿冒险。

目光短浅吃大亏，不要忘记自己的最终目的。

生活中人的行为不完全是理性的，博弈思维不总是有效的。

在多人博弈中，常会出现出人意料的事，一方能否获胜，不仅取决于他的实力，更取决于实力对比造成的复杂关系。

三个火枪手，三国争霸社会体制在很大程度上是鉴别人的能力的体制。

市场机制能鉴别哪个厂商生产的产品更便宜，质量更好，即检验商品的机制。

但制度有人操作，人就能超越它，行贿受贿就是官场的作弊，因此分辨人能力的制度建立是管理者的任务。

制度一方面要能真正鉴别能力，一方面要杜绝作弊。

阿罗的不可能定理：完全民主的事实是不可能的。

投票不能完全民主，由于排名内部的模棱两可，候选人可以有极大的操纵空间，通过不表达自己的真实意愿扭曲选举结果。

霍布森选择是无可选择的选择，在小空间选择让人们在伪选的过程中自我陶醉而丧失创新的动机和动力。

配置资源的半径越大，企业越有优势。

布理丹的驴子是面对不相上下的两个选择的选择，重要的不是怎么选，而是要做出选择。

选好与我们重复博弈的人，爱人和朋友。

如果要彻底改头换面最重要的就是离开从前与自己重复博弈的那群朋友，发展新的健康的朋友圈。

如果不管其他博弈方选择什么策略，一博弈方的某一策略的得益高于或至少不低于其他策略，我们就叫这一策略为该博弈方的上策。

如果一个博弈的某个策略组合中的所有策略都是各个博弈方的上策，这个组合就叫做上策均衡。

所有的上策均衡都是纳什均衡，但纳什均衡不一定是上策均衡。

分析一个博弈时先看是否有上策均衡，如果没有再寻找纳什均
衡。

上策均衡有局限性，于是有了适应性更大的严格下策反复消去法。

通过对可选策略的相互比较把较差的策略排除掉从而筛选出较好的策略，或至少缩小可选策略的范围。

只要各博弈方剩余策略中还有严格下策就可以继续消去，直到没有严格下策为止。

（消去相对的严格下策，如上是相对于下的严格下策）
消去法也有局限性，需要一个适用性更广的方法。

通过在一个博弈方针对另一个博弈方的每个策略的最佳策略下划线的方法来分析博弈的方法叫做划线法。

当一个组合中的每个策略下都划了线即博弈各方都同意时，这就是该博弈的结果。

还有一种与划线法思路不同但是效果相同的方法—箭头法。

对博弈中的每个策略组合进行分析，考察在每个策略组合中各个博弈方能否通过单独改变策略获得得益。

如果能则从所分析的策略组合引一个箭头到可以获得得益的策略组合，最后综合分析，形成对博弈结果的判断。

箭头只能是横竖的，不能是斜的而且每两个之间只能有一个箭头，最后看哪一个组合只有指向的箭头没有指离得箭头。

划线法和箭头法其实都是在可以用得益矩阵表示的博弈中寻找纳什均衡的方法。

但是如果博弈方在三个或三个以上，博弈方无限多，博弈就无法用得益矩阵表示，划线法和箭头法就无法使用，此时若要寻找纳什均衡就要发展其他方法。

纳什均衡与严格下策反复消去法具有相容性。

即如果用严格下策反复消去法排除的只剩下一个策略组合了，那么这个组合必定是纳什均衡；而且纳什均衡一定不会被严格下策反复消去法消去。