运筹学博弈论()
博弈论(TheGamesTheory)是运筹学学科的一个重要分支。
博弈论(The Games Theory)是运筹学学科的一 个重要分支。具有竞争或对抗性质的行为称为博 弈行为,在这类行为中,参与斗争或竞争的各方 各自具有不同的目标和利益,为了达到各自的目 的,各方必须考虑对手的各种可能的行动方案, 并力图选取对自己最为有利或最合理的方案。 博弈论就是研究博弈行为中,斗争各方是否存在 最合理的行动方案,以及如何找到这个合理方案 的理论和方法。
囚徒困境问题
甲和乙两个小偷联手作案,因私入民宅被警方抓住 但未获证据。警方将两人分别置于两间房间分开审 讯,政策是若一人招供但另一人未招,则招者立即
被释放,未招者判入狱10年;若二人都招,则两人 各判刑8年;若两人都不招,则未获证据但因私入 民宅各拘留1年。将这些数据列出,如下:
囚徒困境博弈
在现实生活中,经常可以看到一些具有对抗和竞争性 的现象,如体育比赛、军事斗争中双方兵力的对抗, 各公司企业之间的经济谈判以及为争夺市场而进行的 竞争等等。在竞争过程中,各方为了达到自己的目标 和利益,必须考虑对手的各种可能的行动方案,并力 图选取对自己最为有利或最为合理的方案,也就是说 要研究采取对抗其他竞争者的策略。从数学角度来说, 博弈论就是研究竞争行为中的竞争各方是否存在着最 合理的行动方案,以及如何找到这个合理的行动方案 的数学理论和方法。
5.1 博弈论的基本概念
博弈论是矛盾和合作的规范研究,是系统研究决策主 体的行为发生直接相互作用情况下的决策以及这种决 策均衡的理论. 也就是说,当一个决策主体的选择受 到其他决策主体选择的影响,并且它的.
博弈论思想的主要特征是各参与人所实施的行为方案 (策略)相互依存,各方在冲突或合作后所实现的得 失结果不仅取决于自己所采用的行为方案,同时也依 赖于其他参与人所采用的行为方案,它是各参与人行 为方案组合的函数.
运筹学博弈论
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
精品
智猪博弈(大小猪博弈)
精品
5. 2001年诺贝尔经济 学奖得主:迈克尔 ·斯 宾塞:在不对称信息市 场分析方面所做出开创 性研究。
精品
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
精品
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
精品
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
精品
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
对策论(Theory of Games)
定义
并不是所有的对策都存在鞍点,如 A为齐王的赢得矩阵 3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3 max(min aij)= -1 min (max aij)=3 i j j i
例如:
• 给定矩阵对策
6 5 6 A 1 4 2 8 5 7
对策的最优值为5,对策的解有两个,分 别为局势 , 和 , 。
1 2 3 2
(三)矩阵对策的混合策略
1、矩阵对策的混合策略的定义
2、原则:坏中求好的原则。 3、解的存在:一定有解 4、混合策略求解:利用期望转化成 线性规划问题求解。
三、矩阵对策模型
(一)矩阵对策的概念 (二)矩阵对策的最优纯策略 (三)矩阵对策的混合策略 (四)矩阵对策的解法
(一)矩阵对策的概念 1、矩阵对策的定义 2、建立矩阵对策模型
1、矩阵对策的定义 局中人只有两个,对策中各方只能从有限 的策略集中确定性的选择一种,且对策双 方的支付之和为零的对策称为两人零和纯 策略对策。
表2
齐 王 上中 下 田忌 上中下 3 上下 中上 中 下 1 1 中下 上 -1 下中 上 1 下上 中 1
上下中 1 中上下 1
中下上 1 下中上 1
3 1
1 -1
-1 3
1 1
1 1
3 1
1 -1
1 3
1 1
-1 1
下上中 -1
1
1
1
1
3
引例3
有两个儿童A和B在一起玩“石头-剪子布”游戏。我们规定胜者得1分,负者得 -1分,平手时各得0分。双方选定的各种 出法及相应的结果可由下表列出。双方 应取何种策略?
运筹学第13章博弈论(20141202版)-课件
进 大将军
退
大英雄
进
退
-3, -3
2, 0
0, 2
0, 0
第1节 博弈论概论│什么是博弈论
1.1.2 引例 斗鸡博弈(懦夫博弈)ቤተ መጻሕፍቲ ባይዱ
独木桥
冷战期间美苏抢占地盘,一方抢占一块地盘,另一方就占另一块。 夫妻吵架,一方厉害,另一方就出去躲躲。
第1节 博弈论概论│什么是博弈论
第1节 博弈论概论│什么是博弈论
1.1.2 引例 囚徒困境与苏美争霸
美国
不扩军备战 扩军备战
不扩军备战 (10, 10) (100, -100)
前苏联
在苏美争霸博弈中,美国和前苏联都处于“囚徒困境”中。
扩军备战 (-100, 100)
(0,0)
第1节 博弈论概论│什么是博弈论
1.1.2 引例
智猪博弈
第1节 博弈论概论│什么是博弈论
1.1.3 博弈论的概念 博弈论(game theory):研究利益存在冲突的决策主体在相互依赖的条件下,如何选择适
当的策略实施以获得最大利益的思想和方法。 1 研究对象不是客观规律,而是带有主动性的人的活动。
2 最优不是绝对的,而是现有主客观条件下的理想结果。
第1节 博弈论概论│什么是博弈论
第1节 博弈论概论│什么是博弈论
1.1.2 引例
囚徒困境是图克(Tucker)1950年提出的,该博弈是博弈论最经典、著名的博弈。该
博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及
各种社会问题。
坦白
囚徒 B
不坦白
囚徒 A
坦白 不坦白
-5, -5 -10, -1
应用运筹学-博弈论
待宰的猴群
在一个笼子里关了一群猴子,主人每过一天就 打开笼子抓一只猴子去杀掉。每天主人来时, 每个猴子都紧张,它们不敢有任何举动,怕引 起主人的注意而被主人选中。当主人把目光落 在其中一只猴子身上时,其余的猴子就希望主 人赶快决定。当主人最终作出决定时,没有被 选中的猴子非常高兴。那个被选中的猴子拼命 反抗,其余猴子在一旁幸灾乐祸地观看,这只 猴子被杀掉了。这样的过程日复一日地进行着 ,最终猴子全部被宰杀掉了。
策略性思维 ——博弈概论
决策无处不在
工作,即便只是社交生活,也可以看做是一 个永无止息的决策过程; 通常人们的决策面临两种决策环境:比较伐 木工人和一个将军的决策会有什么区别:
– 伐木工人的工作环境是中立的,没有对抗; – 而将军的任何一种行动都会遭遇对手的抵抗;
研究前者的方法是决策论 研究后者的是博弈论
光天化日之下的违法
在现实社会中,窃贼在公共场所比如公共 汽车上偷东西时,车上的乘客看到了,但 不敢吭声。没有被偷的人想,反正被偷的 待宰猴群的结局人不是我,我反抗了,我 得不到任何好处,反而遭到伤害;而不反 抗虽不得益,但也不受损,我何必要反抗 呢?这就是光天化日之下的偷窃行为为什 么总能成功的原因。
囚徒困境说明了什么
在(坦白、坦白)这个组合中,两囚徒A和B 都不能通过单方面的改变行动增加自己的收益 ,于是谁也没有动力游离这个组合,因此这个 组合是纳什均衡,也叫非合作均衡。
囚徒困境反映了个人理性和集体理性的矛盾。 如果A和B都选择抵赖,各判刑1年,显然比 都选择坦白各判刑8年好得多。当然,A和B 可以在被警察抓到之前订立一个"攻守同盟", 但是这可能不会有用,因为它不构成纳什均衡 ,没有人有积极性遵守这个协定,显然最好的策 略是双方都抵赖.
第九章 运筹学博弈论 ppt课件
则。
1988年 法国人莫里斯-阿莱斯(Maurice Allais)
获奖理由:在市场理论及资源有效利用方面做出了
开创性贡献,并对一般均衡理论重新做了系统阐述。
1987年 美国人罗伯特-索洛(Robert M. Solow)
获奖理由:对增长理论做出贡献。提出长期的经济
增长主要依靠技术进步,而不是依靠资本和劳动力的
获奖理由:对不同汇率体制下的货币和财政政策以及最
优货币区域的分析做出了伟大贡ppt献课件。
8
1998年 印度籍经济学家阿马蒂亚-森(Amartya Sen) 获奖理由:对福利经济学以及发展经济学做出了突破
性贡献。 1997年 美国经济学家迈伦-斯科尔斯(Myron S.
Scholes)和罗伯特-默顿(Robert C. Merton) 获奖理由:前者给出了著名的布莱克-斯科尔斯期权
获奖理由:在动态宏观经济学方面做出了
巨大贡献。 2003年 美国经济学家罗伯特-恩格尔
(Robert F. Engle III)和英国经济学家克莱夫格兰杰(Clive W.J. Granger)
获奖理由:在经济时间数列中运用了统计
学的方法。
ppt课件
7
2002年 美国学者丹尼尔-卡尼曼(Daniel Kahneman)和弗农-
ppt课件
4
在国外,1912年E.Zermelo用集合论研究过下棋 问题,四十年代由于生产和战争的需要,博弈理 论得到了发展,系统博弈理论的形成则以1944 年V.Neumann,O.Morgensten合著的《博弈论 和经济行为》一书为标志.1994年瑞士皇家科 学院决定将诺贝尔经济学奖授予纳什(Nash),哈 萨尼(Harsanyi)和泽尔腾(Selten)三人,表彰他们 在博弈理论和应用研究方面作出的杰出贡献. 目前,博弈论在定价,招投标,拍卖,委托代理以及 很多重要的经营决策中得到应用,它已成为现代 经济学的重要基础.
博弈论
博弈论研究的主题是:理性人的互动行为。
博弈论作为一种解释力非常强的理论有三个基本假定:1 、理性人假定;2 、利益相关性假定; 3 、每个人是理性的是所有参与者的公共知识。
博弈论是一门数学,这是博弈论的学科特点。
主要有三种博弈:零和博弈;变和博弈;常和博弈。
对于任何一个博弈来说,都有一个均衡点,也就是那什均衡,那什均衡是博弈的解。
博弈论中的典型例子:囚徒困境。
囚徒困境在博弈论中有一个经典案例--囚徒困境,非常耐人寻味。
“囚徒困境”说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了。
但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
运筹学博弈论简介
合作博弈
非合作博弈
二)按局中人数分 类:
二人博弈 多人博弈
三)按策略数分 类:
•有限策略博弈 •无限策略博弈
二人非合作博 弈是我们讨论的重 点。
非合作博弈的进一步分类
非合作博弈
非零和的四种博弈
零和博弈
也可以有纯策略和混合
– 纯策略博弈 策略博弈之分。
策略—前进或后退
支付函数
斗鸡B
前进 后退
前进 -3/-3 2/0
斗鸡A
后退 0/2 0/0
五、博弈论的典型例子
市场进入阻挠—二人非合作非零和纯策略博弈
局中人—在位者和进入者 策略—在位着:容忍或斗争;进入者:进入或不进入 支付函数—垄断利润300,寡头利润各50;进入成本10
进入 进入者
不进入
在位者 容忍 斗争
– 混合策略博弈
非零和博弈
动态时行动和策略
– 完全信息博弈 不同,要素有五个;而
静态博弈
静态时行动与策略不加
动态博弈
区别,要素有三个。
– 不完全信息博弈
静态博弈
动态博弈
四、博弈论发展史的要件
1944年,von Neumann and Oskar Morgenstern 发表专著 The Theory of Games and Economic Behavior创立了博弈论
2000 -40万 -40万 -40万
五、博弈论的典型例子
齐王赛马—二人非合作零和博弈
局中人—齐王和田忌 策略—上中下三种等级的马的组合 ,比三
次,有六组策略:(上,中,下)、 (中,上, 下)、 (上,下,中)、 (中,下,上)、 (下, 上,中)、 (下,中,上)
博弈论基本概念
博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
在博弈论中,通常包括以下基本概念:
局中人:在一场竞赛或博弈中,具有决策权的参与者被称为“局中人”。
在一个博弈中,每个局中人都要做出选择。
行动:局中人在博弈中的每一个决策或选择被称为“行动”。
信息:局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。
策略:局中人基于可获得的信息,制定的决策方案或规则称为“策略”。
收益:局中人在博弈中的得失或输赢称为“收益”。
均衡:当所有局中人都认为自己的策略选择最优,并且其他局中人也认为该策略选择是最优时,这种状态被称为“均衡”。
结果:在一场博弈结束后,所有局中人的收益总和被称为“结果”。
博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。
其中,局中人、策略和收益是最基本要素。
发展过程方面,博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
目前,博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论和运筹学
博弈论和运筹学
博弈论和运筹学是两个与决策和优化相关的学科,尽管它们有一些共同点,但也存在明显的区别。
博弈论(Game Theory)是研究决策者在相互作用下做出决策的数学理论。
它研究以多方参与的决策情境为基础的策略选择和决策过程。
博弈论主要关注决策者的利益、策略和收益,并考虑不同决策者之间的相互依赖关系。
博弈论被广泛应用于经济学、管理学、政治学等领域,用于分析和解决与决策者的冲突、合作、竞争相关的问题。
与之相比,运筹学(Operations Research)是一个研究如何最优地利用有限资源来解决实际问题的学科。
运筹学涉及数学建模、优化算法、模拟等方法,以帮助决策者做出最佳的决策。
它在多个领域中应用广泛,如供应链管理、生产调度、库存控制等。
运筹学通过分析问题的结构、建立数学模型并运用数学优化方法,提供了一种系统化的方法来解决复杂的决策问题。
尽管博弈论和运筹学都关注决策和优化,但它们的重点和方法有所不同。
博弈论注重决策者之间的竞争和合作关系,研究决策者如何做出最佳策略。
而运筹学则注重如何通过有效地分配资源和优化决策,来解决特定的问题,并达到最佳结果。
因此,博弈论和运筹学可以被看作是从不同角度和层面来研究决策和优化的学科。
《运筹学》习题与答案
《运筹学》习题与答案(解答仅供参考)一、名词解释1. 线性规划:线性规划是运筹学的一个重要分支,它主要研究在一系列线性约束条件下,如何使某个线性目标函数达到最大值或最小值的问题。
2. 动态规划:动态规划是一种解决多阶段决策问题的优化方法,通过把原问题分解为相互联系的子问题来求解,对每一个子问题只解一次,并将其结果保存起来以备后续使用,避免了重复计算。
3. 整数规划:整数规划是在线性规划的基础上,要求决策变量取值为整数的一种优化模型,用于解决实际问题中决策变量只能取整数值的情形。
4. 马尔可夫决策过程:马尔可夫决策过程是一种随机环境下的决策模型,其中系统的状态转移具有无后效性(即下一状态的概率分布仅与当前状态有关),通过对每个状态采取不同的策略(行动)以最大化期望收益。
5. 最小费用流问题:最小费用流问题是指在网络流模型中,每条边都有一个容量限制和单位流量的成本,寻找满足所有节点流量平衡的同时使得总成本最小的流方案。
二、填空题1. 运筹学的主要研究对象是系统最优化问题,其核心在于寻求在各种(约束条件)下实现(目标函数)最优的方法。
2. 在运输问题中,供需平衡指的是每个(供应地)的供应量之和等于每个(需求地)的需求量之和。
3. 博弈论中的纳什均衡是指在一个博弈过程中,对于各个参与者来说,当其他所有人都不改变策略时,没有人有动机改变自己的策略,此时的策略组合构成了一个(纳什均衡)。
4. 在网络计划技术中,关键路径是指从开始节点到结束节点的所有路径中,具有最长(总工期)的路径。
5. 对于一个非负矩阵A,如果存在一个非负矩阵B,使得AB=BA=A,则称A为(幂等矩阵)。
三、单项选择题1. 下列哪项不是线性规划的标准形式所具备的特点?(D)A. 目标函数是线性的B. 约束条件是线性的C. 决策变量非负D. 变量系数可以为复数2. 当线性规划问题的一个基解满足所有非基变量的检验数都非正时,那么该基解(C)。
A. 不是可行解B. 是唯一最优解C. 是局部最优解D. 不一定是可行解3. 下列哪种情况适合用动态规划法求解?(B)A. 问题无重叠子问题B. 问题具有最优子结构C. 问题不能分解为多个独立子问题D. 子问题之间不存在关联性4. 在运输问题中,如果某条路线的运输量已经达到了其最大运输能力,我们称这条路线处于(A)状态。
运筹学中的对策论与博弈论
人工智能技术为 对策论与博弈论 提供新的研究工 具和思路
机器学习算法在 对策论与博弈论 中的应用,提高 决策效率和准确 性
深度学习技术可 以模拟复杂的博 弈场景,为对策 论与博弈论提供 更真实的数据支 持
人工智能与对策 论与博弈论的结 合将推动相关领 域的发展和创新
对策论与博弈论在商业竞争中的应用研究
不完全信息静态博弈
定义:博弈参与者在完全信息条 件下进行的一次性决策,每个参 与者只能选择一种策略,并且所 有参与者同时做出选择。
示例:寡头垄断市场中的价格竞 争、囚徒困境等。
添加标题
添加标题
添加标题
添加标题
特点:参与者之间无法进行有效 的沟通或协商,只能依靠自己的 判断和决策。
应用:在经济学、政治学、社会 学等领域有广泛应用。
03
对策论的主要内容
合作博弈与非合作博弈
合作博弈:参与者通过合作达成共赢,核心概念包括联盟和核心
非合作博弈:参与者追求个体理性,核心概念包括纳什均衡和优势策略
区别:合作博弈强调合作与共赢,非合作博弈注重竞争与冲突
应用场景:合作博弈常用于国际关系、经济合作等领域,非合作博弈适用于市场竞争、决策分 析等场景
对策论与博弈论 在商业竞争中具 有重要地位,是 制定竞争策略和 决策的重要工具。
随着大数据和人 工智能技术的发 展,对策论与博 弈论在商业竞争 中的应用将更加 广泛和深入。
对策论与博弈论 可以帮助企业预 测竞争对手的行 动,制定更加有 效的竞争策略。
在商业竞争中, 运用对策论与博 弈论需要综合考 虑各种因素,包 括市场环境、竞 争对手、自身实 力等。
面临的挑战与问题:如何将对策论与博弈论更好地应用于实际场景,解决 复杂的问题,仍需进一步的研究和探索。
《运筹学》试题及答案(二)
《运筹学》试题及答案19、简述线性规划模型主要参数(p11)(1)、价值系数:目标函数中决策变量前的系数为价值系数(2)、技术系数:约束条件中决策变量前的系数(3)、约束条件右边常数项15、简述线性规划解几种可能的结果(情形)(ppt第二章39或89页)(1).有唯一最优解 (单纯形法中在求最大目标函数的问题时,对于某个基本可行解,所有δj≤0)(2).无可行解,即可行域为空域,不存在满足约束条件的解,也就不存在最优解了。
(3).无界解,即可行域的范围延伸到无穷远,目标函数值可以无穷大或无穷小,一般来说,这说明模型有错,忽略了一些必要的约束条件(4).无穷多个最优解,则线段上的所有点都代表了最优解(5)退化问题,基变量有时存在两个以上相同的最小比值,这样在下一次迭代中就有一个或几个基变量等于零,用图解法无退化解1、简述单纯形法的基本思路(p70)从可行域中某一个顶点开始,判断此顶点是否是最优解,如不是,则再找另一个使得其目标函数值更优的顶点,称之为迭代,再判断此点是否是最优解。
直到找到一个顶点为其最优解,就是使得其目标函数值最优的解,或者能判断出线性规划问题无最优解为止。
17、简述线性规划中添加人工变量的前提(p85)在系数矩阵中直接找不到初始可行解,进而通过添加人工变量的方法来构造初始可行基,得出初始基本可行解10、简述线性规划对偶问题的基本性质(p122)(1)对称性(2)弱对偶性(3)强对偶性(4)最优性(5)互补松弛型原函数与对偶问题的关系1)求目标函数最大值的线性规划问题中有n 个变量 m个约束条件,它的约束条件都是小于等于不等式。
而其对偶则是求目标函数为最小值的线性规划问题,有m个变量n个约束条件,其约束条件都为大于等于不等式。
2)原问题的目标函数中的价值系数为对偶问题中的约束条件的右边常数项,并且原问题的目标函数中的第i个价值系数就等于对偶问题中的第i个约束条件的右边常数项。
3)原问题的约束条件的右边常数项为对偶问题的目标函数中价值系数。
高级运筹学(博弈论书稿)-周晶
第章博弈论(对策论)第一节引言1.1博弈行为和博弈论在日常生活中,经常会看到一些相互之间具有斗争或竞争性质的行为。
譬如,两个人下棋,任何一个人在走某一步之前,都需要考虑对方是怎么走的,以及对方在他走了一步之后会怎么走,以至无穷。
高手与俗手的区别往往就在于高手能够考虑10步甚至20步以后的变化,最终的输赢不仅取决于你的决策,而且取决于你对手的决策,这就是博弈。
博弈与决策的根本区别在于是否考虑对方的行为,具有竞争或对抗性质的行为称为博弈行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最有利或最合理的方案。
比如战争活动中的双方,都力图选取对自己最有利的策略,千方百计去战胜对方;还比如在政治方面,国际间的谈判、各种政治力量间的较量、各国际集团之间的角逐等都无一不具有对抗性质;在经济活动中,各国之间、各公司企业之间的经济谈判,企业之间为争夺市场而进行的竞争等,举不胜举。
博弈论(game theory),就是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论与方法,即研究博弈行为中竞争各方是否存在着最合理行动方案,以及如何找到最合理行动方案的数学理论和方法。
也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。
博弈论应是一种分析问题的方法,它被设计用来帮助我们理解所观察到的决策主体相互作用时的现象,其应用范围涉及经济学、政治学、犯罪学、军事、外交、国际关系、公共选择等各个领域。
博弈论思想的主要特征是各参与人所实施的行为方案(策略)相互依存,各方在冲突或合作后所实现的损益得失结果不仅取决于自己所采取的行为方案,同时也依赖于其他参与方所实施的行为方案,是各参与方行为方案组合的函数。
所以,博弈论在我国也被称为“对策论”。
《博弈论》阅读及答案
“博弈论”阅读及答案阅读下面文字,完成6-8题。
“博弈论”是运筹学的一个分支,它是钻研个体如何在扑朔迷离的相互影响中得出最公道的策略的一种理论。
“博弈”这一说法是从棋弈、扑克和战争等带有比赛、抗衡和决策性质的问题中借用的术语,听上去有点玄奥,实际上却拥有首要现实意义。
博弈论巨匠看经济社会问题如同棋局,往往寓深入道理于游戏当中。
所以,博弈论多从咱们日常生活中的凡人小事入手,娓娓道来,其实不乏味。
在博弈论中,有一个著名的“阶下囚窘境”博弈模型。
假定一名富翁在家中被杀,财物被盗。
警方抓到两个犯罪嫌疑人,并从他们的住处搜出赃物。
然而,他们矢口否认曾杀过人。
因而警方将两人隔离落后行审判。
检察官给出以下条件:因为你们的偷窃罪已有确实的证据,所以可以判你们一年刑期。
然而,如果你单独坦白杀人的罪恶,我只判你三个月的监禁,但你的同伙要被判十年刑。
如果你拒不坦白,而被同伙检举,那末你就将被判十年刑,他只判三个月的监禁。
然而,如果你们两人都坦白交待,那末,你们都要被判五年刑。
两个囚犯面临着两难的选择——坦白或抵赖。
明显最好的策略是双方都抵赖,结果是大家都只被判一年。
然而因为两人在隔离的情况下没法串供,所以,每一个人都从利己的目的动身,选择坦白交待这一最好策略。
因为坦白交待可以指望得到最短的监禁,但条件是同伙抵赖,这明显比自己抵赖坐十年牢要好。
这种策略是损人利己的策略。
不仅如斯,坦白还有更多的益处。
如果对方坦白了而自己抵赖了,那自己就得坐十年牢。
因而,在这种情况下仍是应当选择坦白交待,即便两人同时坦白,最多也只判五年。
所以,两人公道的选择是坦白,本来对双方都有益的策略(抵赖)和终局(被判一年刑)就不会呈现。
在这个“阶下囚窘境”中,每一个局中人选择了自己的最优策略,从而使自己利益最大化。
所有局中人的策略形成了一个最优的策略组合,没有人有足够理由打破这种均衡。
这种由所有局中人(也称当事人、参与者)的最好策略形成的战略组合,被称为“非合作博弈均衡”,也叫“纳什均衡”①。
《运筹学》课件 第六章 博弈论
§1 基本概念
一、博弈论的定义 二、博弈理论的历史 三、博弈问题举例 四、博弈的分类
三、
1. 囚犯困境(Prisoners’ dilemma
囚犯困境是图克(Tucker)1950年提出的; 该博弈是博奕论最经典、著名的博弈; 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷。
所有局中人的策略组成的向量。)
s (s1,, si,, sn ) 表示n个局中人达成的
一个协议,当这个协议可以自动实施(Self-enforcing) 时,即没有任何局中人有积极性破坏这个协议,那么 这个协议就构成纳什均衡。
否则,若至少存在某些局中人有积极性偏离这个协 议,就构不成纳什均衡。
例:囚犯困境问题:
但是,尽管政府当时无力制止这种事情,公众也不 必担心彩电价格会上涨。这是因为,“彩电厂商自 律联盟”只不过是一种“囚徒困境”,彩电价格不 会上涨。在高峰会议之后不到二周,国内彩电价格 不是上涨而是一路下跌。这是因为厂商们都有这样 一种心态:无论其他厂商是否降价,我自己降价是 有利于自己的市场份额扩大的。
Ⅱ
坦白 抵赖
坦白
Ⅰ
-9,-9
0,-10
抵赖 -10,0 -1,-1
均衡解: 二人均坦白
相关概念介绍
➢博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
坦白 抵赖
➢ 博弈问题的基本要素 (1)局中人(Players)
现代博弈论主要指非合作博弈理论。非合作博弈 更受重视的原因:主导人们行为的主要还是个体理性, 而非集体理性;即,竞争是一切社会、经济关系的根 本基础,不合作是基本的,合作是有条件和暂时的。
博弈论
局中人
策略和策略集
支付和支付函数
一.枪手博弈
1.谁能活下来?
有三个枪手,其中甲十发八中(80%),乙十发六中(60%),丙十发四中(40%)。 三人同时开枪,一次只能发射一颗子Байду номын сангаас,谁最有可能活下来?
实力最强,死得最快
2.出击时机的选择
《纽约邮报》和《每日新闻》两家报纸就曾经在报纸售价上进行过 一场较量
THANKS VERY MUCH
博弈论
game theory
你不知道的博弈论
博弈论
作为运筹学的一个分支,是一门以数学为基础,研究发 生对抗和冲突时如何选择最优策略的学问
博弈论的研究方法
构成 复杂的现象 抽象 基本的概念 数学模型 分析
产生结果
逐步引入对其 局势产生影响 的其他因素
基本假设和要素
基本假设
要素1
要素2
要素3
.
个人理性
不认罪 ( (1 1, ,1 (终身 0 , 5) ( 1) ) 监禁,0)
思考
有一个地方遭灾,国家开办粥厂赈灾,和珅去视察粥厂随手抓了一把沙土洒在粥里,同行的 大臣问和珅你这是干什么,和珅说,真正的灾民饥肠辘辘是不会在乎粥里面有沙子的,来蹭 吃蹭喝的就不来了,这样才能让最困难的人活下来
2017
势者,因利而制权也。 ——《孙子兵法》
二.智猪博弈
猪圈里有一只大猪和一只小猪,猪圈的一边有一个踏板,每踩一下踏板,在远离 踏板的另一边投食口就会有少量事物落下
小猪踩踏板→大猪会在小猪跑回食槽之前把食物吃完 大猪踩踏板→大猪有机会在小猪吃完之前赶回食槽,争吃到另一半残羹
两只猪会采取什么策略呢?
商场中的智猪博弈 20世纪中期,美国专门生产黑人化妆品的公司并不多,佛雷化妆品公司算的上是个 佼佼者。 该公司有一位名叫乔治· 约翰逊的推销员,他后来召集了两三个同事,创办属于自己 的约翰逊黑人化妆品。 与实力强大的佛雷公司相比,约翰逊公司只有500美元和三四个员工,实力相差甚远。