运筹学博弈论

合集下载

运筹学博弈论

运筹学博弈论

i a 2 1 3 a c 1 3 a c c 1 3 a c 9 1 a c 2
产量博弈的古诺模型是一种囚徒困境,无法实现 博弈方总体和各个博弈方各自最大利益的结论,对 于市场经济组织、管理,对于产业组织和社会经济 制度的效率判断,都具有非常重要的意义。说明对 市场的管理,政府对市场的调控和监管都是必须的。
纳什均衡(Nash Equilibrium)
通俗地说,纳什均衡的含义 就是:
给定你的策略,我的策略是 最好的策略;给定我的策略, 你的策略也是你的最好的策 略。即双方在给定的策略下 不愿意调整自己的策略。
1. 纯战略Nash均衡
策略空间:每个博弈方的全部可选策略的集合 S1,Sn
博弈方 i的第 j个策略: si j Si 博弈方 i的得益:u i
每个参与人都想猜透对方的战略,而每个参与人又 不愿意让对方猜透自己的战略。
这种博弈的类型是什么?如何找到均衡?
请举一些这样的例子:
✓石头、剪子、布游戏 ✓老虎、杠子、鸡、虫子游戏 ✓扑克游戏 ✓橄榄球赛 ✓战争中
大猪先到:大猪吃到9个单位,小猪吃到1个单位; 小猪先到:小猪吃到4个单位,大猪吃到6个单位; 同时到达:大猪吃到7个单位,小猪吃到3个单位。
局中人:大猪和小猪 行动:按按钮吃东西
小猪

不按


按 (5, 1) (4, 4)
不按 (9, -1) (0, 0)
24
大猪 按 等待
小猪的上策
寡头产量竞争——以两厂商产量竞争为例 Qq1 q2 PP(Q) aQ
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ a ( q 1 q 2 ) c ]1q
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ a ( q 1 q 2 ) c ]2q

博弈论介绍

博弈论介绍


为什么博弈论在经济学领域会产生如此大的影响呢?这 是因为博弈论改变了传统微观经济学的某些基本假设,从 一个独特的视角帮助我们更加深刻地理解和把握经济现象, 并指导更加有效的经济政策制订。博弈论作为现代经济学 的前沿领域,已成为占据主流的基本分析工具。
一、博弈论的基本概念
博弈论,英文为Game theory,是研究相互依赖、相互影响的 决策主体的理性决策行为以及这些决策的均衡结果的理论。 • 这些相互依赖、相互影响的决策行为及其结果的组合称为博 弈(Game)。
行动次序
信息
静态 纳什均衡 纳什 贝叶斯均衡 海萨尼
动态 子博弈精练 纳什均衡 泽尔腾 精炼贝叶斯均衡 泽尔腾等
完全信息
不完全信息
二、博弈的种类
• 一、完全信息静态博弈 • (一)完全信息静态博弈定义 • 所谓完全信息静态博弈指的是各博弈方同时决策,或者决 策行动虽有先后,但后行动者不知道先行动者的具体行动 是什么且各博弈方对博弈中各种策略组合情况下所有参与 人相应的得益都完全了解的博弈。 • 在博弈论中,一个博弈可以用两种不同的方式来表达: • 一种是策略式表达:另一种是扩展式表达.策略式表达更适 合于静态博弈,而扩展式表达更适合于讨论动态博弈。
•性别战(battle of sexes) 女 足球 男 足球 芭蕾 2,1 0,0 芭蕾 0,0 1,2
• 斗鸡博弈(chicken game)(胆小鬼博弈)
B 进 退
A
进 退
-3,-3
0,2
2,0
0,0
• 进入阻挠(entry deterrance) 在位者 默许 斗争
进入者
进入 不进入
40,50
0,300
-10,0
0,300

运筹学博弈论

运筹学博弈论
代表人物:纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
精品
智猪博弈(大小猪博弈)
精品
5. 2001年诺贝尔经济 学奖得主:迈克尔 ·斯 宾塞:在不对称信息市 场分析方面所做出开创 性研究。
精品
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
精品
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
精品
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
精品
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).

博弈论的定义与应用

博弈论的定义与应用

博弈论博弈论的概念 博弈论有被称为对策论(Games Theory),是研究具有斗争或竞争性 质现象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论的发展 博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正是诞生。

1944年,冯·诺意曼摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的的学科。

博弈论的基本概念 博弈要素 (1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。

只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。

(2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

(3)得失:一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。

所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

《运筹学》ch12博弈论

《运筹学》ch12博弈论

1的最优 策略(行)
目录
博弈论的基本概念 纯策略矩阵博弈
混合策略矩阵博弈
其它类型博弈简介(多人博弈、非零和博弈)
基本概念
设矩阵博弈G {S1, S2 , A} 的支付矩阵是 A (aij )mn ,其中S1 {A1, , Am}
S2 {B1, , Bn }
多人非合作博弈
(1)局中人集合 I {1, , n} ; (2)每个局中人i有一个纯策略的有限集:
Si
{s(i)} {s1i , s2i ,
,
si mi
}
i 1, , n
Hale Waihona Puke (3)每个局中人i有一个支付函数u i ,i 1, , n 。
记为此博弈为G {I , Si ,ui }。
第十二章 博弈论
教学要求:
了解博弈论的基本分析方法 掌握二人零和博弈模型和求解方法 会运用该模型分析一些经济和管理问题
目录
博弈论的基本概念 纯策略矩阵博弈 混合策略矩阵博弈 其它类型博弈简介(多人博弈、非零和博弈)
目录
博弈论的基本概念
纯策略矩阵博弈 混合策略矩阵博弈 其它类型博弈简介(多人博弈、非零和博弈)
同越理小,越若好局,中所人以,2选局择中策人略2可B j以,选则择他至B j ,多使失他去失m1ia去mx a的ij 。不因大局于中1m ji人nm m21i希amx望aij aij
鞍点:如果存在 i*, j* 使支付矩阵 (aij ) 的元素满足:
max
1im
min
1 jn


动态博弈 微分博弈
最常见
目录
博弈论的基本概念

运筹学第13章博弈论

运筹学第13章博弈论

动态博弈(dynamic game) 指局中人的行动有先后顺序,且后行动者能 够观察到先行动者所选择的行动。
“石头、剪刀、布”的游戏;
下棋、打牌等游戏。
运筹学第13章博弈论
第1节 博弈论概论│博弈分类
1.2.2 博弈分类详解
完全信息博弈(completeⅠinformation)
将各博弈方都完全了解所有博弈方各种情况 下得益的博弈称为“完全信息博弈” 。
运筹学第13章博弈论
第1节 博弈论概论│什么是博弈论
1.1.2 引例 囚徒困境是图克(Tucker)1950年提出的,该博弈是博弈论最经典、著名的博弈。该博弈本身
讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题。
坦白
囚徒 B
不坦白
囚徒 A
坦白 不坦白
-5, -5 -10, -1
运筹学第13章博弈论
第1节 博弈论概论│什么是博弈论
1.1.5 博弈论的基本概念
博弈方的得益(Payoffs)
博弈的参加者(Player)
四个核心
各博弈方的策略(Strategies) 或行为(Actions)
博弈的次序(Order)
运筹学第13章博弈论
2 博弈的分类
运筹学第13章博弈论
第1节 博弈论概论│博弈分类
1.2.2 博弈分类详解
零和博弈
在博弈中一组局中人所得到的支付(或收益) 恰好是另一组局中人的损失。通俗地说,博 弈结果总和为零的博弈称为零和博弈。
非零和博弈 非零和博弈指所有局中人的支付(或收益) 的代数和不为零。为正或为负。
赢钱与输钱为零和博弈;
工会与厂方达成增加工资的协议双方获得“双 赢”。反之,罢工导致“两败俱伤”。

第九章-运筹学博弈论

第九章-运筹学博弈论

乙 石头 布

石头
0
-1

1
0
剪刀
-1
1
剪刀
1 -1 0
21
例2 写出齐王和田忌赛马中齐王的收益矩阵. 赢一场得一千金.
解:
S1 a1,a2,a3,a4,a5,a6,S2 b1,b2,b3,b4,b5,b6
a1 (上,中,下),a2 (上,下,中),a3 (中,上,下), a4 (中,下,上),a5 (下,中,上),a6 (下,上,中). S2中的各策 S1对 略应 与的策.略相同
史密斯(Vernon L. Smith)
获奖理由:在心理和实验经济学研究方面做出了开创性工
作。
2001年 三位美国学者乔治-阿克尔洛夫(George A.
Akerlof)、迈克尔-斯彭斯(Michael Spence)和约瑟夫-斯
蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进行分析”领域
11
1986年 美国人詹姆斯-布坎南(James M. Buchanan Jr.)
获奖理由:将政治决策的分析同经济理论结 合起来,使经济分析扩大和应用到社会,政治法 规的选择
1985年 意大利人弗兰科-莫迪利安尼 (Franco Modigliani)
获奖理由:第一个提出储蓄的生命周期假 设,这一假设在研究家庭和企业储蓄中得到了 广泛应用。
完全信息是指所有局中人对其他局中人各自策略 集以及不同局势下的收益函数都有完全的了解.
18
博弈的三个要素的矩阵表示(局中人A的收益)
局中人B
局中人A
策 a1 a2

am
b 1
c11 c 21

运筹学博弈论 PPT

运筹学博弈论 PPT
性研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的 囚徒A 占优战略
抵赖
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
囚徒困境( Prisoners’Dilemma )
运筹学博弈论
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马Байду номын сангаас弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年 , 冯 ·诺 依 曼 和 摩 根斯顿发表《博弈论和经 济行为》的一书,
标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).

应用运筹学-博弈论

应用运筹学-博弈论

待宰的猴群
在一个笼子里关了一群猴子,主人每过一天就 打开笼子抓一只猴子去杀掉。每天主人来时, 每个猴子都紧张,它们不敢有任何举动,怕引 起主人的注意而被主人选中。当主人把目光落 在其中一只猴子身上时,其余的猴子就希望主 人赶快决定。当主人最终作出决定时,没有被 选中的猴子非常高兴。那个被选中的猴子拼命 反抗,其余猴子在一旁幸灾乐祸地观看,这只 猴子被杀掉了。这样的过程日复一日地进行着 ,最终猴子全部被宰杀掉了。
策略性思维 ——博弈概论
决策无处不在
工作,即便只是社交生活,也可以看做是一 个永无止息的决策过程; 通常人们的决策面临两种决策环境:比较伐 木工人和一个将军的决策会有什么区别:
– 伐木工人的工作环境是中立的,没有对抗; – 而将军的任何一种行动都会遭遇对手的抵抗;
研究前者的方法是决策论 研究后者的是博弈论
光天化日之下的违法
在现实社会中,窃贼在公共场所比如公共 汽车上偷东西时,车上的乘客看到了,但 不敢吭声。没有被偷的人想,反正被偷的 待宰猴群的结局人不是我,我反抗了,我 得不到任何好处,反而遭到伤害;而不反 抗虽不得益,但也不受损,我何必要反抗 呢?这就是光天化日之下的偷窃行为为什 么总能成功的原因。
囚徒困境说明了什么
在(坦白、坦白)这个组合中,两囚徒A和B 都不能通过单方面的改变行动增加自己的收益 ,于是谁也没有动力游离这个组合,因此这个 组合是纳什均衡,也叫非合作均衡。
囚徒困境反映了个人理性和集体理性的矛盾。 如果A和B都选择抵赖,各判刑1年,显然比 都选择坦白各判刑8年好得多。当然,A和B 可以在被警察抓到之前订立一个"攻守同盟", 但是这可能不会有用,因为它不构成纳什均衡 ,没有人有积极性遵守这个协定,显然最好的策 略是双方都抵赖.

运筹学博弈论简介

运筹学博弈论简介
弈双方是 否存在有约束力 的协议来分:
合作博弈
非合作博弈
二)按局中人数分 类:
二人博弈 多人博弈
三)按策略数分 类:
•有限策略博弈 •无限策略博弈
二人非合作博 弈是我们讨论的重 点。
非合作博弈的进一步分类
非合作博弈
非零和的四种博弈
零和博弈
也可以有纯策略和混合
– 纯策略博弈 策略博弈之分。
策略—前进或后退
支付函数
斗鸡B
前进 后退
前进 -3/-3 2/0
斗鸡A
后退 0/2 0/0
五、博弈论的典型例子
市场进入阻挠—二人非合作非零和纯策略博弈
局中人—在位者和进入者 策略—在位着:容忍或斗争;进入者:进入或不进入 支付函数—垄断利润300,寡头利润各50;进入成本10
进入 进入者
不进入
在位者 容忍 斗争
– 混合策略博弈
非零和博弈
动态时行动和策略
– 完全信息博弈 不同,要素有五个;而
静态博弈
静态时行动与策略不加
动态博弈
区别,要素有三个。
– 不完全信息博弈
静态博弈
动态博弈
四、博弈论发展史的要件
1944年,von Neumann and Oskar Morgenstern 发表专著 The Theory of Games and Economic Behavior创立了博弈论
2000 -40万 -40万 -40万
五、博弈论的典型例子
齐王赛马—二人非合作零和博弈
局中人—齐王和田忌 策略—上中下三种等级的马的组合 ,比三
次,有六组策略:(上,中,下)、 (中,上, 下)、 (上,下,中)、 (中,下,上)、 (下, 上,中)、 (下,中,上)

博弈论基本概念

博弈论基本概念

博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

在博弈论中,通常包括以下基本概念:
局中人:在一场竞赛或博弈中,具有决策权的参与者被称为“局中人”。

在一个博弈中,每个局中人都要做出选择。

行动:局中人在博弈中的每一个决策或选择被称为“行动”。

信息:局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。

策略:局中人基于可获得的信息,制定的决策方案或规则称为“策略”。

收益:局中人在博弈中的得失或输赢称为“收益”。

均衡:当所有局中人都认为自己的策略选择最优,并且其他局中人也认为该策略选择是最优时,这种状态被称为“均衡”。

结果:在一场博弈结束后,所有局中人的收益总和被称为“结果”。

博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。

其中,局中人、策略和收益是最基本要素。

发展过程方面,博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

目前,博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论和运筹学

博弈论和运筹学

博弈论和运筹学
博弈论和运筹学是两个与决策和优化相关的学科,尽管它们有一些共同点,但也存在明显的区别。

博弈论(Game Theory)是研究决策者在相互作用下做出决策的数学理论。

它研究以多方参与的决策情境为基础的策略选择和决策过程。

博弈论主要关注决策者的利益、策略和收益,并考虑不同决策者之间的相互依赖关系。

博弈论被广泛应用于经济学、管理学、政治学等领域,用于分析和解决与决策者的冲突、合作、竞争相关的问题。

与之相比,运筹学(Operations Research)是一个研究如何最优地利用有限资源来解决实际问题的学科。

运筹学涉及数学建模、优化算法、模拟等方法,以帮助决策者做出最佳的决策。

它在多个领域中应用广泛,如供应链管理、生产调度、库存控制等。

运筹学通过分析问题的结构、建立数学模型并运用数学优化方法,提供了一种系统化的方法来解决复杂的决策问题。

尽管博弈论和运筹学都关注决策和优化,但它们的重点和方法有所不同。

博弈论注重决策者之间的竞争和合作关系,研究决策者如何做出最佳策略。

而运筹学则注重如何通过有效地分配资源和优化决策,来解决特定的问题,并达到最佳结果。

因此,博弈论和运筹学可以被看作是从不同角度和层面来研究决策和优化的学科。

运筹学中的对策论与博弈论

运筹学中的对策论与博弈论

人工智能技术为 对策论与博弈论 提供新的研究工 具和思路
机器学习算法在 对策论与博弈论 中的应用,提高 决策效率和准确 性
深度学习技术可 以模拟复杂的博 弈场景,为对策 论与博弈论提供 更真实的数据支 持
人工智能与对策 论与博弈论的结 合将推动相关领 域的发展和创新
对策论与博弈论在商业竞争中的应用研究
不完全信息静态博弈
定义:博弈参与者在完全信息条 件下进行的一次性决策,每个参 与者只能选择一种策略,并且所 有参与者同时做出选择。
示例:寡头垄断市场中的价格竞 争、囚徒困境等。
添加标题
添加标题
添加标题
添加标题
特点:参与者之间无法进行有效 的沟通或协商,只能依靠自己的 判断和决策。
应用:在经济学、政治学、社会 学等领域有广泛应用。
03
对策论的主要内容
合作博弈与非合作博弈
合作博弈:参与者通过合作达成共赢,核心概念包括联盟和核心
非合作博弈:参与者追求个体理性,核心概念包括纳什均衡和优势策略
区别:合作博弈强调合作与共赢,非合作博弈注重竞争与冲突
应用场景:合作博弈常用于国际关系、经济合作等领域,非合作博弈适用于市场竞争、决策分 析等场景
对策论与博弈论 在商业竞争中具 有重要地位,是 制定竞争策略和 决策的重要工具。
随着大数据和人 工智能技术的发 展,对策论与博 弈论在商业竞争 中的应用将更加 广泛和深入。
对策论与博弈论 可以帮助企业预 测竞争对手的行 动,制定更加有 效的竞争策略。
在商业竞争中, 运用对策论与博 弈论需要综合考 虑各种因素,包 括市场环境、竞 争对手、自身实 力等。
面临的挑战与问题:如何将对策论与博弈论更好地应用于实际场景,解决 复杂的问题,仍需进一步的研究和探索。

高级运筹学(博弈论书稿)-周晶

高级运筹学(博弈论书稿)-周晶

第章博弈论(对策论)第一节引言1.1博弈行为和博弈论在日常生活中,经常会看到一些相互之间具有斗争或竞争性质的行为。

譬如,两个人下棋,任何一个人在走某一步之前,都需要考虑对方是怎么走的,以及对方在他走了一步之后会怎么走,以至无穷。

高手与俗手的区别往往就在于高手能够考虑10步甚至20步以后的变化,最终的输赢不仅取决于你的决策,而且取决于你对手的决策,这就是博弈。

博弈与决策的根本区别在于是否考虑对方的行为,具有竞争或对抗性质的行为称为博弈行为。

在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最有利或最合理的方案。

比如战争活动中的双方,都力图选取对自己最有利的策略,千方百计去战胜对方;还比如在政治方面,国际间的谈判、各种政治力量间的较量、各国际集团之间的角逐等都无一不具有对抗性质;在经济活动中,各国之间、各公司企业之间的经济谈判,企业之间为争夺市场而进行的竞争等,举不胜举。

博弈论(game theory),就是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论与方法,即研究博弈行为中竞争各方是否存在着最合理行动方案,以及如何找到最合理行动方案的数学理论和方法。

也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。

博弈论应是一种分析问题的方法,它被设计用来帮助我们理解所观察到的决策主体相互作用时的现象,其应用范围涉及经济学、政治学、犯罪学、军事、外交、国际关系、公共选择等各个领域。

博弈论思想的主要特征是各参与人所实施的行为方案(策略)相互依存,各方在冲突或合作后所实现的损益得失结果不仅取决于自己所采取的行为方案,同时也依赖于其他参与方所实施的行为方案,是各参与方行为方案组合的函数。

所以,博弈论在我国也被称为“对策论”。

供应链中的博弈论问题在运筹学中的研究与应用

供应链中的博弈论问题在运筹学中的研究与应用

供应链中的博弈论问题在运筹学中的研究与应用供应链是指在产品或服务的交付过程中,涉及原材料供应商、制造商、分销商和最终消费者等各个环节的一系列组织和活动。

博弈论是一种数学模型,用于研究冲突和合作关系中的策略选择。

在运筹学中,博弈论被广泛应用于解决供应链中的问题,以实现最优的运作效果。

本文将探讨供应链中的博弈论问题及其在运筹学中的研究与应用。

1. 博弈论在供应链决策中的应用在供应链中,各个环节之间存在着合作和冲突的关系。

合作可以带来效益的最大化,而冲突则可能导致损益的分配不均。

博弈论通过建立数学模型,分析供应链中各个参与方的利益和策略选择,找到最优的决策方案。

1.1. 合作和联盟形成在供应链中,各个环节需要进行合作以实现整体效益的最大化。

通过博弈论,可以研究供应商、制造商和分销商之间的合作行为,并建立联盟以共同面对压力和问题。

博弈论可以帮助确定合作的条件和收益分配方案,以促进供应链的稳定和可持续发展。

1.2. 价格竞争与定价策略在供应链中,价格是各个环节之间最核心的竞争手段。

博弈论可以用于分析不同参与方之间的定价策略,包括合作定价、竞争定价和混合定价等。

通过建立博弈模型,可以确定最优的定价策略,实现供应链利益的最大化。

2. 博弈论在库存管理中的应用库存管理是供应链中非常重要的一个环节,直接关系到成本和服务水平。

博弈论可以帮助解决供应商和制造商之间的库存管理问题,以实现最优的供应链效果。

2.1. 批发商和零售商的库存决策在供应链中,批发商和零售商之间的库存管理决策是一个典型的博弈论问题。

通过建立博弈模型,可以研究批发商和零售商之间的策略选择,包括订货量、备货周期、销售价格等。

通过博弈论分析,可以找到双方的最优策略,实现供应链库存的最优化管理。

2.2. 制造商和供应商的合作库存策略在供应链中,制造商和供应商之间的合作库存策略是另一个重要的博弈论问题。

制造商需要平衡成本和服务水平,而供应商需要平衡库存和订单的平稳流动。

博弈论就业方向

博弈论就业方向

博弈论就业方向博弈论,又称对策论或赛局理论,是现代数学的一个新分支和运筹学的一个重要学科。

博弈论主要研究在策略性环境中如何进行策略性决策和采取策略性行动的问题,涉及到数学、经济学、心理学和计算机科学等多个学科领域。

随着市场经济的发展和竞争的加剧,博弈论在就业方向上有着广泛的应用,以下是博弈论的一些就业方向:1. 金融风险管理师金融风险管理师是负责设计和实施金融机构风险管理的专业人员。

他们需要运用风险管理理论、金融理论、经济理论和计算机技术等知识,对金融机构面临的各种风险进行识别、评估和控制。

在风险管理领域,博弈论可以用于研究市场风险、信用风险和操作风险等方面的管理问题。

2. 咨询顾问咨询顾问是为客户提供专业咨询服务的人员。

他们需要具备广泛的知识和技能,包括经济学、心理学、市场营销和计算机科学等。

博弈论作为一门跨学科的学科,可以为咨询顾问提供一种分析和解决实际问题的工具,特别是在战略规划和竞争分析方面。

3. 数据分析师数据分析师是负责对大量数据进行分析和挖掘的专业人员。

他们需要运用统计学、机器学习和数据挖掘等技术,从数据中提取有用的信息和知识。

博弈论可以作为数据分析的一种方法,用于研究数据之间的竞争关系和互动机制。

4. 市场营销经理市场营销经理是负责制定和实施市场营销策略的专业人员。

他们需要了解市场需求、消费者行为和竞争状况等方面的信息。

博弈论可以为市场营销经理提供一种理解和预测消费者行为和市场动态的方法,以及制定有效的营销策略。

5. 运营管理专家运营管理专家是负责制定和实施企业运营管理策略的专业人员。

他们需要了解生产管理、供应链管理和质量管理等方面的知识。

博弈论可以为运营管理专家提供一种理解和优化企业运营过程的方法,提高企业的效率和竞争力。

除了以上几个就业方向,博弈论还可以应用于其他领域,如法律、社会学、政治学和生物学等。

随着科技的发展和市场经济的深入,博弈论将会在更多的领域得到应用和推广,为未来的发展提供更多的机会和挑战。

第九章-运筹学博弈论

第九章-运筹学博弈论
2000年 美国芝加哥大学的詹姆斯-赫克曼(James J. Heckman)和加州大学伯克利分校的丹尼尔-麦克法登
(Daniel L. McFadden) 获奖理由:在微观计量经济学领域做出了重大贡献。 1999年 加拿大著名经济学家罗伯特-蒙代尔教授(Robert
A. Mundell) 获奖理由:对不同汇率体制下的货币和财政政策以及最
早期的博弈实例是中国春秋战国时代的齐王和 田忌赛马的故事:齐王有上,中,下三等马,他麾下 的大将也有上,中,下三等马,但是同等级的马都 比齐王差一些.赛马时齐王表示按上,中,下的顺 序出马,而田忌的谋士让他按下,上,中的顺序出 马,比赛结果田忌赢了一千金.请思考:这是一种 什么类型的博弈?理论上齐王不会输,但他为什 么输了?
“博弈中一个理性的决策必定建立在预测其他 局中人的反应之上.一个局中人将自己置身于 其他局中人的位置并为他着想从而预测其他局 中人将选择的行为,在这个基础上该局中人决 定自己最理想的行动.”
博弈的三个要素,即局中人,策略集和收益函 数构成了博弈信息,根据不同信息可对博弈 做如下分类:
1.按局中人对信息掌握情况分为:完全信息博弈 和不完全信息博弈; 2.按局中人采取行动的次序分为:如果同时采取 行动或在互相保密情况下采取行动,称为静态博 弈;如果采取行动有先后,后采取行动的人可以 观察到前面人采取的行动,称为动态博弈.
获奖理由:第一个提出储蓄的生命周期假 设,这一假设在研究家庭和企业储蓄中得到了 广泛应用。
什么是博弈论?
所谓博弈是指局中人按一定规则,在充分考虑其 他局中人可能采取的策略的基础上,从自己的策 略集中选取相应策略,并从中得到回报的过程. 博弈是一种特殊的决策,在决策论中,决策者的 对手是大自然,在博弈论中,代替大自然的是有 理性的人,因而任何一方做出决定时,都必须考 虑其他对手可能作出的反应.

《运筹学》课件 第六章 博弈论

《运筹学》课件 第六章 博弈论

§1 基本概念
一、博弈论的定义 二、博弈理论的历史 三、博弈问题举例 四、博弈的分类
三、
1. 囚犯困境(Prisoners’ dilemma
囚犯困境是图克(Tucker)1950年提出的; 该博弈是博奕论最经典、著名的博弈; 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷。
所有局中人的策略组成的向量。)
s (s1,, si,, sn ) 表示n个局中人达成的
一个协议,当这个协议可以自动实施(Self-enforcing) 时,即没有任何局中人有积极性破坏这个协议,那么 这个协议就构成纳什均衡。
否则,若至少存在某些局中人有积极性偏离这个协 议,就构不成纳什均衡。
例:囚犯困境问题:
但是,尽管政府当时无力制止这种事情,公众也不 必担心彩电价格会上涨。这是因为,“彩电厂商自 律联盟”只不过是一种“囚徒困境”,彩电价格不 会上涨。在高峰会议之后不到二周,国内彩电价格 不是上涨而是一路下跌。这是因为厂商们都有这样 一种心态:无论其他厂商是否降价,我自己降价是 有利于自己的市场份额扩大的。

坦白 抵赖
坦白

-9,-9
0,-10
抵赖 -10,0 -1,-1
均衡解: 二人均坦白
相关概念介绍
➢博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
坦白 抵赖
➢ 博弈问题的基本要素 (1)局中人(Players)
现代博弈论主要指非合作博弈理论。非合作博弈 更受重视的原因:主导人们行为的主要还是个体理性, 而非集体理性;即,竞争是一切社会、经济关系的根 本基础,不合作是基本的,合作是有条件和暂时的。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

10.2.1 策略型博弈模型及占优战略博弈
非合作博弈模型从模型自身形式上可分为扩展型和 策略型两种,一般用策略型模型描述完全信息静态 博弈模型。
构成策略型博弈模型的三个要素: 局中人、策略、支付函数
参与人或局中人(Players) :独立决策、独立承 担博弈结果的个人或组织
博弈规则面前博弈方之间平等,不因博弈方 之间权利、地位的差异而改变
标志着博弈论作为一门独立科学的开始,也 标志着新古典经济学进入了一个新的发展阶 段。
3. 1994年三位获诺奖的博弈论学者
John Nash
John Harsany
Leihaden Selten
4. 1996年诺贝尔经 济学奖得主:詹姆 斯·莫里 斯:主要贡 献:不对称信息条 件下的激励理论
5. 2001年诺贝尔经济学 奖 得 主: 迈 克尔 ·斯 宾 塞:在不对称信息市场 分析方面所做出开创性
研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
博弈论:博弈论就是系统研究具有上述特征的博弈问 题,寻求各博弈方合理选择战略情况下博弈的解,并 对这些解进行讨论分析的理论。
博弈的分类及对应的均衡概念
完全信息
静态
完全信息静态博弈 纳什均衡
代表人物:纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
10.2 完全信息静态博弈
10.2.1 策略型博弈模型及占优战略博弈 10.2.2 重复剔除的占优战略博弈 10.2.3 纳什均衡
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白是A的
囚徒A 占优战略
坦白
抵赖
-5,-5 0,-8
-8,0 -1,-1
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的0.2完全信息静态博弈
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马博弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作 1943年,冯·诺依曼和摩根斯顿发表《博 弈论和经济行为》的一书,
博弈方数量对博弈结果和分析有影响
根据博弈方数量分单人博弈、两人博弈、多 人博弈等。最常见的是两人博弈,单人博弈 是退化的博弈
策略或战略(strategies) :博弈中各博弈方 的选择内容。
策略有定性定量、简单复杂之分
不同博弈方之间不仅可选策略不同,而且可选策 略数量也可不同
有限博弈:每个博弈方的策略数都是有限的
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
都有一定的规则 都有一个结果 策略至关重要,游戏者不同的策略选择常会带来不同的游戏
结果 策略和利益有相互依存性
无限博弈:至少有某些博弈方的策略有无限多个
支付函数(Payoffs function) :各博弈方从博弈 中所获得的利益。
得益对应博弈的结果,也就是各博弈方策略的组 合
得益是各博弈方追求的根本目标及行为和判断的 主要依据
根据得益的博弈分类:零和博弈、常和博弈、变 和博弈
例10.1 囚徒困境博弈
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战略 均衡”(iterated dominance equilibrium).
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷
基本模型
经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人 入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双 方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称“背叛”对方), 而对方保持沉默,此人将即时获释,沉默者将判监8年。 若二人都保持沉默(相关术语称互相“合作”),则二人同 样判监1年。 若二人都互相检举(互相“背叛”),则二人同样判监5年。
囚徒困境( Prisoners’Dilemma )
只达到效率很差的个体理性解,没有实现团体 理性解。 前者是稳定的,是自动实施的;尽管团体理性 解对大家都好,但它是不能自动实施的,需要改变 条件。
提示:该博弈揭示了个体理性与团体理性之间的矛 盾。——从个体利益出发的行为往往不能实现团体的 最大利益,同时也揭示了个体理性本身的内在矛盾— —从个体利益出发的行为最终也不一定能真正实现个 体的最大利益,甚至得到相当差的结果。
智猪博弈(大小猪博弈)
智猪博弈:假设猪圈里有两头猪,一头大猪,一头小猪, 猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制 猪食的供应。按一下按钮。将有10个单位的猪食进入猪食 槽,供两头猪食用。两头猪面临选择的策略有两个:自己 去按按钮或等待另一头猪去按按钮。如果某一头猪作出自 己去按按钮的选择,它必须付出如下代价:第一,它需要 收益相当于2个单位的成本;第二,由于猪食槽远离猪食, 它将比另一头猪后到猪食槽,从而减少吃食的数量。
相关文档
最新文档