运筹学与最优化方法课件--第七章--对策论模型--2012

合集下载

最优化方法PPT

最优化方法PPT

共117页第8页
同时太阳系这个"整体"又是它所属的"更大整 体"--银河系的一个组成部分。世界上的具体系统是 纷繁复杂的,必须按照一定的标准,将千差万别的 系统分门别类,以便分析、研究和管理,如:教育 系统、医疗卫生系统、宇航系统、通讯系统等等。 如果系统与外界或它所处的外部环境有物质、能量 和信息的交流,那么这个系统就是一个开放系统, 否则就是一个封闭系统。开放系统具有很强的生命 力,它可能促进经济实力的迅速增长,使落后地区 尽早走上现代化。如改革开放以来已大大增强了我 们的综合国力。而我国的许多边远山区农村,由于 交通不便,相对封闭,还处于比较落后的状态。
会科学和思维科学的相互渗透与交融汇流,产生了 具有高度抽象性和广泛综合性的系统论、控制论和 信息论。
系统论是研究系统的模式、性能、行为和规律 的一门科学。它为人们认识各种系统的组成、结构、 性能、行为和发展规律提供了一般方法论的指导。 系统论的创始人是美籍奥地利理论生物学家和哲学 家路德维格·贝塔朗菲。系统是由若干相互联系的 基本要素构成的,它是具有确定的特性和功能的有 机整体。如太阳系是由太阳及其围绕它运转的行星 (金星、地球、火星、木星等等)和卫星构成的。
从数学上比较一般的观点来看,所谓最优化问题可 以概括为这样一种数学模型:给定一个“函数”,F(X), 以及“自变量”X应满足的一定条件,求X为怎样的值时, F(X)取得其最大值或最小值。这里在函数和自变量两个 词上之所以打上引号,是想强调它们的含意比中学数学 和大学微积分中函数的定义要广泛得多。通常,称F(X) 为“目标函数”,X应满足的条件为“约束条件”。约 束条件一般用一个集合D表示为:X∈D。求目标函数 F(X)在约束条件X∈D下的最小值或最大值问题,就是一 般最优问题的数学模型,它还可以利用数学符号更简洁 地表示成:Min F(X)或Max F(X)。

运筹学PPT完整版

运筹学PPT完整版
线性规划通常解决下列两类问题:
(1)当任务或目标确定后,如何统筹兼顾,合理安排,用 最少的资源 (如资金、设备、原标材料、人工、时间等) 去完成确定的任务或目标 (2)在一定的资源条件限制下,如何组织安排生产获得最 好的经济效益(如产品量最多 、利润最大.)
线性规划问题的数学模型
例1.1 如图所示,如何截取x使铁皮所围成的容积最 大?
(2)
x j 0, j 1,2,, n (3)
求解线性规划问题,就是从满足约束条件(2)、(3)的方程组 中找出一个解,使目标函数(1)达到最大值。
线性规划问题的数学模型
Page 27
可行解:满足约束条件②、③的解为可行解。所有可行解 的集合为可行域。
最优解:使目标函数达到最大值的可行解。
绪论
本章主要内容: (1)运筹学简述 (2)运筹学的主要内容 (3)本课程的教材及参考书 (4)本课程的特点和要求 (5)本课程授课方式与考核 (6)运筹学在工商管理中的应用
运筹学简述
Page 2
运筹学(Operations Research) 系统工程的最重要的理论基础之一,在美国有人把运筹
学称之为管理科学(Management Science)。运筹学所研究的 问题,可简单地归结为一句话: “依照给定条件和目标,从众多方案中选择最佳方案” 故有人称之为最优化技术。
Page 3
运筹学的主要内容
Page 4
数学规划(线性规划、整数规划、目标规划、动态 规划等) 图论 存储论 排队论 对策论 排序与统筹方法 决策分析
本课程的教材及参考书
Page 5
❖选用教材 ➢ 《运筹学基础及应用》胡运权主编 哈工大出版社
❖参考教材 ➢ 《运筹学教程》胡运权主编 (第2版)清华出版社 ➢ 《管理运筹学》韩伯棠主编 (第2版)高等教育出版社 ➢ 《运筹学》(修订版) 钱颂迪主编 清华出版社

运筹学_对策论

运筹学_对策论
第17页
混合策略
• 混合扩充
矩阵对策扩充 N人有限对策
• 混合平衡解
矩阵对策 N人有限对策
• 均衡解的存在性
第18页
混 合 扩 充—矩阵对策
策略集
m
S * 1
{X
( x1 , x2 ,..., xm )
xi 1, xi 0, i 1,2,..., m}
i 1
nS* 2{Y( y1 ,y2 ,...,
yn )
y j 1, y j 0, j 1,2,..., n}
j 1
支付函数
mn
E( X ,Y )
aij xi y j
i1 j1
混合扩充: *
{
S1*
,
S
* 2
,
E
(
x
,
y),
x
S1* ,
y
S
* 2
}
第19页
混 合 扩 充—N人有限对策
N 人有限对策 I {1,2,..., N }, Si , i I , H i (s), i I
• 定理1 N人有限对策的混合扩充存在平衡局势. • 定理2 矩阵对策的混合扩充存在平衡局势.
第23页
矩阵对策的解法
• 问题的简化
优超 算例
• 线性规划方法
基本思想 算例
第24页
优超
给定矩阵对策 {S1 , S2 , A} , A 是 m n 的矩阵,如果
akj alj , j 1,2,..., n
则称局中人 1 的策略 k 优超于策略 l。如果
aik ail , i 1,2,..., m
则称局中人 2 的策略 k 优超于策略 l。
注:局中人 1 的策略 k 优超于策略 l 则说明对局中人 1

【课件】运筹学与最优化方法(华南理工)第 七 章(06-1)PPT教学课件

【课件】运筹学与最优化方法(华南理工)第 七 章(06-1)PPT教学课件
第七章
目标规划
2020/12/09
1
第七章 目标规划
在科学研究、经济建设和生产实践中,人 们经常遇到一类含有多个目标的数学规划问题, 我们称之为多目标规划。本章介绍一种特殊的 多目标规划叫目标规划(goal programming), 这是美国学者Charnes等在1952年提出来的。 目标规划在实践中的应用十分广泛,它的重要 特点是对各个目标分级加权与逐级优化,这符 合人们处理问题要分别轻重缓急保证重点的思 考方式。
试建立这个问题的数学模型.
讨论:
若把总利润最大看作目标,而把产量不能
超过市场预测 2020/12/09
4
7.1 目标规划模型
7.1.1 问题提出 (续)
的销售量、工人加班时间最少和要尽可能满足市
场需求的目标看作约束,则可建立一个单目标 线性规划模型
设决策变量 x1,x2 分别为产品A,B的产量
Max Z = 12x1 + 18x2
2020/12/09
6
7.1 目标规划模型
7.1.2 目标规划模型的基本概念
把例7.1.1的4个目标表示为不等式.仍设
决策变量 麽,
x1,x2 分别为产品A,B的产量.

第一个目标为: x1 9 ,x2 8 ; 第二个目标为: 4x1 + 6x2 60 ;
第三个目标为: 希望总利润最大,要表示成
我们用正偏差变量d + 表示决策值超过目标 值的部分;负偏差变量d - 表示决策值不足目 标值的部分。因决策值不可能既超过目标值 同时又末达到目标值,故恒有 d + d - = 0.
(2)、绝对约束和目标约束
我们把所有等式、不等式约束分为两部分:绝

运筹学与最优化方法

运筹学与最优化方法
n
五、基本概念和符号(续)
2、多元函数及其导数
(2) 梯度(一阶偏导数向量): T n f ( x) = ( f / x1 , f / x2 , … , f / xn ) R . 线性函数:f (x) = cTx + b , f (x) = c 二次函数:f (x) = (1/2) xTQx + cTx + b f (x) = Qx + c m 向量值线性函数:F(x) = Ax + d R F / x = AT
( 1)
,d
(2)
,…,d
(m) m
R, d
(j)
n
(k)
0
记 L( d
(1)
,d
(2)
,…,d
(m)
)={ x = d j j =1
jR }
为由向量d , d , … , d 生成的子空间,简记为L。 n 正交子空间:设 L 为R 的子空间,其正交子空间为 n L ={ x R xTy=0 , y L } n n 子空间投影定理:设 L 为R 的子空间。那么 x R , 唯一 x L , y L , 使 z=x+y , 且 x 为问题 min ‖z - u‖ s.t. u L 的唯一解,最优值为‖y‖。 n 特别, L =R 时,正交子空间 L ={ 0 }(零空间)
d 0 x x+(1/2)d
n
五、基本概念和符号(续)
1、向量和子空间投影定理
(2) 向量运算:x , y R
n
x,y
的内积:xTy
= i =1 xiyi = x1y1+ x2y2+ …+ xnyn

最优化方法全部ppt课件

最优化方法全部ppt课件
解法:Lagrange乘子法
1.2 实例
数据拟合问题 原料切割问题 运输问题 营养配餐问题 分配问题
1.3 基本概念
1. 最优化问题的向量表示法
设 xvx1,x2,L,xnT 则
m i n fx 1 ,x 2 ,L ,x n m i n fx v (1)
以向量为变量的实值函数 定义向量间的序关系(定义1.1):
②取 c0,1,4,9,L并画出相应的曲线(称之为等值线).
③确定极值点位置,并用以往所学方法求之。
易知本题的极小值点 xv* 2,1T。
再复杂点的情形见P13上的例1.7。 虽然三维及以上的问题不便于在平面上画图,图解 法失效,但仍有相应的等值面的概念,且等值面具有以 下性质:
①有不同函数值的等值面互不相交(因目标函数是单值 函数的缘故);
其中
g1 xv0
x1
g2 xv0
x1
L
gv
xv0
g1 xv0
x2
g2 xv0
x2
L
M
g1 xv0
xn
M
g2 xv0
xn
称为向量值函数 gv xv 在点
L
xv 0
g
m xv0
x1
g
m
xv0
x2
g
M
m xv0
xn
处的导数,
而gv xv0 T 称为向量值函数 gv xv 在点 xv 0 处的Jacobi矩阵。
称为最优化方法。最优化方法是在第二次世界大战前后,
在军事领域中对导弹、雷达控制的研究中逐渐发展起来 的。
最优化方法解决问题一般步骤: (1)提出需要进行最优化的问题,开始收集有关资 料和数据; (2)建立求解最优化问题的有关数学模型,确定变 量,列出目标函数和有关约束条件; (3)分析模型,选择合适的最优化方法; (4)求解方程。一般通过编制程序在电子计算机上 求得最优解; (5)最优解的验证和实施。 随着系统科学的发展和各个领域的需求,最优化方 法不断地应用于经济、自然、军事和社会研究的各个领 域。

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
局中人称为“i旳对手”,记为-i。
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1

1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}

运筹学对策论优秀课件

运筹学对策论优秀课件
6
用矩阵表示为(称为局中人Ⅰ的赢得矩阵 或局中人Ⅱ的支付矩阵):
a11 a12
A
a21
a22
am1 am2Biblioteka a1n a2namn
我们称两人有限零和对策为矩阵对策, 记为:G={Ⅰ,Ⅱ ;S1,S2;A} 或 G={S1,S2; A}。
7
例1:设有矩阵对策,局中人Ⅱ的支付矩阵如下:
7 1 8
m a i xm jinaij m jinai*j
m
ax
i
a ij
:
16,2,5
局中人Ⅱ选择这些最大数中的最小者。即:
m j in m a ix a ij m in { 1 6 ,2 ,5 } 2 a 2 2
即选择策略β2。 Ⅰ的最优策略为α2, Ⅱ的最优策略为β2 。
10
定义:设G={S1,S2;A}为矩阵对策,其中S1= {α1,α2,…αm},S2={β1,β2,…βn}。A=(aij) m×n, 若满足等式:
2
在这类行为中,参加斗争或竞争的各方各自 具有不同的目标和利益,为了达到各自的目标和 利益各方必须考虑对手的各种可能的行动方案, 并力图选取对自己最为有利或最为合理的方案, 对策论就是研究对策行为中斗争各方是否存在着 最合理的行动方案,以及如何找到这个合理的行 动方案的数学理论和方法。
例:两个儿童玩的“石头—剪子—布”游戏 和我国古代的“齐王赛马”就是典型的对策论研 究的例子。
5
第二节 矩阵对策的基本定理
一、矩阵对策的数学模型
特点:①局中人只有两人,分别用局中人Ⅰ和局 中人Ⅱ表示,双方都只有有限个策略可供选择,
Ⅰ的策略集为: S1(1,2, ,m)
Ⅱ的策略集为:S2(1,2, ,n)

运筹学教程对策论

运筹学教程对策论
局中人2 局中人1 1(正) 2(反) 1(正) 1 -1 2(反) -1 1
Games) §2.矩阵对策(Matrix Games) 2.矩阵对策( 矩阵对策
剪刀、 例2:“石头 、剪刀、布”游戏
局中人2 局中人2 局中人1 局中人1 1(石头) ) 2(剪刀) 剪刀) 3 (布) 0 -1 1 1 0 -1 -1 1 0 1(石头) ) 2(剪刀) 剪刀) 3 (布)
0=0
3.最优纯策略
齐王赛马:
-1<3
3.最优纯策略
定义:一个矩阵对策,如果它的支付矩阵A的元素满足: 定义:一个矩阵对策,如果它的支付矩阵A的元素满足:
则称这个值v为对策的值。如果纯局势(i*,j*)使: 则称这个值v为对策的值。
则称( 为对策G的鞍点( point),也称它是对策G 则称(i*,j*)为对策G的鞍点(Saddle point),也称它是对策G在 纯策略中的解, 分别为局中人1和局中人2的最优解。 纯策略中的解,i*与j*分别为局中人1和局中人2的最优解。
故对策的解为(3,3),即秋季贮煤20吨合理。(决策论中的悲观准则)
3.最优纯策略
例6:甲、乙双方谈判签订一项合同,甲方的“要价”是25万元,而乙方的“ 出价”是20万元,谈判陷于僵局。为打破僵局,双方约定,再各报一个价。以 下述价格成交:谁让步多,取谁出的价;如果双方让步相同,则取双方报价的 中间值。问甲、乙双方应如何报价?最后的成交价是多少? 解 显然,甲、乙双方的报价都在20万元到25万元之间。不妨取整数值,甲 、乙各有6个策略:报价20,21,…,25(单位:万元)。由约定知,甲的支付矩 阵可用表所示。
•局中人: •策略: 自始至终的行动方案; 把局中人的策略全体,称做这个局中人的策略集合; 例如,在齐王与田忌赛马的例子中,如果—开始就要把各人的三匹马排好 次序,然后依次出赛。各局中人都有六个策略:(1)(上、中、下),(2) ( 上、下、中)(3)(中、上、下)(4)(中、下、上),( 5 ) ( 下 、 中 、 上 ) , (6) (下、上、中)。这个策略全体就是局中人的策略集合。 有限,无限

第七章 对策论

第七章 对策论

第七章对策论§1 引言社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来解决这样的问题开始于17世纪的科学家,如C.,Huygens和W.,Leibnitz等。

现代对策论起源于1944年J.,V on Neumann和O.,Morgenstern的著作《Theory of Games and Economic Behavior》。

对策论亦称竞赛论或博弈论。

是研究具有斗争或竞争性质现象的数学理论和方法。

一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。

对策论发展的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常生活等有着密切的联系,并且处理问题的方法又有明显特色。

所以日益引起广泛的注意。

在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。

具有竞争或对抗性质的行为称为对策行为。

在这类行为中。

参加斗争或竞争的各方各自具有不同的目标和利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。

对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。

§2 对策问题对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果。

先考察一个实际例子。

例1 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑18个月;如果双方都供认伪造了钱币,将各被判刑3年;如果一方供认另一方不供认,则供认方将被从宽处理而免刑,但另一方面将被判刑7年。

将嫌疑犯A、B被判刑的几种可能情况列表如下:嫌疑犯B供认不供认嫌疑犯A供认(3,3)(0,7)不供认(7,0)(1.5,1.5)表中每对数字表示嫌疑犯BA、被判刑的年数。

运筹与优化对策论PPT课件

运筹与优化对策论PPT课件

是对策G的两个解,则 akr =apq.
事实上,由 aij ,有aij aij
apq≤ apr≤ akr ≤ akq ≤ apq
因此 akr =apq.
6 5
2
1
7 5
6
2
第9页/共44页
性质2(可交换性).若(αk,βr)和 (αp,βq) 是对策G的两个解,则(αk,βq)和 (αp,βr) 也是对策G的解. 由 aiq ≤ apq= akr ≤ akq≤ apq = akr ≤ akj 得aiq≤akq≤ akj ,即akq是鞍点. 故(αk,βq)是解.同理,(αp,βr)是解.
,
y

S
* 2
,

(
x
*
,
y
*
)

G








:
对任意i=1,2,…,m

j=1,2,…,n,有
E(i,y*)≤E(x*,y*)≤E(x*,j) (7)
证明:设(x*,y*)是G的解,则由定理2,有
E(x,y*)≤E(x*,y*)≤E(x*,y) (4)
由于纯策略是混合策略的特例,故(7)式成立. 反之,设(7)式成立,由(5)、(6)有 E(x,y*)=∑E(i,y*)xi≤E(x*,y*)∑xi=E(x*,y*) E(x*,y)=∑E(x*,j)yj≥E(x*,y*)∑yj=E(x*,y*)可知(4)式成立,故(x*,y*)是G的解
S1={α1,α2,α3,α4}, S2={β1,β2,β3},
6 1 8
A
3
2
4
9 1 10
试求双方的最优策略和赢得.

运筹学与最优化方法课件--第七章--对策论模型--2012

运筹学与最优化方法课件--第七章--对策论模型--2012

海萨尼
值得一提的是纳什,他发表奠定 其在博弈论中重要地位的学术论文时,年 仅22岁,被人称为“一个天才”。1959年, 纳什被精神病医生诊断为“妄想性精神分 裂”,饱受精神病折磨40余年。
泽尔滕
二、基本概念
例1 市场上的某种商品仅由甲,乙两厂生产, 它们都 想通过内部改造,获得更多的市场份额,且两厂分别都有 三个可行方案.据预测,当双方采取不同的方案后甲厂的 市场占有份额(百分比)变动情况如下:
(五)静态博弈和动态博弈
1.静态博弈:是指所有博弈方同时或可看作同时选择策 略、采取行动的博弈。 2.动态博弈:是指博弈方的选择、行动有先有后,而且后 选择、后行动的博弈方在自己进行选择、行动之前可以看在 他之前选择、行动的博弈方的选择、行动的博弈。
(六)完全信息博弈和不完全信息博弈
1.完全信息博弈:是指每一参与者都拥有所有其他参 与者的特征、策略集及得益函数等方面的准确信息的博弈。 2.不完全信息博弈:是指参与者只了解上述信息中的 一部分的博弈。 将博弈的信息特征和行为时间特征结合起来,可以进一 步把博弈细分为下面四种类型的非合作博弈,得到四种均衡:
博 弈 论
美藉匈牙利数学家冯·诺依曼(John Von Neuman) 和美藉奥地利经济学家摩根斯顿(Morgenstern)相识于 普林斯顿大学,他们于1944年出版了经典著作《博弈论 与经济行为》,为现代博弈论的发展奠定了基础。
纳什
美国的数学家、经济学家纳什(John Nash), 美籍匈牙利经济学家海萨尼(John C. Harsanyi) 和德国经济学家泽尔滕(R.Selten)因对博弈论的卓 越贡献而获得1994年度的诺贝尔经济学家。
信息博弈 纳什均衡 完全信息动态博弈 子博弈精炼纳什均衡

运筹学与最优化方法

运筹学与最优化方法

( 1)
,d
(2)
,…,d
(m) m
R, d
(j)
n
(k)
0
记 L( d
(1)
,d
(2)
,…,d
(m)
)={ x = d j j =1
jR }
为由向量d , d , … , d 生成的子空间,简记为L。 n 正交子空间:设 L 为R 的子空间,其正交子空间为 n L ={ x R xTy=0 , y L } n n 子空间投影定理:设 L 为R 的子空间。那么 x R , 唯一 x L , y L , 使 z=x+y , 且 x 为问题 min ‖z - u‖ s.t. u L 的唯一解,最优值为‖y‖。 n 特别, L =R 时,正交子空间 L ={ 0 }(零空间)
x
x+y
点列的收敛:设点列{x(k)} R , x R 点列{x(k)}收敛到 x ,记 (k) = x lim‖x(k)- x‖ = 0 lim x (k) = x ,i lim x i k k ki
y
n
n
五、基本概念和符号(续)
1、向量和子空间投影定理
(3) 子空间:设 d

“若 xTy ≤ , yRn 且 y ≤ 0,则 x ≥ 0, ≥ 0 .” “若 xTy ≥ , yRn 且 y ≥ 0,则 x ≥ 0, ≤ 0 .” n “若 xTy ≥ , yR 且 y ≤ 0,则 x ≤ 0, ≤ 0 .” “若 xTy ≥ , y L Rn , 则 x L, ≤ 0 .”
一、什么是运筹学
为决策机构在对其控制下的业务活动进
行决策时,提供一门量化为基础的科学 方法。 或是一门应用科学,它广泛应用现有的 科学技术知识和数学方法,解决实际中 提出的专门问题,为决策者选择最优决 策提供定量依据。 运筹学是一种给出问题坏的答案的艺术, 否则的话,问题的结果会更坏。

运筹学课件——对策1

运筹学课件——对策1
第7章 对策论
对策论的产生,发展和应用 对策论的产生 发展和应用
早期工作 (1)191献。策梅罗设法证明了,对于每一个严格争利 严格争利 的二人完备信息 完备信息对局,或者其中一个对策者有一个确定的胜局 完备信息 纯策略,或者二个都有可靠的平局纯策略。这个结果适用于象 棋一类的棋类对局,证明胜局策略或平局的存在是一回事,而 找出它们就是另一回事了。到目前为止,还没有人找出一局象 棋的胜局策略或平局策略,甚至不知道到底是某一方有一胜局 策略,还是双方都有平局策略.
(2)策略 一局对策中,可供局中人选择的一个实际可行 实际可行 的完整的行动方案称为一个策略。 的完整的行动方案 策略的全体称为策略集,策略集可以是有限或无限 的。若策略集为有限集称为有限对策,否则称为无 限对策。 参加对策的每个局中人(i∈I)都有自己的策略集, S i 一般,每一局中人的策略集中至少应包括两个策略。

(2) 对于对策论的产生作出了重要贡献的另一位数学
家是法国人波涅尔,1921--1927年间他发表了一系 列文章,建立了对策论的数学基础。但是,波涅 尔没有证明对策论的核心定理——极小极大定理, 他还轻率地预言这个定理是不能证明的。
(3)1928年冯·诺意曼证明了博弈论的基本原理,从 而宣告了博弈论的正式诞生.(德国数学家冯-诺意 曼简洁明确地证明了极小极大定理)。
发展成熟 Nash均衡、经济博奕论、信息不对称对策和广义 、 对策.
标准型,广义型和合作型等基本的博弈模型,解的概 标准型,广义型和合作型等基本的博弈模型, 念及分析方法,构建了博弈论的理论框架. 念及分析方法,构建了博弈论的理论框架.
(4) 谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博 弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什 均衡的概念和均衡存在定理。 此外,塞尔顿、哈桑尼的研究也对博弈 论发展起到推动作用。为此,美国的数学家、经济学家纳什(John
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在应用方面从最初的经济学领域扩展到军 事、政治、社会学、心理学等方面, 近年来又 有回到经济学方面的趋势. 应强调指出的是,对策论在经济学中的应 用最为广泛也是最成功的.1994年诺贝尔经济 学奖同时授给三位博奕论专家纳什 (Nash),塞 尔腾 (selten)和豪尔沙尼(Harsanyi),就是一最 好的例证. 但这种研究目前主要还是定性的研究。
乙 甲 坦 白 抵 赖
坦 白 -3 -3 -5 0
抵 赖 0 -5 -1 -1
从以上三例中可发现, 对策现象包括以下三 个基本要素: 1.局中人(player): 局中人指有权决定自己行 动方案的对策参加者. 注意: 一个对策中至少应有两个局中人.局中 人可以是人,也可以是集团. 2.策略(strategy)与策略集(strategy set):策略 指局中人预先作出对付其他局中人的一个可能方 案,策略也称为纯策略. 一个局中人的策略全体,称为策略集.
7.2.2 在纯策略下有解对策的解法 下面通过对例1的分析, 说明在纯策略下有 解对策的求解方法及有解的条件. 例1 当对策双方采取不同的方案后甲厂的 市场占有份额(百分比)变动情况如下表所示:
甲厂
乙厂
1
10 12 6
2
-1 10 8
3
3 -5 5
1 2 3
这是一个两人有限零和对策,其数学模型为 Γ={ S甲, S乙;A }, 其中, S甲={1, 2, 3}, S乙={1, 2, 3},
两人有限零和对策的数学模型 一般地,设两个局中人为Ⅰ、Ⅱ, 且局中人Ⅰ 有m个纯策略1, 2 ,…, m ,局中人Ⅱ有n个纯策 略 1, 2,…, n, 则局中人Ⅰ, Ⅱ的策略集分别记 为: SⅠ={1, 2, …, m }, SⅡ={1, 2 , … , n }. 当局中人Ⅰ,Ⅱ分别采用纯策略i ,和j时,就形成 一个局势{i , j }, 设局中人Ⅰ在该局势下的赢得 为aij (其中i=1,2,…,m; j=1,2,…,n), 则局中人Ⅰ的 赢得矩阵为:A=(aij)m×n .
(二)单人博弈、双人博弈和多人博弈 (三)有限策略博弈和无限策略博弈 (四)零和博弈、常和博弈与变和博弈
1.零和博弈:是指在博弈中,一方的得益就是另一方的损 失,所有博弈方的得益总和为零。 2.常和博弈:是指所有博弈方的得益总和为非零的常数。 3.变和博弈:也称非常和博弈,它意味着不同的策略组合 或结果下各博弈方的得益之和一般是不相同的。
博 弈 论
美藉匈牙利数学家冯·诺依曼(John Von Neuman) 和美藉奥地利经济学家摩根斯顿(Morgenstern)相识于 普林斯顿大学,他们于1944年出版了经典著作《博弈论 与经济行为》,为现代博弈论的发展奠定了基础。
纳什
美国的数学家、经济学家纳什(John Nash), 美籍匈牙利经济学家海萨尼(John C. Harsanyi) 和德国经济学家泽尔滕(R.Selten)因对博弈论的卓 越贡献而获得1994年度的诺贝尔经济学家。
1944年J .von Neumann 和 O.Morgenstern出 版了Theory of Games and Economic Behavior,可 以说该书是对策论的奠基之作, 它第一次给对策 (game)以明确的数学描述,对有关理论作出了系统 的论证, 并且讨论了对策在经济学上的一些应用. 这也标志着对策论成为数学和运筹学的一个分支. 从1944年到现在,对策论在理论和应用方面都 有了极大的发展. 在理论方面,从最初的零和二人对策(zero-sum two-person game)发展到非零和n人对策(non-zerosum n-person game), 特别是最近10多年来, 在n人 合作对策 (n-person cooperative game)方面的研究 有很大的进展.
齐王的赢得函数如下表所示:
田忌
齐王
上 中 下 上 下 中
上 中 下 3 1
上 下 中
1 3
中 上 下 1 1
中 下 上 1 1
下 上 中
下 中 上 1
-1
1
-1
1
1
中 上 下
中 下 上
1
-1
1
3
1
1
3
1
1
-1
1 1
下 上 中 下 中 上
1 1
1
-1
1
3 1
1 3
-1
例3 “囚徒困境”: 在西方某国, 一次严重的纵火案 发生后, 警方抓到两个犯罪嫌疑人 (事实上正是他们为了 报复,一起放火烧了这个仓库),但又缺乏足够的证据证明. 于是,警方把他们隔离起来,要求坦白交代. 如果他们都承 认纵火,每人将入狱三年;如果他们都不坦白, 由于证据不 足, 每人将只入狱一年 ; 如果一个抵赖而另一个坦白并 且愿意作证, 那么抵赖者将入狱五年,而坦白者将得到释 放,免予刑事处罚.这样,两个囚徒面临的博弈格局如下表 所示:
第 七 章 对策论模型
7.1引言
一、对策论的发展和研究内容
对策论(game theory)又称博奕论,是研究具 有竞争或斗争现象的数学理论和方法;它既是现 代数学的分支,也是运筹学中的一个重要分支. 注意: ① 对策论就是研究两个或多个竞争 者之间利益有冲突时,各竞争者应如何分析各方 的局势, 权衡利弊,以决定自己应采取怎样的行 动,得到一个对己方最有利结局的数学理论. ② 对策论的研究非常强调个人理性.
(五)静态博弈和动态博弈
1.静态博弈:是指所有博弈方同时或可看作同时选择策 略、采取行动的博弈。 2.动态博弈:是指博弈方的选择、行动有先有后,而且后 选择、后行动的博弈方在自己进行选择、行动之前可以看在 他之前选择、行动的博弈方的选择、行动的博弈。
(六)完全信息博弈和不完全信息博弈
1.完全信息博弈:是指每一参与者都拥有所有其他参 与者的特征、策略集及得益函数等方面的准确信息的博弈。 2.不完全信息博弈:是指参与者只了解上述信息中的 一部分的博弈。 将博弈的信息特征和行为时间特征结合起来,可以进一 步把博弈细分为下面四种类型的非合作博弈,得到四种均衡:
对策的大致分类: 静态对策 结 盟
对 策 动态对策 不结盟
局中人
两 人 对 策 多 人 对 策
结 局 零 和 对 策
非 零 和 对 策
策 纯 策 略 对 策
混 合 பைடு நூலகம் 策
略 有 限 对 策
无 限 对 策
赢得函数
矩 阵 对 策 非 矩 阵 对 策
三.博弈(对策)的基本分类
(一)合作博弈和非合作博弈 1.合作博弈:如果各博弈方能达成某种 有约束力的契约 或协议(包括默契)以使他们选择共同的或 联合的策略。 2.非合作博弈:反之,就属于非合作博 弈。
信息特征
静态 行动先后顺序 动态
完全信息 完全信息静态博弈 纳什均衡 完全信息动态博弈 子博弈精炼纳什均衡
不完全信息 不完全信息静态博弈 贝叶斯纳什均衡 不完全信息动态博弈 精炼贝叶斯纳什均衡
四种博弈及其相应的均衡
趣例
智猪博弈(boxed pig game)
假设猪圈里有一大一小两头猪,猪圈的一头有一个猪食 槽,另一头有一个按钮,控制着猪食的供应。揿一下按钮就 会有10个单位的猪食进槽,供猪食用,但谁揿按钮谁就得付 出2个单位的效用成本。 如果大猪与小猪同时去揿按钮,大猪吃到7个单位的猪食 (扣去2个单位的效用成本,剩下的效用单位为5,显然这里 假设1个单位的猪食提供1个单位的效用),小猪吃到3个单位 的猪食(扣去2个单位的效用成本,剩下的效用单位为1); 如果大猪去揿按钮,小猪等待,大猪吃到6个单位的猪食(扣去 2个单位的效用成本,剩下的效用单位为4),小猪吃到4个单 位的猪食;如果小猪去揿按钮,等奔过来后只能吃到1个单位 的猪食(扣去成本,得到的效用为-1),先吃的大猪则可吃到 9个单位猪食,即得到9个单位的效用;当然,如果都不去揿 按钮,原地等待,则无猪食进槽,得到的效用均为0。
a11 a21 A=(aij)m×n = ... a m1
a12 a22 ... am 2
... a1n ... a2 n ... ... ... amn
记两人有限零和对策的数学模型为: Γ={Ⅰ,Ⅱ; SI, SⅡ; A} 或简记为: Γ={ SI, SⅡ; A} 注意:局中人Ⅱ的赢得矩阵是-A .
中,不同群体的积极性,主动性也是不一样的,从某种意
义上说,改革中要注意创造出尽可能多的“大猪”,减少 不劳而获的“小猪”。
7.2 两人有限零和对策 7.2.1 两人有限零和对策的数学模型 因为两人有限零和对策是最基本, 最简单的 一类对策,在理论和方法上比较成熟.同时,它又是 研究其它对策模型的基础. 所以我们主要介绍两 人有限零和对策,其次简介两人有限非零和对策. 两人有限零和对策:局中人仅有两个,且各自 只有有限个策略可供选择,同时在任一局势下,两 个局中人的赢得之和为零, 即一局中人的所得等 于另一局中人的所失. 由于赢得函数可用一个矩阵表示, 因而两人 有限零和对策亦称矩阵对策.
智猪博弈
在这个案例中,不论大猪选择“揿”还是“等待”,小 猪的最优选择都是“等待”,在预期小猪“等待”的前提下,
大猪的最优策略便是“揿”。也就是说,这个案例的纳什均衡
便是图中右上角表示的策略组合及其效用组合:大猪“揿”、 小猪“等待”。从而多劳者不多得。
智猪博弈常被用来说明“搭便车”的情形。如大股东 花费大量的时间与精力等监督股份公司的管理层,小股东 搭便车,不去实施监督,却享受大股东的监督带来的利益。 还有富人修路,穷人走修好的路等也是如此。在改革过程
海萨尼
值得一提的是纳什,他发表奠定 其在博弈论中重要地位的学术论文时,年 仅22岁,被人称为“一个天才”。1959年, 纳什被精神病医生诊断为“妄想性精神分 裂”,饱受精神病折磨40余年。
相关文档
最新文档