教案_对策论基础

合集下载

四年级上册数学教案-《对策论问题》人教新课标

四年级上册数学教案-《对策论问题》人教新课标

四年级上册数学教案-《对策论问题》人教新课标一、教学目标1. 让学生理解对策论的基本概念,掌握简单的对策论问题解决方法。

2. 培养学生运用数学知识解决实际问题的能力,提高学生的逻辑思维和分析问题的能力。

3. 培养学生的合作意识,让学生在合作中学会沟通、交流,培养团队精神。

二、教学内容1. 对策论的基本概念:对策、参与者、策略、支付函数、纳什均衡等。

2. 简单的对策论问题:石头、剪刀、布游戏,井字棋游戏等。

3. 对策论问题的解决方法:画树状图、矩阵法等。

三、教学重点与难点1. 教学重点:让学生理解对策论的基本概念,掌握简单的对策论问题解决方法。

2. 教学难点:让学生运用数学知识解决实际问题,培养学生的逻辑思维和分析问题的能力。

四、教学过程1. 导入新课:通过生活中的实例,如石头、剪刀、布游戏,引入对策论的概念,激发学生的学习兴趣。

2. 讲解新课:讲解对策论的基本概念,让学生了解对策、参与者、策略、支付函数、纳什均衡等。

3. 案例分析:分析石头、剪刀、布游戏,让学生了解对策论在实际生活中的应用。

4. 解决问题:让学生运用所学知识解决井字棋游戏等简单的对策论问题,培养学生的逻辑思维和分析问题的能力。

5. 小组讨论:让学生分组讨论,共同解决对策论问题,培养学生的合作意识和团队精神。

6. 总结提升:对本节课所学内容进行总结,让学生明确对策论在实际生活中的重要性。

五、课后作业1. 请学生列举生活中的对策论问题,并尝试用所学知识解决。

2. 让学生回家与家长一起玩石头、剪刀、布游戏,并思考如何制定最优策略。

六、教学反思1. 教师要关注学生在课堂上的参与度,调动学生的积极性,让每个学生都能参与到教学活动中来。

2. 在讲解对策论问题时,教师要注意引导学生运用数学知识,培养学生的逻辑思维和分析问题的能力。

3. 教师要关注学生的合作学习,培养学生的团队精神,让学生在合作中学会沟通、交流。

总之,本节课通过讲解对策论的基本概念,让学生了解对策论在实际生活中的应用,培养学生的逻辑思维和分析问题的能力,以及合作意识和团队精神。

对策论讲义

对策论讲义

对策论讲义对策论【教学内容】对策论的基本概念,纳什均衡,矩阵对策,二人的无限零和对策,有限的二人非零和对策,n人合作型对策与n人合作型对策。

【教学要求】要求学生理解对策论的基本概念,掌握矩阵对策的求解方法;理解纳什均衡的概念及相应的求解方法、理解二人的无限零和对策及有限的二人非零和对策问题,了解n人合作型对策与n人合作型对策。

【教学重点】对策论的基本概念、矩阵对策及求解、纳什均衡与求解、二人的无限零和对策,有限的二人非零和对策。

【教学难点】建立对策的模型求解。

【教材内容及教学过程】对策论来自于生活。

简单的问题如游戏,决策者的策略对最终结果有着举足轻重的影响,但决策者的策略选择也要考虑其它策略者的策略选择,现实生活中一个坏的策略选择未必带来坏的结果(原因是他方选择了对自己不利,对前者有利的策略),对策论的研究中排除了对方犯错误的可能性,每个决策者都在考虑到他方的各种策略后,选择对自己最有利的策略。

对策论解决的问题大的象经济生活中的经营决策、市场竞争,政治、军事活动中的竞选、谈判、联合和战争等,从这点来说对策论大有用武之地。

本章先介绍了对策论的基本概念,然后通过例子介绍了纳什均衡的概念及求解方法,重点介绍了二人零和对策(矩阵对策)与求解,接着介绍二人的无限零和对策、有限的二人非零和对策。

最后介绍n人合作型对策与n人合作型对策,目的是让学生通过本章学习,对其基本方法有所掌握与了解,为以后的实际应用打好基础。

i.§1.1 对策的三要素第一节引言从前述可看出对策论是研究具有斗争或竞争性质现象的数学理论和方法。

根据不同性质的问题,可建立不同的对策模型。

尽管对策模型的种类可以千差万别,但本质上都必须包含3个基本要素:1.局中人局中人即在一个对策行为中,有权决定自己行动方案的对策参加者。

通常用I表示局中- 1 -人的集合,如果有n个局中人,则I=?1,2,3,…n两个局中人。

?。

一般要求一个对策中至少要有对策中关于局中人的概念是广义的。

《对策问题》(教案)2023-2024学年数学四年级上册-人教版.doc

《对策问题》(教案)2023-2024学年数学四年级上册-人教版.doc

对策问题(教案)教学目标1. 理解对策问题的基本概念和原理。

2. 学会使用简单的对策方法解决实际问题。

3. 培养学生的逻辑思维能力和解决问题的能力。

教学重点1. 对策问题的基本概念。

2. 对策问题的解决方法。

教学难点1. 对策问题的建模。

2. 对策问题的求解。

教学准备1. 教学课件。

2. 教学用具。

教学过程一、导入(5分钟)1. 引入对策问题的概念,让学生了解对策问题的基本含义。

2. 通过一个简单的例子,让学生初步感受对策问题的解决方法。

二、讲解(10分钟)1. 详细讲解对策问题的基本概念和原理。

2. 通过实例,讲解对策问题的解决方法。

三、练习(10分钟)1. 让学生独立完成一些对策问题的练习题。

2. 老师对学生的解答进行点评和指导。

四、拓展(5分钟)1. 引导学生思考对策问题在实际生活中的应用。

2. 让学生尝试解决一些实际问题。

五、总结(5分钟)1. 对本节课的内容进行总结。

2. 强调对策问题的重要性和应用价值。

作业布置1. 完成课后练习题。

2. 思考对策问题在实际生活中的应用,并尝试解决一些实际问题。

教学反思通过本节课的教学,学生应该能够理解对策问题的基本概念和原理,学会使用简单的对策方法解决实际问题。

在教学过程中,要注意培养学生的逻辑思维能力和解决问题的能力,引导他们思考和探索对策问题在实际生活中的应用。

同时,也要注意对学生的作业进行及时的批改和反馈,帮助他们巩固和提高对策问题的解决能力。

在以上的教案中,"教学过程"是需要重点关注的细节。

教学过程是教案的核心部分,它详细描述了教师将如何引导学生学习新知识,包括导入、讲解、练习、拓展和总结等环节。

这些环节的设计直接影响到学生的学习效果和理解程度。

以下是对教学过程的详细补充和说明:一、导入(5分钟)导入环节是吸引学生注意力和激发兴趣的重要部分。

在这个环节中,教师可以通过以下方式引入对策问题的概念:1. 情境创设:教师可以创设一个与学生生活相关的情境,例如游戏、比赛或决策场景,让学生在具体的情境中感受对策问题的存在。

人教版小学数学四年级上册《对策论问题》优秀教案教学设计

人教版小学数学四年级上册《对策论问题》优秀教案教学设计

人教版小学数学四年级上册《对策论问题》优秀教案教学设计3对策论问题上课解决方案教案设计设计说明在教学本节课时,一部分学生已经对田忌赛马的故事有所了解,但只是停留在浅层次的理解之上,没能从数学的角度去具体思考其中蕴涵的对策论思想。

在本节课的教学中,让这个故事发挥其应有的教育功能。

1.重视对学习兴趣的激发。

俗话说:“好的开始是成功的一半。

”在教学中,从学生感兴趣的故事入手,有效地激发了他们的学习兴趣,使学生的注意力很快地被吸引过来,积极主动地进入学习状态。

2.重视学生的互动探究。

在教学中,组织一些与教学内容有着紧密联系的活动,让学生全部参与到操作活动中,并通过师生之间、生生之间的信息交流及活动交往,达到知识的互补,培养学生发现问题、探究问题、解决问题的能力。

课前准备教师准备 PPT课件扑克牌学生准备表格两种颜色马的图片各3张教学过程⊙创设情境,提出问题通过课件向学生展示万马奔腾的画面,并指出:由于特定的历史条件,当时齐国人很喜欢一种活动——赛马。

今天这节课就让我们从2000多年前战国时期的一个关于赛马的故事说起。

1.同学们,你们听说过”田忌赛马”的故事吗?(课件展示:田忌赛马)师:从刚才的故事中,你知道了什么?(学生自由回答)2.田忌之所以能赢齐王,从数学的角度去分析,是因为他巧妙地运用了我们数学中的一种策略方法,那么田忌到底运用了什么策略赢了齐王呢?这节课就让我们一起来研究这个问题。

(板书课题:对策论问题)设计意图:新课伊始,教师借助课件,以生动的故事调动学生学习的积极性,引发学生的数学思考,引领学生步入探索求知的课堂活动中。

⊙互动探究,发现策略1.动手操作,探究田忌获胜的策略。

同学们,齐王的每一等级马都要比田忌的马强一些,田忌却赢了齐王,你知道他是怎样赢齐王的吗?教师根据学生的回答课件演示如下:齐王田忌本场胜者第一场上等马下等马齐王第二场中等马上等马田忌第三场下等马中等马田忌2.再次小组合作探究,验证田忌赛马取胜对策的唯一性。

对策论

对策论

例 1:
甲、乙两名儿童玩猜拳游戏。游戏中 双方可分别出拳头(代表石头)、 手掌(代表布),两个手指(代表 剪刀)。规则是剪刀赢布,布赢石 头,石头赢剪刀,赢者得一分。若 双方所出相同,算和局,均不得分。 试列出游戏中儿童甲的赢得矩阵。
儿童甲的赢得矩阵:
乙 甲 石头 布 剪刀 石头 0 1 -1 布 -1 0 1 剪刀 1 -1 0
在矩阵对策模型中,赢得矩阵每一行代表 了局中人甲的一个策略,每一列代表了局 中人乙的一个策略; 行的数目表示了甲的策略集的策略数目, 列的数目表示了乙的策略集的策略数目; 赢得矩阵的第i行第j列的数值表示了甲出 第i个策略,乙出第j个策略时,所得的损 益值(所得的损益值应为该数的相反数.)
例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组 成,双方都可排成三种不同的阵容,每一种阵容可以看作一
★各局中人使用一定的对策形成一个 局势时,一个局势就决定了各局中人 的对策的结果也称为对策的损益值。 ★一般而然,当以上三个基本因素确 定后一个对策模型也就确定了。 ★在众多对策模型中,占有重要地位 的是二人有限零和对策。
二人有限零和对策(two-person zero score game) 对策中存在有2个局中人; 每个局中人的策略集的策略数是有限 的; 每一局势的对策都有确定的损益值, 且对同一局势的两个局中人的损益值 之和为零。 例:齐王赛马
(上中下)(上下中)(中上下)(中下上)(下上中)(下中上)
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。 下面矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3

管理运筹学课件第13章-对策论

管理运筹学课件第13章-对策论
管理运筹学课件第13章对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。

第12章 对策论1

第12章 对策论1

1 2 3 4 min
1 2 A 3 4
8 1 9 3 max 9 6 8 3 4 6 7 1 10 6 10 6 6 3 1 Max 6 6 6 3 3 6
鞍点:
1 , 2 1 , 4 3 , 2 3 , 4
V乙
12
8 4 0
v1=ห้องสมุดไป่ตู้1-8y v2=2+3y
无论乙使用哪种策略,甲最小赢得如红线所示: 由最小最大原则,应选C点,由v2,v3两个方程联 立,解得x=3/11,此时的最优值v2=v3=v=49/11. 而v1=62/11,为下策,乙不会采用,即y1=0。 设:y2=y,y3=1-y,则甲的赢得期望为:
2.最大最小原则
对于矩阵对策G={S1,S2,A},设A={aij)m×n为局在人 甲的赢得矩阵,aij为在纯局势(αi,βj)下局中人甲的损益值, 对行中元素先取小后取大,即max min(aij),对应的局中 人甲的策略为αr;
对列中元素先取大后取小,即min max(aij),对应着
局中人乙的策略为βs,如果max min(aij)=min max(aij)=V成 立时,矩阵对策才存在最优纯策略,并把纯局势(αi,βj)称
3 4
Min
A 1 4 4 -4 Max=2 2 3 2 3
Max 4 3 Min=3
双方若仍然使用纯策略对策, 就会出现不稳定状态。
12.3 矩阵对策的最优混合策略
1.混合策略的概念
采取的不是惟一的策略,而是其策略空间上的一种概率分布。
[例12.4]儿童玩掷硬币游戏,乙猜对,甲给乙1元,错乙给甲1元. 甲出正面:α1,出背面:α2; 乙猜正面:β1,猜背面:β2。 最大最小原则 Min -1 Max=-1 -1 Max 1 1 Min=1 MaxMin(aij)≠MInMax(aij)

对策论专题知识讲座

对策论专题知识讲座

在甲方旳赢得矩阵中: A=[aij]m×n
i 行代表甲方策略 i=1, 2, …, m;j 列代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下 甲方旳益损值。此时乙方旳益损值为 -aij(零和性质)。
在考虑各方采用旳策略时,必须注意一种前提,就是 双方都是理智旳,即双方都是从各自可能出现旳最不利旳 情形选择一种最为有利旳情况作为决策旳根据。
10.4 矩阵对策旳矩阵降维
优超原则:
假设矩阵对策 G ={ S1, S2, A } 甲方赢得矩阵 A=[aij]mn 若存在两行(列),s 行(列)旳各元素均优于 t 行(列)旳元 素,即
asjatj j=1,2 … n ( ais ait i=1,2 … m )
称甲方策略s优超于t ( s优超于t)。
成立时,双方才有最优纯策略,并把(1,2)称为对策G在纯 策略下旳解,又称(1,2)为对策G旳鞍点。把其值V称之为对
策G={S1,S2,A}旳值。
10.3 矩阵对策旳混合策略
设矩阵对策 G = { S1, S2, A }。当
max i
min j
aij
min j
max i
aij
时,不存在最优纯策略。
人对策一样也是对策方在乎识到其他对策方旳存在,意识到其他 对策方对自己决策旳反应和反作用存在旳情况下谋求本身最大利 益旳决策活动。因而,它们旳基本性质和特征与两人对策是相同 旳,我们经常能够用研究两人对策一样旳思绪和措施来研究它们, 或将两人对策旳结论推广到多人对策。
但多人对策中出现了更多旳追求各自利益旳独立决策者,策 略旳相互依存关系也就更为复杂,对任一对策方旳决策引起旳反 应也就要比两人对策复杂得多。

对策论基础NEW

对策论基础NEW

田 忌 (上中下) 1 (上下中) 2 齐 (中上下) 3 王 (中下上) 4
1 2 3 4 5 6
3 1 1 -1 1 1 1 3 -1 1 1 1 1 1 3 1 -1 1 1 1 1 3 1 -1 1 -1 1 1 3 1 -1 1 1 1 1 3
(下中上) 5 (下上中) 6
一、基本概念与名词
7.零和对策:如果在任一“局势”中, 全体局中人的“得失”相加总是等于0 时,这个对策就称为零和对策。上述 赛马就是零和对策。否则称为非零和 对策 8.矩阵对策:参加对策的局中人只有二 人,而每个局中人可选策略只有有限个, 每局的得失之和为零.
二、对策分类
结 盟 对 策
联合对策
-1 1 1 1 1 3
(上下中)
齐 (中上下) 王 (中下上) (下中上) (下上中)
策略组合的得失:齐王赛马赢得矩阵A
田 忌 (上中下) 1 (上下中) 2
齐 (中上下) 3 王 (中下上) 4 (下中上) 5 (下上中) 6
1 2 3 4 5 6
3 1 1 -1 1 1 1 3 -1 1 1 1 1 1 3 1 -1 1 1 1 1 3 1 -1 1 -1 1 1 3 1 -1 1 1 1 1 3
1 2
8 4 1 10 0 6
• 从最坏处着想,去争取最好的结果---即最优纯策略。 • 对局中人甲来说,所有最坏的结果是(取A中每一行的最 小) :得 • {-8,2,-10,-3},在这些最坏的情况中最好的结果是 2,因此,无论局中人乙采取什么策略,局中甲只要选a2 参加对策,就能保证收入不会小于2。 • 对局中人乙来说,所有最坏的结果是(取A中每一列的最 大元素,损失最大): • {9,2,6}, • 在这些最坏的情况中最好的结果是2,因此,无论局中人 甲采取什么策略,局中乙只要选B2参加对策,就能保证损 失(支出)不会大于2。 • 那么,此时,局中人甲和乙的最坏情况下的最好结果的绝 对值相等(都是2),那么我们就称a2为局中人甲的最优 策略,B2就称为局中人乙的最优策略。(a2,B2)就称为 对策模型G={S1,S2,A}的最优局势,而局中人甲的赢 得值2称为对策G的值;

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
局中人称为“i旳对手”,记为-i。
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1

1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}

运筹学—对策论(一)

运筹学—对策论(一)

3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。

二人
动 策无


对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵

运筹学-10、对策论

运筹学-10、对策论
第五章
对策论
第一节 引言
一、对策行为与对策论
对策论又称博弈论,是运筹学的一个重要分 支。对策论所研究的主要对象是带有斗争或竞争性 质的现象。由于对策论研究的对象与政治、军事、 工业、农业、交通、运输等领域有密切关系,处理 问题的方法又有着明显的特色,所以越来越受到人 们的重视。
1
在日常生活中,我们经常看到一些相互之间的 竞争、比赛性质的现象,如下棋、打扑克、体育竞 赛等。
所以:min max aij
j i
max min aij (1)
i j
i
j
另一方面,对任意i,j均有:
min aij aij max aij j i max min aij max aij
i j i
j j
max min aij min max aij (2)
i
所以: max min aij
7
例1:设有矩阵对策,局中人Ⅱ的支付矩阵如下:
7 3 A 16 3
1 8 2 4 1 9 0 5
解: α3 → β3 → α4 → β1 → α 3
如果各局中人都不想冒险,必须考虑对方会 选择策略使他得到最差的收入。因此各局中人都 选择理智的决策行为。
对策的值为VG= 5。
17
二、矩阵对策的混合策略
矩阵对策G有鞍点时,就存在最优解(最优纯策 略),但是否一切矩阵对策问题中,各局中人都有 上述意义的最优纯策略呢?答案是否定的。
1 1 0 A 1 0 1 例1:石头、剪刀、布 1 1 0
max min aij 1 min max aij 1
i j j i
不存在上述纯策略意义下的解。

第8章:对策论《运筹学》

第8章:对策论《运筹学》

S2 {1, 2 , 3}
4 2 6
A
4
3
5
8 1 10
3 0
6
试求出双方的最优纯策略和对策值。
S1 {,1,2 ,3,4}
1 2 3
1 4 2 6
2
4
3
5
3 8 1 10
4 3 0
6
解:由 A 可以看出,局中人甲的最大赢得是8,要想得到这 个赢得,他就得选择纯策略α3 。
3
0
6
-3
836
定义1:设G={S1,S2;A}为矩阵对策,其中双方的策略集和赢
得矩阵分别为 S1 {1,2、, ,m} S2 、{1, 2, 。,若n有} 等A式 {:aij}mn
mai x[mjin(aij )] mjin[mai x(aij )] ai j
成立,则称 ai为 j 对策G的值,局势( i) , 为j对策G的解或平
意义上的解;
x* 和 y* 分别称为局中人甲和乙的最优混合策略;
VG 为矩阵对策G={S1,S2;A}或G’={X,Y;E}的值。
定理2: 局势(x*,y*)是矩阵对策G={S1,S2;A}在混合策略意义 上解的充分必要条件是对于一切 x∈X、y∈Y均存在:
E(x, y) E(x, y) E(x, y)
第二节 矩阵对策的基本理论
有限二人零和对策,即参加对策的局中人只有两个,而每个局
中人都有有限个可供选择的策略。而且在任一局势中,两个局中
人的得失之和总等于零(一个局中人的所得即为另一个局中人的
所失)。局中人的利益是冲突的,也称为对抗对策。
一、矩阵对策的数学模型
用甲、乙表示两个局中人,假设甲有 m 个策略,表示为:

对策论讲稿

对策论讲稿
• 超优原理:在矩阵博弈中,若所给支付矩阵中第i行的 各个元素都不超过第k行的各元素,即αij≤ αkj(j=1,2,…,n),则对局中人甲来说策略αi明显不如 策略αk,我们称纯策略αk优超纯策略αi,于是,局 中人甲可把αi从策略集S1中删去,并把A的第i行抹去; 同理,若第k列的元素都不小于第j列的对应元素,即 αik≥ αij(i=1,2,…,m),则对局中人乙来说策略βj 超优策略βk,可把βk从策略集S2中删去,并把A的第k 列抹去。利用这个方法优可能降低A的阶数,这种利用 超优策略降低支付矩阵A的阶数的原理为超优原理。 (此法可以减少求解矩阵博弈的计算量) • 例7 (415页例11-7, • 例8 (例11-8)
3.2 矩阵对策的最优纯策略
• 定理1 (αi*,βj*)为矩阵对策G= {S1,S2;A} 的鞍点的充要条件是对于任意 的i,j,有 aij*≤ai*j*≤ai*j • 即鞍点有这样的性质: ai*j*是第j*列的 最大元素,是第i*行的最小元素,也就 是说,对于纯局势(αi*,βj*),有下列 式成立:min ai*j =max aij*
3.2 矩阵对策的最优纯策略
例3 对于一个矩阵博弈G={甲,乙, S1 S2,A},其中 S1={1,2,3},S2={1,2,3}, -5 1 -7 A= 3 2 5 16 -1 -9 -4 0 4 求双方的最优策略? • 解:对于局中人甲,求矩阵A每行的最小值: • min{-5,1,-7}=-7; min{3,2,5}=2 • min{16,-1,-9}=-9; min{-4,0,4}=-4在从这些数中取 最大值,即max{-7,2,-9,-4}=2,因此局中人甲的ai*= a2 对于局中人乙,求矩阵每列的最大值,然后在求 最小值,局中人乙的βj*= a2 因此2是博弈G的值,即 v=2, a 与β 分别为局中人甲和乙的纯最优策略。

对策问题教案

对策问题教案

对策问题教学目标:1、学生通过简单的事例,初步体会对策论方法在解决实际问题中的应用。

2、在活动中让学生认识到解决问题策略的多样性,形成寻找解决问题最优方案的意识,同时培养学生详细分析,周密思考的思维品质。

3、感受数学在日常生活中的广泛应用,尝试用数学的方法来解决实际生活中的简单问题,初步培养学生的应用意识和解决实际问题的能力。

教学重点:能在所有可能采用的策略中选择一个最优策略。

教学难点:能初步体会对策论方法在解决问题中的应用,做到举一反三。

教学过程:一、创设情境,研究出牌对策1、男女生第一次比赛,体验实力悬殊,胜负分明。

师:玩过牌吗?会玩吗?今天我们男生女生来个大PK好吗?比赛规则是这样的,男女各生三张牌,一对一比大小,谁大谁就赢,三局两胜,明白了吗?出示:女生10、7、4和男生A、2、3(A、2分别当作1、2)师:比一比,谁会赢,怎么赢?师:看来男生和女生实力太悬殊了,女生肯定赢(出示实力悬殊,胜负分明)2、男女第二次比赛,体验实力稍逊,如何用对策以弱胜强。

(1)研究策略的多样性,优选策略师:男生换三张牌。

出示第二组牌女生:10、7、4,男生:9、6、3比一比,谁会赢?师:看来局势不一样了,有时候男生赢,有时候女生赢,那谁赢得机会大些?假如女生出牌的顺序是10、7、4,男生有多少种出牌的可能?在这么多方法里面要男生能够胜过女生这样的方法又有几种呢?想好了,把你要应对的方法写在第一张表格上。

看哪个同学排得最多。

找到所有应对方法之后去判断每种方法最终师:男生应对女生的方法一共有几种?只有6种,为什么?( 9开头两种,6开头两种,3开头两种。

师:在我们排出的方案中,谁赢得多?男生赢了几次?师:为什么女生赢得可能性大,男生赢得可能性小?生:女生整体实力强。

师:那男生取胜的这种方法有什么高明之处?生:男生用自己最小的牌对女生最大的牌,拿自己的中等牌对女生最小的牌,拿自己最大的牌对女生中等的牌)你听懂了吗?谁再来说一说?让学生多说几遍。

第三章-对策论

第三章-对策论

纳什简介
1994年诺贝尔经济学奖获得者, 纳什在普林斯顿读博士时刚刚20岁出 头,他的一篇关于非合作对策的博士 论文和其他两篇相关文章确立了他博 奕论大师的地位。到上世纪50年代末, 他已是闻名世界的大牌科学家了。
然而,正当他的事业如日中天的时候,天妒英才,他得了 严重的精神分裂症。多亏前妻艾莉西亚的爱心呵护和普林 斯顿大学诸多朋友和同事无私的帮助才没有使他流落街头, 并最终把他推上诺贝尔经济学奖宝座(1994年获奖)。
一、纯策略与混合策略 二、纯策略对策 三、混合策略对策
一、纯策略与混合策略
纯策略是指确定的选择某策略;而混合策略 则指以某一概率分布选择各策略。
§2 二人有限零和对策
一、纯策略与混合策略 二、纯策略对策
引例 纯策略分析 纯策略对策模型的解 优超原理
三、混合策略对策
二、纯策略对策
1. 引例
例 设一对策 G S, D, A,其中 S s1, s2 , s3,
{坦白,抵赖}
(3)局势
坦白 抵赖
坦白 抵赖 -9,-9 0,-10 -10,0 -1,-1
当每个局中人从各自策略集合中选择一策略而组 成的策略组成为一个局势,用 (si , d j )来表示。
(4)赢得(支付)
局中人采用某局势时的收益值。
例:当局中人甲选择策略si ,局中人乙选策略 dj 时,局中人甲的赢得值可用 R甲(si , d j )表示。
D d1, d2 , d3 ,其赢得矩阵为:
d1 d2 d3
A
s1 s2
3 6
1 0
2 - 3
s3 - 5 - 1 4
前提: 对策双方均理智
结论: 最不利中选最有利
问:双方局中人采用何策略最佳。

教案-对策论基础

教案-对策论基础

例子引出混合策略
赢得期望值 E(x, y) xy 3x(1 y) 4(1 x) y
2(1 x)(1 y)
4xy x 2 y 1/ 2 5 / 2
4(x 1/ 2)(y 1/ 4) 5 / 2
在x=1/2,y=1/4时,赢得函数取得最优值5/2。 这实际上是对策双方都满意的结果。我们把纯 策略对应的概率向量叫做混合策略,最优解则 是最优混合策略。本例中,最优混合策略是 (1/2,1/2)和(1/4,3/4)。
(ai*
Байду номын сангаас
j
)
的即为最优纯策略。
上述例子的最优纯策略为:最优局势
(2, 2 )
且G=2为局中人I的赢得值。
再看一例

已知
G

(S1 ,
S2,
A),
其中S1

{1,


2


3
4}
S2
{1,


2


3
4}
8 6 8 6
A


1
3
4
3
9 6 7 6
3 1 10
其中
1 2 3
1 6 1 8
A
2

3
2
4


3 4
9 3

1 0
10
6

纯策略与纯局势
如果局中人I,II的策略集分别为
S1 {a1, a2 ,, am}, S2 {1, 2 ,, n}
称 i为I
的纯策略,

j
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
矩阵: A(aij)
2020/12/5
• 齐王的赢得矩阵(支付矩阵)A
3
1
1
1
1
-1
1
3
1
1
-1
1

A=
1
-1
3
1
1
1
-1
1
1
3
1
1
1
1
-1
1
3
1
1
1
1
-1
1
3
• 田忌的赢得矩阵是什么?
2020/12/5
锤头、剪刀、布游戏
• 设游戏双方为甲、乙,则甲的赢得

甲的赢得





0
-1
1

1
0
-1

2020/12/5
博弈现象
下棋与打牌 体育比赛 战争 市场进入 谈判 生产管理决策 竞拍
2020/12/5
几个典型的博弈案例
• 锤子、剪刀、布的儿童游戏 • 囚徒困境 • 智猪博弈 • 强盗分金币
2020/12/5
一、基本概念与名词
• 局中人 • 策略与策略集 • 局势 • 赢得函数 • 零和对策 • 矩阵对策:二人有限零和对策
运筹学
2020/12/5
第六章 对策论基础
• 概论 • 矩阵对策的基本理论
2020/12/5
第一节 概论
• 对策与决策 • 决策是由单方做出的 • 对策是由利害冲突的多方做出的 • 1944年,Von Neumann &
D.Morgenstern合作出版《对策论与经济 行为》,标志着对策论的诞生
S 1 { a 1 ,a 2 , ,a m } S 2 ,{ 1 ,2 , ,n }
称 i为I 的纯策略, j为II 的纯策略,
对于纯策略i , j 构成的策略偶( i , j )称 为纯局势
2020/12/5
矩阵对策的纯策略解(鞍点解)
• 对于局中人I来说,各策略中最坏的结果 分别为{-8, 2, -10, -3}
2020/12/5
例子的最优纯策略
• 在上述定理中
a i* jm j (a iij)n, a i*jm i (a a ij)x
因此符合条件 mi (aaix* j)mj (ian i*j)
的即为最优纯策略。 • 上述例子的最优纯策略为:最优局势
(2,ቤተ መጻሕፍቲ ባይዱ)
• 且VG=2为局中人I的赢得值。
2020/12/5
3
1
1
1
王 (中下上) 4 -1
1
1
3
1
1
(下中上) 5 1
1
-1
1
3
1
(下上中) 6 1
1
1
-1
1
3
2020/12/5
对策的数学表示
• 二人矩阵对策用下列式子表示
G I , I , S 1 , I S 2 , A 或 G S 1 , S 2 , A
• 其中I、II表示两个局中人,S1、S2分别 表示局中人I、II的策略集,A则表示赢得
• 在这些最坏的情况中,最好的结果是 max{-8, 2, -10, -3}=2
即:只要局中人I采用 2 ,无论II采用何
种策略,I都可以保证赢得不少于2
• 在这种情况下,II应采用策略 2 ,否则
输得更多
2020/12/5
最优纯策略的表述
•若满足 m i m ajx{a iin } j m j m iin{a ai} jx
,表这示六,组对策田略忌用,则i,i用 1,i2 ,i,3 ,4 1,,5 2,,6 3,4,5,6 表示。
支付函数—赢了得一千金,输了付一千金。
2020/12/5
齐王赛马赢得函数
田忌
1 2 3 4 5 6
(上中下) 1 3
1
1
1
1
-1
(上下中) 2 1
3
1
1
-1
1
齐 (中上下) 3 1
-1
2020/12/5
• 零和对策
– 如果各局中人的赢得函数之和为零,则称之 为零和对策,反之为非零和对策
• 矩阵对策
– 有限二人零和对策 – 三个特征:局中人只有2个;每个局中人只
有有限个可选择的策略;在任一局势中,两 个局中人的得失之和为零
2020/12/5
二、对策分类
(一)按对策双方是否存在有约束力的协议 来分:合作对策 非合作对策 (二)按局中人数分类:二人对策 多人对策 (三)按策略数分类:
则上述条件规定的局势
(
* i
,
* j
)
叫做最优纯局势,也是矩阵对策的最优解,
是局中人I、II的最优纯策略,即鞍点
•定理:矩阵对策G={S1,S2,A}有纯策略解的 充要条件是存在一个纯局势 (i*, *j使) 得
a i* j a i* j* a i* j,i 1 ,2 , ,m ;j 1 ,2 , ,n
-1
1
0
2020/12/5
二、最优纯策略
• 现有一矩阵对策 G S1,S2,A
S1 {1, 2 , 3 , 4}, S2 {1, 2 , 3}
• 其中
1 2 3
1 6 1 8
A
2
3
2
4
3 4
9
3
1 0
10 6
2020/12/5
纯策略与纯局势
• 如果局中人I,II的策略集分别为
2020/12/5
• 局势
– 在一局对策中,每个局中人采用的策略所形 成的策略组称为一个局势,用s表示。
• 赢得函数(支付、支付函数,Payoff)
– 当局势出现后,对策的结果也就确定。即: 对任一局势 sS,局中人i可以得到一个赢得 Hi (s) ,显然,Hi (s) 是局势s的函数,称之 为第i个局中人的赢得函数
2020/12/5
• 策略和策略集
– 一局对策中,可供局中人选择的一个实际可 行的完整的行动方案,称为一个策略,它的 集合称为策略集S。
– 在儿童游戏中,锤子、剪刀、布就分别是一 个策略,{锤子、剪刀、布}就是一个策略 集。
– 如果每个局中人只有有限个策略,则相应的 对策称为有限对策,否则称为无限对策
有限策略对策 无限策略对策
二人有限零和对策是讨论的重点。
第二节 矩阵对策的基本理论
• 矩阵对策的数学模型 • 最优纯策略 • 混合策略与混合扩充
2020/12/5
一、矩阵对策的数学模型
以齐王赛马为例说明: 齐王赛马—二人有限零和对策
局中人—齐王和田忌 策略— 上 中下三种等级的马的组合 ,比三次,有六组策 略:( 上,中,下) 、 ( 中,上,下) 、 ( 上,下,中) 、 ( 中,下,上) 、 ( 下,上,中) 、 ( 下,中,上) ,对齐王
2020/12/5
局中人
– 在一个对策行为(或一局对策)中,有权决 定自己行动方案的对策参加者,称为局中人 (Player)
– 通常用I表示局中人的集合,如果有n个局中 人,则I={1,2,3,…,n}
– 在一个对策中,至少要有两个局中人 – 局中人,不一定是单个人,也可以是利益完
全一致的一个集体 – 只有两个局中人的对策,称为两人对策
相关文档
最新文档