第15章 对策论
运筹学-第15章--对策论
1 8 5 8 5 5*
2 2 3 2 1 1
3 4
9 0
5 2
6 3
5 5*
3
0
max 9 5* 8 5*
可知 ai* j* =5,i*=1,3,j*=2,4.故(α1,β2)(α1,β4)(α2,
β2)(α2,β4)为对策的纳管 什理均运衡,筹 V学G=5.
15
• 最优纯策略求解步骤:
• 1、行中取小,小中取大得最大化最小收益 值;
• 2、列中取大,大中取小得最小化最大支付 值;
• 3、比较两值是否相等。若相等便存在最优 纯策略。若不等,则不存在最优纯策略。
管理运筹学
16
§3 矩阵对策的混合策略
设矩阵对策 G = { S1, S2, A }。当
max
i
min
j
aij
min
j
max
i
aij
时,不存在最优纯策略。
例:设一个赢得矩阵如下:
一个局势,一个局势决定了各局中人的对策结果(量化) 称为该局势对策的益损值。
管理运筹学
3
§1 对策论的基本概念
出赛的次序是一个策略 “齐王赛马”齐王在各局势中的益损值表(单位:千金)
管理运筹学
4
§1 对策论的基本概念
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。
A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m;j 列代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下甲方的 益损值。此时乙方的益损值为 -aij(零和性质)。
管理运筹学期末复习资料【韩伯棠】
运筹学(Operational Research)复习资料第一章绪论一、名词解释1.运筹学:运筹学是应用分析、试验、量化的方法,对经济管理系统中的人力、物力、财力等资源进行统筹安排,为决策者提供有依据的最优方案,以实现最有效的管理。
二、选择题1.运筹学的主要分支包括(ABDE )A图论B线性规划C非线性规划D整数规划E目标规划2. 最早运用运筹学理论的是( A )A . 二次世界大战期间,英国军事部门将运筹学运用到军事战略部署B . 美国最早将运筹学运用到农业和人口规划问题上C . 二次世界大战期间,英国政府将运筹学运用到政府制定计划D . 50年代,运筹学运用到研究人口,能源,粮食,第三世界经济发展等问题上第二章线性规划的图解法一、选择题/填空题1.线性规划标准式的特点:(1)目标函数最大化(2)约束条件为等式(3 决策变量为非负(4 ) 右端常数项为非负2. 在一定范围内,约束条件右边常数项增加一个单位:(1)如果对偶价格大于0,则其最优目标函数值得到改进,即求最大值时,最优目标函数值变得更大,求最小值时最优目标函数值变得更小。
(2)如果对偶价格小于0,则其最优目标函数值变坏,即求最大值时,最优目标函数值变小了;求最小值时,最优目标函数值变大了。
(3)如果对偶价格等于0,则其最优目标函数值不变。
3.LP模型(线性规划模型)三要素:(1)决策变量(2)约束条件(3)目标函数4. 数学模型中,“s·t”表示约束条件。
5. 将线性规划模型化成标准形式时,“≤”的约束条件要在不等式左端加上松弛变量。
6. 将线性规划模型化成标准形式时,“≥”的约束条件要在不等式左端减去剩余变量。
7.下列图形中阴影部分构成的集合是凸集的是A【解析】:如何判断是凸集?凸集:两点之间连线在图内凹集:两点之间连线在图外8. 线性规划问题有可行解且凸多边形无界,这时CA没有无界解 B 没有可行解 C 有无界解 D 有有限最优解9. 对于线性规划问题,下列说法正确的是( D )A. 线性规划问题可能没有可行解B. 在图解法上,线性规划问题的可行解区域都是“凸”区域C. 线性规划问题如有最优解,则最优解可在可行解区域顶点上到达D. 上述说法都正确第三章线性规划问题的计算机求解一、名词解释1.相差值:相应的决策变量的目标系数需要改进的数量,使得决策变量为正值。
系统架构设计师教程(第4版)
系统架构设计师教程(第4版)第 1 章计算机组成与体系结构 141.1.1计算机硬件的组成 141.1.2计算机系统结构的分类 151.1.3复杂指令集系统与精简指令集系统 171.1.4 总线 181.2.1主存储器 201.2.2辅助存储器 211.2.3Cache 存储器 221.3.1流⽔线周期 281.3.2计算流⽔线执⾏时间 281.3.3流⽔线的吞吐率 291.3.4流⽔线的加速⽐ 29第 2 章操作系统 302.1.1操作系统的定义 312.1.2操作系统分类 312.2.1进程管理 312.2.2存储管理 402.2.3设备管理 452.2.4⽂件管理 462.2.5作业管理 51第 3 章数据库系统 523.1数据库管理系统的类型 533.2数据库模式与范式 533.2.1数据库的结构与模式 533.2.2数据模型 553.2.2 关系代数 563.2.4数据的规范化 593.2.5反规范化 623.3数据库设计 633.3.1数据库设计的⽅法 643.3.2数据库设计的基本步骤 663.3.3需求分析 683.3.4概念结构设计 693.3.5逻辑结构设计 733.3.6物理结构设计 793.4事务管理 803.4.1并发控制 813.4.2故障与恢复 823.5备份与恢复 843.6分布式数据库系统 863.6.1分布式数据库的概念 863.6.2分布式数据库的架构 893.7数据仓库 943.7.1数据仓库的概念 943.7.2数据仓库的结构 963.7.3数据仓库的实现⽅法 983.8数据挖掘 1003.8.1数据挖掘的概念 1003.8.2数据挖掘的功能 1023.8.3数据挖掘常⽤技术 1033.8.4数据挖掘的流程 1053.9NoSQL 1063.10 ⼤数据 108第 4 章计算机⽹络 1094.1⽹络架构与协议 1094.1.1⽹络互联模型 1104.1.2常见的⽹络协议 1124.1.3 IPv6 1144.2局域⽹与⼴域⽹ 1174.2.1局域⽹基础知识 1174.2.2⽆线局域⽹ 1184.2.3⼴域⽹技术 1214.2.4⽹络接⼊技术 1214.3⽹络互连与常⽤设备 1234.4⽹络⼯程 1264.4.1⽹络规划 1264.4.2⽹络设计 1284.4.3⽹络实施 1304.5⽹络存储技术 1314.6综合布线 134第 5 章系统性能评价 1355.1性能指标 1365.1.1 计算机 1365.1.2 ⽹络 1395.1.3操作系统 1405.1.4数据库管理系统 1405.1.5Web 服务器 1415.2性能计算 1415.3性能设计 1435.3.1阿姆达尔解决⽅案 1435.3.2负载均衡 1445.4性能评估 1475.4.1基准测试程序 1475.4.2Web 服务器的性能评估 148 5.4.3系统监视 149第 6 章:开发⽅法 1506.1软件⽣命周期 1506.2软件开发模型 1526.2.1瀑布模型 1526.2.2演化模型 1556.2.3螺旋模型 1556.2.4增量模型 1566.2.5构件组装模型 1576.3统⼀过程 1586.4敏捷⽅法 1616.4.1极限编程 1626.4.2特征驱动开发 1666.4.3Scrum 1686.4.4⽔晶⽅法 1726.4.5其他敏捷⽅法 1746.5软件重⽤ 1746.5.1软件重⽤ 1746.5.2构件技术 1756.6基于架构的软件设计 1766.6.1ABSD ⽅法与⽣命周期 176 6.6.2基于架构的软件开发模型 179 6.7形式化⽅法 185第 7 章:系统规划 1867.1项⽬的提出与选择 1867.1.1项⽬的⽴项⽬标和动机 186 7.1.2项⽬的选择和确定 1877.1.3项⽬提出和选择的结果 191 7.2可⾏性研究与效益分析 192 7.2.1可⾏性研究的内容 1927.2.2成本效益分析 1947.2.3可⾏性分析报告 1957.3⽅案的制订和改进 1967.4新旧系统的分析和⽐较 199 7.4.1遗留系统的评价⽅法 200 7.4.2遗留系统的演化策略 204第 8 章:系统分析与设计⽅法 205 8.1定义问题与归结模型 2068.1.1问题分析 2068.1.2问题定义 2098.2需求分析与软件设计 2118.2.1需求分析的任务与过程 2118.2.2如何进⾏系统设计 2148.2.3软件设计的任务与活动 2158.3结构化分析与设计 2168.3.1结构化分析 2168.3.2结构化设计 2218.3.3模块设计 2238.4⾯向对象的分析与设计 2258.4.1⾯向对象的基本概念 2258.4.2⾯向对象分析 2288.4.3统⼀建模语⾔ 2298.5⽤户界⾯设计 2438.5.1⽤户界⾯设计的原则 2438.5.2⽤户界⾯设计过程 2448.6⼯作流设计 2458.6.1⼯作流设计概述 2458.6.2⼯作流管理系统 2478.7简单分布式计算机应⽤系统的设计 248 8.8系统运⾏环境的集成与设计 2508.9系统过渡计划 251第 9 章:软件架构设计 2539.1软件架构概述 2539.1.1软件架构的定义 2539.1.2软件架构的重要性 2559.1.3架构的模型 2569.2架构需求与软件质量属性 2589.2.1软件质量属性 2589.2.26 个质量属性及实现 2609.3软件架构风格 2689.3.1软件架构风格分类 2689.3.2数据流风格 2699.3.3调⽤/返回风格 2719.3.4独⽴构件风格 2749.3.5虚拟机风格 2759.3.6仓库风格 2759.4层次系统架构风格 2769.4.1⼆层及三层 C/S 架构风格 2779.4.2B/S 架构风格 2789.4.3MVC 架构风格 2809.4.4MVP 架构风格 2819.5⾯向服务的架构 2829.5.1SOA 概述 2839.5.2SOA 的关键技术 2859.5.3SOA 的实现⽅法 2879.5.4 微服务 2919.6架构设计 2959.7软件架构⽂档化 2979.8软件架构评估 3019.8.1软件架构评估的⽅法 3019.8.2架构的权衡分析法 3019.8.3成本效益分析法 3039.9构件及其复⽤ 3049.9.1商⽤构件标准规范 3059.9.2应⽤系统簇与构件系统 3069.9.3基于复⽤开发的组织结构 3079.10产品线及系统演化 3089.10.1复⽤与产品线 3089.10.2基于产品线的架构 3099.10.3产品线的开发模型 3109.10.4特定领域软件架构 3119.10.5架构及系统演化 3129.11软件架构视图 3139.11.1软件视图的分类 3139.11.2模块视图类型及其风格 3149.11.3C&C 视图类型及其风格 3169.11.4分配视图类型及其风格 3189.11.5各视图类型间的映射关系 320第 10 章:设计模式 32010.1设计模式概述 32010.1.1设计模式的概念 32110.1.2设计模式的组成 32110.1.3GoF 设计模式 32210.1.4其他设计模式 32410.1.5设计模式与软件架构 32510.1.6设计模式分类 32510.2设计模式及实现 32610.2.1Abstract Factory 模式 32610.2.2Singleton 模式 32910.2.3Decorator 模式 33010.2.4Facade/Session Facade 模式 332 10.2.5Mediator 模式 33410.2.6Observer 模式 33610.2.7Intercepting Filter 模式 33910.3设计模式总结 342第 11 章:测试评审⽅法 34211.1测试⽅法 34311.1.1软件测试阶段 34311.1.2⽩盒测试和⿊盒测试 34511.1.3缺陷的分类和级别 34811.1.4 调试 34911.2评审⽅法 35011.3验证与确认 35211.4测试⾃动化 35311.5⾯向对象的测试 354第 12 章:嵌⼊式系统设计 35612.1嵌⼊式系统概论 35712.2嵌⼊式系统的组成 35812.2.1硬件架构 35812.2.2软件架构 36412.3嵌⼊式开发平台与调试环境 365 12.3.1嵌⼊式系统软件开发平台 365 12.3.2嵌⼊式开发调试 36712.4嵌⼊式⽹络系统 37112.4.1现场总线⽹ 37112.4.2家庭信息⽹ 37211.4.3 ⽆线数据通信⽹ 37212.4.4 嵌⼊式 Internet 37312.5嵌⼊式数据库管理系统 37412.5.1使⽤环境的特点 37512.5.2系统组成与关键技术 37512.6实时系统与嵌⼊式操作系统 379 12.6.1嵌⼊式系统的实时概念 37912.6.2嵌⼊式操作系统概述 38012.6.3实时嵌⼊式操作系统 38212.6.4主流嵌⼊式操作系统介绍 385 12.7嵌⼊式系统开发设计 38612.7.1嵌⼊式系统设计概述 38612.7.2开发模型与设计流程 38912.7.3嵌⼊式系统设计的核⼼技术 391 12.7.4嵌⼊式开发设计环境 39412.7.5嵌⼊式软件设计模型 39412.7.6需求分析 39812.7.7系统设计 40012.7.8系统集成与测试 407第 13 章:开发管理 40713.1项⽬的范围、时间与成本 40813.1.1项⽬范围管理 40813.1.2项⽬成本管理 40913.1.3项⽬时间管理 41013.2配置管理与⽂档管理 41113.2.1软件配置管理的概念 41113.2.2软件配置管理的解决⽅案 41213.2.3软件⽂档管理 41613.3软件需求管理 42013.3.1需求变更 42013.3.2需求跟踪 42113.4软件开发的质量与风险 42213.4.1软件质量管理 42213.4.2项⽬风险管理 42513.5⼈⼒资源管理 43013.6软件的运⾏与评价 43613.7软件过程改进 436第 14 章:信息系统基础知识 43914.1信息系统概述 43914.1.1信息系统的组成 43914.1.2信息系统的⽣命周期 44114.1.3信息系统建设的原则 44314.1.4信息系统开发⽅法 44514.2信息系统⼯程 44714.2.1信息系统⼯程的概念 44714.2.2信息系统⼯程的内容 45014.2.3信息系统⼯程的总体规划 45314.2.4总体规划的⽅法论 46014.3政府信息化与电⼦政务 46514.3.1我国政府信息化的历程和策略 46614.3.2电⼦政务的内容 47014.3.3电⼦政务建设的过程模式和技术模式 47214.4企业信息化与电⼦商务 47614.4.1企业信息化概述 47614.4.2企业资源规划 47914.4.3客户关系管理 48414.4.4产品数据管理 48814.4.5企业门户 49114.4.6企业应⽤集成 49414.4.7供应链管理 49714.4.8电⼦商务概述 50014.6知识管理与商业智能 50214.6.1知识管理 50214.6.2商业智能 50414.7业务流程重组 505第 15 章:基于中间件的开发 50815.1中间件技术 50915.1.1中间件的概念 50915.1.2中间件的分类 51115.1.3中间件产品介绍 51215.2应⽤服务器技术 51315.2.1应⽤服务器的概念 51415.2.2主要的应⽤服务器 51615.3 J2EE 51815.3.1 表⽰层 51915.3.2 应⽤服务层 52015.4 .NET 523 平台 523 框架 52615.5企业应⽤集成 53115.6轻量级架构和重量级架构 53515.6.1Struts 框架 53515.6.2Spring 框架 53615.6.3Hibernate 框架 53715.6.4基于 Struts、Spring 和 Hibernate 的轻量级架构 539 15.6.5轻量级架构和重量级架构的探讨 540第 16 章:安全性和保密性设计 54116.1加密和解密 54216.1.1对称密钥加密算法 54216.1.2不对称密钥加密算法 54316.2数字签名与数字⽔印 54516.2.1数字签名 54616.3数字证书与密钥管理 54916.3.1密钥分配中⼼ 54916.3.2数字证书和公开密钥基础设施 551 16.4安全协议 55516.4.1IPSec 协议简述 55516.4.2SSL 协议 56016.4.3PGP 协议 56316.5计算机病毒与防治 56716.5.1计算机病毒概述 56716.5.2⽹络环境下的病毒发展新趋势 569 16.5.3计算机病毒的检测与清除 57016.5.4计算机病毒的预防 57216.6⾝份认证与访问控制 57316.6.1⾝份认证技术 57416.6.2访问控制技术 58016.7⽹络安全体系 58216.7.1OSI 安全架构 58316.7.2VPN 在⽹络安全中的应⽤ 585 16.8系统的安全性设计 58816.8.1物理安全问题与设计 58816.8.2防⽕墙及其在系统安全中的应⽤ 589 16.8.3⼊侵检测系统 59116.9安全性规章 59416.9.1安全管理制度 59416.9.2计算机犯罪与相关法规 595第 17 章:系统的可靠性分析与设计 598 17.1可靠性概述 59817.2系统故障模型 59917.2.1故障的来源以及表现 59917.2.2⼏种常⽤的故障模型 60017.3系统配置⽅法 60117.3.1单机容错技术 60117.3.2双机热备份技术 60217.3.3服务器集群技术 60317.4系统可靠性模型 60317.4.1时间模型 60417.4.2故障植⼊模型 60417.4.3数据模型 60617.5系统的可靠性分析和可靠度计算 606 17.5.1组合模型 60717.5.2马尔柯夫模型 61017.6提⾼系统可靠性的措施 61217.6.1硬件冗余 61317.6.2信息冗余 61617.7备份与恢复 617第 18 章:软件的知识产权保护 61818.1著作权法及实施条例 61918.1.1著作权法客体 61918.1.2著作权法的主体 62018.1.3 著作权 62018.2计算机软件保护条例 62218.3商标法及实施条例 62318.4专利法及实施细则 62518.5反不正当竞争法 626第 19 章:标准化知识 62819.1标准化概论 62819.2标准分级与标准类型 62819.2.1标准分级 62819.2.2强制性标准与推荐性标准 630第 20 章:应⽤数学 63220.1运筹⽅法 63220.1.1⽹络计划技术 63220.1.2线性规划 63620.1.3 决策论 63920.1.4 对策论 643第 21 章:虚拟化、云计算与物联⽹ 646 21.1 虚拟化 64621.1.1虚拟化技术的分类 64621.1.2虚拟化的模式 64921.2 云计算 65021.2.1云计算的特点 65021.2.2云计算的类型 65121.2.3云计算的应⽤ 65221.3 物联⽹ 65321.3.1物联⽹的层次结构 65421.3.2物联⽹的相关领域与技术 655 21.3.3物联⽹的应⽤ 660。
运筹学复习资料
试题结构:1、判断题(10×2`)2、单选题(10×2`)3、多选题(5 ×2`)4、计算题(5×10`)(第三、五、七、十一、十三章有计算题)第一张:绪论1.定义:运筹学是应用分析、试验、量化的方法,对经济管理系统中人力、物力、财力等资源进行统筹安排,为管理者提供有依据的最优方案,以实现最有效的管理。
2.研究内容:线性规划、整数线性规划、目标规划、图与网络模型、存储论、排队论、对策论、排序与统筹方法、决策分析、动态规划、预测3.运用运筹学解决问题的一般过程(课件答案)(课本答案)规定目标和明确问题认清问题收集数据和建立模型找出一些可供选择的方案求解模型和优化方案确定目标或评估方案的标准检验模型和评价方案评估各个方案方案实施和不断改进选出一个最优的方案执行此方案进行最后评估:问题是否得到圆满解决第二章:线性规划的图解方法1.怎样辨别一个模型是线性模型?其特征是:(1)问题的目标函数是多个决策变量的线性函数,通常是求最大值或最小值;(2)问题的约束条件是一组多个决策变量的线性不等式或等式。
2.线性规划三个要素建模步骤决策变量、目标函数、约束条件3.LP 问题的标准型11max .1,2,,0,1,2,,nj jj nij ji j j Z c x a x b s t i m x j n ===⎧=⎪=⎨⎪≥=⎩∑∑ 特点:(1)目标函数求最大值(2)约束条件都为等式方程,且右端常数项b i 都大于或等于零 (3)决策变量x j 为非负。
一般形式目标函数: max (min ) z = c 1 x 1 + c 2 x 2 + … + c n x n约束条件: s.t. a 11 x 1 + a 12 x 2 + … + a 1n x n ≤ ( =, ≥ )b 1 a 21 x 1 + a 22 x 2 + … + a 2n x n ≤ ( =, ≥ )b 2…… …… a m1 x 1 + a m2 x 2 + … + a mn x n ≤ ( =, ≥ )b mx 1 ,x 2 ,… ,x n ≥ 0 标准形式目标函数: max z = c 1 x 1 + c 2 x 2 + … + c n x n 约束条件: s.t. a 11 x 1 + a 12 x 2 + … + a 1n x n = b 1 a 21 x 1 + a 22 x 2 + … + a 2n x n = b 2 …… …… a m1 x 1 + a m2 x 2 + … + a mn x n = b mx 1 ,x 2 ,… ,x n ≥ 0,b i ≥04.线性问题的性质与判断 (1 )线性规划可行域为凸集(2)最优解在凸集上某一顶点达到(特殊情况下为凸集的某条边)(3 )可行域有界,则一定有最优解5.图解法与解的状况(1)图解法使用范围:仅有两个决策变量的LP(2)基本步骤:a.建立平面直角坐标系;b.将约束条件图解,求得满足约束条件的解的集合;c.作出目标函数的等值线,并根据优化要求,平移目标函数等值线,求出最优解。
管理运筹学期末复习资料【韩伯棠】
运筹学(Operational Research)复习资料第一章绪论一、名词解释1.运筹学:运筹学是应用分析、试验、量化的方法,对经济管理系统中的人力、物力、财力等资源进行统筹安排,为决策者提供有依据的最优方案,以实现最有效的管理。
二、选择题1.运筹学的主要分支包括(ABDE )A图论B线性规划C非线性规划D整数规划E目标规划2. 最早运用运筹学理论的是( A )A . 二次世界大战期间,英国军事部门将运筹学运用到军事战略部署B . 美国最早将运筹学运用到农业和人口规划问题上C . 二次世界大战期间,英国政府将运筹学运用到政府制定计划D . 50年代,运筹学运用到研究人口,能源,粮食,第三世界经济发展等问题上第二章线性规划的图解法一、选择题/填空题1.线性规划标准式的特点:(1)目标函数最大化(2)约束条件为等式(3 决策变量为非负(4 ) 右端常数项为非负2. 在一定范围内,约束条件右边常数项增加一个单位:(1)如果对偶价格大于0,则其最优目标函数值得到改进,即求最大值时,最优目标函数值变得更大,求最小值时最优目标函数值变得更小。
(2)如果对偶价格小于0,则其最优目标函数值变坏,即求最大值时,最优目标函数值变小了;求最小值时,最优目标函数值变大了。
(3)如果对偶价格等于0,则其最优目标函数值不变。
3.LP模型(线性规划模型)三要素:(1)决策变量(2)约束条件(3)目标函数4. 数学模型中,“s·t”表示约束条件。
5. 将线性规划模型化成标准形式时,“≤”的约束条件要在不等式左端加上松弛变量。
6. 将线性规划模型化成标准形式时,“≥”的约束条件要在不等式左端减去剩余变量。
7.下列图形中阴影部分构成的集合是凸集的是A【解析】:如何判断是凸集?凸集:两点之间连线在图内凹集:两点之间连线在图外8. 线性规划问题有可行解且凸多边形无界,这时CA没有无界解 B 没有可行解 C 有无界解 D 有有限最优解9. 对于线性规划问题,下列说法正确的是( D )A. 线性规划问题可能没有可行解B. 在图解法上,线性规划问题的可行解区域都是“凸”区域C. 线性规划问题如有最优解,则最优解可在可行解区域顶点上到达D. 上述说法都正确第三章线性规划问题的计算机求解一、名词解释1.相差值:相应的决策变量的目标系数需要改进的数量,使得决策变量为正值。
范里安《微观经济学(高级教程)》(第3版)章节题库-博弈论(圣才出品)
11.古诺均衡中的每个参与人在决策时都假定对手的产量不变,而这是不现实的,因 此,古诺均衡是错误的。( )
【答案】F 【解析】古诺均衡是指如果对方采取古诺产量,则本方也采取古诺产量,在此情况下, 双方都没有改变产量的动机。在古诺均衡的情况下,由于对方没有改变产量的动机,故本方 假定对方产量不变是正确的。
3.如果某博弈存在纯策略均衡,那么不可能同时存在非退化的混合策略均衡。( ) 【答案】F
1 / 28
圣才电子书 十万种考研考证电子书、题库视频学习平台
【解析】纯策略均衡是指每个参与者只选择一种策略并始终坚持这个选择。混合策略是 指参与人使他们的策略选择随机化,即对每项选择都指定一个概率,并按照这些概率选择策 略。混合纳什均衡是指给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每 一种策略的概率。混合策略均衡总是存在的,纯策略均衡的存在与否并不影响混合策略均衡 的存在。
9.囚徒的困境说明了个人的理性选择不一定是集体的理性选择。( ) 【答案】T 【解析】在囚犯难题中,每个囚犯都选择了自己的最优策略,所以个人理性得到了体现。 但最后的结果是可以进行帕累托改进的,所以并不是集体理性的选择。
10.同时行动的博弈就是指博弈双方同时进行选择的博弈。( ) 【答案】F 【解析】同时行动的博弈中,每个参与人必须在不知道对方所做选择(不论他正在选择 还是已经选择了)的情况下,做出自己的选择。这里的关键是“不知道”对方的选择,而不 是强调的时问相同。
8.纳什定理告诉我们纳什均衡解存在且稳定。( ) 【答案】F 【解析】纳什定理即指纳什均衡存在性定理,指如果一个对策的参与人是有限的,并且 每个参与人只有有限的策略,则该对策至少存在一个纳什均衡。但该定理没有指出解是否唯 一,一个对策可能存在多个纳什均衡;也没有指出解是否稳定。而且,很多情况下,纳什均 衡解都是不稳定的。如性别战中的均衡解就是两个不稳定的纯纳什均衡解。
运筹学教材习题答案详解
B1:2.0
3
需要量(套)
200
150
问怎样下料使得(1)用料最少;(2)余料最少.
【解】第一步:求下料方案,见下表。
方案
一
二
三
四
五
六
七
八
九
十
十一
十二
十三
十四
需要量
B1:2.7m
2
1
1
1
0
0
0
0
0
0
0
0
0
0
300
B2:2m
0
1
0
0
3
2
2
1
1
1
0
0
0
0
450
A1:1.7m
0
0
1
0
0
1
0
2
1
0
3
2
1
0
(2)
【解】最优解X=(3/4,7/2);最优值Z=-45/4
(3)
【解】最优解X=(4,1);最优值Z=-10
(4)
【解】最优解X=(3/2,1/4);最优值Z=7/4
(5) 【解】最优解X=(3,0);最优值Z=3
(6)
【解】无界解。
(7)
【解】无可行解。
(8)
【解】最优解X=(2,4);最优值Z=13
【解】设x1、x2、x3分别为产品A、B、C的产量,则数学模型为
1.3建筑公司需要用6m长的塑钢材料制作A、B两种型号的窗架.两种窗架所需材料规格及数量如表1-23所示:
表1-23窗架所需材料规格及数量
型号A
型号B
每套窗架需要材料
长度(m)
博弈论基础
博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
参见:行为生态学(behavioral ecology)。
约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
高级运筹学(博弈论书稿)-周晶
第章博弈论(对策论)第一节引言1.1博弈行为和博弈论在日常生活中,经常会看到一些相互之间具有斗争或竞争性质的行为。
譬如,两个人下棋,任何一个人在走某一步之前,都需要考虑对方是怎么走的,以及对方在他走了一步之后会怎么走,以至无穷。
高手与俗手的区别往往就在于高手能够考虑10步甚至20步以后的变化,最终的输赢不仅取决于你的决策,而且取决于你对手的决策,这就是博弈。
博弈与决策的根本区别在于是否考虑对方的行为,具有竞争或对抗性质的行为称为博弈行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最有利或最合理的方案。
比如战争活动中的双方,都力图选取对自己最有利的策略,千方百计去战胜对方;还比如在政治方面,国际间的谈判、各种政治力量间的较量、各国际集团之间的角逐等都无一不具有对抗性质;在经济活动中,各国之间、各公司企业之间的经济谈判,企业之间为争夺市场而进行的竞争等,举不胜举。
博弈论(game theory),就是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论与方法,即研究博弈行为中竞争各方是否存在着最合理行动方案,以及如何找到最合理行动方案的数学理论和方法。
也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。
博弈论应是一种分析问题的方法,它被设计用来帮助我们理解所观察到的决策主体相互作用时的现象,其应用范围涉及经济学、政治学、犯罪学、军事、外交、国际关系、公共选择等各个领域。
博弈论思想的主要特征是各参与人所实施的行为方案(策略)相互依存,各方在冲突或合作后所实现的损益得失结果不仅取决于自己所采取的行为方案,同时也依赖于其他参与方所实施的行为方案,是各参与方行为方案组合的函数。
所以,博弈论在我国也被称为“对策论”。
Python最优化算法实战学习笔记
Python最优化算法实战第一章最优化算法概述1.1最优化算法简介最优化算法,即最优计算方法,也是运筹学。
涵盖线性规划、非线性规划、整数规划、组合规划、图论、网络流、决策分析、排队论、可靠性数学理论、仓储库存论、物流论、博弈论、搜索论和模拟等分支。
当前最优化算法的应用领域如下。
(1)市场销售:多应用在广告预算和媒体的选择、竞争性定价、新产品开发、销售计划的编制等方面。
如美国杜邦公司在20世纪50年代起就非常重视对广告、产品定价和新产品引入的算法研究。
(2)生产计划:从总体确定生产、储存和劳动力的配合等计划以适应变动的需求计划,主要采用线性规划和仿真方法等。
此外,还可用于日程表的编排,以及合理下料、配料、物料管理等方面。
(3)库存管理:存货模型将库存理论与物料管理信息系统相结合,主要应用于多种物料库存量的管理,确定某些设备的能力或容量,如工厂库存量、仓库容量,新增发电装机容量、计算机的主存储器容量、合理的水库容量等。
(4)运输问题:涉及空运、水运、陆路运输,以及铁路运输、管道运输和厂内运输等,包括班次调度计划及人员服务时间安排等问题。
(5)财政和会计:涉及预算、贷款、成本分析、定价、投资、证券管理、现金管理等,采用的方法包括统计分析、数学规划、决策分析,以及盈亏点分析和价值分析等。
(6)人事管理:主要涉及以下6个方面。
①人员的获得和需求估计。
②人才的开发,即进行教育和培训。
③人员的分配,主要是各种指派问题。
④各类人员的合理利用问题。
⑤人才的评价,主要是测定个人对组织及社会的贡献。
⑥人员的薪资和津贴的确定。
(7)设备维修、更新可靠度及项目选择和评价:如电力系统的可靠度分析、核能电厂的可靠度B风险评估等。
(8)工程的最佳化设计:在土木,水利、信息电子、电机、光学、机械、环境和化工等领域皆有作业研究的应用。
(9)计算机信息系统:可将作业研究的最优化算法应用于计算机的主存储器配置,如等候理论在不同排队规则下对磁盘、磁鼓和光盘工作性能的影响。
(NEW)运筹学教材编写组《运筹学》(第4版)笔记和课后习题(含考研真题)详解
线性规划问题的共同特征:
(1)每一个问题都用一组决策变量
表示某一方案,这组
决策变量的某一确定值就代表一个具体方案。一般这些变量的取值是非
负且连续的。
(2)存在有关的数据,如资源拥有量、消耗资源定额、创造新价值 量等,同决策变量构成互不矛盾的约束条件,这些约束条件可以用一组 线性等式或线性不等式来表示。
1.2 课后习题详解
本章无课后习题。
1.3 考研真题详解
本章只是对本课程的一个简单介绍,不是考试重点,所以基本上没 有学校的考研试题涉及到本章内容,因此,读者可以简单了解,不必作 为复习重点,本部分也就没有可选用的考研真题。Leabharlann 第2章 线性规划与目标规划
2.1 复习笔记
1.线性规划模型的概念及其一般形式
目 录
第1章 运筹学概论 1.1 复习笔记 1.2 课后习题详解 1.3 考研真题详解
第2章 线性规划与目标规划 2.1 复习笔记 2.2 课后习题详解 2.3 考研真题详解
第3章 对偶理论与灵敏度分析 3.1 复习笔记 3.2 课后习题详解 3.3 考研真题详解
第4章 运输问题 4.1 复习笔记 4.2 课后习题详解
2.线性规划问题的标准型及标准化 (1)线性规划的标准型
或
(2-4) (2-5) 线性规划的标准型要求:目标函数是Max型;约束条件是等式约 束;决策变量非负。 (2)线性规划的标准化方法
① 若要求目标函数实现最小化,即
,则只需将目标函数最
小化变换为求目标函数最大化,即令 ,于是得到
第13章 排队论
13.1 复习笔记 13.2 课后习题详解 13.3 考研真题详解 第14章 存储论 14.1 复习笔记 14.2 课后习题详解 14.3 考研真题详解 第15章 对策论基础 15.1 复习笔记 15.2 课后习题详解 15.3 考研真题详解 第16章 单目标决策 16.1 复习笔记 16.2 课后习题详解 16.3 考研真题详解 第17章 多目标决策 17.1 复习笔记
博弈论全套课件
三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础,经济学家们已经 把研究策略相互作用的博弈论当作最合适的分 析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学 、国际关系、计算机科学、政治学、军事战略 和其他很多学科都有广泛的应用。现在已经有 愈来愈多的人开始关注、了解并学习博弈理论 。
博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。
博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。
黄桦《税收学》笔记和课后习题(含考研真题)详解(税收前沿理论简介)
第15章税收前沿理论简介15.1 复习笔记一、公共产品——公共财政理论1.公共财政理论内容简介(1)西方公共财政理论当代西方公共财政理论认为,财政存在的必要性在于市场存在缺陷,也就是存在“市场失灵”的状况。
社会经济的运行应当以市场调节为主,只是在市场难以调节或者调节不好的领域,才需要政府进行适应性调节,对市场进行干预。
公共财政的主要职能主要有以下三个:①资源配置职能。
②收入分配职能。
③经济稳定职能。
(2)我国的公共财政理论研究及实践由于我国的特殊国情和经济发展历程的影响,我国传统的财政学理论一直是以“国家分配论”为核心的,认为财政是一种“以国家为主体的分配关系”,“国家财政”的提法可以说是深入人心的。
2.公共财政理论对传统税收学的冲击我国传统的税收学理论是在马克思主义的政治经济学基础上建立起来的。
它认为,税收是国家的经济基础。
国家必须采取一定的方式来取得财政收入。
税收自身的特点决定税收是国家一种重要的财政收入形式。
“国家分配论”用“权力说”(或权益说)来解释国家征税的依据。
税收根本依赖的就是政治权力。
“公共财政论”提出的“交换说”认为,税收是国家与纳税人的一种利益交换关系。
这样,“交换说”把征税依据归结为:社会公众为获得政府所提供的公共产品而必须付出交换代价,政府为提供公共产品而必须从社会公众那里获得交换补偿,代价与补偿之间是一种等价交换关系。
二、税收债权债务关系理论1.税收债权债务关系理论的形成对于税收法律关系的性质问题有两种比较典型的学说。
一是“税收权力关系”说。
另一则是“税收债务关系”说。
2.税收债权债务关系概述(1)税收债权债务关系的概念所谓税收债权债务关系,就是指作为税收债权人的国家请求作为税收债务人的纳税人履行纳税义务的法律关系。
(2)税收债权债务关系的特征①税收债权债务关系是一种公法上的债权债务关系。
②税收债权债务关系是一种单务关系。
③税收债权债务关系双方当事人法律权利的不对等。
3.税收债权债务关系的构成要素(1)税收债权债务关系的主体税收债权债务关系的主体是指税收债权债务关系中享有权利和承担义务的当事人。
[管理学]93第十五章 对策论_OK
20
差价
4 21
A=
3 22
甲25 2 23
1 24
乙20
1 23 4 21 22 23 24 21 21 21 22.5 22 22 22.5 24 23 22.5 23 24 22.5 22 23 24
21
二、矩阵对策在纯策略下有解的解法 解法的基本思想是:
双方都立足在最不利的情况下争取 最好的结果
am1 y`1 + am2 y`2 +….+ amn y`n ≤3v7 y`1,y`2 ,… , y`n ≥0
作如下变换 令xi = xi` / V
yj = yj` / V 则:
minZ= x1 + x2 +….+ xm
最大最小原则
22
例题一
•
甲、乙双方谈判签订一项合同,甲方的最后要价是25万元,而乙方的出价是20万元,
谈判陷于僵局,为了打破僵局,双方约定,再各报一个价(必须报整数价格),以下
述价格成交:谁让步多,取谁出的价,如果双方让步相同,则取双方报价的中间值,
问甲、乙双方应如何报价?最后的成交价是多少?
① 写出此对策问题的三要素或者说建立
Ⅱ方
例如
β1 β2
Ⅰ方
α1 9 7 x1`
α2 2 8 x2 `
y1 ` y2 `
假设x1` ,x2`分别表示Ⅰ方选取α1,α2纯策略的概率,y301 ` y2 `分别表示Ⅱ方选取β1,β2纯策略的概率,即为混合策略
求解最优混合策略的思路
∵局中人Ⅰ使用α1的概率为x1` ,使用α2的概率为x2 ` ,则
第十五章 对策论
• 15.1 对策论的基本概念 • 15.2 矩阵对策的最优纯策略 • 15.3 矩阵对策的混合策略 • 15.4 求解矩阵对策中的计算技巧(自
第十六章 对策论
第二节 完全信息对策
(二) 纳什均衡 纳什均衡:当给定其他局中人选择策略的前提下,
每个人选择自己的最优策略,把所有局中人选择 的最优策略组合起来,就构成纳什均衡。 1. 纯策略纳什均衡
13/30
第二节 完全信息对策
2. 混策略纳什均衡 混策略即局中人按照某一概率选择纯策略。
14/30
局中人并不具备其他局中人策略选择方面的完 全信息,却具备其概率分布方面的完全信息, 这种对策被称为完全但不完美信息对策。
贝叶斯均衡表示这样一种策略组合:在给定局 中人自己的类型及其他局中人类型概率分布的 情况下,每位局中人的预期收益或预期效用都 达到最大化。
20/30
第三节 不完全信息对策
二、不完全信息动态对策
或效用水平,它是所有局人中策略的函数。
2. 收益函数通常可以用两种形式表示:一种是 用实物或货币收入的绝对数值或相对数值,另 一种是用局中人的效用。
(四) 信息 1. 对策的信息是指局中人有关对策的全部知识,
包括局中人的特征和行动。
2. 信息集是局中人在对策进行到某一点时,对 于不同变量取值的全部知识之和。
在完全信息动态条件下,如果原对策的所有子 对策均达到纳什均衡,则称整个对策均衡为子 对策完美纳什均衡。
承诺行动是指,局中人使自己的威胁策略变成 可以置信的行动。不可置信的威胁,则称空洞 威胁。
17/30
第二节 完全信息对策
(二) 重复对策 重复对策是一种特殊的完全信息动态对策,指
同样结构的对策重复多次。 重复对策可能是有限次的,也可能是无限次的 重复对策的均衡结果,往往与一次性对策不同,
7/30
第一节 对策特点
(三) 完全信息对策与不完全信息对策 1. 按照局中人事先是否拥有其他局中人决策
运筹学教材习题答案详解
显然用料最少的方案最优。
1.4A、B两种产品,都需要经过前后两道工序加工,每一个单位产品A需要前道工序1小时和后道工序2小时,每一个单位产品B需要前道工序2小时和后道工序3小时.可供利用的前道工序有11小时,后道工序有17小时.
3
B1:2.0
3
需要量(套)
200
150
问怎样下料使得(1)用料最少;(2)余料最少.
【解】第一步:求下料方案,见下表。
方案
一
二
三
四
五
六
七
八
九
十
十一
十二
十三
十四
需要量
B1:2.7m
2
1
1
1
0
0
0
0
0
0
0
0
0
0
300
B2:2m
0
1
0
0
3
2
2
1
1
1
0
0
0
0
450
A1:1.7m
0
0
1
0
0
1
0
2
1
0
3
2
1
0
《运筹学》
第1章线性规划
第2章线性规划的对偶理论
第3章整数规划
第4章目标规划
第5章运输与指派问题
第6章网络模型
第7章网络计划
第8章动态规划
第9章排队论
第10章存储论
第11章决策论
第12章对策论
习题一
1.1讨论下列问题:
对策论
对策的三要素: 对策的三要素:
局中人: 局中人:有权决定自己行为方案的对局参加者
称为局中人。案例中,敌我双方的决策者为局中 称为局中人。案例中, 当对局中局中人只有两人时,称为二人对策。 人。当对局中局中人只有两人时,称为二人对策。
策略: 策略:对局中一个实际可行的方案称为一个策
略。案例中,敌我双方各有二个策略。 案例中,敌我双方各有二个策略。
经测算,双方均可得到如下估计: 经测算,双方均可得到如下估计:
局势1 局势1:
盟军的侦察机重点搜索北线,日本舰 盟军的侦察机重点搜索北线, 队也恰好走北线。由于气候恶劣,能见度差, 队也恰好走北线。由于气候恶劣,能见度差,盟 军只能实施两天的轰炸。 军只能实施两天的轰炸。
局势2 盟军的侦察机重点搜索北线, 局势2:盟军的侦察机重点搜索北线,日本舰
定理7 定理7-1:矩阵对策 G = { S1,S2;A}
在纯策略意义下有解的充分必要条件是:存在 在纯策略意义下有解的充分必要条件是: 一个局势( ),使得对一切 一个局势( α*i*, β*j *),使得对一切 =1, j=1, i=1,2,… m, j=1,2…n 均有 aij*≤ai*j* ≤ ai*j
矩阵对策的最优纯策略
设定 最稳妥策略 对策的解 例子
设
两人有限零和对策
局中人: 局中人:两人 策略集: 策略集
定
S 1 = {α 1 , α 2 ,..., α m } S 2 = { β 1 , β 2 ,..., β n }
局势集: 局势集: S1 × S 2 = {(α i , β j ) i = 1,2,..., m; j = 1,2,..., n} 支付函数: 支付函数:H 1 (α i , β j ) = a ij 和 H 2 (α i , β j ) = − a ij
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
成立时,双方才有最优纯策略,并把(1,2)称为对策G在纯策略下的解, 又称(1,2)为对策G的鞍点。把其值V称之为对策G={S1,S2,A}的值。
管
理
运
筹
学
9
§2 矩阵对策的最优纯策略
例2 某单位采购员在秋天决定冬季取暖用煤的储量问题,已知 在正常的冬季气温条件下要消耗15吨煤,在较暖和较冷的天气下要
通常将矩阵对策记为:
S1:甲的策略集;
G = {S1, S2, A}
S2:乙的策略集;
A:甲的赢得矩阵。
“齐王赛马”是一个矩阵策略。
管
理
运
筹
学
6
§2 矩阵对策的最优纯策略 §2 矩阵对策的最优纯策略
在甲方的赢得矩阵中: A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m;j 行代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下甲方的
14
§3 矩阵对策的混合策略
2)无论乙取何策略,甲的平均赢得应不少于V: 对乙取1: 5X1′ + 8X2′ V
对乙取2:
注意 V>0,因为A各元素为正。 STEP 2
9X1′+ 6X2′V
作变换: X1= X1′/V ;
得到上述关系式变为: X1+ X2=1/V
X2= X2′/V
(V愈大愈好,即1/V愈小愈好)待定
X1′= X1V= 0.336 X2′= X2V= 0.664 于是甲的最优混合策略为: 以0.336的概率选1, 以0.664的概率选2,最优值V=6.993。
管
理
运
筹
学
16
§3 矩阵对策的混合策略
同样可求乙的最优混合策略: 设乙使用策略1的概率为Y1′ 设乙使用策略2的概率为Y2′ Y1′+Y2′=1 Y1′,Y2′0
管 理 运 筹 学
2
§1 对策论的基本概念
对策模型的三个基本要素: 1.局中人:参与对抗的各方; 2.策略集:局中人选择对付其它局中人的行动方案称为策略; 某局中人的所有可能策略全体称为策略集;
3.一局势对策的益损值:局中人各自使用一个对策就形成了
一个局势,一个局势决定了各局中人的对策结果(量化) 称为该局势对策的益损值。
§3 矩阵对策的混合策略
返回原问题: Y1′= Y1V = 1/2 Y2′= Y2V = 1/2
于是乙的最优混合策略为:
以 ½ 的概率选1;以 ½ 的概率选2 ,最优值 V=6.993。
当赢得矩阵中有非正元素时,V0 的条件不一定成立,可以 作下列变换: 选一正数 k,令矩阵中每一元素加上 k 得到新的正 矩阵A′,其对应的矩阵对策 G ′= { S 1, S 2, A ′}
解相同,但VG = VG’ – k。
与
G ={ S1, S2, A }
管
理
运
筹
学
18
§3 矩阵对策的混合策略
例:求解“齐王赛马”问题。
已知齐王的赢得矩阵A
3 1 1 A 1 1 1
i
1 3 1 1 1 1
1 1 3 1 1 1
1 1 1 3 1 1
1 1 1 1 3 1
求解混合策略的问题有图解法、迭代法、线性方程组法和线性 规划法等,我们这里只介绍线性规划解法,其他方法略。 例:设甲使用策略1的概率为X1′,使用策略2的概率为X2′ , 并设在最坏的情况下,甲赢得的平均值为V(未知)。
5
A=
9
STEP 1
8
6
1)
X1′+X2′=1
X1′, X2′0
管
理
运
筹
学
管
理
运
筹
学
3
§1 对策论的基本概念
“齐王赛马”齐王在各局势中的益损值表(单位:千金)
齐王 益损值 S1
α 1(上中下) α 2(上下中) α 3(中上下) α 4(中下上) α 5(下上中) α 6(下中上) 3 1 1 -1 1 1 1 3 -1 1 1 1 1 1 3 1 1 -1 1 1 1 3 -1 1 -1 1 1 1 3 1 1 -1 1 1 1 3
3 1 1 -1 1 1 1 1 1 3 1 1 -1 3 1 1 1 3 1 1 -1 1 -1 1 -1 1 1 1 3 1 1 -1 1 1 1 3
A=
管
理
运
筹
学
5
§1 对策论的基本概念
二人有限零和对策(又称矩阵对策): 局中人为2;每个局中人的策略集的策略数目都 是有限的;每一局势的对策均有确定的损益值,并 且对同一局势的两个局中人的益损值之和为零。
设在最坏的情况下,甲赢得的平均值为V。这也是乙损失的平均
值,越小越好。
作变换: Y1= Y1′/V , Y2= Y2′/V 建立线性模型:
max
Y1+Y2
Y1= 0.0715 Y2= 0.0715 1/V= Y1+Y2=0.143 所以,V=6.993
管 理 运 筹 学
17
s.t. 5Y1+9Y21 8Y1+6Y21 Y1, Y20
S2
β1 (上中下)
β2 (上下中)
β3 (中上下)
β4 (中下上)
β5 (下上中)
β6 (下中上)
管
理
运
筹
学
4
§1 对策论的基本概念
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。
下面矩阵称齐王的赢得矩阵:
第十五章 对策论
§1 对策论的基本概念
§2 §3 §4 矩阵对策的最优纯策略 矩阵对策的混合策略 其他类型的对策论简介
管 理 运 筹 学
1
第十五章 对策论
由“齐王赛马”引入
战国时期,齐王与大将田忌赛马,双方约定,比赛三 局,各局各出赛马一匹,双方都有上、中、下三个等级的 马。在同等级的马中,田忌的马不如齐王的马,但如果田 忌的马的高一级则能取胜。当时田忌的谋士出一个好对策, 即用下马对齐王的上马,用中马对齐王的下马,用上马对 齐王的中马,结果田忌两胜一负,得千金。这个例子就说 明了对策的重要性。
管 理
3 5 1 3 3 3
运
3 3 5 3 3 1
筹 学
3 3 3 5 1 3
1 3 3 3 5 3
3 1 3 3 3 5
19
§3 矩阵对策的混合策略
建立对G′={S1,S2,A′}中求甲方最佳策略的线性规划如下: Min x1+x2+x3+x4+x5+x6 约束条件:
益损值。此时乙方的益损值为 -aij(零和性质)。
在考虑各方采用的策略时,必须注意一个前提,就是双 方都是理智的,即双方都是从各自可能出现的最不利的情形 选择一种最为有利的情况作为决策的依据。
管
理
运
筹
学
7
§2 矩阵对策的最优纯策略
例1:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成, 双方都可排成三种不同的阵容,每一种阵容可以看作一种策略,双
消耗10吨和20吨。假定冬天的煤价随天气寒冷程度而有所变化,在
较暖和、正常、较冷的气候条件下每吨煤价分别为10元、15元、20 元。又设秋季时煤炭价格为每吨10元。在没有关于当年冬季准确的 气象预报的条件下,秋天储煤多少吨能使得单位的支出最少? 解:局中人I为采购员,局中人II为大自然,采购员有三个策 略,买10吨、15吨、20吨。分别记为1,2,3。大自然也有三个 策略:暖、正常、冷,分别记为1,2,3。
管
理
运
筹
学
10
§2 矩阵对策的最优纯策略
赢得矩阵如下:
1
1(10吨) 2(15吨) 3(20吨) -100 -150 -200
2
-175 -150 -200
3
-300 -250 -200
在此表上计算,有
1 1(10吨) 2(15吨) -100 -150 2 -175 -150 3 -300 -250 min -300 -250
管
理
运
筹
学
§3 矩阵对策的混合策略
同样可以建立对策G′={S1,S2,A′}中求乙方最佳策略的线性规划如下: Max y1+y2+y3+y4+y5+y6 约束条件: 5y1+3y2+3y3+3y4+y5+3y6 ≤1 3y1+5y2+3y3+3y4+3y5+y6 ≤1 3y1+y2+5y3+3y4+3y5+3y6 ≤1 y1+3y2+3y3+5y4+3y5+3y6 ≤1 3y1+3y2+3y3+y4+5y5+3y6 ≤1 3y1+3y2+y3+3y4+3y5+5y6 ≤1 yi≥0,i=1,2,…,6 可解得解为: y1=y4=y5=0.111, y2=y3=y6=0, v′=3, y1′=y4′=y5′= 1/3, y2′=y3′=y6′=0,即Y′* =(1/3,0,0,1/3,1/3,0)T。 所以田忌的最优混合策略为作出策略1、4、5的概率都为1/3,而作出2,3,
1 1 1
1 3 3
请问这次比赛各队采用哪种阵容上场最为稳妥?
管
理
运
筹
学
8
§2 矩阵对策的最优纯策略
矩阵A中每行的最小元素分别为1,-3,-1。 在这些最少赢得中最好的结果是1,故甲队会采取策略1,无论对手