决策理论与方法教学作者罗党第四章(2)-教材

合集下载

决策的基本理论及方法 PPT课件

决策的基本理论及方法 PPT课件
决策的基本理论及方法

一 、 概 论 、 定 义 及 分 类
决策是管理中经常发生的一种 活动, 决策科学是一门综合性系 统科学.
所谓决策, 通俗地讲就是选择. 决策方法根据决策事件所处的 环境可分为确定性决策, 风险型 决策和不定型决策.


确定性决策:
二 、 确 定 性 决 策
指对在未来状况下 事件所发生的结果 完全掌握的情况作 出决策.
汽车数 概 率 15 0.13 16 0.17 17 0.18 18 0.26 19 0.14 20 0.07 21 0.03 22 0.02


3.2
最大 可能 准则
最大可能准则的思想是 将风险型决策问题化到 确定型问题, 根据概率越 大, 发生可能性就越大, 于是将未来发生的状态 就选取概率最大的一种 状况, 从而化为确定型决 策.

例 3.2
某飞机制造厂, 每月销售量为 0, 1, 2 架三种状态, 根据历史资料 分析得这三种状况的概率分别 为 P1=0.1, P2=0.7, P3=0.2. 每销 售一架将赢利 1000万元, 每滞 销一架将亏损100万元.试问该 厂每月生产几架飞机获益最大?
最 大 最小
7 9 7 7 5
4 2 3 3 3

4.4 等可 能准 则


该方法将所有销售状态发生的概率 认为均相等 , 于是将不确定型问题 转化为风险型问题 , 再用期望值法 即可找到最优方案. 认为各销售状态出现的可能为 0.25, 各方案的期望值分别为 5.5, 5.25, 5.0, 5.5, 4.5. 认为方案A1或 A4 为最优方案.


不定 型决 策模 型及 求解

某厂产品销售状态有 “差、一般、好、 很好”四种情况,分别记为:S1, S2, S3, S4。 生产方案有“试生产、小批 量生产、一般量生产、批量生产、大 批量生产”五种,分别记为: A1, A2, A3, A4 和 A5。 各方案在各销售状态下利润如左表。 试问按何种方案生产可获益最大?

决策理论与方法讲义(PPT 75张)

决策理论与方法讲义(PPT 75张)

渴望水平原则是指决策者在收益或损失可以接受的限度内,预先 给出收益或损失的一个渴望水平值A,对每一个方案,都求出其 收益或损失达到渴望水平的概率,使这个概率最大的方案,就是 渴望水平原则下的最优方案。 4.最大期望原则 该标准从统计的角度出发,用统计学的期望值来权衡各个方案。 所谓最大期望原则就是把每个行动方案的期望值求出来,然后加 以比较,选择期望值最大的(当目标是利润时)或期望值最小的 (当目标是损失时)行动方案。 5.概率优势法则 概率优势法则是指先在各个自然状态下通过观察法比较各方案的 优劣,淘汰比较劣的方案,然后在各个概率状态下通过分布函数 比较各方案的优劣,选出最优的方案。
2.1 随机性决策的概念
《决策理论与方法》
解 这是一个单级决策树。按决策树方法决策的步骤如下: (1) 收集数据,数据已经全部在题目中给出。 (2) 画决策树,并标出数据 (3)计算并减枝 ①从右往左计算各方案的期望值,将相应的计算结果标在方
案分枝右端的状态节点旁;
②比较各方案期望值的大小,保留期望值最大的分枝,在其
2.1 随机性决策的概念
2.1.4 随机性决策的分析方法
1.机会均等原则
《决策理论与方法》
例2-1-4 某建筑企业要决策下个月是否开工建设一个项目。如果
开工后天气好,则企业可以盈利5万元,如果开工后天气不好, 企业要损失1万元,如果不开工,则企业要支付窝工费2千元。 企业是否要开工建设此项目呢?
相当一部分决策问题不能通过随机试验确定他们的概率,
只能根据决策者对事件的了解来设定事件发生的概率。这 样根据决策者的经验和对事件掌握的知识所人为设定的概 率,称为主观概率( subjective probability)。同时,除此 之外的其他概率称为客观概率(objective probability)。 能性的看法的度量,即他相信或认为这个随机事件将会发 生的可能性的大小。这种相信的程度是主观的,是决策者 根据自身拥有的经验、知识以及个人对客观情况的了解, 利用此方面的一些相关信息综合分析、推理以及判断而设 定的。但它不同于主观臆断,是从客观所拥有的信息出发 根据理性分析而得出的结果,是理性的,合理的。主观概 率也必须符合概率论的基本定理:①所确定的概率必须大 于或等于 0 ,而小于或等于 1 ;②经验判断所需全部事件中 各个事件概率之和必须等于1。

决策理论与方法教学作者罗党第一章决策理论概述讲课文档

决策理论与方法教学作者罗党第一章决策理论概述讲课文档
第十九页,共29页。
1.2决策的概念及决策的过程
▪ 决策的基本概念与分类 ▪ 决策的分类
(1)按决策性质的重要性可以将决策分为战略决策,策略决策和执行
决策,或叫战略计划、管理控制和运行控制三个级别。
(2)按决策的作用可以将决策分为战略决策、管理决策、业 务决策。
(3)按决策的性质可将决策分为程序化决策和非程序化决策 (4)按决策的对象和范围可将决策分为宏观决策和微观决策
用自己的下马对齐王的上马,自己的上马对齐王的中马,自己 的中马对齐王的下马。最后田忌三局两胜击败了齐王 丁渭重建汴宫的工程
丁渭下令,首先开基土建,所用的土壤就是在城中街道挖取,节省 了不少工时。待将大街挖成深沟,开堤,引水进入深沟,便成了运 河,此时将各地的建筑材料由水运运至皇宫,十分便利。皇宫修缮 完毕,将沟中的水排尽,再将需要处理的残渣废料、砖头瓦砾添入 沟中,使得深沟变成平地重新恢复街道的状态。
决策理论与方法教学PPT作者罗党第一章决策理论概述
第一页,共29页。
学习目的
▪ 了解决策分析的发展历史、现状及发展趋势; ▪ 理解决策概念的内涵; ▪ 把握决策的基本要素; ▪ 理解决策过程中应遵循的主要原则; ▪ 掌握决策分析的基本概念; ▪ 掌握决策分析的基本步骤。
第二页,共29页。
本讲内容
(5)系统性原则 :系统性原则客观上要求决策应达到整体化、综合化、 最佳化
(6)满意原则 :决策者做出的是“令人满意”的决策,而不是最优决策 。
(7)环境原则 :管理决策目标的确定是依据事务所处的内外环境条件来考虑的 (8)动态原则 :决策者在管理决策时一定要用动态的、变化的观点进行管理决
策活动,而不能用固定、一成不变的观点去决策
第十三页,共29页。

决策理论与方法概述(PPT 75页)

决策理论与方法概述(PPT 75页)
时出现状态j的后果
解决问题的主要理论方法:概率论与数理统计
决策理论与方法-随机决策理论与方法
2020/1/24
随机决策理论与方法
1、主观概率 2、效用函数 3、决策准则 4、贝叶斯决策分析
决策理论与方法-随机决策理论与方法
2020/1/24
主观概率—概率的定义
古典概率的定义:在相同条件下进行了n次试验(随机试 验),其中事件A发生的次数nA称为事件A发生的频数,比 值nA/n称为事件A发生的频率,记为fn(A),则古典概率的定 义为:p(A)=limn→∞fn(A)
决策理论与方法-随机决策理论与方法
2020/1/24
主观概率—先验分布估计:打赌法
打赌法(离散型)
设打赌者(A)的个人财产为W。设事件E发生时A获得收入 为p,(0<p<1;p<<W:保证打赌者的效用函数是线性的), 不发生时A获得的收入为1-p。调整p值使A感觉无论事件 E是否发生,其收入基本相同,即(E)×p=(1-(E))×(1p)。则事件E发生的可能性(E)=1-p。
气候状况的先验分布:
(1)+(2)+(3)=1; (1)/((2)+(3))=3/2; (2)=(3) 解得: (1)=0.6,(2)=0.2,(3)=0.2
思考:设某决策问题有n个状态,有m个专家对各状态发 生的可能性进行了比较评估,我们如何综合利用所有专 家的评估结果得到最终的先验分布?
决策理论与方法-随机决策理论与方法
2020/1/24
效用函数—效用的定义
效用就是偏好的量化值。决策的目标就是使期望效 用极大化。
基本概念及符号
严格序>:a>b表示a优于b。满足传递性和反对称性。 无差异~:a~b表示a与b无差异。满足自反性、对称性和

决策理论与方法讲义(PPT47页)

决策理论与方法讲义(PPT47页)

相等 A B aij bij , i 1, 2, , m; n 1, 2, n.
包含 A B aij bij , i 1, 2, , m; n 1, 2, n.
第第 1166页页
7.1 模糊理论的基本概念
《决策理论与方法》
7.1.4 模糊矩阵
定义7.1.8 设 A aij , B bij mn,定义
为从到的模糊映射。 定义 7.1.12 称映射 T : P X PY A T A B
为从 X到Y 的模糊变换。
《决策理论与方法》
第第 1199页页
Y
7.1 模糊理论的基本概念
《决策理论与方法》
7.1.4 模糊矩阵
定义 7.1.13 设T 是 X到 Y 的模糊变换,且
RT P X Y
满足T A A RT A P X ,则称 T 是由模糊关系 RT 诱导
出的。
第第 2200页页
本讲内容
7.2模糊决策基本方法
7.2.1 模糊意见集中决策 7.2.2 模糊二元对比决策 7.2.3 模糊综合评判决策 7.2.4 层次分析法
▪ 3、Patience is bitter, but its fruit is sweet. (Jean Jacques Rousseau , French thinker)忍耐是痛苦的,但它的果实是甜蜜的。 08:305.26.202108:305.26.202108:3008:30:575.26.202108:305.26.2021
《决策理论与方法》 ▪ 2、Our destiny offers not only the cup of despair, but the chalice of opportunity. (Richard Nixon, American President )命运给予我们的不是失望之酒,而是机会之杯。二〇二一年五月二十六日2021 年5月26日星期三

决策理论与方法(ppt 177页)实用资料

决策理论与方法(ppt 177页)实用资料

1.1.5 管理决策的概念
• 管理决策是管理主体针对管理中的问题,制定解决问题的各种可 行方案,选择最佳方案并实施的全部活动过程。
• (1)管理决策是管理主体的全部活动的重要组成部分 管理决策为未来实践活动选择最佳行动方案,因而它是管理主体 最重要的活动内容。
• (2)管理决策的主体包括企业管理各个层次的管理者 各层次的管理者在各自的职权范围内做出相应的决策,形成了决 策的层次性。可见,管理决策并不是最高层管理的独有职责。
• 管理决策作为一门交叉学科,与经济学、管理学的发 展密切相关。20世纪中后期以来,随着西方(现代) 经济理论的演变,出现了一个十分引人注目的现象, 即经济 研究的领域与范畴逐渐超出了传统经济学的视 阈,作为主流经济学的新古典经济学假设与分析方法 日益受到质疑和挑战,经济分析的对象延伸到几乎所 有的人类行 为。经济学与其他学科的交流和相互渗透 得以拓展和加深,经济学的大家族中又派生出许多交 叉学科和边缘学派,例如,心理经济学、地理经济学、 新经济史学、混 沌经济学、不确定性经济学、信息经 济学、行为经济学、实验经济学等。
• 决策理论的启示:
• ①从管理职能的角度来说,决策理论提出了一条新的 管理职能。针对管理过程理论的管理职能,西蒙提出 决策是管理的职能,决策贯穿于组织活动全部过程, 进而提出了 “管理的核心是决策”的命题,而传统的 管理学派是把决策职能纳入到计划职能当中的。由于 决策理论不仅适用于企业组织,而且适用于其他各种 组织的管理,具有 普遍的适用意义。
• ③在 决策标准上,用“令人满意”的准则代替“最优化”准则。 以往的管理学家往往把人看成是以“绝对的理性”为指导,按最 优化准则行动的理性人。西蒙认为事实上 这是做不到的,应该用 “管理人”假设代替“理性人”假设,“管理人”不考虑一切可 能的复杂情况,只考虑与问题有关的情况,采用“令人满意”的 决策准则,从 而可以做出令人满意的决策。

决策分析目录

决策分析目录

决策理论和方法(章节目录)Decision Theory and Technology 引言第一章决策的底子概念§1-1引论一、决策与决策阐发的定义1. Decision的本义:(牛津辞书)2.苏联大百科全书3.<现代科学技术辞典>4. <美国大百科全书>的“Decision Theory〞条:5.美国现代经济辞书6.哈佛办理丛书:7.决策的政治含义二、开展简史三、地位(与其他学科的关系)1.是运筹学的一支2. 控制论的延伸3.办理科学的重要组成局部4.系统工程中的重要局部5.是社会科学与自然科学的交叉,典型的软科学§1-2决策问题的底子特点与要素一、特点二、要素§1-3决策问题的分类一、按容易区分的因素划分二、按涉及面的宽窄三、个人事务决策与公务决策§1-4 决策人与决策阐发人一、问题的复杂性:二、微不雅经济学和决策论关于经济人的假定:三、决策人和决策阐发人的分工§1-5 阐发方法和步调一、决策树与抽奖二、阐发步调习题进一步阅读的文献第二章主不雅概率和先验分布Subjective Probability and Prior Distribution §2-1 底子概念一、概率〔probability〕. 频率Laplace在概率的理论阐发 (1812)中的定公理化定义二、主不雅概率(subjective probability, likelihood)1. 为什么引入主不雅概率2.主不雅概率定义三、概率的数学定义四、主客不雅概率的比较§2-2 先验分布(Prior distribution)及其设定一、设定先验分布时的几点假设二、离散型随机变量先验分布的设定三、持续型RV的先验分布的设定1.直方图法2.相对似然率法3.区间对分法4.与给定形式的分布函数相匹配5. 概率盘法(dart)§2-3 无信息先验分布一、为什么要研究无信息先验二、如何设定无信息先验分布§2.4 操纵过去的数据设定先验分布一、有θ的统计数据二、状态θ不克不及直接不雅察时习题进一步阅读的文献第三章效用、损掉和风险(Utility,Loss and Risk)§3—1 效用的定义和公理系统一、引言·为什么要引入效用二、效用的定义三、效用存在性公理理性行为公理 Von Neumann-Morenstern, 1994 [169]四、基数效用与序数效用 (Cardinal & Ordinal Utility)§3.2 效用函数的构造一、离散型的概率分布二、持续型后果集§3.3 风险与效用一、效用函数包含的内容1.对风险的态度2.对后果的偏好强度3.效用暗示时间偏好二、可测价值函数确定性后果偏好强度的量化三、相对风险态度四、风险酬金五、钱的效用§3.4 损掉、风险和贝叶斯风险一、损掉函数L二、风险函数三、贝叶斯风险习题进一步阅读的文献第四章贝叶斯阐发Bayesean Analysis §引言一、决策问题的表格暗示——损掉矩阵二、决策原那么三、决策问题的分类:四、按状态优于§4.1 不确定型决策问题一、极小化极大(wald)原那么二、极小化极小三、Hurwitz准那么四、等概率准那么(Laplace)五、懊悔值极小化极大准那么(svage-Niehans)六、Krelle准那么:七、莫尔诺(Molnor)对抱负决策准那么的要求 (1954)§4.2 风险型决策问题的决策原那么一、最大可能值准那么二、贝叶斯原那么三、贝努利原那么四、E—V(均值—方差)准那么五、不完全信息情况下的决策原那么(Hodges-Lehmann原那么)§贝叶斯定理一、条件概率二、贝叶斯定理§4.4 贝叶斯阐发的正规型与扩展型一、正规型阐发二、扩展型贝叶斯阐发(Extensive Form Analysis)三、例§4.5 非正常先验与广义贝叶斯规那么一、非正常先验(Improper Prior)二、广义贝叶斯规那么(General Bayesean Rule)§4.6 一种具有局部先验信息的贝叶斯阐发法一、概述二、阐发步调三、几何意义§4.7 序贯决策习题进一步阅读的文献第五章随机优势Stochastic Dominance§5.1 Markowitz 模型§5.2 优势原那么(Dominance Principle)一、最简单的优势原那么:(强随机优势)1.按状态优于:—V排序3. Markowitz模型二、为什么要研究优势原那么三、优势原那么的一般暗示§5.3 一、二、三等随机优势一、第一等随机优势FSD (First-Degree S D)1.第一类效用函数U2.第一等随机优势定义:3.例:二、第二等随机优势SSD三、第三等随机优势TSD四、N等随机优势习题进一步阅读的文献第六章随机性决策的应用(The Application of Probabilistic Decision-making) Murphy’s law & Callahan’s corollary§6.1 常用的决策模型§6.2 几种与决策过程有关的布局模型一、Y、C、Ho二、思考、计算、决策三、Howard的模型四、西蒙关于决策的模型五、几点说明1.好的决策=好的成果2.理论是尺度化、规定性的,而非描述性的(人文学科)3.决策阐发人是成立决策的模型的专家而非作决策的专家六、评估过程(估值)§6.3 行为决策理论一、引言二、主要研究内容习题进一步阅读的文献第七章多目标决策的底子概念Foundational Concept of Multi-criterion Decision-making 本章主要参考文献: 68, 111, 112§7.0 概述一、特点二、分类三、几个术语的含义§7.2 多目标决策与多目标评价一、多目标决策的求解过程二、多目标评价§7.3 多目标决策问题的五要素一、决策单位(Decision-making Unit)二、目标集及其递阶布局三、属性集和代用属性四、决策形势(情况)( Decision Situation)五、决策规那么(Decision Rule)§多目标决策问题(MCDP)的符号暗示§7.4 非劣解及其生成一、定义二、非劣解的生成三、最正确调和解(Best Compromise Solution)习题进一步阅读的文献第八章多属性效用理论(Multi-attribute Utility Theory)§8.1 优先序一、二元关系二、二元关系的种类§多属性价值函数一、价值函数的存在性二、加性价值函数三、其他简单形式§多属性效用函数一、二个属性的效用函数二、效用独立三、拟加性效用函数及例习题进一步阅读的文献第九章多属性决策问题(Multi-attribute Decision-making Problem)即: 有限方案多目标决策问题§概述一、决策矩阵(属性矩阵、属性值表)二、数据预处置常用的数据预处置方法1 线性变换2 尺度0-1变换3 最优值为给定区间时的变换4 向量尺度化5 原始数据的统计处置6 专家组成员定见的尺度化三、方案筛选§9.2 加权和法一、引言二、字典序法与一般加权和法三、确定权的常用方法四、层次阐发法AHP五、最低层目标权重的设定1.网状布局树状布局六、权重的敏感性阐发§9.3 TOPSIS法§基于相对位置的方案排对法§9.5 ELECTRE一、级别高于关系(Outranking Relation)二、级别高于关系的性质:三. 级别高于关系的构造四、级别高于关系的使用五 ELECTRE-Ⅱ六、讨论§9.6 PROMETH§9.7 其它方法习题进一步阅读的文献第十章多目标决策(Multi-objective Decision-making) §10.1 序言一、问题的数学表达二、最正确调和解与决策人的偏好三、决策人偏好信息的获取方式1.在优化之前2.在优化过程中:逐步索取偏好信息3.在优化之后§10.2 目的规划法一、距离测度的选择二、目的规划问题的表述三、分类四、例:§10.3字典序法§10.4 逐步进行法(STEP Method)§10.5 调和解和移动抱负点法§10.6 SEMOP(多目标问题的序贯解法)一、思路与记号二、解题步调三、优错误谬误§10.7Geoffrion法一、思路二、求解步调三、优错误谬误§10.8 代办署理值置换法(Surrogate worth Trade-off Method)一、思路:二、求解步调第十一章群决策与社会选择Group Decision-making and Social Choice Theory §11-1概述一、为什么要研究群决策二、分类三、社会选择的定义与方式§11.2 投票表决(选举)(V oting)一、非排序式投票表决(Non-ranked Voting Systems) (一)只有一人中选候选人只有两个候选人多于两个时①简单大都(相对大都)②过对折规那么(绝对大都Majority)a.二次投票,(二). 同时选出二人或多人投票表决(Single nontransferable voting)2. 复式选举(Multiple voting)(Limited voting)4. 累加式选举(Cumulate voting)5. 名单制(List system)(1)最大均值法:⑵. 最大余额法:6. 简单可转移式选举(Single nontransferable voting)7. 承认选举( Approval vote )(三). 其它投票表决(选举)方法1. 资格认定⑴2/3大都,⑵2/3大都 60%大都⑶3/4大都⑷过对折撑持, 反对票少于1/3⑸一票否决二、偏好选举与投票悖论 ( Paradox of voting )2.Borda法( 1770年提出)3. Condorcet原那么( 1785年提出)(投票悖论)5. 呈现 Condorcet效应的概率三、策略性投票(把持性)1.小集团控制群2.谎报偏好而获益3. 程序(议程)问题四、衡量选举方法优劣的尺度§11.3 社会选择函数一、引言二、社会选择函数的几个性质三、社会选择函数1. Condorcet-函数2 Borda-函数3. Copeland-函数4. Nanson函数5.Dodgson函数函数7.C ook-Seiford函数8.本征向量函数9. Bernardo函数§11.4 社会福利函数(Social Welfare Function)一、社会福利(Social Welfare)二、偏好断面(profile of preference ordering)(偏好分布)1. 可能的偏好序2. 偏好断面:三、Arrow的条件(即社会福利函数应当具有的性质)四、Arrow 的可能性定理五、单峰偏Black好与Coombs条件六、SCF与SWF的比较§11.5群效用函数一、导致Arrow不成能定理的原因二、群效用函数与多目标效用函数的比较群决策提法本身存在缺陷习题进一步阅读的文献第十二章冲突阐发Conflict Analysis §12.1引言一、群决策的分类二、研究沿革§12.2 Nash谈判模型一、问题表述:二、底子假设三、Nash提出的四条公理——为了预先求得谈判成果四、定理五、评注:.§12.3 其他谈判模型一、等效用法(即K-S法)二、中间——中间法三、均衡增量法§12.4 谈判问题与效用一、谈判问题成立在效用空间上的必要性二、使用效用存在的问题§1 仲裁与调整(Arbitration & Mediation)一、强制性仲裁(Binding Arbitration)二、最终报价仲裁(Final-offer Arbitration)三、复合仲裁法(Combination arbitration)四、调整§1 n人合作对策一、术语:二、Nash-Harsanyi谈判模型三、Shapley值四、Raiffa的裁决五、例一(存在核)六、例二(不存在核的情况)§12.7 投资分摊与协调规划法习题进一步阅读的文献参考文献习题的参考答案与提示。

决策理论与方法教学作者罗党第四章动态决策分析

决策理论与方法教学作者罗党第四章动态决策分析
(2)如果买专利,是否采取试销办法?
(3)如果不试销,应大批生产,中批生产还是小批 生产?如果试销,又应该如何根据试销结果决定其行 动?
例4-2-2
2 1
试销 3
θ1
a1 8
θ2
H1 4
a2 a3
9
θ3
10
H2 5
H3 6 (略)
7 不试销
第一阶段
第二阶段
第三阶段
例4-2-2
解:这是一个三阶段决策问题,采用逆序归 纳法进行决策分析,先要计算在一定的试销
单价 第1年 第2年 第3年 第4年 第5年
5元
10
12
15
20
25
6元
12
13
16
20
24
7元
14
14
16
18
18
8元
16
15
15
14
14
4.2 多阶段决策
4.2.2 多阶段决策问题的决策方法
84
73
60
45
5元
10
12
15
20
25
84
73
60
45
6元
12
13
16
20
24
84
73
60
45
7元
14
14
16
18
18
84
73
60
45
8元
16
15
15
14
14
例4-2-1决策图
4.2 多阶段决策
4.2.2 多阶段决策问题的决策方法
例4-2-2 为了更正确地掌握市场情况,正式投产公司 打算先生产少量产品试销,试销费需要5000元。试 销结果分为产品受欢迎(H1),一般(H2)和不受欢迎 (H3)三种。由于试销面不宽,试销结果的准确性有 限。其准确度(似然分布矩阵)见下表:

ERP技术与管理课件:决策理论与方法

ERP技术与管理课件:决策理论与方法
Compare the worst possible outcome of each alternative and select the alternative whose worst possible outcome is the least undesirable.
(Take an umbrella)
Alternative Take umbrella Do not take umbrella
State of nature
No Rain
Rain
Dry, but inconvenient
Dry
Dry, happy
Wet
6–20
Conditions for Making Decisions
A. Certainty—the decision maker knows exactly what will happen and can calculate the precise outcome for each alternative.
6–17
步骤 5:分析备选方案 Step 5: Analyzing Alternatives
评估每一个备选方案的优缺点 Appraising each alternative’s strengths
and weaknesses
这些准则是在步骤2和步骤3中建立的。
An alternative’s appraisal is based on its ability to resolve the issues identified in steps 2 and 3.
实施Implementation(通过计划、组织和领导职能有效实 施) 包括了将决策传递给有关的人员和部门,并要求他们对实 施结果作出承诺。

决策理论与方法教学作者罗党第四章(2)

决策理论与方法教学作者罗党第四章(2)

第第 99页页
4.3 序贯决策
《决策理论与方法》
为了更好地做出决定可以先从一箱中随机抽取1件作 为样本检验它,然后根据这件产品是都次品再决定 该箱是否要检验,抽样成本为4.2元。进行第一次抽 样后,除选择检验还是不检验外,还可以根据前面 抽样的结果,考虑再进行一次抽样检验如此形成一 个决策序列。
第第 33页页
本讲内容
4.3序贯决策
4.3.1序贯决策的基本概念 4.3.2序贯决策的决策方法
《决策理论与方法》
第第 44页页
4.3 序贯决策
《决策理论与方法》
4.3.1 序贯决策的基本概念
上面的多阶段决策,阶段数是确定的。除这种决 策外,还有一些决策的阶段数不是事先确定的,它依 赖于执行决策过程中出现的情况。这种决策问题称为 序贯决策(sequential decision problem)。
0.90 0.2 0.422

0.4265
第一次抽样的后验概率矩阵为
X1 0
X1 1
1 0.3426 0.0047 P( | X1 ) 2 0.6228 0.5687
3 0.0346 0.4265
第第 1155页页
《决策理论与方法》
后验行动方案的期望损失值矩阵为

0.0346
3
P( X1 1) P( X1 1 | j )P( j ) j 1
0.01 0.2 0.40 0.6 0.90 0.2 0.422
第第 1144页页
【例8.2】
《决策理论与方法》
P(1
|
X1
1)

P( X1 1 | 1 )P(1 )
1.1778 s3
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
序列决策树图不能够一次绘制成功,而是随着决策过 程序列的延伸和终止依次进行。为了简化图形,行动 方案al和a2可能出现的状态及其对应的损失值均在图 中略去,仅在方案枝末端标注上期望损失值。
第 111页页

A1
X1=0
4
2
X1=1
5
… 《决X策2=理0 论与方法》
8
… X2=1
9
a1
a2
(略)
a1
3 a2
《决策理论与方法》
4.3.1 序贯决策的基本概念
上面的多阶段决策,阶段数是确定的。除这种决 策外,还有一些决策的阶段数不是事先确定的,它依 赖于执行决策过程中出现的情况。这种决策问题称为 序贯决策(sequential decision problem)。
序列决策在进行决策后又产生一些新的情况,需 要进行新的决策,接着又有一些新的情况,又需要进 行新的决策。这样决策、情况、决策……,这就构成 一个序列。
A2
A3
6
7
… A4
第 1122页页
《决策理论与方法》
该问题的费 用矩阵为:
101 000 10 Q(qij)232.5100 22
相应的损失矩阵为 R(rij)2390.75001025
先进行第p (x 10| j)p (j) j 1 0 . 9 0 . 2 9 0 . 6 0 . 6 0 0 . 1 0 . 2 0 0.578 第 1133页页
第 99页页
4.3 序贯决策
《决策理论与方法》
▪ 为了更好地做出决定可以先从一箱中随机抽取1件作 为样本检验它,然后根据这件产品是都次品再决定 该箱是否要检验,抽样成本为4.2元。进行第一次抽 样后,除选择检验还是不检验外,还可以根据前面 抽样的结果,考虑再进行一次抽样检验如此形成一 个决策序列。
3)系统下一步(或未来)可能出现的状态是随机的 或不确定的。
第 66页页
ra,E 2fE 2
4.3 序贯决策
《决策理论与方法》
4.3.1 序贯决策的基本概念
系统在每次作出决策后下一步可能出现的状态 是不能确切预知的,存在两种情况:
1)系统下一步可能出现的状态的概率分布是已 知的,可用客观概率的条件分布来描述。对于这类系 统的序贯决策研究得较完满的是状态转移律具有无后 效性的系统,相应的序贯决策称为马尔可夫决策过程 ,它是将马尔可夫过程理论与决定性动态规划相结合 的产物。
《决策理论与方法》
P (1 |X 1 0 ) p (X 1 P (X 0 1 | 1 0 )P )(1 ) 0 .9 0 .5 0 9 .2 7 0 .3 84 P (2 |X 1 0 ) P (X 1 P (X 0 1 | 2 0 )P )(2 ) 0 .6 0 .5 0 0 .6 7 0 .6 82 P (3 |X 1 0 ) P (X 1 P (X 0 1 | 3 0 ) P )(3 ) 0 .1 0 .5 0 0 .2 7 0 .0 83
《决策理论与方法》
第 22页页
学习目的
《决策理论与方法》
▪ 了解多阶段决策、序贯决策的概念及特点;
▪ 掌握动态规划与决策树方法及其在多阶段决策、 序贯决策中的应用。
第 33页页
本讲内容
4.3序贯决策
4.3.1序贯决策的基本概念 4.3.2序贯决策的决策方法
《决策理论与方法》
第 44页页
4.3 序贯决策
▪ 试进行序列决策:
(1)是否需要抽样?(若需要,抽样几次?)
(2)在抽样或不抽样的前提下,采用何种方案进行 检验?
第 1100页页
【例8.2】
《决策理论与方法》
解: θ1,θ2,θ3分别表示产品次品率为 0.01 ,0.4, 0.9三种状态。对于抽样检验一件产品,X=1和X=0分 别表示样品为次品和合格品两个结果。结果值均用期 望损失值表示。
3
P (X 1 1 ) P (X 1 1 | j)P (j)
j 1
0 . 0 0 . 2 1 0 . 4 0 . 6 0 0 . 9 0 . 2 0 0.422
第 1144页页
【例8.2】
《决策理论与方法》
P (1 |X 1 1 ) P (X P 1 (X 1 1 | 1 1 )P )(1 ) 0 .0 0 .4 0 1 .2 2 0 .0 204 P (2 |X 1 1 ) P (X 1 P (X 1 1 | 2 1 )P )(2 ) 0 .4 0 .4 0 0 .6 2 0 .5 268 P (3 |X 1 1 ) P (X 1 P (X 1 1 | 3 1 )P )(3 ) 0 .9 0 .4 0 0 .2 2 0 .4 226
2)系统下一步可能出现的状态的概率分布不知 道,只能用主观概率的条件分布来描述。用于这类系 统的序贯决策属于决策分析的内容。
第 77页页
ra,E 2fE 2
4.3 序贯决策
《决策理论与方法》
4.3.2 序贯决策的决策方法
序贯决策的过程是:从初始状态开始,每个时 刻做出最优决策后,接着观察下一步实际出现的状态 ,即收集新的信息,然后再做出新的最优决策,反复 进行直至最后。
第 55页页
4.3 序贯决策
《决策理论与方法》
4.3.1 序贯决策的基本概念
序贯决策是用于随机性或不确态定性动态系统最 优化的决策方法。它的特点是:
1)所研究的系统是动态的,即系统所处的状态 与时间有关,可周期(或连续)地对它观察;
2)决策是序贯地进行的,即每个时刻根据所观 察到的状态和以前状态的记录,从一组可行方案中选 用一个最优方案(即作最优决策),使取决于状态的 某个目标函数取最优值(极大或极小值);
解决序贯决策问题的有效办法仍然是决策树,解 决序贯决策的关键是确定一个决策序列终止的原则。 在下例中,这个原则就是:不管到决策的哪个阶段, 只要有一个非经抽样的后悔期望值小于进行一次抽样 的费用,决策序列便可终止。
第 88页页
4.3 序贯决策
《决策理论与方法》
4.3.2 序贯决策的决策方法
例4-3-1 某工厂的产品每1000件装成一箱出售。 每箱中产品的次品率有0.01,0.40,0.90三种可能, 其概率分别为0.2,0.6,0.2。现在的问题是:出厂前 是否要对产品进行严格检验,将次品挑出。可以选择 的行动有两个:① 整箱检验(a1) ,检验费 为每箱100 元;②整箱不检验(a2) ,但如果顾客在使用中发现 次品,每件次品除条换为合格品外还要赔偿0.25元损 失费。
相关文档
最新文档