决策理论与方法教学作者罗党第四章(2)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)
4.3 序贯决策
§为了更好地做出决定可以先从一箱中随机抽取1件作 为样本检验它,然后根据这件产品是都次品再决定 该箱是否要检验,抽样成本为4.2元。进行第一次抽 样后,除选择检验还是不检验外,还可以根据前面 抽样的结果,考虑再进行一次抽样检验如此形成一 个决策序列。
解决序贯决策问题的有效办法仍然是决策树,解 决序贯决策的关键是确定一个决策序列终止的原则。 在下例中,这个原则就是:不管到决策的哪个阶段, 只要有一个非经抽样的后悔期望值小于进行一次抽样 的费用,决策序列便可终止。
PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)
4.3 序贯决策
4.3.2 序贯决策的决策方法
8
… X2=1
9
a1
a2
(略)
a1
3 a2
A2
A3
6
7
… 决策A理4 论与方法教(2学) 作者罗党第四章
该问题的费 用矩阵为: 相应的损失矩阵为
先进行第一次抽样的后验概率计算
PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)
PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)
【例8.2】
PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)
4.3 序贯决策
4.3.1 序贯决策的基本概念
系统在每次作出决策后下一步可能出现的状态 是不能确切预知的,存在两种情况:
1)系统下一步可能出现的状态的概率分布是已 知的,可用客观概率的条件分布来描述。对于这类系 统的序贯决策研究得较完满的是状态转移律具有无后 效性的系统,相应的序贯决策称为马尔可夫决策过程 ,它是将马尔可夫过程理论与决定性动态规划相结合 的产物。
决策理论与方法教学作 者罗党第四章(2)
PPT文档演模板
2020/11/10
决策理论与方法教学作者罗党第四章 (2)
•第四章 动态决策分析
PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)
学习目的
§ 了解多阶段决策、序贯决策的概念及特点; § 掌握动态规划与决策树方法及其在多阶段决策、
序贯决策中的应用。
例4-3-1 某工厂的产品每1000件装成一箱出售。 每箱中产品的次品率有0.01,0.40,0.90三种可能, 其概率分别为0.2,0.6,0.2。现在的问题是:出厂前 是否要对产品进行严格检验,将次品挑出。可以选择 的行动有两个:① 整箱检验(a1) ,检验费 为每箱100 元;②整箱不检验(a2) ,但如果顾客在使用中发现 次品,每件次品除条换为合格品外还要赔偿0.25元损 失费。
1)所研究的系统是动态的,即系统所处的状态 与时间有关,可周期(或连续)地对它观察;
2)决策是序贯地进行的,即每个时刻根据所观 察到的状态和以前状态的记录,从一组可行方案中选 用一个最优方案(即作最优决策),使取决于状态的 某个目标函数取最优值(极大或极小值);
3)系统下一步(或未来)可能出现的状态是随机的 或不确定的。
序列决策在进行决策后又产生一些新的情况,需 要进行新的决策,接着又有一些新的情况,又需要进 行新的决策。这样决策、情况、决策……,这就构成 一个序列。
PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)
4.3 序贯决策
4.3.1 序贯决策的基本概念
序贯决策是用于随机性或不确态定性动态系统最 优化的决策方法。它的特点是:
§试进行序列决策:
(1)是否需要抽样?(若需要,抽样几次?)
(2)在抽样或不抽样的前提下,采用何种方案进行 检验?
PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)
【例8.2】
解: θ1,θ2,θ3分别表示产品次品率为 0.01 ,0.4, 0.9三种状态。对于抽样检验一件产品,X=1和X=0分 别表示样品为次品和合格品两个结果。结果值均用期 望损失值表示。
第一次抽样的后验概率矩阵为
PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)
后验行动方案的期望损失值矩阵为
PPT文档演模板
一次抽样后最满 意方案分别为:
决策理论与方法教学作者罗党第四章 (2)
0.3426
97.5
a1
33.40
0.6228
0
0.0346
0
0.578
4.325
0.3426 0
a2
4.325
0.5687 0
0.4265
125
0.0047
97.5
百度文库
2.69
0.4582 a1
0.5687 0
0.4265
0.4582 0.422
a2
0 0.0047
0
6.89
53.31
0.5687 0
0.4265
最满意方案是,应抽取一件产品作样0品.2 检验125。 97.5
期望损失值(包含抽样费用)
PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)
本讲内容
4.3序贯决策
4.3.1序贯决策的基本概念 4.3.2序贯决策的决策方法
PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)
4.3 序贯决策
4.3.1 序贯决策的基本概念
上面的多阶段决策,阶段数是确定的。除这种决 策外,还有一些决策的阶段数不是事先确定的,它依 赖于执行决策过程中出现的情况。这种决策问题称为 序贯决策(sequential decision problem)。
序列决策树图不能够一次绘制成功,而是随着决策过 程序列的延伸和终止依次进行。为了简化图形,行动 方案al和a2可能出现的状态及其对应的损失值均在图 中略去,仅在方案枝末端标注上期望损失值。
PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)

A PPT文1 档演模板
X1=0
4
2
X1=1
5
… X2=0
a1
19.5
19.5 若为正品,则无须检 验整箱产品;
若a为2 次品,则整箱检 验。 25
0.6 0
0.2
0.2
0
0
0.6 0
0.2
125
A PPT文1 档演模板
A2
S1
A3
2)系统下一步可能出现的状态的概率分布不知 道,只能用主观概率的条件分布来描述。用于这类系 统的序贯决策属于决策分析的内容。
PPT文档演模板
决策理论与方法教学作者罗党第四章 (2)
4.3 序贯决策
4.3.2 序贯决策的决策方法
序贯决策的过程是:从初始状态开始,每个时 刻做出最优决策后,接着观察下一步实际出现的状态 ,即收集新的信息,然后再做出新的最优决策,反复 进行直至最后。
相关文档
最新文档