个决策树算法案例分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
800 700
d2
d3
1220 3 1420 4
1400
500 2000
-900
首先计算出各个状态结点的期望值,从中选取一个最大期望值, 往回找对应的方案,为最佳方案,如上图,④点最大 ,选d3方案 为最佳方案。
8
§4.4 灵敏度分析
灵敏度分析是将自然状态出现的概率加以改变,来考察这一改变对决策 方案选取将带来什么样的影响。比如:高的接受程度 S1的概率降到 0.2, 低的接受S2的概率升为0.8,即P(S1)=0.2,P(S2)=0.8, EV(d1)=0.2×800+0.8×700=720 EV(d2)=0.2×1400+0.8×500=680 EV(d1)=0.2×2000+0.8×(-900)=-320 可见,小楼方案d1为最佳,大楼方案为最差的。 如果问题只涉及两种自然状态,则可以按以下方式求出各方案的临界 设自然状态S1的概率P(S1)=P,则自然状态S2的概率P(S2)=1-P。按本问 题的益损矩阵, EV(d1)=P×800+(1-P)×700=100P+700 EV(d2)=900P+500 EV(d3)=2900P-900
13
可算出: 状态结点④的EV=0.935×8+0.065×7=7.935 状态结点⑤的EV=13.416 状态结点⑥的EV=18.118…… 状态结点⑦的EV=0.348×8+0.652×7=7.348 状态结点⑧的EV=8.130…… 状态结点⑨的EV=1.086 2 ,应选d3 3 ,应选d2方案。
P( S i | I K ) P( S i ) P( I K | S i )
P( S ) P( I
i 1 i
n
K
| Si )
I=1,2,…..n, k=1,2,…,m
按以上数据,可算得其后验概率为:
有兴趣(支持)买楼者I1的有关概率计算表
自然状态Si s1 s2 先验概率P(Si) 0.8 0.2 条件概率P(I1|Si) 0.1 0.75 联合概率P(I1∩s1) 0.72 0.05 P(Si|I1) 0.9635 0.065
1
常规(用)决策技术和效用理论
4.1 决策分析案例背景
匹兹堡开发公司(PDC)已购得一块地用于建造一个高档的沿河 综合商业楼,其位置对繁华的匹兹堡和金三角有很好的景观,所 谓金三角是指两条小河汇流成俄亥俄 (Ohio)河的地段。每一个建 30 万~120 万,取决于单元所处楼层,面积 以及备选的设施。
公司对这套楼房的设计, d1——小型楼,有6层,30 d2——中型楼,有12层,60 d3——大型楼,有18层,90个单元。 决策问题是要从这三个方案中选择其中之一,并提出决策分析的 书面报告,包括分析计算书,建议,以及风险提示。
2
为了进行决策分析,
(1)市场调研,综合楼被市场接受的程度如何?亦即市场的需求如何? 对此问题,公司管理者通过调研认为,只有两种市场接受状态,称为决策 者无法控制的自然
再分别对各方案,从不同自然状态的后悔值中取一最大者,
d1 →1200 d2 →600万←Min d3 →1600
然后从各方案的最大后悔值中选取一最小者,为600万,则它对应的方案 d2为最佳方案。
6
二、风险决策方法(自然状态出现的概率已知)
既然各种可能的自然状态出现的概率已经通过调研获得,则可以以此求 各方案的期望益损值。 令n——
d2→1400+500=1900万←Max
d3→2000-900=1100 再从各方案的合计和值中取一最大值,如1900万,所对应方案d2的最佳方案。
5
4 该方法相似于保守方法,取悲观态度。首先从益损矩阵中求后悔值,即机 会损失值Rij Rij Vij = V*j-Vij (j=1,2,…,n) (i=1,2,…,m) 式中V*j——对状态Sj ——状态Sj、方案di相应的益损值。 s1 d1 d2 d3 2000-800=1200 2000-1400=600 2000-2000=0 s2 700-700=0 700-500=200 700-(-900)=1600 由此,可得后悔值Rij
没有兴趣(支持)买楼者I2的有关概率计算表
自然状态Si s1 先验概率P(Si) 0.8 条件概率P(I1|Si) 0.1 联合概率P(I1∩s1) 0.08 P(Si|I1) 0.348
s2
0.2
0.75
0.15
0.652
12
根据上列概率计算表,ቤተ መጻሕፍቲ ባይዱ
小型d1
高接受S1,P(S1|I1)=0.935 4 低接受S2,P(S2|I1)=0.065
S1——高的市场接受程度, S2——低的市场接受程度,对楼房需求有限。 (2)要根据工程设计与造价核算以及销售价格计算出不同方案,不同自然状 态时,楼房的盈 亏(益损)表。对该问题,经计算得到如下益损矩阵Vij
备选方案
小型楼d1 中型楼d 2 大型楼d 3
自然状 态 高的市场接受程度S1 800万 1400万 2000万 低的市场接受程度S2 700万 500万 -900万
9
(1)当EV(d1)=EV(d2)时,即100P+700=900P+500
可解得P=200/800=0.25
(2)当EV(d2)=EV(d3)时, 可解得P=0.7
按此,用不同P值(P=0~1.0)
从图可见,当高的市场 接受状态的概率P<0.25 时,第一方案d1 当0.25≤P≤0.7时,方案 d2 当P>0.7时,方案d3最佳。
高接受S1,P(S1)=0.8 低接受S2,P(S2)=0.2
有兴趣买楼,即支持者I1
P(I1|S1)=0.90 P(I1|S2)=0.25
无兴趣买楼,不支持者I2
P(I2|S1)=0.10 P(I2|S2)=0.75
11
这个似然函数的意义是:在真正高接受者中核查为有兴趣 (即支持建 楼)买楼的概率为0.9,而不支持的为0.1;在真正低接受者中,核查为不支 持的概率为0.75,反而支持的为0.25。这些补充信息是在明确了高、低接 受者的条件下,进一步调查核实的信息,由此统计出的条件概率。 有 了先验概率和似然函数,可以运用贝叶斯全概率公式,计算出后验概率 P(S|I):
一般在一些技术较复杂、投资费用较大,开发周期较长的项目中,往往 存在许多不确定因素。如前所述如果可以给出这些不确定因素的概率分布, 最常用的决策方法是采用益损期望值、其方差和效用函数来进行分析。
案例:某公司有一投资项目,有3个投资方案A、B、C,这三个方案的经济
收益取决于今后两年的经济状态,经济状态估计为三种及其概率为:好 (0.3); 中(0.5);差(0.2)。
P(Sj)——自然状态Sj的概率。
则有 P(Sj)≥0,(j=1,2,…,n) n
P( S
j 1
j
) P( S1 ) P( S 2 ) ... P( S n ) 1
各方案dj
EV (d i ) P( S j ) * Vij
j 1 n
益损期望值为最大者对应的方案,可选为最佳方案。 对本问题而言,若已知:P(S1)=0.8,P(S2)=0.2, 有: EV(d1)=0.8×800+0.2×700=780 EV(d2)=0.8×1400+0.2×500=1220 EV(d3)=0.8×2000+0.2×(-900)=1420
3
其中 i—— 表示方案, j—— 表示状态。比如: V32 =-900 万,表示大型楼方案 d3在低 的市场接受S2时,楼房不能正常销售,估计可能带来亏损900万。
4.2 常用决策分析方法
按照问题面临的自然状态出现的概率无法知道,抑或可以通过调研统计得 到,常用决策方法划分为不确定性决策方法与风险决策方法。 一、不确定性决策方法(自然状态出现的概率不知道) 1
可见,方案d3建大楼为最佳方案。
7
为了较形象直观地作出决策,也可应用决策树方式进行分析,决策树 决策结点用□表示,由它生出方案枝;各方案枝分别生出状态结点,用○ 表示,由状态结点引出各种状态分枝,分枝末梢绘上相应的益损值。对本
780
d1 1 2
s1 , P( S1 ) 0.8 s 2 , P( S 2 ) 0.2 s1 , P( S1 ) 0.8 s 2 , P( S 2 ) 0.2 s1 , P( S1 ) 0.8 s 2 , P( S 2 ) 0.2
投资方案 A 经济状态及其概率,收益(万元) 好,0.3 1800 中,0.5 1500 差,0.2 800
B
C
1600
2000
1200
1600
1000
900
1000 2000
1500
d1可得 最大 EV的P 区间
d2可得 最大 EV的P 区间
d3可得 最大EV 的P区间
EV(d3)
EV(d2) EV(d1)
500
0
0.2
-500
0.4
0.6
0.8
1.0
-1000
10
§4.5
前述两种自然状态出现的概率P(S1)=0.8,P(S2)=0.2,只是一种比较粗 糙地调研而获得的自然状态的概率分布,也即是一种所谓先验概率。如果 我们能够再深挖一些新信息,用以修正先验概率,最终获得一种所谓后验 概率,用来进行决策,则决策的效果更好、更科学。 一般讲,补充信息是可以通过对自然状态样本信息设计的实验方法来 取得,包括原始资料的采样、产品检验、市场调研等等。比如:通过天气 预报的验证信息,来修正天气状态的先验概率;通过产品检验的正确与否 的信息,来修正产品的正、废品先验概率。对PDC问题来讲,可以通过市 场调查,调查有多少比率的人有兴趣买楼,记为I1,有多少比率的人没有 兴趣买楼,记为I2,则可以获得四个条件概率,记为:P(I1|S1),P(I2|S1), P(I1|S2),P(I2|S2),它们也叫做似然函数。 对PDC问题,经过调查,获得了下表的似然函数。 自然状态
小型d1
高接受S1,P(S1|I2)=0.348
7 8 低接受S2,P(S2|I2)=0.652 高接受S1,P(S1|I2)=0.348 低接受S2,P(S2|I2)=0.652 高接受S1,P(S1|I2)=0.348 9 低接受S2,P(S2|I2)=0.652
8 7 14 5 20 -9
3
中型d2 大型d3
对各方案先从不同状态的Vij 中取一最大值者,得:
最大值 小型楼d1→800 中型楼d2→1400 大型楼d3→2000万←Max· Max 再从不同方案的最大值中取一最大值,为2000万,所对应的方案——大型楼 方案d3为决策的最佳方案。
4
2
对各方案,先从不同状态的Vij d2→500 d3→-900 再从不同方案的最小值中取一最大值,如700万,所对应的方案——小型楼方 案d 1为决策的最佳方案。 3 该方法认为,不同自然状态出现的概率彼此相等。在等概率原则下,则可分 别先将各不同方案的所有自然状态的益损值求和, d1→800+700=1500 中取一最小值者,得: 最小值d1→700←Max·Min
8 百万 7
2 支持的,I1 P(I1)=0.77 1 支持的,I2 P(I2)=0.77
中型d2 大型d3
5
6
高接受S1,P(S1|I1)=0.935 14 低接受S2,P(S2|I1)=0.065 5 高接受S1,P(S1|I1)=0.935 20 低接受S2,P(S2|I1)=0.065 -9
结论是:当市场报告是支持建楼,I1时,应建大型楼;当市场报 告是不支持,I2时,应
建中型楼。
14
§4.5 效用与风险分析(Utility and Risk Analysis)
以前所述的决策分析方法是按照最好的货币期望值选择方案,但在决策 分析中除了要考虑方案的货币益损因素以外,还要考虑风险程度,包括决策 人对待风险的态度这一主观偏好因素。因而,往往单从货币益损期望值选择 的方案,不一定是最佳方案。本节将介绍决策分析中的期望效用。 所谓效用是一种特定结果的总价值的相对尺度,它反映决策者面对诸如 利润、损失和风险等因素集合的态度。
兵者,国之大事也。死生之地,存亡之道,不 可不察也。故经之以五事,效之以计,而索其情。一曰 道,二曰天,三曰地,四曰将,五曰法。 夫未战而庙算胜者,得算多者;未战而庙算不 胜者,得算少也。多算胜,少算不胜,而况於无算乎? 兵法:一曰度,二曰量,三曰数,四曰称,五 曰胜。地生度,度生量,量生数,数生称,称生胜。