决策树例题分析及解答PPT课件
合集下载
决策树例题分析

9
➢ 最后比较决策点1的情况: • 由于点③(719万元)与点②(680万元)相比,
点③的期望利润值较大,因此取点③而舍点②。 这样,相比之下,建设大工厂的方案不是最优方 案,合理的策略应采用前3年建小工厂,如销路好 ,后7年进行扩建的方案。
10
决策树法的一般程序是: (1)画出决策树图形 决策树指的是某个决策问题未来发展情 况的可能性和可能结果所做的估计,在图纸上的描绘决策树 (2)计算效益期望值 两个行动方案的效益期望值计算过程: 行动方案A1(建大厂)的效益期望值: 13.5×0.8×10+25.5×0.2×10-25=134万元 行动方案A2(建小厂)的效益期望值: 15×0.8×10+15×0.2×10-10=140万元 (3)将效益期望值填入决策树图 首先在每个结果点后面填上 相应的效益期望值;其次在每个方案节点上填上相应的期望值, 最后将期望值的角色分支删减掉。只留下期望值最大的决策分 支,并将此数值填入决策点上面,至此决策方案也就相应选出
11
建小厂的方案在经济上是比较合理的
12
• 例:随着茶叶生产的发展,三年后的原 料供应可望增加,两个行动方案每年损益及 两种自然状态的概率估计如表
三年后两种收益估计值
单位: 万元
13
14
各点效益值计算过程是: 点2:13.5×0.8×3+172.9×0.8+25.5×0.2×3+206.5×0.2- 25(投资)=202.3万元 点3:15×0.8×3+105×0.8+15×0.2×3+105×0.2-10(投 资)=140万元 点4:21.5×0.6×7年+29.5×0.4×7年=172.9万元 点5:29.5×1.0×7=206.5 点6:15×0.6×7+15×0.4×7=105万元 通过以上计算。可知建小厂的效益期望值为140万元,而 建大厂的效益期望值为202.3万元,所以应选择建大厂的方 案。
➢ 最后比较决策点1的情况: • 由于点③(719万元)与点②(680万元)相比,
点③的期望利润值较大,因此取点③而舍点②。 这样,相比之下,建设大工厂的方案不是最优方 案,合理的策略应采用前3年建小工厂,如销路好 ,后7年进行扩建的方案。
10
决策树法的一般程序是: (1)画出决策树图形 决策树指的是某个决策问题未来发展情 况的可能性和可能结果所做的估计,在图纸上的描绘决策树 (2)计算效益期望值 两个行动方案的效益期望值计算过程: 行动方案A1(建大厂)的效益期望值: 13.5×0.8×10+25.5×0.2×10-25=134万元 行动方案A2(建小厂)的效益期望值: 15×0.8×10+15×0.2×10-10=140万元 (3)将效益期望值填入决策树图 首先在每个结果点后面填上 相应的效益期望值;其次在每个方案节点上填上相应的期望值, 最后将期望值的角色分支删减掉。只留下期望值最大的决策分 支,并将此数值填入决策点上面,至此决策方案也就相应选出
11
建小厂的方案在经济上是比较合理的
12
• 例:随着茶叶生产的发展,三年后的原 料供应可望增加,两个行动方案每年损益及 两种自然状态的概率估计如表
三年后两种收益估计值
单位: 万元
13
14
各点效益值计算过程是: 点2:13.5×0.8×3+172.9×0.8+25.5×0.2×3+206.5×0.2- 25(投资)=202.3万元 点3:15×0.8×3+105×0.8+15×0.2×3+105×0.2-10(投 资)=140万元 点4:21.5×0.6×7年+29.5×0.4×7年=172.9万元 点5:29.5×1.0×7=206.5 点6:15×0.6×7+15×0.4×7=105万元 通过以上计算。可知建小厂的效益期望值为140万元,而 建大厂的效益期望值为202.3万元,所以应选择建大厂的方 案。
高中信息技术浙教版:决策树教学课件(共27张PPT)

第五步:使用Python库测试结果可视化
第一步:收集数 据
第三步:向Python导入 数据
第四步:使用Python库sklearn训练
第二步:分割数据
课堂小结
一、2017年度重点工作项目完成情况
1 决策树分类概念 2 构建决策树
3 举例说明:鸢尾花分类
备未用来:的深深度度学学习习:人工智能
展望与挑战
“温度”是多余的特点
如何判断某一天游客是否会来游乐场游玩?
天气、温度、湿度
2.4.1决策树分类概念
建立决策树的过程 选择一个属性值,基于这个属性对样本集进行划分,得到子集划分结果。
再选择其他属性,对得到的划分结果进行划分,直至最后所得划分结果中每 个样本为同一个类别。
2.4.2构建决策树
构建决策树来解决实际生活中的问题时,需按照一定的顺序选择划分属 性。通常,性能好的决策树随着划分不断进行,决策树分支节点的“纯度” 会越来越高,即其所包含样本尽可能属于相同类别。为了逐次选出最优属 性,可以采用信息增益(informationgain)这一指标。
2.4.2构建决策树
练一练: 1.计算表2.4.1中温度高低、湿度大小、风力强弱三个气象特点的信息增益。
思考: 将天气状况、温度高低、湿度大小、风力强弱作为分支点来构造图2.4.1决策
树时,是否信息增益大的气象特点离根节点越近?
【练一练】: 如下表所示,每朵鸢尾花有萼片长度、萼片宽度、花瓣长度、花瓣宽度四个
4个属性 1个标签 1 Label 4 Features 用来标记种类
序号 Index 0-149, 一共150个样本
基于鸢尾花数据集
例:鸢尾花数据集是常用的分类实验数据集,由Fisher1936收集整理。 Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含 150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通 过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于 (Sentosa 0,Versicolor 1,Virginia 2)三个种类中的哪一类。
第一步:收集数 据
第三步:向Python导入 数据
第四步:使用Python库sklearn训练
第二步:分割数据
课堂小结
一、2017年度重点工作项目完成情况
1 决策树分类概念 2 构建决策树
3 举例说明:鸢尾花分类
备未用来:的深深度度学学习习:人工智能
展望与挑战
“温度”是多余的特点
如何判断某一天游客是否会来游乐场游玩?
天气、温度、湿度
2.4.1决策树分类概念
建立决策树的过程 选择一个属性值,基于这个属性对样本集进行划分,得到子集划分结果。
再选择其他属性,对得到的划分结果进行划分,直至最后所得划分结果中每 个样本为同一个类别。
2.4.2构建决策树
构建决策树来解决实际生活中的问题时,需按照一定的顺序选择划分属 性。通常,性能好的决策树随着划分不断进行,决策树分支节点的“纯度” 会越来越高,即其所包含样本尽可能属于相同类别。为了逐次选出最优属 性,可以采用信息增益(informationgain)这一指标。
2.4.2构建决策树
练一练: 1.计算表2.4.1中温度高低、湿度大小、风力强弱三个气象特点的信息增益。
思考: 将天气状况、温度高低、湿度大小、风力强弱作为分支点来构造图2.4.1决策
树时,是否信息增益大的气象特点离根节点越近?
【练一练】: 如下表所示,每朵鸢尾花有萼片长度、萼片宽度、花瓣长度、花瓣宽度四个
4个属性 1个标签 1 Label 4 Features 用来标记种类
序号 Index 0-149, 一共150个样本
基于鸢尾花数据集
例:鸢尾花数据集是常用的分类实验数据集,由Fisher1936收集整理。 Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含 150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通 过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于 (Sentosa 0,Versicolor 1,Virginia 2)三个种类中的哪一类。
决策树例题(共10张PPT)

现采用决策树方法进行决策 第二步:画决策树图形,根据第一步所列的表格,再绘制决策树,如下图;
【例题8】
【解】第一步:将题意表格化
自然状态
概率
天气好
0.3
天气坏
0.7
行动方案
开工
不开工
40000
-1000
-10000
-1000
【例题8】
❖ 第二步:画决策树图形,根据第一步所列的表格, 再绘制决策树,如下图;
【例题8】
• 假设有一项工程,施工管理人员需要决定 下月是否开工。如果开工后天气好,则可 投标不中时,则对A损失50万元,对B损失100万元。
现采用决策树方法进行决策 3,天气坏的概率是0.
为国家创收4万元,若开工后天气坏,将给 若考虑的是损失时,则取最小期望值。
B、从出发点向右引出若干条直线,这些直线叫做方案枝; 3,天气坏的概率是0.
国家造成损失1万元,不开工则损失1000元。 某承包商拥有的资源有限,只能在A和B两个工程中选A或B进行投标,或者对这两项工程都不参加投标。
该承包商过去也承包过与A、B类似的工程,根据统计资料,每种方案的利润和出现的概率如下表所示。 一般按反向的时间程序逐步计算,将各方案的几种可能结果的数值和它们各自的概率相乘,并汇总所得之和,其和就是该方案的期望值。
概率
0.3 0.5 0.2 0.2 0.6 0.2 0.3 0.5 0.2 0.3 0.6 0.1
【例题9】
【解】第一步:将题意表格化
概率分叉点
3,天气坏的概率是0.
(自 然 状 态 点 )
投标不中时,则对A损失50万元,对B损失100万元。
损益值
但根据过去该承包商投标经验资料,他对A或B投标又有两种策略:一种是投高标,中标的机会是0.
【例题8】
【解】第一步:将题意表格化
自然状态
概率
天气好
0.3
天气坏
0.7
行动方案
开工
不开工
40000
-1000
-10000
-1000
【例题8】
❖ 第二步:画决策树图形,根据第一步所列的表格, 再绘制决策树,如下图;
【例题8】
• 假设有一项工程,施工管理人员需要决定 下月是否开工。如果开工后天气好,则可 投标不中时,则对A损失50万元,对B损失100万元。
现采用决策树方法进行决策 3,天气坏的概率是0.
为国家创收4万元,若开工后天气坏,将给 若考虑的是损失时,则取最小期望值。
B、从出发点向右引出若干条直线,这些直线叫做方案枝; 3,天气坏的概率是0.
国家造成损失1万元,不开工则损失1000元。 某承包商拥有的资源有限,只能在A和B两个工程中选A或B进行投标,或者对这两项工程都不参加投标。
该承包商过去也承包过与A、B类似的工程,根据统计资料,每种方案的利润和出现的概率如下表所示。 一般按反向的时间程序逐步计算,将各方案的几种可能结果的数值和它们各自的概率相乘,并汇总所得之和,其和就是该方案的期望值。
概率
0.3 0.5 0.2 0.2 0.6 0.2 0.3 0.5 0.2 0.3 0.6 0.1
【例题9】
【解】第一步:将题意表格化
概率分叉点
3,天气坏的概率是0.
(自 然 状 态 点 )
投标不中时,则对A损失50万元,对B损失100万元。
损益值
但根据过去该承包商投标经验资料,他对A或B投标又有两种策略:一种是投高标,中标的机会是0.
决策树ppt课件

建设小工厂投资280万元,如销路好,3年后扩建,扩 建需要投资400万元,可使用7年,每年赢利190万元。 不扩建则每年赢利80万元。如销路不好则每年赢利60 万元。
试用决策树法选出合理的决策方案。 经过市场调查, 市场销路好的概率为0.7,销路不好的概率为0.3。
15
680万元 2
建大厂
该承包商过去也承包过与A、B类似的工程,根 据统计资料,每种方案的利润和出现的概率如 下表所示。投标不中时,则对A损失50万元, 对B损失100万元。根据上述情况,试画出决 策树
11
方案 A高 A低 B高 B低
效果
优 一般 赔 优 一般 赔 优 一般 赔 优 一般 赔
可能的利润(万元)
5000 1000 -3000 4000 500 -4000 7000 2000 -3000 6000 1000 -1000
10
例2
某承包商拥有的资源有限,只能在A和B两个工 程中选A或B进行投标,或者对这两项工程都不 参加投标。
但根据过去该承包商投标经验资料,他对A或B 投标又有两种策略:一种是投高标,中标的机会 是0.3;另一种是投低标,中标的机会是0.5。 这样共有A高、A低、不投、B高和B低五种方 案。
叫做方案枝; C、在每个方案枝的末端画一个圆圈,这个圆
圈称为概率分叉点,或自然状态点; D、从自然状态点引出代表各自然状态的分枝,
称为概率分枝; E、如果问题只需要一级决策,则概率分枝末
端画三角形,表示终点 。
3
1
决策 结点
概率分叉点
(自然状态点) 概率枝
方案分枝 2
概率枝
方案分枝
概率枝
益期望值分别为125、0、620和1100。 至此,承包商可做出决策,如投A工程,
试用决策树法选出合理的决策方案。 经过市场调查, 市场销路好的概率为0.7,销路不好的概率为0.3。
15
680万元 2
建大厂
该承包商过去也承包过与A、B类似的工程,根 据统计资料,每种方案的利润和出现的概率如 下表所示。投标不中时,则对A损失50万元, 对B损失100万元。根据上述情况,试画出决 策树
11
方案 A高 A低 B高 B低
效果
优 一般 赔 优 一般 赔 优 一般 赔 优 一般 赔
可能的利润(万元)
5000 1000 -3000 4000 500 -4000 7000 2000 -3000 6000 1000 -1000
10
例2
某承包商拥有的资源有限,只能在A和B两个工 程中选A或B进行投标,或者对这两项工程都不 参加投标。
但根据过去该承包商投标经验资料,他对A或B 投标又有两种策略:一种是投高标,中标的机会 是0.3;另一种是投低标,中标的机会是0.5。 这样共有A高、A低、不投、B高和B低五种方 案。
叫做方案枝; C、在每个方案枝的末端画一个圆圈,这个圆
圈称为概率分叉点,或自然状态点; D、从自然状态点引出代表各自然状态的分枝,
称为概率分枝; E、如果问题只需要一级决策,则概率分枝末
端画三角形,表示终点 。
3
1
决策 结点
概率分叉点
(自然状态点) 概率枝
方案分枝 2
概率枝
方案分枝
概率枝
益期望值分别为125、0、620和1100。 至此,承包商可做出决策,如投A工程,
一个决策树算法案例分析ppt课件

8
§4.4 灵敏度分析
灵敏度分析是将自然状态出现的概率加以改变,来考察这一改变对决策 方案选取将带来什么样的影响。比如:高的接受程度S1的概率降到0.2, 低的接受S2的概率升为0.8,即P(S1)=0.2,P(S2)=0.8, EV(d1)=0.2×800+0.8×700=720 EV(d2)=0.2×1400+0.8×500=680 EV(d1)=0.2×2000+0.8×(-900)=-320 可见,小楼方案d1为最佳,大楼方案为最差的。
一个决策树算法案例分析ppt课件
常规(用)决策技术和效用理论
4.1 决策分析案例背景
匹兹堡开发公司(PDC)已购得一块地用于建造一个高档的沿河 综合商业楼,其位置对繁华的匹兹堡和金三角有很好的景观,所 谓金三角是指两条小河汇流成俄亥俄(Ohio)河的地段。每一个建
30万~120万,取决于单元所处楼层,面积 以及备选的设施。
效用函数U(x)是一种相对度量尺度,0≤U(x)≤1,或者0≤U(x)≤10,其中 x对本问题而言是收益期望值。
效用函数U(x)值的确定方法较多,其中常用的一种方法是标准博奕法 , 即针对具体决策问题及其收益数据,由决策分析者向决策人一一提问(或 决策人自问自答),由决策人一一回答其偏好,或者表明某两个事件之间 是否无差异。为此,首先要从数据中选出一最大收益Vmax ,设定其效用 函数U(Vmax)=10,选出最小收益值Vmin,令U(Vmin)=0。
自然状 态
高的市场接受程度S1 低的市场接受程度S2
800万
700万
1400万
500万
2000万
-900万
3
4
该方法相似于保守方法,取悲观态度。首先从益损矩阵中求后悔值,即机 会损失值Rij
§4.4 灵敏度分析
灵敏度分析是将自然状态出现的概率加以改变,来考察这一改变对决策 方案选取将带来什么样的影响。比如:高的接受程度S1的概率降到0.2, 低的接受S2的概率升为0.8,即P(S1)=0.2,P(S2)=0.8, EV(d1)=0.2×800+0.8×700=720 EV(d2)=0.2×1400+0.8×500=680 EV(d1)=0.2×2000+0.8×(-900)=-320 可见,小楼方案d1为最佳,大楼方案为最差的。
一个决策树算法案例分析ppt课件
常规(用)决策技术和效用理论
4.1 决策分析案例背景
匹兹堡开发公司(PDC)已购得一块地用于建造一个高档的沿河 综合商业楼,其位置对繁华的匹兹堡和金三角有很好的景观,所 谓金三角是指两条小河汇流成俄亥俄(Ohio)河的地段。每一个建
30万~120万,取决于单元所处楼层,面积 以及备选的设施。
效用函数U(x)是一种相对度量尺度,0≤U(x)≤1,或者0≤U(x)≤10,其中 x对本问题而言是收益期望值。
效用函数U(x)值的确定方法较多,其中常用的一种方法是标准博奕法 , 即针对具体决策问题及其收益数据,由决策分析者向决策人一一提问(或 决策人自问自答),由决策人一一回答其偏好,或者表明某两个事件之间 是否无差异。为此,首先要从数据中选出一最大收益Vmax ,设定其效用 函数U(Vmax)=10,选出最小收益值Vmin,令U(Vmin)=0。
自然状 态
高的市场接受程度S1 低的市场接受程度S2
800万
700万
1400万
500万
2000万
-900万
3
4
该方法相似于保守方法,取悲观态度。首先从益损矩阵中求后悔值,即机 会损失值Rij
《决策树例题》课件(2024)

基于信息增益的决策树
通过计算每个特征的信息增益来选择 最佳划分特征,构建决策树。例如, 在二分类问题中,可以使用ID3算法 来构建决策树。
基于基尼指数的决策树
通过计算每个特征的基尼指数来选择 最佳划分特征,构建决策树。例如, 在二分类问题中,可以使用CART算 法来构建决策树。
剪枝策略
针对决策树过拟合问题,可以采用预 剪枝或后剪枝策略来优化决策树性能 。
输入 欠标采题样
从多数类样本中随机选择一部分样本,减少其样本数 量,使得正负样本数量平衡。例如Random UnderSampler算法。
过采样
代价敏感学 习
通过集成多个基分类器的结果来提高整体性能。例如 Bagging和Boosting方法。
集成学习方 法
为不同类别的样本设置不同的误分类代价,使得模型 在训练过程中更加关注少数类样本。例如AdaCost算 法。
剪枝策略
通过预剪枝或后剪枝策略,可以优化决策 树的性能,减少过拟合。
19
过拟合问题解决方案讨论
增加训练数据
更多的训练数据可以让模型学习 到更多的模式,减少过拟合。
使用集成学习方法
去除不相关或冗余的特征,可以 减少模型的复杂度,降低过拟合
风险。
2024/1/30
特征选择
通过添加正则化项,可以惩罚模 型的复杂度,防止过拟合。
模型构建:选择合适的 模型优化:针对不平衡
决策树算法(如ID3、 数据集问题,可以采用
C4.5、CART等)构建分 过采样、欠采样或代价
类模型,并采用交叉验 敏感学习等方法优化模
证等方法评估模型性能 型性能。同时,也可以
。
通过调整决策树参数(
如最大深度、最小样本
决策树例题分析图文

➢ 计算各点的期望值: • 点②:0.7×200×10+0.3×(-40)×10-600(投资
)=680(万元) • 点⑤:1.0×190×7-400=930(万元) • 点⑥:1.0×80×7=560(万元) ➢ 比较决策点4的情况可以看到,由于点⑤(930万元)
与点⑥(560万元)相比,点⑤的期望利润值较大, 因此应采用扩建的方案,而舍弃不扩建的方案。 ➢ 把点⑤的930万元移到点4来,可计算出点③的期望利 润值: • 点③:0.7×80×3+0.7×930+0.3×60×(3+7)-280 = 719(万元)
9
.3)
200万元 -40万元
1 719万元
建小厂
扩建 5 销路好(1.0) 930万元
销路好(0.7) 4 不扩建
930万元
6 销路好(1.0)
3
560万元
719万元
销路差(0.3)
前3年,第一次决策
后7年,第二次决策
190万元
80万元 60万元
10
3
状态节点
2 方案分枝
1 决策结点
方案分枝
3
状态节点
概率分枝 4 结果节点
概率分枝 5 结果节点
概率分枝 6
结果节点
概率分枝 7
结果节点
4
• 应用决策树来作决策的过程,是从右向 左逐步后退进行分析。根据右端的损益 值和概率枝的概率,计算出期望值的大 小,确定方案的期望结果,然后根据不 同方案的期望结果作出选择。
7
决策过程如下:画图,即绘制决策树
• A1的净收益值=[300×0.7+(-60)×0.3] ×5-450=510 万
• A2的净收益值=(120×0.7+30×0.3)×5-240=225万 • 选择:因为A1大于A2,所以选择A1方案。 • 剪枝:在A2方案枝上打杠,表明舍弃。
决策树例题分析及解答分解课件

决策树例题分析及解 答分解课件
目录
CONTENTS
• 决策树与其他机器学习算法的比 • 决策树未来发展方向
01
决策树简 介
决策树的定义
决策树是一种监督学习算法,用于解决分类和回归问题。
它通过递归地将数据集划分成更纯的子集来构建决策树,每个内部节点表示一个 特征属性上的判断条件,每个分支代表一个可能的属性值,每个叶子节点表示一 个类别。
03
决策树例题分析
题目描述
题目
预测一个学生是否能够被大学录 取
数据集
包含学生的个人信息、成绩、活动 参与情况等
目标变量
是否被大学录取(0表示未录取,1 表示录取)
数据预处理
01
02
03
数据清洗
处理缺失值、异常值和重 复值
数据转换
将分类变量转换为虚拟变 量,将连续变量进行分箱 处理
数据归一化
将特征值缩放到0-1之间, 以便更好地进行模型训练
结果解读与优化建议
结果解读
根据模型输出的结果,分析决策树 的构建情况,理解各节点的划分依据。
优化建议
根据模型评估结果和业务需求,提出 针对性的优化建议,如调整特征选择、 调整模型参数等。
05
决策树与其他机器
学习算法的比 较
与逻辑回归的比较
总结词
逻辑回归适用于连续和二元分类问题,而决策树适用于多元分类问题。
建立决策树模型
选择合适的决策树算 法:ID3、C4.5、 CART等
构建决策树模型并进 行训练
确定决策树的深度和 分裂准则
模型评估与优化
使用准确率、召回率、F1分数等指标 评估模型性能
对模型进行优化:剪枝、调整参数等
进行交叉验证,评估模型的泛化能力
目录
CONTENTS
• 决策树与其他机器学习算法的比 • 决策树未来发展方向
01
决策树简 介
决策树的定义
决策树是一种监督学习算法,用于解决分类和回归问题。
它通过递归地将数据集划分成更纯的子集来构建决策树,每个内部节点表示一个 特征属性上的判断条件,每个分支代表一个可能的属性值,每个叶子节点表示一 个类别。
03
决策树例题分析
题目描述
题目
预测一个学生是否能够被大学录 取
数据集
包含学生的个人信息、成绩、活动 参与情况等
目标变量
是否被大学录取(0表示未录取,1 表示录取)
数据预处理
01
02
03
数据清洗
处理缺失值、异常值和重 复值
数据转换
将分类变量转换为虚拟变 量,将连续变量进行分箱 处理
数据归一化
将特征值缩放到0-1之间, 以便更好地进行模型训练
结果解读与优化建议
结果解读
根据模型输出的结果,分析决策树 的构建情况,理解各节点的划分依据。
优化建议
根据模型评估结果和业务需求,提出 针对性的优化建议,如调整特征选择、 调整模型参数等。
05
决策树与其他机器
学习算法的比 较
与逻辑回归的比较
总结词
逻辑回归适用于连续和二元分类问题,而决策树适用于多元分类问题。
建立决策树模型
选择合适的决策树算 法:ID3、C4.5、 CART等
构建决策树模型并进 行训练
确定决策树的深度和 分裂准则
模型评估与优化
使用准确率、召回率、F1分数等指标 评估模型性能
对模型进行优化:剪枝、调整参数等
进行交叉验证,评估模型的泛化能力
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 例: 某农业企业有耕地面积33.333公顷,可供灌水量 6300立方米,在生产忙季可供工作日2800个,用于 种植玉米、棉花和花生三种作物。预计三种作物每公 顷在用水忙季用工日数、灌水量和利润见表,在完成 16.5万公斤玉米生产任务的前提下,如何安排三种作 物的种植面积,以获得最大的利润。
作物 类别
2
决策方案评价
作物类别
玉米 棉花 花生 合计 资源供给量 资源余缺量
占用耕 忙季耗用 灌水用量 地面积 工日数 (立方米) (公顷)
20
1200
45000
5.333
560
12000
8
360
6000
33.333
2120
63000
33.333
2800
63000
0
680
0
总产量 (千瓦)
165000 40000
120000
利润量 (元)
30000 9600
13200 52800
在生产出16.5万公顷玉米的前提下,将获 得5.28万元的利润,在忙劳动力资源尚剩余 680个工日可用于其他产品生产。
3
例:设某茶厂计划创建精制茶厂,开始有两个方案,方案 一是建年加工能力为800担的小厂,方案二是建年加工能 力为2000担的大厂。两个厂的使用期均为10年,大厂投资 25万元,小厂投资10万元。产品销路没有问题,原料来源 有两种可能(两种自然状态):一种为800担,另一种为 2000担。两个方案每年损益及两种自然状态的概率估计值 见下表
• 建设大工厂需要投资600万元,可使用10年。销路好每 年赢利200万元,销路不好则亏损40万元。
• 建设小工厂投资280万元,如销路好,3年后扩建,扩 建需要投资400万元,可使用7年,每年赢利190万元。 不扩建则每年赢利80万元。如销路不好则每年赢利60 万元。
• 试用决策树法选出合理的决策方案。 经过市场调查, 市场销路好的概率为0.7,销路不好的概率为0.3。
11
680万元 2
建大厂
销路好(0.7) 销路差(0.3)
200万元 -40万元
1 719万元
建小厂
销路好(0.7) 扩建 5
930万元
销路好(0.7) 4 不扩建
930万元
6 销路好(0.7)
3
560万元
719万元
销路差(0.3)
前3年,第一次决策
后7年,第二次决策
190万元
80万元 60万元
12
自然状态 概率 建大厂(投资25 建小厂(投资10
万元)
万元)
原料800担 0.8 原料2000担 0.2
13.5 25.5
15.0 15.0
4
补充: 风险型决策方法——决策树方法
• 风险决策问题的直观表示方法的图示法。因为图的形状 像树,所以被称为决策树。
• 决策树的结构如下图所示。图中的方块代表决策节点, 从它引出的分枝叫方案分枝。每条分枝代表一个方案, 分枝数就是可能的相当方案数。圆圈代表方案的节点, 从它引出的概率分枝,每条概率分枝上标明了自然状态 及其发生的概率。概率分枝数反映了该方案面对的可能 的状态数。末端的三角形叫结果点,注有各方案在相应 状态下的结果值。
13
最后比较决策点1的情况: • 由于点③(719万元)与点②(680万元)
相比,点③的期望利润值较大,因此取 点③而舍点②。这样,相比之下,建设 大工厂的方案不是最优方案,合理的策 略应采用前3年建小工厂,如销路好,后 7年进行扩建的方案。
14
决策树法的一般程序是: (1)画出决策树图形 决策树指的是某个决策问题未来发展 情况的可能性和可能结果所做的估计,在图纸上的描绘决策树
7
• 计算完毕后,开始对决策树进行剪枝, 在每个决策结点删去除了最高期望值以 外的其他所有分枝,最后步步推进到第 一个决策结点,这时就找到了问题的最 佳方案
• 方案的舍弃叫做修枝,被舍弃的方案用 “≠”的记号来表示,最后的决策点留 下一条树枝,即为最优方案。
8
• A1、A2两方案投资分别为450万和240万, 经营年限为5年,销路好的概率为0.7, 销路差的概率为0.3,A1方案销路好、差 年损益值分别为300万和负60万;A2方案 分别为120万和30万。
9
决策过程如下:画图,即绘制决策树
• A1的净收益值=[300×0.7+(-60)×0.3] ×5-450=510万 • A2的净收益值=(120×0.7+30×0.3)×5-240=225万 • 选择:因为A1大于A2,所以选择A1方案。 • 剪枝:在A2方案枝上打杠,表明舍弃。
10
例题
• 为了适应市场的需要,某地提出了扩大电视机生产的 两个方案。一个方案是建设大工厂,第二个方案是建 设小工厂。
计算各点的期望值: • 点②:0.7×200×10+0.3×(-40)×10-600(投资)
=680(万元) • 点⑤:1.0×190×7-400=930(万元) • 点⑥:1.0×80×7=560(万元) 比较决策点4的情况可以看到,由于点⑤(930万元)
与点⑥(560万元)相比,点⑤的期望利润值较大,因 此应采用扩建的方案,而舍弃不扩建的方案。 把点⑤的930万元移到点4来,可计算出点③的期望利 润值: • 点③:0.7×80×3+0.7×930+0.3×60×(3+7)-280 = 719(万元)
5
状态节点
2 方案分枝
1 决策结点
方案分枝
3
状态节点
概率分枝 4 结果节点
概率分枝 5 结果节点
概率分枝 6
结果节点
概率分枝 7
结果节点
6
• 应用决策树来作决策的过程,是从右向 左逐步后退进行分析。根据右端的损益 值和概率枝的概率,计算出期望值的大 小,确定方案的期望结果,然后根据不 同方案的期望结果作出选择。
玉米 棉花 花生
忙季需 工作日数
60 105 45
灌水需要量 (立方米)
2250 2250 750
产量 (公斤)
8250 750 1500
利润 (元)Leabharlann 1500 1800 1650
1
解:玉米、棉花、花生和种植面积分别为X1,X2,X3公顷,依题 意列出线性规划模型。
目标函数:S=1500X1+1800X2+1650X3——极大值 约束条件:X1+X2+X3≤33.333 60X1+105X2+45X3≤2800 2250X1+2250X2+750X3≤63000 8250X1≤165000 X1,X2,X3≥0 采用单纯形法求出决策变量值: X1=20公顷 X2=5.333公顷 X3=8公顷
作物 类别
2
决策方案评价
作物类别
玉米 棉花 花生 合计 资源供给量 资源余缺量
占用耕 忙季耗用 灌水用量 地面积 工日数 (立方米) (公顷)
20
1200
45000
5.333
560
12000
8
360
6000
33.333
2120
63000
33.333
2800
63000
0
680
0
总产量 (千瓦)
165000 40000
120000
利润量 (元)
30000 9600
13200 52800
在生产出16.5万公顷玉米的前提下,将获 得5.28万元的利润,在忙劳动力资源尚剩余 680个工日可用于其他产品生产。
3
例:设某茶厂计划创建精制茶厂,开始有两个方案,方案 一是建年加工能力为800担的小厂,方案二是建年加工能 力为2000担的大厂。两个厂的使用期均为10年,大厂投资 25万元,小厂投资10万元。产品销路没有问题,原料来源 有两种可能(两种自然状态):一种为800担,另一种为 2000担。两个方案每年损益及两种自然状态的概率估计值 见下表
• 建设大工厂需要投资600万元,可使用10年。销路好每 年赢利200万元,销路不好则亏损40万元。
• 建设小工厂投资280万元,如销路好,3年后扩建,扩 建需要投资400万元,可使用7年,每年赢利190万元。 不扩建则每年赢利80万元。如销路不好则每年赢利60 万元。
• 试用决策树法选出合理的决策方案。 经过市场调查, 市场销路好的概率为0.7,销路不好的概率为0.3。
11
680万元 2
建大厂
销路好(0.7) 销路差(0.3)
200万元 -40万元
1 719万元
建小厂
销路好(0.7) 扩建 5
930万元
销路好(0.7) 4 不扩建
930万元
6 销路好(0.7)
3
560万元
719万元
销路差(0.3)
前3年,第一次决策
后7年,第二次决策
190万元
80万元 60万元
12
自然状态 概率 建大厂(投资25 建小厂(投资10
万元)
万元)
原料800担 0.8 原料2000担 0.2
13.5 25.5
15.0 15.0
4
补充: 风险型决策方法——决策树方法
• 风险决策问题的直观表示方法的图示法。因为图的形状 像树,所以被称为决策树。
• 决策树的结构如下图所示。图中的方块代表决策节点, 从它引出的分枝叫方案分枝。每条分枝代表一个方案, 分枝数就是可能的相当方案数。圆圈代表方案的节点, 从它引出的概率分枝,每条概率分枝上标明了自然状态 及其发生的概率。概率分枝数反映了该方案面对的可能 的状态数。末端的三角形叫结果点,注有各方案在相应 状态下的结果值。
13
最后比较决策点1的情况: • 由于点③(719万元)与点②(680万元)
相比,点③的期望利润值较大,因此取 点③而舍点②。这样,相比之下,建设 大工厂的方案不是最优方案,合理的策 略应采用前3年建小工厂,如销路好,后 7年进行扩建的方案。
14
决策树法的一般程序是: (1)画出决策树图形 决策树指的是某个决策问题未来发展 情况的可能性和可能结果所做的估计,在图纸上的描绘决策树
7
• 计算完毕后,开始对决策树进行剪枝, 在每个决策结点删去除了最高期望值以 外的其他所有分枝,最后步步推进到第 一个决策结点,这时就找到了问题的最 佳方案
• 方案的舍弃叫做修枝,被舍弃的方案用 “≠”的记号来表示,最后的决策点留 下一条树枝,即为最优方案。
8
• A1、A2两方案投资分别为450万和240万, 经营年限为5年,销路好的概率为0.7, 销路差的概率为0.3,A1方案销路好、差 年损益值分别为300万和负60万;A2方案 分别为120万和30万。
9
决策过程如下:画图,即绘制决策树
• A1的净收益值=[300×0.7+(-60)×0.3] ×5-450=510万 • A2的净收益值=(120×0.7+30×0.3)×5-240=225万 • 选择:因为A1大于A2,所以选择A1方案。 • 剪枝:在A2方案枝上打杠,表明舍弃。
10
例题
• 为了适应市场的需要,某地提出了扩大电视机生产的 两个方案。一个方案是建设大工厂,第二个方案是建 设小工厂。
计算各点的期望值: • 点②:0.7×200×10+0.3×(-40)×10-600(投资)
=680(万元) • 点⑤:1.0×190×7-400=930(万元) • 点⑥:1.0×80×7=560(万元) 比较决策点4的情况可以看到,由于点⑤(930万元)
与点⑥(560万元)相比,点⑤的期望利润值较大,因 此应采用扩建的方案,而舍弃不扩建的方案。 把点⑤的930万元移到点4来,可计算出点③的期望利 润值: • 点③:0.7×80×3+0.7×930+0.3×60×(3+7)-280 = 719(万元)
5
状态节点
2 方案分枝
1 决策结点
方案分枝
3
状态节点
概率分枝 4 结果节点
概率分枝 5 结果节点
概率分枝 6
结果节点
概率分枝 7
结果节点
6
• 应用决策树来作决策的过程,是从右向 左逐步后退进行分析。根据右端的损益 值和概率枝的概率,计算出期望值的大 小,确定方案的期望结果,然后根据不 同方案的期望结果作出选择。
玉米 棉花 花生
忙季需 工作日数
60 105 45
灌水需要量 (立方米)
2250 2250 750
产量 (公斤)
8250 750 1500
利润 (元)Leabharlann 1500 1800 1650
1
解:玉米、棉花、花生和种植面积分别为X1,X2,X3公顷,依题 意列出线性规划模型。
目标函数:S=1500X1+1800X2+1650X3——极大值 约束条件:X1+X2+X3≤33.333 60X1+105X2+45X3≤2800 2250X1+2250X2+750X3≤63000 8250X1≤165000 X1,X2,X3≥0 采用单纯形法求出决策变量值: X1=20公顷 X2=5.333公顷 X3=8公顷