决策树练习题 (2)

合集下载

决策树练习题

决策树练习题

决策树作业题公司拟建一预制构件厂,一个方案就是建大厂,需投资300万元,建成后如销路好每年可获利100万元,如销路差,每年要亏损20万元,该方案的使用期均为10年;另一个方案就是建小厂,需投资170万元,建成后如销路好,每年可获利40万元,如销路差每年可获利30万元;若建小厂,则考虑在销路好的情况下三年以后再扩建,扩建投资130万元,可使用七年,每年盈利85万元。

假设前3年销路好的概率就是0、7,销路差的概率就是0、3,后7年的销路情况完全取决于前3年;为了适应市场的变化,投资者又提出了第三个方案,即先小规模投资160万元,生产3年后,如果销路差,则不再投资,继续生产7年;如果销路好,则再作决策就是否再投资140万元扩建至大规模(总投资300万元),生产7年。

前3年与后7年销售状态的概率见表16,大小规模投资的年损益值同习题58。

试用决策树法选择最优方案。

表16 销售概率表项目前3年销售状态概率后7年销售状态概率好差好差销路差0、7 0、3 0、9 0、1决策树例题1.某投资者预投资兴建一工厂,建设方案有两种:①大规模投资300万元;②小规模投资160万元。

两个方案的生产期均为10年,其每年的损益值及销售状态的规律见下表。

试用决策树法选择最优方案。

(2)计算各状态点的期望收益值节点②:[100*0、7+(-20)*0、3]*10-300=340;节点③:[60*0、7+20*0、3]*10-160=320;将各状态点的期望收益值标在圆圈上方。

(3)决策比较节点②与节点③的期望收益值可知,大规模投资方案优于小规模投资方案,故应选择大规模投资方案,用符号“//”在决策树上“剪去”被淘汰的方案。

2.某项目有两个备选方案A与B,两个方案的寿命期均为10年,生产的产品也完全相同,但投资额及年净收益均不相同。

A方案的投资额度为500万元,其年净收益在产品销售好时为150万元,销售差时为50万元;B方案的投资额度为300万元,其年净收益在产品销售好时为100万元,销售差时为10万元,根据市场预测,在项目寿命期内,产品销路好时的可能性为70%,销路差的可能性为30%,试根据以上资料对方案进行比较。

决策树习题

决策树习题

习题[1]商务智能产生的原因是什么?[2]怎么认识商务智能?[3]商务智能对企业有什么价值?[4]举例说明商务智能在保险、证券、银行、电信、制造、零售和物流等行业的应用。

[5]讨论商务智能与ERP、CRM和SCM等业务管理系统的关系。

[6]商务智能系统包括哪些部分?分别有什么功能?[7]结合具体的商务智能项目,说明商务智能系统的组成。

[8]讨论数据集成对商务智能项目的重要性。

[9]阅读下面的案例,分析产生问题的原因并给出对策。

一位新上任的大型国企老总曾经表达过这样的困惑。

当他向下属提出,希望查看近十年企业的生产和运营数据时,他手边得到了各种各样不同的数据报表。

这些数据报表大致可以分成两种类型:一种是两年前,即ERP上线之前的,这是一些简单、杂乱而又枯燥的数据。

另一种是有了ERP以后的,数据变得清楚而有条理,但仍然有来自ERP、CRM、SCM以及计费业务等不同应用的数据和各种分析报告。

在仔细查看这些报表之后,这位国企老总惊讶地发现,不同的系统可以得出截然相反的两种结论。

例如某一产品,它的动态成本反映在ERP系统和CRM、SCM系统中相差很大,如果引用ERP和CRM里面的数据,它就是一款很成功、销量很好的产品,但在SCM中,它的采购和物流成本过高,导致了这款看起来很成功的产品实际上是一笔赔钱的买卖。

更让他难以理解的是,正是由于这些来自不同系统的数据不够准确或不一致,给企业的前任领导提交了相当多顾此失彼的分析报告,导致了许多市场决策上的混乱和失误。

在花费了大量时间和精力之后,这位国企老总困惑了:究竟哪些数据才是真实的?为什么对同一件事不同的系统会得到截然不同的结果?[10]讨论数据仓库与操作型数据库、数据集市的区别。

[11]如何认识数据仓库的几个特点?这些特点与企业管理决策有什么关系?[12]什么是元数据?元数据有什么用处?[13]讨论ETL的过程,其中数据质量对这个过程有什么影响?[14]什么是操作数据存储(ODS)?为什么使用ODS?[15]数据仓库有哪些模型?举例说明。

练习决策树

练习决策树

练习决策树1、长城公司该选择哪一种方案?长城照相器材厂是一家有着20年生产照相机历史的企业。

最近企业实行改制,由国有独资企业改制为股份制企业,并通过猎头公司招聘李远担任公司的总经理。

李远上任后要求公司的发展规划部为公司的未来发展提出方案。

发展规划部提出了两个方案供公司领导班子选择:一个方案是继续生产传统产品,另一个方案是生产数码相机。

根据发展规划部的分析测算,如果照相机市场需求量大的话,生产传统相机一年可获利30万元,而生产数码相机则可获利50万元。

如果市场需求量小,生产传统相机仍可获利10万元,生产数码相机将亏损5万元。

根据对照相机市场所作的调研和市场分析,市场需求量大的概率为0.8,需求量小的概率为0.2。

以李远为总经理的公司领导班子根据发展规划部提交的方案将作出怎样的决策?2、某公司生产一种电视机,有两种方案可选:一是建大厂,需要投资2800万元;二是建小厂,需要投资1200万元。

两种方案建成后使用期都是十年。

公司对十年中该电视的市场销售预测如下:高需求、中需求、低需求的概率分别为0·5、0·3、0·2。

在高需求下每年获利大厂为1000万,小厂为400万;在中需求下每年获利大厂为500万,小厂为300万;在低需求下每年大厂亏损200万,小厂获利为250万。

问该采取哪种方案?3、现要开辟一条新航线,有三种收费方案件,征收过闸费、驳船费、执照费;有三种自然状态存在:通航船只多,中,少,其自然状态的概率是船只多0.3,船只中0.5,船只少0.2,三种方案的收益为:(万元)船只多船只中船只少0.30.50.2征收过闸费3.42.82.0征收驳船费3.92.91.9征收执照费3.02.72.54、为生产某种新产品而设计了三个基本建设方案。

一是建大厂:投资300万元。

二是建小厂:投资140万元。

两者使用期限都是10年。

估计在此期间,产品销路好的概率是0.7,销路差的概率是0.3。

决策树练习题

决策树练习题

决策树练习题决策树练习题决策树是一种常用的机器学习算法,它通过对数据集进行分割和判断,最终得出决策结果。

在实际应用中,决策树可以帮助我们解决各种问题,如分类、回归和聚类等。

为了更好地理解和掌握决策树算法,下面将给出一些练习题,供读者进行实践和思考。

1. 假设有一个数据集,包含了学生的年龄、性别和成绩等信息。

我们想要根据这些信息判断学生是否会通过考试。

请问,在构建决策树时,应该如何选择最佳的划分属性?答案:在构建决策树时,我们需要选择最佳的划分属性,以使得每个子节点的纯度最高。

常用的划分属性选择方法有信息增益、信息增益比和基尼系数等。

其中,信息增益是一种常用的选择方法,它通过计算划分前后的信息熵差异来衡量划分的好坏。

选择信息增益最大的属性作为划分属性即可。

2. 假设有一个数据集,包含了某个地区的天气信息和人们是否出门的记录。

我们想要构建一个决策树模型,来预测某一天是否适合出门。

请问,在构建决策树时,应该如何处理连续型特征?答案:在处理连续型特征时,我们可以将其转化为离散型特征。

一种常用的方法是通过设定阈值,将连续型特征划分为多个离散的取值。

例如,对于温度这一连续型特征,我们可以设定一个阈值,如25摄氏度,将其划分为“高温”和“低温”两个离散的取值。

然后,我们可以将离散化后的特征作为划分属性,继续构建决策树。

3. 假设有一个数据集,包含了某个电商网站的用户信息和购买记录。

我们想要根据用户的特征来预测其购买意向。

请问,在构建决策树时,应该如何处理缺失值?答案:在处理缺失值时,我们可以选择忽略带有缺失值的样本,或者使用合适的方法进行填充。

常用的填充方法有均值填充、中位数填充和众数填充等。

如果缺失值较少,可以考虑使用均值或中位数填充;如果缺失值较多,可以考虑使用众数填充。

另外,我们还可以将缺失值作为一个特殊的取值,单独作为一类进行处理。

4. 假设有一个数据集,包含了某个电商网站的用户信息和购买记录。

我们想要构建一个决策树模型,来预测用户的购买类别。

决策树分类和朴素贝叶斯分类练习题及答案

决策树分类和朴素贝叶斯分类练习题及答案

数据挖掘的第二次作业1•下表由雇员数据库的训练数据组成,数据己泛化。

例如,年龄“31・・・35〃表示31到35的Z 间。

对于给定的行,count表示department, status, age和salary在该行上具有给定值的元组数。

status是类标号属性。

1)countStatus分为2个部分:Department分为4个部分:Senior 共计52Sales 共计110Junior 共计113Systems 共计31Marketing 共计14Secretary 共计10Age分为6个部分:Salary分为6各部分:21...25 共计20 26K..30K 共计4626..30 共计49 31K..35K 共计4031 …35 共计79 36K...40K 共计436 …40 共计10 41K...45K 共计441...45 共计3 46K...50K 共计6346...50 共计4 66K...70K 共计8Info(D)= -磊 log2善-詈Sg2 罟=0.889位Info(departmet)—沁占)+忌V-厭0幻初-存。

灯韵=0.8504位Gain^department) = Info(D) — Info^department) = 0.0386位Gain(age) = Info(D) — Info(age) = 0.3892 位(4.4 0. 0\ 63 / 30 . 30 33 . 33\ , 8 ( 8 - 8 0. 0\(-ilog 2---log 2-) + —*(--log 2---lo g2-) + —♦(--log 2---lo g2-) = 0.3812 位Gain^salary) = Info^D) — Info^salary) = 0.5078位由以上的计算知按信息增益从人到小对屈性排列依次为:salary 、age. department,所以定department status age salary count sales senior 31...35 46K...50K 30 systems junior 21...25 46K...50K 20 systems junior 26...30 46K...50K 3 marketing senior36 (40)46K...50K10由这个表可知department 和age 的信息增益将都为0。

决策树练习题

决策树练习题

.决策树作业题公司拟建一预制构件厂,一个方案是建大厂,需投资300万元,建成后如销路好每年可获利100万元,如销路差,每年要亏损20万元,该方案的使用期均为10年;另一个方案是建小厂,需投资170万元,建成后如销路好,每年可获利40万元,如销路差每年可获利30万元;若建小厂,则考虑在销路好的情况下三年以后再扩建,扩建投资130万元,可使用七年,每年盈利85万元。

假设前3年销路好的概率是0.7,销路差的概率是0.3,后7年的销路情况完全取决于前3年;为了适应市场的变化,投资者又提出了第三个方案,即先小规模投资160万元,生产3年后,如果销路差,则不再投资,继续生产7年;如果销路好,则再作决策是否再投资140万元扩建至大规模(总投资300万元),生产7年。

前3年和后7年销售状态的概率见表16,大小规模投资的年损益值同习题58。

试用决策树法选择最优方案。

表16 销售概率表0.1决策树例题1.某投资者预投资兴建一工厂,建设方案有两种:①大规模投资300万元;②小规模投资160万元。

两个方案的生产期均为10年,其每年的损益值及销售状态的规律见下表。

试用决策树法选择最优方案。

4/ 1.)计算各状态点的期望收益值(2 ;)*0.3]*10-300=340节点②:[100*0.7+(-20 ;节点③:[60*0.7+20*0.3]*10-160=320 将各状态点的期望收益值标在圆圈上方。

3)决策(比较节点②与节点③的期望收益值可知,大规模投资方案优于小规模投资方案,故应选择大规模//”在决策树上“剪去”被淘汰的方案。

投资方案,用符号“年,生产的产品也完全相同,但投资额10和AB,两个方案的寿命期均为2.某项目有两个备选方案万元,销150方案的投资额度为500万元,其年净收益在产品销售好时为及年净收益均不相同。

A万元,销售万元,其年净收益在产品销售好时为100方案的投资额度为50万元;B300售差时为,销路差的可能万元,根据市场预测,在项目寿命期内,产品销路好时的可能性为70%差时为10。

决策树练习题-多级决策树

决策树练习题-多级决策树
3
E(5)=1.0×(-30)×7= -210 (万元)
4
前三年的期望收入=0.7×100×3+0.3×(-30)×3=183(万元)
5
E(1)=183+0.7×609+0.3×(-210)-300=246.3 (万元)
6
02
03
对于节点2即改建车间
E(6)=0.9×40×7+0.1×10×7=259 (万元)
Hale Waihona Puke 01通过比较各期望收益,选择方案。
03
方案3为最佳方案。
02
E(3)=302.3> E(1)246.3 > E(2)155.3
销路好0.7
销路好0.7
销路差0.3
销 路差0.3
销路差0.3
销路差1.0
销路差0.1
销路差0.1
销路差1.0
销路差0.1
销路差0.1
销路差1.0
销路好0.9
销路好0.9
销路好0.9
销路好0.9
100
-30
-30
40
10
10
10
10
100
-30
40
前三年
后七年
扩 建
不 扩 建
E(4)=0.9×100×7+0.1×(-30)×7=609
E(5)=1.0×(-30)×7= -210
前三年的期望收入= 0.7×100×3+0.3×(-30)×3=183
E(1)=183+0.7×609+0.3×(-210)-300=246.3
决策树计算题
某工厂为生产一种新产品,制定三个基建方案。一是新建车间生产;二是改建原有车间进行生产;三是先改建,生产3年后当产品销路好时再进行扩建。新建和改建车间所需投资分别是300万元和140万元,若要在改建的基础上扩建车间,还需要追加投资140万元,产品生产期定为10年。

江西科学技术版小学信息技术五年级下册《决策树》同步练习题附知识点归纳

江西科学技术版小学信息技术五年级下册《决策树》同步练习题附知识点归纳

江西科学技术版小学信息技术五年级下册《决策树》同步练习题附知识点归纳一、课文知识点归纳:1.决策树是一种基于树形结构的决策分析方法,用于描述分类过程中不同特征属性之间的关系。

2.决策树由节点(包括决策节点、机会节点、叶节点)和边(连接线)组成。

3.决策树算法通过递归地将数据集划分为更小的子集,并在每个子集上应用决策规则,构建出树形结构。

4.决策树常用于分类问题、回归预测、特征选择和数据挖掘等场景。

二、同步练习题。

(一)、填空题。

1. 决策树通常由______、______、______和连接线组成。

2. 决策树绘制时,通常从______节点开始,根据______选择路径。

3. 决策树的一个重要应用是______问题,如垃圾邮件识别和疾病诊断等。

(二)、选择题。

1. 在决策树中,表示需要做出选择的情况是哪种节点?()A. 决策节点B. 机会节点C. 叶节点D. 事件节点2. 决策树的绘制方向通常是?()A. 自下而上B. 自上而下C. 从右到左D. 从左到右3. 决策树算法在以下哪个方面有很好的应用?()A. 图形设计B. 文本编辑C. 特征选择D. 图像处理(三)、判断题。

(正确的打“√”,错误的打“×”)1. 决策树是一种基于图形的决策过程描述方法。

()2. 叶节点表示可能的结果,而决策节点表示需要做出的选择。

()3. 信息增益是度量样本集合纯度的一个指标,其值越大表示纯度越低。

()(四)、简答题。

1. 描述一下决策树在分类问题中的基本作用。

__________________________________________________________________ __________________________________________________________________ __________________________________________________________________ 2.举例说明在日常生活中,你可能会用到决策树的情况。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

欢迎共阅
决策树作业题
公司拟建一预制构件厂,一个方案是建大厂,需投资300万元,建成后如销路好每年可获利100万元,如销路差,每年要亏损20万元,该方案的使用期均为10年;另一个方案是建小厂,需投资170万元,建成后如销路好,每年可获利40万元,如销路差每年可获利30万元;若建小厂,则考虑在销路好的情况下三年以后再扩建,扩建投资130万元,可使用七年,每年盈利85万元。

假设前3年销路好的概率是0.7,销路差的概率是0.3,后7年的销路情况完全取决于前3年;为了适应市场的变
继续生产
产7
1.万元。


案。

(2
(3
比较节点②与节点③的期望收益值可知,大规模投资方案优于小规模投资方案,故应选择大规模投资方案,用符号“//”在决策树上“剪去”被淘汰的方案。

2.某项目有两个备选方案A和B,两个方案的寿命期均为10年,生产的产品也完全相同,但投资额
及年净收益均不相同。

A方案的投资额度为500万元,其年净收益在产品销售好时为150万元,销售差时为50万元;B方案的投资额度为300万元,其年净收益在产品销售好时为100万元,销售差时为10万元,根据市场预测,在项目寿命期内,产品销路好时的可能性为70%,销路差的可能
欢迎共阅
性为30%
,试根据以上资料对方案进行比较。

3170
) 点② 决策树图示。

相关文档
最新文档