第6章决策树

合集下载

第六章经营决策原理

二、经济决策的原则 1．信息准全原则 2．未来预测原则 3．可行性原则 4．系统原则 5．对比优选原则 6．经济性原则 7．民主集中制原则 8．追踪监控原则
第二节科学决策原理的内容与类型
一、科学决策的内容（1）决策原理的研究（2）决策情报信息研究。（3）决策步骤和方法的研究（4）决策组织机构的研究。（5）决策对象规律性的研究。
2．心理人格素质（1）宽广的胸怀。（2）开放的心态。（3）坚韧的毅力和意志力。（4）个人的自我控制力。 3．基础知识素质（1）扎实的基础知识。（2）完善的知识结构。
二、明确的决策目标：
根据决策是否围绕特定的目标来进行，决策是否要力图实现某种预期的结果，我们可以将决策分为理性决策和非理性决策两大类。根据一项决策过程中所选定的决策目标的多寡，决策可分为单目标决策与多目标决策。
风险型决策有明确的目标，如最大利润；有可以选择的两个以上的可行方案；有两种以上的自然状态；不同方案在不同自然状态下的损益值可以计算出来；决策者能估算出不同自然状态下的概率。因此，决策者无论采用何种方案都要承担一定风险。
风险型决策常用的决策方法有期望值法和决策树法
（一）期望值法当管理者面临的各备选方案中存在着两种以上的可能结果，且管理者可估计每一种结果发生的客观概率时，就可用期望值法进行决策，即根据各方案的期望值大小来选择行动方案。各方案的收益期望值：期望值＝（方案在状态下的预期收益）×（方案i状态发生的概率）
第六章经营决策原理
【重点难点】 1．科学决策原理的内容与类型和科学决策的基本要素； 2．经营决策的基本方法。
【学习内容】 1．经营决策的内涵与原则； 2．经营决策的内容与类型； 3．经营决策的方法； 4．经营决策的基本要素和经营决策的程序。

第六章多阶段决策

θ θ1 θ2 θ3
P（θ） 0.4 0.3 0.3
a1
40000
a2
30000
a3
10000
20000
30000
10000
-30000 -20000 10000
为了更正确地了解市场情况，正式投产前可先生产少量产品试销。由于要增添少量生产设备等原因，试销费需要600元。由于试销前未做广告，顾客对产品不太了解，加之试销量较小，试销结果不很准确。假设试销结果分为产品受欢迎（H1）、一般（H2）和不受欢迎（H3）三种，其准确度见表。
（3）如果不试销，应大批生产、中批生产还是小批生产？如果试销，又应该如何根据试销结果决定其行动？
第二节序列决策
序列决策：有些问题，在进行决策后又产生一些新情况，需要进行新的决策，接着又有一些新的情况，又需要进行新的决策。这样就构成一个序列，这就是序列决策。
例 6-3 设某石油勘探队，在一片估计能出油的荒田钻探，可以先做试验，然后决策钻井与否。或者不做试验，只凭经验决策钻井与否。做试验的费用为每次3000元，钻井费用为10000元。若钻井后出油，井队可收入 40000 元；若不出油就没有收入。各种情况下出油的概率已估计出，并标在图 6-2 上。问钻井队该如果决策使其期望收入值最大。
θ θ1 θ2 θ3
P（θ） P(H1|θ ) 0.4 0.4 0.3 0.2 0.3 0.4
P(H2|θ )
P(H3|θ )
0.3 0.4 0.5
0.3 0.4 0.1
如不买此技术，把这笔费用用在其它方面，在同样的时期可获利ห้องสมุดไป่ตู้000元。那么，该公司应该如何决策？（1）是否买技术？
（2）如果买技术，是否采取试销方法？

第六章领导决策

第六章领导决策经管教学部丰云1. 界定领导艺术的概念及其特征；2. 描述现代决策的特点及趋势；3. 熟知决策分析的程序与方法；4. 阐释如何评估决策的科学性；5. 把握不同类型决策之间的区别联系；6. 辨析领导者与智囊团的关系。

两利相权取其重，两害相权取其轻。

领导决策，是领导者在实施领导活动过程中对若干个准备行动的方案进行选择，以期最好地达到目标。

决策行为贯穿于领导活动的全过程，领导者进行有效的决策，是领导活动取得高效的关键所在。

因此，掌握必备的决策知识与决策艺术，是领导活动成败的关键。

各级领导者要深刻认识领导决策的主要方法，理解不同类型决策之间的区别联系，切实提高领导决策水平。

一、领导决策概述（一）领导决策的含义、特点与作用1．领导决策的含义领导决策是指享有领导权力的领导或领导机关，为达成特定的管理目标，在综合考虑各种需求和可能性的基础上，为处理领导权力范围内的事务而进行的一种决定政策、对策和方案的活动过程。

2．领导决策的特点与其他非领导决定相比，它具有下列几个明显的特点。

（1）领导决策主要是组织决策领导决策所要解决的问题是多种多样的，以决策主体地位高低为标准，可分为组织决策、管理决策和业务决策三种。

组织决策：是由组织中最高管理层做出的、关系到组织全局利益的、与外界环境关系密切的重大问题的决定。

它主要表现为方针、目标、政策、计划及重大方案的制定，具有战略性、整体性和长期性的特点。

管理决策：是由组织内中层管理者做出的，关系到本地区、本部门的一些较大问题的决定。

它主要以实现组织决策所规定的目标为决策标准，具体内容包括诸如设计、调整组织的体制结构、规划、安排同类资源、协调、控制各个环节等。

管理决策具有策略性、局部性和连接性的特点。

业务决策：是由组织内部基层管理者做出的，主要是解决日常实际工作中的具体问题。

它比管理决策更具体、更定量化。

业务决策具有战术性、技术性和短期性的特点。

（2）领导决策主要是非常规型(或非程序化)决策根据决策问题的重复程度，可分为常规型(或程序化)决策和非常规型(或非程序化)决策两种。

《管理学》习题第六章决策(参考答案)

第六章决策（练习与思考-参考答案）一、单项选择题1. ( )大多由中层管理者来进行，主要是对组织内部的资源进行有效的组织和利用，以提高管理效力。

A. 业务性决策B. 战略性决策C. 战术性决策D. 程序化决策2. 决策树适合下列哪种类型的决策？( )A. 确定型决策B. 非确定型决策C. 风险型决策D. 非程序化决策3. 有一种说法认为“管理就是决策”，这实际上意味着( )。

A. 对于管理者来说只要善于决策就一定能够获得成功B. 管理的复杂性和挑战性都是由于决策的复杂性而导致的C. 决策能力对于管理的成功具有特别重要的作用D. 管理首先需要的就是面对复杂的环境作出决策4. 波士顿矩阵中的瘦狗业务是指( )。

A. 高增长、低市场份额B. 低增长、低市场份额C. 高增长、高市场份额D. 低增长、高市场份额5. 某企业生产某产品，固定成本8万元，单位可变成本每件5元，该产品每件售价13元，则产品的盈亏平衡点产量是( )。

A. 8000件B. 10000件C. 12000件D. 20000件参考答案：1.C； 2.C； 3.D； 4.B；5.B；二、多项选择题1. 以下属于主观决策法的主要有( )。

A. 头脑风暴法B. 发散思维法C. 德尔菲法D. 定量决策法E. 后悔值最小法2. 下列选项中不属于企业短期决策的是( )。

A. 投资方向的选择B. 人力资源的开发C. 组织规模的确定D. 企业日常营销E. 本季度研发支出的投入3. 决策的影响因素有( )。

A. 环境B. 过去的决策C. 决策者的风险态度D. 组织成员对组织变化所持的态度E. 决策者的素质4. 量本利分析法中的所谓“量、本、利”是指( )。

A. 产量B. 成本C. 产出D. 利润E. 利益参考答案：1.ABC； 2.ABC； 3.ABCD； 4.ABD；三、判断题1. 按照决策条件的可控程度，决策可分为程序性决策和非程序性决策者。

( ) 2. 不确定型决策面临的是多种可能的自然状态，可选方案在不同自然状态下的结果不同，未来会出现哪一种自然状态，事前虽难以肯定，但却可以预测其出现的概率。

管理学06章-决策

34
最小最大后悔值法
• 基本思想是：
– 各种自然状态下最大收益值（最优值） – 后悔值＝（最优值－各个自然状态下收益值） – 求出不同方案中的最大后悔值，并选择所有最大后悔值中最小的一个所对应的方案作为决策方案。
• 后悔的程度用最大收益值与所采取的方案的收益值之差来衡量，称为后悔值。 • 例：Ｐ１４７
• 优点是有可能夺取最好的效果； • 缺点是承担的风险较大。 • 例：Ｐ１４６
33
坏中求好的决策方法（小中取大）
• 基本思想是：
– 计算出各种方案在各种自然状态下可能有的收益值 – 找出各种自然状态下的最小收益值 – 选择这些最小收益值中最大的所对应的方案为决策方案。
• 优点是风险较小，即使在不利的情况下，也能获得一定的利润。 • 缺点是有可能失去获得高额利润的机会。 • 例：１４７
7
2、决策的类型－（２）
• 决策问题的大小：宏观和微观决策 • 问题描述的性质：定量与定性决策 • 决策问题的考虑方式：动态决策、静态决策
8
二、决策的原则与影响因素
• 满意原则
9
决策的影响因素－组织决策
环境过去决策决策者对风险的态度组织文化时间
10
环境的构成
经济自然资源科学技术
38
（2）按“坏中求好”决策方法决策。
首先求每一方案在各自然状态下的最小收益值：
f (d1 ) min(200, 20) 20
f (d 2 ) min(150, 20) 20
f (d3 ) min(100, 60) 60
在各最小收益中选取最大，最大值为60，对应的为第三方案，因此“坏中求好”决策方法结果是第三方案为最优方案。

第六章决策(参考答案)[6页]

A. 8000件B. 10000件C. 12000件D. 20000件参考答案：1.C； 2.C； 3.D； 4.B；5.B；二、多项选择题1. 以下属于主观决策法的主要有( )。

A. 头脑风暴法B. 发散思维法C. 德尔菲法D. 定量决策法E. 后悔值最小法2. 下列选项中不属于企业短期决策的是( )。

A. 投资方向的选择B. 人力资源的开发C. 组织规模的确定D. 企业日常营销E. 本季度研发支出的投入3. 决策的影响因素有( )。

A. 环境B. 过去的决策C. 决策者的风险态度D. 组织成员对组织变化所持的态度E. 决策者的素质4. 量本利分析法中的所谓“量、本、利”是指( )。

第六章系统分析

3. 数据字典的条目数据字典中的条目有以下六种形式： (1) 数据项。是数据处理中基本的不可分割的逻辑单位。 (2) 数据结构。用以描述数据流/数据存储的逻辑组成。 (3) 数据流。 (4) 数据存储。 (5) 处理功能。 (6) 外部实体。
6.3.3 功能分析
功能分析是对数据流程图中处理过程的功能作详细的说明。从逻辑上进行分析，处理功能可归纳为三类，即数据的输入和输出处理、算术运算、逻辑判断。常采用决策树、决策表及结构化语言等作为描述功能分析的工具。 1.决策树决策树又称判定树，是一种呈树状的图形工具，适合于描述处理中具有多种策略，要根据若干条件的判定，确定所采用策略的情况。左端圆圈为树根表示决策结点；由决策结点引出的直线，形似树枝，称为条件技，每条树枝代表一个条件；中间的圆圈称为条件结点；右端的实心圆表示决策结果。决策树中条件结点以及每个结点所引出条件技的数量依具体问题而定。决策树的优点是清晰、直观；缺点是当条件多，而且互相组合时，不容易清楚地表达判断过程。
6.1.2 系统分析阶段的任务与团队
系统分析阶段的主要任务是要对现有系统进行详细调查，充分掌握现有系统的作用环境和真实情况，完成用户需求分析，在此基础上建立新系统的逻辑模型。
1. 系统分析师：他们的主要任务是研究用户对信息系统的需求；评价该企业开发计算机化信息系统的可行性；进行系统分析与设计，负责对新系统的安装、测试和技术文件的编写。 2. 业务人员：参与开发工作的业务人员，应当由来自企业信息系统部门的用户代表组成，业务骨干且具备计算机知识。提出、解释和梳理用户的业务需求，介绍业务流程含义，对原型评估和反馈。 3. 计算机技术专家：有些开发项目需要聘请专门的计算机技术专家参与系统分析过程，如审计专家、通信专家、安全专家等，加强某些方面的设计。

数据仓库与数据挖掘技术第六章决策树

第6章决策树方法6.1信息论的基本原理6.1.1信息论原理6.1.2互信息的计算1. 定义2. 出现概率3. 条件概率4. 子集概率5. 子集条件概率6. 信息熵7. 互信息6.2常用决策树算法6.2.1ID3算法1. 基本思想数据仓库与数据挖掘技术图6-1ID3决策树2. 主算法数据仓库与数据挖掘技术图6-2ID3算法流程3. 建树算法4. 实例计算6.2.2C4.5算法1. 信息增益比例的概念2. 连续属性值的处理3. 未知属性值的处理4. 规则的产生5. 案例计算数据仓库与数据挖掘技术图6-3天气结点及其分支图6-4C4.5算法形成的决策树数据仓库与数据挖掘技术6.3决策树剪枝6.3.1先剪枝6.3.2后剪枝6.4由决策树提取分类规则6.4.1获得简单规则图6-5决策树6.4.2精简规则属性数据仓库与数据挖掘技术6.5利用SQL Server 2005进行决策树挖掘6.5.1数据准备6.5.2挖掘模型设置6.5.3挖掘流程图6-6选择数据挖掘技术数据仓库与数据挖掘技术图6-7选择数据源视图图6-8指定表类型数据仓库与数据挖掘技术图6-9指定定型数据图6-10指定列的内容和数据类型图6-11完成数据挖掘结构的创建数据仓库与数据挖掘技术6.5.4挖掘结果分析图6-12挖掘得到的“次级”决策树图6-13挖掘得到的依赖关系图数据仓库与数据挖掘技术图6-14“余额”结点的依赖关系图图6-15与“余额”结点链接强度最强结点示意图数据仓库与数据挖掘技术6.5.5挖掘性能分析图6-16列映射图数据仓库与数据挖掘技术图6-17属性“次级”的预测提升图习题61. 概率分布［0:0625;0:0625;0:125;0:5］的熵是多少？2. 汽车保险例子。

假定训练数据库具有两个属性: 年龄和汽车的类型。

年龄——序数分类。

汽车类型——分类属性。

类——L: 低(风险)，H: 高(风险)。

使用ID3算法做出它的决策树。

管理学课件第6章制定决策管理者工作的本质(Decision

Ø Assumptions are that decision makers:
v Will not seek out or have knowledge of all alternatives
v Will satisfice—choose the first alternative encountered that satisfactorily solves the problem—rather than maximize the outcome of their decision by considering all alternatives and choosing the best.
v Are perfectly rational, fully objective, and logical. v Have carefully defined the problem and identified all viable
alternatives. v Have a clear and specific goal v Will select the alternative that maximizes outcomes in the
• Choosing the best alternative
Ø The alternative with the highest total weight is chosen.
Step 7: Implementing the Alternative
• Putting the chosen alternative into action.
管理学课件第6章制定决策管理者工作的本质(Decision
The Role of Intuition（直觉的作用）

管理信息系统第六章习题

第六章管理信息系统第六章习题6。

1 单项选择题6.1.1 表格分西图是( D ）。

a. 数据流程调查使用的工具b。

编程工具c。

系统设计工具d。

管理业务调查使用的工具6。

1.2 开发MIS的系统分析阶段的任务是（Aa。

完成新系统的逻辑设计 b. 完成新系统的功能分析c。

完成新系统的物理设计d。

完成新系统的数据分析6。

1.3 数据字典建立应从( B ）阶段开始.a. 系统设计b.系统分析c。

系统实施 d.系统规划6.1.4 对一个企业供户、存管理信息系统而言，（ B ）是外部实体。

a. 仓库b. 划科c. 供应科d。

销售科6.1。

5 数据流( A ）。

a. 也可以用来表示数据文件的存储操作b. 不可以用来表示数据文件的存储操作c. 必需流向外部实体d. 不应该仅是一项数据6。

1.6 管理业务流程图可用来描述（ C ）a. 处理功能b. 数据流程c. 作业顺序d. 功能结构6.1。

7 管理信息系统的开发过程不包含( A ）a。

设备设计过程b。

学习过程c。

人与人之间的对话过程d. 通过改革管理制度来适应信息系统的需要6.1。

8 决策树和决策表用来描述（Aa. 逻辑判断功能b. 决策过程c。

数据流程 d. 功能关系6。

1.9 表格分配图是系统分析阶段用来描述( A ）的。

a. 管理业务流程的图表b. 数据流程的图表c. 功能结构的图表d。

数据处理方式的图表6.1.10 工资系统中职工的“电费”数据（每月按表计费）具有（ Ca. 固定值属性b。

随机变动属性 c. 固定个体变动属性 d. 静态特性属性6.1。

11 数据流程图是描述信息系统的( Ca。

物理模型的主要工具 b. 优化模型的主要工具c. 逻辑模型的主要工具d。

决策模型的主要工具6。

1.12 在系统设计阶段，图6.1中的四种符号用于绘制( A ）a. 数据流程图b. 处理流程图c。

信息系统流程图d. 表格分配图图6.1 四种符号6。

1。

13 描述数据流程图的基本元素包括：( D ）a。

工程经济学第6章习题参考解答

6-8 拟建某企业，预计产品的固定费用为 31500元，单位可变费用为15元，销售单价为30元。由于原材料大量采购，单位产品可变费用随产量增加以1.3‰的比例下降，由于销售量增加，产品的销售价格随销售量增加以2.8‰的比例下降，未考虑销售税金及附加，求该企业盈利的范围区。
解：假定产品产量（销售量）为Q，根据题意：总成本为C=31500+(15-0.0013Q)Q 销售收入S=(30-0.0028Q)Q 根据盈亏平衡C=S 求解得Q1=3000; Q2=7000 结论：根据非线性盈亏平衡分析可知，当企业产品的销售量在3000到7000单位之间时可以盈利。
再进行建大厂还是建小厂的决策：计算建小厂（点③）的期望净现值 E(NPV)3 销路好时： NPV=-140+40(P/A,10%,3)+262.5 (P/F,10%,3) =156.7 （万元）销路差时： NPV=-140+30(P/A,10%,10)=44.3 （万元）建小厂的期望净现值 E(NPV)3 E(NPV)3=156.7*0.7+44.3*0.3=123 （万元）
解：（1）画出决策树图。
销路好(0.7)
100
建大厂投
资300万
2
扩建投销路好 (0.7) 资200万
销路差(0.3) -20
1
建小厂投
资140万
5
95
3
4
不扩建销路差
6
40
(0两级决策。先进行是否扩建决策：计算点⑤和点⑥的净现值扩建（点⑤）净现值（以第3年末为基点） NPV=-200+95(P/A,10%,7)=262.46（万元）不扩建（点⑥）净现值（以第3年末为基点） NPV=40(P/A,10%,7)=194.7（万元）由于扩建的净现值大于不扩建的净现值，因此决策点④应选择扩建。

决策树(完整)

无缺失值样本中在属性上取值的样本所占比例
无缺失值样本中在属性上取值的样本所占比例
ቤተ መጻሕፍቲ ባይዱ
谢谢大家！
举例：求解划分根结点的最优划分属性
根结点的信息熵：
用“色泽”将根结点划分后获得3个分支结点的信息熵分别为：
属性“色泽”的信息增益为：
若把“编号”也作为一个候选划分属性，则属性“编号”的信息增益为：
根结点的信息熵仍为：
用“编号”将根结点划分后获得17个分支结点的信息熵均为：
则“编号”的信息增益为：
三种度量结点“纯度”的指标：信息增益增益率基尼指数
1. 信息增益
香农提出了“信息熵”的概念，解决了对信息的量化度量问题。香农用“信息熵”的概念来描述信源的不确定性。
信息熵
信息增益
一般而言，信息增益越大，则意味着使用属性a来进行划分所获得的“纯度提升”越大。决策树算法第8行选择属性
著名的ID3决策树算法
远大于其他候选属性信息增益准则对可取值数目较多的属性有所偏好
2. 增益率
增益率准则对可取值数目较少的属性有所偏好著名的C4.5决策树算法综合了信息增益准则和信息率准则的特点：先从候选划分属性中找出信息增益高于平均水平的属性，再从中选择增益率最高的。
3. 基尼指数
基尼值
基尼指数
著名的CART决策树算法
过拟合：学习器学习能力过于强大，把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质，导致泛化性能下降。欠拟合：学习器学习能力低下，对训练样本的一般性质尚未学好。
过拟合无法彻底避免，只能做到“缓解”。
不足：基于“贪心”本质禁止某些分支展开，带来了欠拟合的风险
预剪枝使得决策树的很多分支都没有“展开”优点：降低过拟合的风险减少了训练时间开销和测试时间开销

模糊决策树的构建和优化

模糊决策树的构建和优化第一章：引言1.1 背景随着数据科学和机器学习的发展，决策树已成为一种常见且强大的分类和回归模型。

然而，传统的决策树只能处理离散和连续的数据，对于模糊数据处理能力有限。

为了处理模糊数据，研究者们提出了模糊决策树的概念，该决策树使用模糊集理论来表示模糊数据，从而提高了决策树模型的表现能力。

1.2 目的本文的目的是介绍模糊决策树的构建和优化方法，探讨其在处理模糊数据时的优势，并结合实际案例说明其应用价值。

第二章：模糊决策树的构建2.1 模糊集理论简介介绍模糊集理论的基本概念和原理，如隶属度函数、模糊集运算等。

2.2 模糊决策树的基本结构说明模糊决策树的基本结构和节点类型，如模糊节点、叶子节点等。

2.3 模糊数据的表示和处理介绍如何将模糊数据表示为模糊集，以及如何处理模糊数据的问题。

2.4 模糊决策树的构建算法详细介绍模糊决策树的构建算法，包括模糊划分准则、节点分裂准则等。

第三章：模糊决策树的优化3.1 剪枝算法介绍模糊决策树的剪枝算法，包括预剪枝和后剪枝方法，用于提高模型的泛化性能。

3.2 特征选择探讨如何选择对模型最有信息价值的特征，避免冗余特征对模型的干扰。

3.3 模型集成介绍模型集成方法，如随机森林等，用于提高模型的精确度和稳定性。

3.4 参数调整探讨如何通过调整模型的超参数，如决策树深度、节点分裂的最小样本数等，来优化模型的性能。

第四章：模糊决策树的应用案例4.1 案例背景介绍介绍一个真实的案例背景，如模糊风险评估，以说明模糊决策树的应用场景。

4.2 数据预处理对案例中的数据进行预处理，包括缺失值处理、异常值处理等。

4.3 模糊决策树构建和优化应用前面介绍的模糊决策树构建和优化方法，构建一个模糊决策树模型。

4.4 模型评估和结果分析对模型进行评估，比较模型的性能指标，如准确率、召回率等。

同时对模型的结果进行分析，找出模型的优点和局限性。

第五章：结论总结本文的内容，强调模糊决策树的优势和应用前景，并展望未来的研究方向。

第六章决策方法

金牛型：市场占有率较高，而业务增长率较低，为企
业带来较多的利润，同时需要较少的资金投资——产生的大量现金可以满足企业经营的需要

明星型：市场占有率和业务增长率都较高——不失时
机地投入必要的资金，扩大生产规模
23
二、有关活动方向的决策方法 2
政策指导矩阵（麦肯锡矩阵、九象限法）：
从市场前景吸引力和经营单位竞争能力两个维度分析企业各经营单位的现状和特征，并把他们标示在矩阵上，据此指导企业活动方向的选择
8
一、集体决策方法
头脑风暴法
名义小组技术德尔菲法
9
头脑风暴法
创始人：美国创造工程学家奥斯本特点:
针对解决的问题，相关专家或人员聚在一起，在宽松的氛围中，敞开思路，畅所欲言，寻求多种决策思路
四项原则：
各自发表自己的意见，对别人的建议不作评论建议不必深思熟虑，越多越好
盈利平衡法线性规划法边际分析法净现值法
31
盈利平衡分析法
通过分析产品成本、销售量和利润这三
个变量之间的关系，分析各种方案对盈亏的影响，从中选择最佳方案。
最主要的就是找出盈亏变化的平衡点固定成本
企业利润=销售收入-生产成本
变动成本
销售数量销售价格
32
盈亏平衡分析
德尔菲法
选择专家设计问卷函询综合专家意见结果
反复
特点：匿名性，有价值性，决策结果的统计性
缺点：
受专家组主观意见制约，决策的准确程度取决于专家们的观点、学识和对决策对象的兴趣程度。专家级评价主要依靠直观判断，缺乏严格的论证。

20
二、有关活动方向的决策方法

2010年自考医学类工程心理学复习笔记(第6章)

决策决策的概念：所谓决策应该符合4个条件，第一是能够多个选择项中选择一个选择项，第二是一定要有一些有用的信息，第三是要有一定的时间长度（多于1秒），第四决策的选择带有不确定性，决策带有风险的成分。

决策有两种：自觉自动决策“知觉-行动”决策，需要付出努力、有控制的、需要分析才能完成的决策。

决策的理论1.决策的常态模型，也叫决策的理性模型。

效用：每个选择的总结值。

期望效用理论：一个选择项的总价值是每个结果的价值与它的概率的乘积。

主观期望效应理论：主观效应理论仍然坚持每个结果都是期望概率与其价值概率的成绩。

但是这个价值成分是主观的，依赖与人体差异。

2.描述性模型，研究感兴趣的是对现实的决策进行描述。

特维斯基和卡纳曼（Kahneman）.框架效应：由于呈现方式而导致决策上变化，称为框架效应。

决策中的启发式：人们的决策只依赖一些简单的，不完全的选择项就可以做出判断。

早期的著名的描述性模型就是“西蒙”提出的“满意决策”模型。

他认为通常人们并不是作出一个唯一的、最好的，或最合适的决策，而是选择一个能达到目的的、“足够好”的决策，即获得一种满意感就行了。

如果信息量相对较小，而且时间又很充裕，决策时人们需要仔细分析各种选项和他们的“效用”。

但如果信息量超过了人们的认知加工能力的限制，而且时间也很有限，这时，人们倾向于采用启发式决策。

实际上，人们在作出不同的决策时，常常是从分析式相适当的启发式转换。

第一节启发式和偏见信息加工的框架，威肯斯模型把认知成分的特征和意识、努力及决策紧密联系在起来，如选择性注意、工作记忆中的活动及长时间记忆中提取信息。

工作记忆中会有如下活动发生：1．线索接受和整合2．假设生成3．假设的评估和选择4．产生并选择行动方式认知缺陷对决策产生影响的因素：1.进入工作记忆中的线索信息的数量和质量2.对每一个决策活动的可利用的时间长度。

3.逐一资源4.知识的数量和质量5.从长时记忆中提取相关信息的能力。

第六章决策

第六章决策决策贯穿整个管理活动；科学决策是现代管理的本质、核心。

决策的重要性：企业家的控制力应该主要表现在决策方面；高层管理者的决策功能是第一位的；管理工作中，充斥着决策工作。

第一节决策的定义、原则与依据决策的定义：从两个及以上的备选方案中选择一个的过程就是决策。

--------杨洪兰，1996年提出；组织或个人为了实现某种目标而对未来一定时期内有关活动的方向、内容及方式的选择或调整过程。

------周三多，1999年提出。

本教材中决策的定义：决策是管理者识别并解决问题、利用机会的过程。

决策的主体是管理者；决策的本质是一个过程；决策的目的是解决问题或利用机会。

决策的原则：决策遵循的是满意（合适）原则，而不是最优原则。

（现实中的最优条件只是一个理想）决策的依据：信息→数量、维度和质量信息是什么？→是资源；是权利；是机会；是能力。

信息的获得是有成本的第二节决策的类型与特点决策的类型：按不同的标准对决策进行分类：长期决策与短期决策；战略决策、战术决策、业务决策；集体决策、个人决策；初始决策、追踪决策；程序化决策、非程序化决策；确定型决策、风险型决策、不确定型决策。

长期决策与短期决策→按时间长短分：长期（战略）决策：有关组织今后发展方向的长远性、全局性的重大决策，又称长期战略决策。

如投资方向的选择、人力资源开发。

短期（战术（决策：为实现长期战略目标而采取的短期策略手段，又称短期战术决策，如：企业日常营销，物资储备。

战略决策、战术决策与业务决策→按重要程度分：战略决策：对组织最重要，通常包括组织目标、方针的确定，组织机构的调整，企业产品的更新换代，技术改造等。

战术决策：又称管理决策，是在组织内贯彻的决策，属于战略决策执行过程中的具体决策（战略的一个阶段）。

业务决策：又称执行性决策，是日常工作中为提高生产效率、工作效率而作出的决策，牵涉范围较窄，只对组织产生局部影响。

集体决策与个人决策→按照决策人的数量分集体决策：指多个人一起作出的决策。

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

6.1 决策树
从数据中生成分类器的一个特别有效的方法是生成一个决策树。它是一种基于逻辑的方法，通过一组输入-输出样本构建决策树的有指导学习方法。决策树包含属性已被检验的节点，一个节点的输出分枝和该节点的所有可能的检验结果相对应。
图7-2是一个简单的决策树。该问题有两个属性X,Y。所有属性值X>1和Y>B的样本属于类2。不论属性Y的值是多少，值X <1的样本都属于类1。
6.2 C4.5算法：生成一个决策树
C4.5算法最重要的部分是由一组训练样本生成一个初始决策树的过程。决策树可以用来对一个新样本进行分类，这种分类从该树的根节点开始，然后移动样本直至达叶节点。在每个非叶决策点处，确定该节点的属性检验结果，把注意力转移到所选择子树的根节点上。
例如，如图7-3a为决策树分类模型，待分类有样本如图7-3b所示，由决策树分类模型可得出待分类样本为类2。(节点A,C,F(叶节点))
该算法的关键性决策是对节点属性值的选择。ID3和C4.5算法的属性选择的基础是基于使节点所含的信息熵最小化。基于信息论的方法坚持对数据库中一个样本进行分类时所做检验的数量最小。ID3的属性选择是根据一个假设，即：决策树的复杂度和所给属性值表达的信息量是密切相关的。基于信息的试探法选择的是可以给出最高信息的属性，即这个属性是使样本分类的结果子树所需的信息最小。
而C4.5算法选择{vi,vi+1}的最小值vi为阈值。这确保出现结果中阈值属于数据库的一个值。对于上例，属性2的值的集合是: {65,70,75,78,80,85,90,95,96} 可能的阈值Z的集合是: {65,70,75,78,80,85,90,95}。从这8个值里选择最优的阈值(最高信息增益)，最优的Z=80。(如果计算?)
2.如果属性Y有连续的数值，通过将该值和阈值Z比较，用输出Y≤Z和Y＞Z定义二元检验。 3.基于离散值的更复杂的检验，该检验中属性的每个可能值被分配到许多易变的组中，每组都有一个输出和分枝。数值型属性检验：对于属性Y，按训练样本进行分类，分类顺序用{v1,v2,…,vm}表示，因此对Y仅有m-1个分区，要系统在检查所有分区以求得最优分区。通常选择区间的中点为阈值。
假设选择有n个输出(所给属性的n个值)的检验，把训练样本集T分区成子集T1,T2,…,Tn。仅有的指导信息是在 T和它的子集Ti中的类分布。如果S是任意样本集，设freq(Ci,S)代表S中属于Ci的样本数量，|S|表示集合S中的样本数量。
ID3算法的属性选择的检验方法采用增益标准，它基于信息论中熵的概念。集合S的期望信息(熵)如下：
Gain(x3)=0.94-0=0.94 产生两个分枝为最终叶节点，分枝中的数据子集属于同一类。
对根节点下的T3子集进行同样的计算，按属性3=真和属性3=假检验，产生两个叶节点。图7-5表示数据库T的最终决策树。
另外，决策树可以用可执行代码（或伪代码）的形式表示。图7-6用伪代码给出了上面例子的决策树。
除了考虑到仅有的几个有已知属性值的样本，Info(T)和Infox(T)的计算和前面机相同。然后可以用系数Ｆ合理地修正增益参数，该系数表示所给属性已知的概率。Ｆ＝数据库中一个给出的属性值具有已知值的样本的数量/数据集中样本数量总和。新的增益标准有以下形式： Gain(x)=F· (Info(T)-Infox(T)) 同样，通过把具有未知值的样本看作分区的一个附加组可以修改Split-info(x) 。如果检验x有n个输出， Split-info(x)按照检验把数据集分区成n+1个子集计算。
3. T包含属于不同类的样本。这种情况下，是把T精化成朝向一个单类样本集的样本子集。根据某一属性，选择具有一个或更多互斥的输出 {O1,O2,…,On}的合适检验。T被分区成子集T1,T2,…,Tn。T的决策树包含标识检验的一个决策点和每个可能输出的一个分枝(如图7-3a中的A,B和C 节点)
6.3 未知属性值
C4.5算法的前一版本是基于所有属性值都已确定这一假设。但是在一个数据库，经常会缺少某些样本的一些属性。由于该属性值与某个样本是不相关的，或搜集样本时没有对它进行记录，或在数据录入时有人为的误差，就可能出现属性值丢失的情况。
解决丢失值问题的两种方法： 1.抛弃数据库中有丢失数据的样本。 2.定义一个新的算法或改进现有算法来处理丢失的数据。第一种解决方案很简单，但当样本集中存在大量丢失值时不能采用这种方法。在C4.5算法中,有未知值的样本是按照已知值的相对频率随机分布的,这是普遍使用的法则。
2.4/0.4
上图与图7-6结构相同，但是因为最终分类的不明确性，每个决策都以形式(|Ti|/E)和两个参数关联。|Ti|是到叶节点的部分样本和，E是属于除了指定类以外的类的样本的数量。
对每个分枝重复上述步骤选择检验和最优化过程。对于子节点T2子集，4个样本都是类1，该节点是叶节点。
对于余下的节点，在T1中有5个样本，最优检验有两个选择：属性2≤70和属性2＞70的检验x4。 info(T1)=-2/5log2(2/5)-3/5log2(3/5) =0.940
infox4(T1)=2/5(-2/2log2(2/2)-0/2log2(0/2)) +3/5(-0/3log2(0/3)-3/3log2(3/3)) =0
info ( S ) (( freg (Ci , S ) / S ) log 2 ( freg (Ci , S ) / S ))
i 1 k
T被分区之后的一个相似度标准，T按照一个属性检验X的几个输出进行分区。所需信息为子集的熵的加权和:
info x (T ) ( Ti / T ) info (Ti ))
例如：一个改进了的C4.5决策树的方法。数据集见表7-2。
该例有14个样本，属性1有一个丢失值，用 “?”表示。只有13个样本数据完整。分区前的熵是： Info(T)=-8/13log2(8/13)-5/13log2(5/13) =0.961 属性1检验的信息： infox1(T)=5/13(-2/5log2(2/5)-3/5log2(3/5)) +3/13(-3/3log2(3/3)-0/3log2(0/3)) +5/13(-3/5log2(3/5)-2/5log2(2/5)) =0.747
增益标准对具有许多输出的检验有严重的偏差，根据info(S)的定义，指定一个附加的参数：
Split info ( X ) ((Ti / T ) log 2 (Ti / T ))
i 1 n
这表示通过把集T分区成n个子集Ti而生成的潜在信息。现在，定义一个新的增益标准： Gain-radio(X)=gain(X)/Split-info(X)
对应属性2的检验3(属性2≤80和属性2＞80) 的信息增益计算：
infox3(T)=9/14(-7/9log2(7/9)-2/9log2(2/9)) +5/14(-2/5log2(2/5)-3/5log2(3/5)) =0.837
相应的增益: Gain(x3)=0.94-0.837=0.103 属性1的增益最高，选择该属性进行首次分区。每个属性值具有一个分枝，产生3个分枝，如图7-4所示.
C4.5算法的构架是基于亨特的CLS方法，其通过一组训练样本T构造一个决策树。用{C1,C2,…,CK}来表示这些类，集合T所含的内容信息有3种可能性： 1. T包含一个或更多的样本，全部属于单个的类Cj。那么T的决策树是由类Cj标识的一个叶节点。 2. T不包含样本。决策树也是一个叶，但和该叶关联的类由不同于T的信息决定，如T 中的绝大多数类。
相应的增益: Gain(x1)=0.94-0.694=0.246
按属性3分区可得子集的熵的加权和：
infox2(T)=6/14(-3/6log2(3/6)-3/6log2(3/6)) +8/14(-6/8log2(6/8)-2/8log2(2/8)) =0.892
相应的增益: Gain(x2)=0.94-0.892=0.048 由于属性2是数值型的连续数据，不能简单按上面方式计算。下面先介绍一下C4.5 算法中一般包含3种类型的检验结构： 1.离散值的“标准”检验，对属性的每个可能值有一个分枝和输出。
对于属性1的检验x1分区结果，丢失值的记录将被表示在3个子集中。如图7-7所示。
因为最初的(旧的)w值等于1，新的权值wi等于概率5/13,3/13,和5/13。在 C4.5中，Ti的算式如下： |T1|=5+5/13, |T2|=3+3/13, |T3|=5+5/13 对属性2和属性3检验分区，最终决策树如图7-8中所示的形式。
对于树中的非叶节点，可以沿着分枝继续分区样本，每一个节点得到它相应的样本子集。生成决策树的一个著名的算法是 Quinlan的ID3算法，C4.5是它改进版。
ID3算法的基本思路： 1. 从树的根节点处的所有训练样本开始，选取一个属性来划分这些样本。对属性的每一个值产生一分枝。分枝属性值的相应样本子集被移到新生成的子节点上。 2. 这个算法递归地应用于每个子节点，直到一个节点上的所有样本都分区到某个类中。 3. 到达决策树的叶节点的每条路径表示一个分类规则。
另外，每个样本都有一个相关的新参数,即概率。显然，当一个值已知的样本从T分配给Ti时，它属于Ti的概率是1，属于其他所有子集的概率是0。当一值是未知时，只能得出不稳定的概率描述。因此C4.5和每个子集Ti中的每个样本是用权重w联系起来的，它表示属于每个子集的样本概率。为了使该解决方法更具一般性，必须认为分区前样本的概率并不总是等于1。因此，分区后丢失值的新参数wnew为： wnew=wold· P(Ti)
9个样本属于类1，5个属于类2，因此分区前的熵为（基于类的熵计算） info(T)=-9/14log2(9/14)-5/14log2(5/14) =0.940 按属性1分区可得子集的熵的加权和：

第6章 决策树

第六章 经营决策原理

第六章 多阶段决策

第六章 领导决策

《管理学》习题第六章 决策(参考答案)