《研判别分析》PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
性质, 将性质相近的归为一类,将性质差别较 大的归入不同的类。 判别分析先根据已知类别的事物的性质, 利用某种技术建立函数式,然后对未知 类别的新事物进行判断以将之归入已知 的类别中。 所以可利用判别分析对聚类分析结果的 准确性进行检验。聚类分析分成几类后, 即可以作为判别分析的类别输入,进行 判断。
向后选择法 是从把所有指定的变量建立一个全模型,每一 步把一个对模型的判断能力贡献最小的变量剔除出 模型,直到模型中的所有变量都符合留在模型中的 判据时,剔除变量工作结束。在希望较少的变量留 在判别函数中时使用向后选择法。 逐步选择法 是从模型中没有变量开始,每一步都要对模型 进行检验。在把模型外的对模型的判断能力贡献最 大的变量加入到模型中的同时,也考虑把已经在模 型中但又不符合留在模型的条件的变量剔除。因为 新变量的引入有可能使原来已经在模型中的变量对 模型的贡献变得不显著了,直到模型中的所有变量 都符合引入模型的判据,模型外的变量都不符合进 入模型的判据时,逐步选择变量的过程停止。
判别分析
根据相关的数据对所研究的对象进行分类 判别,例如,在经济学中,根据国民收入、 人均工农业产值、人均消费水平等多种指 标来判定一个国家的经济发展程度所属类 型;在人口学中,可以根据平均预期寿命、 经济水平、婴儿死亡率等因素来决定人的 死亡水平所属类别。这就是判别分析 (Discriminant Analysis)可解决的问题。
判别分析的种类
判别分析按判别的组数来分,有两组判别 分析和多组判别分析; 按区分不同总体所用的数学模型来分,有 线性判别和非线性判别; 按判别对所处理的变量方法不同有逐步判 别、序贯判别等。 判别分析可以从不同角度提出问题,因此 有不同的判别准则,如费歇尔(Fisher)准则 和贝叶斯(Bayes)准则。
建立判别函数的方法
全模型法 是把用户指定的变量全部放入判别函数中。 不管变量对判别函数是否起作用以及作用的大 小,当对反映对象特征的变量认识比较全面时 可以用此方法,该法也是SPSS默认的方法。 向前选择法 是从判别模型中没有变量开始,每一步把一 个对判别模型的判断能力贡献最大的变量引入 模型,直到没有被引入模型的变量都不符合进 入模型的条件(判据)时,变量引入过程结束。 当希望比较多的变量留在判别函数中时使用向 前选择法。
判别函数的模型
SPSS通过判别分析,自动建立的判别函数 (组)为:
d i1 b01 b11 xi1 bp1 xip d i 2 b02 b12 xi1 bp 2 xip d ik b0 k b1k xi1 bpk xip
分析各个阶段应把握的原则
事前组别(类)的分类标准(作为判别分析的 因变量)要尽可能准确和可靠,否则会影响 判别函数的准确性,从而影响判别分析的 效果。 所分析的自变量应是因变量的重要影响因 素,应该挑选既有重要特性又有区别能力 的变量,达到以最少变量而有高辨别能力 的目标。 初始分析的数目不能太少。
判别分析的假定
预测变量服从正态分布。 预测变量之间没有显著的相关。 预测变量的平均值和方差不相关。 预测变量应是连续变量,因变量(类别或组 别)是间断变量。 两个预测变量之间的相关性在不同类中是 一样的。
判别分析的基本思想
判别分析方法是在处理问题时,通常要给出一个 判别函数,即衡量新样品与已知组别接近程度的 描述指标,同时也指定一种判别规则,用以判定 新样品的归属。 判别规则可以是统计性的,决定新样品所属类别 时用数理统计的显著检验,也可用确定性的。 决定样品归属时,只考虑判别函数值的大小。 判别分析就是要从中筛选出能够提供较多信息的 变量并建立判别函数,使得利用推导出来的判别 函数对观测量判别其所属类别时的错判率最小。
判别分析的含义
判别分析是用于判别样本所属类型的一种统 计方法,是应用性很强的一种多元统计方法。 它要解决的问题是在一些已知研究对象用某 种方法已分成若干类的情况下,确定新的观 察数据属于已知类别中的哪一类。 判别分析先根据已知类别的事物的性质(自变 量),利用某种技术建立函数式(自变量的线 性组合,即判别函数),然后对未知类别的新 事物进行判断以将之归入已知的类别中。
判别分析用统计模型的语言来描述就是, 设有m个类G1,G2,…,Gm,希望建立一 个准则,对给定的任意一个样本x,依据这 个准则就能判断它是来自哪个类别。 当然,应当要求这种准则在某种意义下是 最优的,例如,错判概率最小或错判损失 最小等。
SPSS对于分为m个类的研究对象,建立m 个线性判别函数。对于每个个体进行判别 时,把测试的各变量值代入判别函数,得 出判别得分,从而确定该个体属于哪一类。 或者计算属于各类别的概率,从而判断该 个体属于哪一类。 确定一个观测量属于哪一类,可以把该观 测量的各变量值代入每个判别函数,哪个 判别函数值大,该观测量就属于哪一类。
预测变量1 预测变量2 判别函数 (组)
……
预测变量 p
类别1 类别2 …… 类别n
公司 组织文化 研究问题 Microsof 80
领导角色 75
员工发展 90
Group 1
IBM 调查了15个公司的组织义化、领导角色和 85 90 90 1 Dell 85 60 1 员工发展385 个方面内容作为预测变量。 Apple 90 75 90 1 联想 因变量为公司对员工的吸引力 ,为符合研 99 78 80 1 NPP 88 89 90 2 究问题,将公司对员工的吸引力根据被试 79 95 97 3 北京电子 的实际填答情形 ,划分为高吸引力组 89 81 82 1 清华紫光 95 96=2)和低吸引 1 北大方正 (group=1)75 、中吸引力组 (group TCL 60 85 88 3 力组(group 79=3)。数据如下表所示。 50 51 2 娃哈哈 75 88 89 13 Angel 研究组织文化、领导角色和员工发展这 Hussar 60 89 90 3 个变量是否能够有效地区别公司对员工的 100 85 84 3 世纪飞扬 Vinda 61 89 60 3 吸引力,其区别的正确率如何 ?
判别函数的个数,为列别数-l和预测变量数 两个值之中的较小者。
判别函数的性能
判别分析得出的判别函数性能如何,可以通 过回代的方法进行验证。即对各观测量的变量 值代到线性判别函数中,根据判别函数值(判 别分数)确定每个观测量分别属于哪一类。然 后与原始数据中的分组变量值进行比较,得到 判错率。 判别函数的特征值(Eigenvalue)越大,表明该 函数越具有区别力。 表示判别函数分数与组别间的关联程度,典型 相关系数(Canonical Correlation) 。
向后选择法 是从把所有指定的变量建立一个全模型,每一 步把一个对模型的判断能力贡献最小的变量剔除出 模型,直到模型中的所有变量都符合留在模型中的 判据时,剔除变量工作结束。在希望较少的变量留 在判别函数中时使用向后选择法。 逐步选择法 是从模型中没有变量开始,每一步都要对模型 进行检验。在把模型外的对模型的判断能力贡献最 大的变量加入到模型中的同时,也考虑把已经在模 型中但又不符合留在模型的条件的变量剔除。因为 新变量的引入有可能使原来已经在模型中的变量对 模型的贡献变得不显著了,直到模型中的所有变量 都符合引入模型的判据,模型外的变量都不符合进 入模型的判据时,逐步选择变量的过程停止。
判别分析
根据相关的数据对所研究的对象进行分类 判别,例如,在经济学中,根据国民收入、 人均工农业产值、人均消费水平等多种指 标来判定一个国家的经济发展程度所属类 型;在人口学中,可以根据平均预期寿命、 经济水平、婴儿死亡率等因素来决定人的 死亡水平所属类别。这就是判别分析 (Discriminant Analysis)可解决的问题。
判别分析的种类
判别分析按判别的组数来分,有两组判别 分析和多组判别分析; 按区分不同总体所用的数学模型来分,有 线性判别和非线性判别; 按判别对所处理的变量方法不同有逐步判 别、序贯判别等。 判别分析可以从不同角度提出问题,因此 有不同的判别准则,如费歇尔(Fisher)准则 和贝叶斯(Bayes)准则。
建立判别函数的方法
全模型法 是把用户指定的变量全部放入判别函数中。 不管变量对判别函数是否起作用以及作用的大 小,当对反映对象特征的变量认识比较全面时 可以用此方法,该法也是SPSS默认的方法。 向前选择法 是从判别模型中没有变量开始,每一步把一 个对判别模型的判断能力贡献最大的变量引入 模型,直到没有被引入模型的变量都不符合进 入模型的条件(判据)时,变量引入过程结束。 当希望比较多的变量留在判别函数中时使用向 前选择法。
判别函数的模型
SPSS通过判别分析,自动建立的判别函数 (组)为:
d i1 b01 b11 xi1 bp1 xip d i 2 b02 b12 xi1 bp 2 xip d ik b0 k b1k xi1 bpk xip
分析各个阶段应把握的原则
事前组别(类)的分类标准(作为判别分析的 因变量)要尽可能准确和可靠,否则会影响 判别函数的准确性,从而影响判别分析的 效果。 所分析的自变量应是因变量的重要影响因 素,应该挑选既有重要特性又有区别能力 的变量,达到以最少变量而有高辨别能力 的目标。 初始分析的数目不能太少。
判别分析的假定
预测变量服从正态分布。 预测变量之间没有显著的相关。 预测变量的平均值和方差不相关。 预测变量应是连续变量,因变量(类别或组 别)是间断变量。 两个预测变量之间的相关性在不同类中是 一样的。
判别分析的基本思想
判别分析方法是在处理问题时,通常要给出一个 判别函数,即衡量新样品与已知组别接近程度的 描述指标,同时也指定一种判别规则,用以判定 新样品的归属。 判别规则可以是统计性的,决定新样品所属类别 时用数理统计的显著检验,也可用确定性的。 决定样品归属时,只考虑判别函数值的大小。 判别分析就是要从中筛选出能够提供较多信息的 变量并建立判别函数,使得利用推导出来的判别 函数对观测量判别其所属类别时的错判率最小。
判别分析的含义
判别分析是用于判别样本所属类型的一种统 计方法,是应用性很强的一种多元统计方法。 它要解决的问题是在一些已知研究对象用某 种方法已分成若干类的情况下,确定新的观 察数据属于已知类别中的哪一类。 判别分析先根据已知类别的事物的性质(自变 量),利用某种技术建立函数式(自变量的线 性组合,即判别函数),然后对未知类别的新 事物进行判断以将之归入已知的类别中。
判别分析用统计模型的语言来描述就是, 设有m个类G1,G2,…,Gm,希望建立一 个准则,对给定的任意一个样本x,依据这 个准则就能判断它是来自哪个类别。 当然,应当要求这种准则在某种意义下是 最优的,例如,错判概率最小或错判损失 最小等。
SPSS对于分为m个类的研究对象,建立m 个线性判别函数。对于每个个体进行判别 时,把测试的各变量值代入判别函数,得 出判别得分,从而确定该个体属于哪一类。 或者计算属于各类别的概率,从而判断该 个体属于哪一类。 确定一个观测量属于哪一类,可以把该观 测量的各变量值代入每个判别函数,哪个 判别函数值大,该观测量就属于哪一类。
预测变量1 预测变量2 判别函数 (组)
……
预测变量 p
类别1 类别2 …… 类别n
公司 组织文化 研究问题 Microsof 80
领导角色 75
员工发展 90
Group 1
IBM 调查了15个公司的组织义化、领导角色和 85 90 90 1 Dell 85 60 1 员工发展385 个方面内容作为预测变量。 Apple 90 75 90 1 联想 因变量为公司对员工的吸引力 ,为符合研 99 78 80 1 NPP 88 89 90 2 究问题,将公司对员工的吸引力根据被试 79 95 97 3 北京电子 的实际填答情形 ,划分为高吸引力组 89 81 82 1 清华紫光 95 96=2)和低吸引 1 北大方正 (group=1)75 、中吸引力组 (group TCL 60 85 88 3 力组(group 79=3)。数据如下表所示。 50 51 2 娃哈哈 75 88 89 13 Angel 研究组织文化、领导角色和员工发展这 Hussar 60 89 90 3 个变量是否能够有效地区别公司对员工的 100 85 84 3 世纪飞扬 Vinda 61 89 60 3 吸引力,其区别的正确率如何 ?
判别函数的个数,为列别数-l和预测变量数 两个值之中的较小者。
判别函数的性能
判别分析得出的判别函数性能如何,可以通 过回代的方法进行验证。即对各观测量的变量 值代到线性判别函数中,根据判别函数值(判 别分数)确定每个观测量分别属于哪一类。然 后与原始数据中的分组变量值进行比较,得到 判错率。 判别函数的特征值(Eigenvalue)越大,表明该 函数越具有区别力。 表示判别函数分数与组别间的关联程度,典型 相关系数(Canonical Correlation) 。