判别分析解读 PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
判别分析
Discriminant Analysis
流行病与卫生统计学系
• 聚类分析:对(样本)总体进行分类 • 判别分析:对(样本)个体进行分类
判别与聚类
• 聚类分析可以对样本/指标进行分类,判别分析 只对样本进行分类。
• 聚类分析事先 不知道事物的类别,也不知道应 分几类;判别分析必须事先知道事物的类别, 也知道应分几类。
• 在农林害虫预报中,根据以往的虫情,多种气 象因子来判别一个月后的虫情是大发生,中发 生或正常
• 在体育运动中,判别某游泳运动员是适合练蛙 泳,仰泳还是自由泳
• 在医疗诊断中,根据某人多种检验指标来判断 此人是某病患者还是非患者
判别分析--诊断
• 临床诊断: • 急腹症的患者,需要诊断患病原因。 • 诊断阑尾炎时需要与其他急腹症作鉴别诊断;
• 聚类分析不需要分类的历史资料,能直接对样 本进行分类;判别分析需要历史资料去建立判 别函数,然后才能对样本进行分类。
• 判别分析:根据判别对象若干个指 标的观测结果判定其应属于哪一类 的统计学方法。
应用
• 在经济学中,根据人均国民收入,人均工农业 产值,人均消费水平等多个指标来判定一个国 家的经济发展程度所属等级
以p=q=k=2 来说明Fisher判别分析法的基本原理和计算方法
根据Fisher判别分析法的基本原理,就是要选择一组 适当的系数 c 1 , c 2 ,…, c k ,使得类间差异D最大 且类内差异V最小,即,使得下式的值 Q 达到最大。
根据多元函数求极值的原理和方法,使得 Q 取最大 值的点是Q 的一阶偏导函数等于0的方程组的解。 令上述方程组的解是: 那么,Fisher判别函数估计式是:
该类。 • 适合于多类的判别分析。
第二节 Fisher判别分析法
1. 建立Fisher判别函数 2. 假设A和B为分类明确的两类症状。在总体A中
观察了p 例,在总体B中观察了q 例,每一例记 录了k个指标,它们是 x1,x2,…,xk。令y是这 k个指标的一个线性函数,即,
其中,c 1 ,c 2 , …,c k 是待估计的未知系数。 称这个线性函数是Fisher判别函数。
大家有疑问的,可以询问和交流
可以互相讨论下,但要小声点
第一节 判别分析的基本思想
• 判别分析(discriminant analysis) :根据 一批分类明确的样本在若干指标上的观 察值,建立一个关于指标的判别函数和 判别准则,然后根据这个判别函数和判 别准则对新的样本进行分类,并且根据 回代判别的准确率评估它的实用性。
再假设g个总体均服从k 元正态分布,则对于任意一个样 本 x* = ( x 1 *, x 2 *, …, x k *),它属于类 s 的事后概率是:
其中
2. 建立Bayes判别准则 3. 将每一个点 x 判别到事后概率最大的类中。 3. 估计各项指标对判别函数的作用 4. 一元方差分析:检验每一个指标变量是否对判别
Bayes判别的基本思想
• E.g. 急性肠梗阻的鉴别诊断
第三节 Bayes判别分析法
1. 建立Bayes判别函数 2. 假设 x = ( x 1 , x 2 ,…, x k )出现在第 i 类中的事
前概率是 p i ,i =1,2,…, g,它可以是理论值,也 可以是经验值。当样本是随机抽样得到的,事前 概率可以取样本估计值,即,
• Bayes判别法是以概率论中Bayes条件概 率公式为基础导出的判别法。Warner HR 等在1961年首先把它成功底应用于鉴别 先天性心脏病,他们利用50个症候,鉴 别33种先天性心脏病,借助于计算机, 共试验36例,结果由计算机得出的判别 结果与三位有经验的心脏病专家通过生 理学研究和外科检查的诊断结论一致。
• 判别函数(discriminant function):指的是 一个关于指标变量的函数。每一个样本在 指标变量上的观察值代入判别函数后可以 得到一个确定的函数值。
• 判别准则(discriminant rule):对样本的判 别函数值进行分类的法则。
判别分析的内容
• 建立判别准则:
• 建立判别函数:其原则是,将所有样本按其判 别函数值的大小和事先规定的判别原则分到不 同的组里后,能使得分组结果与原样本归属最 吻合。
确诊为阑尾炎后,还需要诊断属何种类型,如 是否并发腹膜炎,是否穿孔等。 • 放射学诊断 • 病理学诊断
什么是判别分析?
分类明确的数据
y = f ( x1, x2 ,…, xk )
病人
x1,x2,…,xky(Fra bibliotek1)正常人
x1,x2,…,xk
y
(n2)
计算机疾病辅助诊断原理
以一批正常人和一批已经确诊的病人为样本, 收集他们的各项检验指标,如化验指标、X线、 心脑电图、超声波、CT等诊断指标,然后利用 这批分类明确的样本在这些相同指标上的观察 值,建立一个关于指标的判别判函数和判别准 则(区分病人和正常人的界限的方法),使得按此 准则来判断这批样本归属的正确率达到最高。 这就是计算机疾病辅助诊断方法,它的的理论 依据就是判别分析方法原理。
2. 建立Fisher判别准则 3. 令判别临界点是:
设y* 是某个样本的判别函数值,则, Fisher判别准则是:
如果 y* < y0,则 y* ∈B类 如果 y* > y0,则 y* ∈A类
3. 估计各项指标对判别函数的贡献率
对贡献率很小的指标可以剔除,重新建立 只含有重要指标的判别函数。
第三节 Bayes判别分析法
• 回代样本:即计算出每一个样本的判别函数值, 并根据判别准则将样本归类。
• 估计回代的错误率:即比较新的分组结果和原 分组结果的差别,并以此确定判别函数的效能;
• 判别新的样本:如果判别函数效能较高,可用 以对新样本进行归类判别。
判别分析的方法
• Fisher判别分析法 • 采用Fisher判别准则: • 它使得类间点的距离最大,而类内点的距离最小。 • 适合于两类的判别分析。 • Bayes判别分析法 • 采用Bayes判别准则: • 它使得每一类中的每个样本都以最大的概率进入
函数的判别能力有显著性意义。
5. 多元方差分析:检验所有指标变量是否联合对判 别函数的判别能力有显著性意义。
Discriminant Analysis
流行病与卫生统计学系
• 聚类分析:对(样本)总体进行分类 • 判别分析:对(样本)个体进行分类
判别与聚类
• 聚类分析可以对样本/指标进行分类,判别分析 只对样本进行分类。
• 聚类分析事先 不知道事物的类别,也不知道应 分几类;判别分析必须事先知道事物的类别, 也知道应分几类。
• 在农林害虫预报中,根据以往的虫情,多种气 象因子来判别一个月后的虫情是大发生,中发 生或正常
• 在体育运动中,判别某游泳运动员是适合练蛙 泳,仰泳还是自由泳
• 在医疗诊断中,根据某人多种检验指标来判断 此人是某病患者还是非患者
判别分析--诊断
• 临床诊断: • 急腹症的患者,需要诊断患病原因。 • 诊断阑尾炎时需要与其他急腹症作鉴别诊断;
• 聚类分析不需要分类的历史资料,能直接对样 本进行分类;判别分析需要历史资料去建立判 别函数,然后才能对样本进行分类。
• 判别分析:根据判别对象若干个指 标的观测结果判定其应属于哪一类 的统计学方法。
应用
• 在经济学中,根据人均国民收入,人均工农业 产值,人均消费水平等多个指标来判定一个国 家的经济发展程度所属等级
以p=q=k=2 来说明Fisher判别分析法的基本原理和计算方法
根据Fisher判别分析法的基本原理,就是要选择一组 适当的系数 c 1 , c 2 ,…, c k ,使得类间差异D最大 且类内差异V最小,即,使得下式的值 Q 达到最大。
根据多元函数求极值的原理和方法,使得 Q 取最大 值的点是Q 的一阶偏导函数等于0的方程组的解。 令上述方程组的解是: 那么,Fisher判别函数估计式是:
该类。 • 适合于多类的判别分析。
第二节 Fisher判别分析法
1. 建立Fisher判别函数 2. 假设A和B为分类明确的两类症状。在总体A中
观察了p 例,在总体B中观察了q 例,每一例记 录了k个指标,它们是 x1,x2,…,xk。令y是这 k个指标的一个线性函数,即,
其中,c 1 ,c 2 , …,c k 是待估计的未知系数。 称这个线性函数是Fisher判别函数。
大家有疑问的,可以询问和交流
可以互相讨论下,但要小声点
第一节 判别分析的基本思想
• 判别分析(discriminant analysis) :根据 一批分类明确的样本在若干指标上的观 察值,建立一个关于指标的判别函数和 判别准则,然后根据这个判别函数和判 别准则对新的样本进行分类,并且根据 回代判别的准确率评估它的实用性。
再假设g个总体均服从k 元正态分布,则对于任意一个样 本 x* = ( x 1 *, x 2 *, …, x k *),它属于类 s 的事后概率是:
其中
2. 建立Bayes判别准则 3. 将每一个点 x 判别到事后概率最大的类中。 3. 估计各项指标对判别函数的作用 4. 一元方差分析:检验每一个指标变量是否对判别
Bayes判别的基本思想
• E.g. 急性肠梗阻的鉴别诊断
第三节 Bayes判别分析法
1. 建立Bayes判别函数 2. 假设 x = ( x 1 , x 2 ,…, x k )出现在第 i 类中的事
前概率是 p i ,i =1,2,…, g,它可以是理论值,也 可以是经验值。当样本是随机抽样得到的,事前 概率可以取样本估计值,即,
• Bayes判别法是以概率论中Bayes条件概 率公式为基础导出的判别法。Warner HR 等在1961年首先把它成功底应用于鉴别 先天性心脏病,他们利用50个症候,鉴 别33种先天性心脏病,借助于计算机, 共试验36例,结果由计算机得出的判别 结果与三位有经验的心脏病专家通过生 理学研究和外科检查的诊断结论一致。
• 判别函数(discriminant function):指的是 一个关于指标变量的函数。每一个样本在 指标变量上的观察值代入判别函数后可以 得到一个确定的函数值。
• 判别准则(discriminant rule):对样本的判 别函数值进行分类的法则。
判别分析的内容
• 建立判别准则:
• 建立判别函数:其原则是,将所有样本按其判 别函数值的大小和事先规定的判别原则分到不 同的组里后,能使得分组结果与原样本归属最 吻合。
确诊为阑尾炎后,还需要诊断属何种类型,如 是否并发腹膜炎,是否穿孔等。 • 放射学诊断 • 病理学诊断
什么是判别分析?
分类明确的数据
y = f ( x1, x2 ,…, xk )
病人
x1,x2,…,xky(Fra bibliotek1)正常人
x1,x2,…,xk
y
(n2)
计算机疾病辅助诊断原理
以一批正常人和一批已经确诊的病人为样本, 收集他们的各项检验指标,如化验指标、X线、 心脑电图、超声波、CT等诊断指标,然后利用 这批分类明确的样本在这些相同指标上的观察 值,建立一个关于指标的判别判函数和判别准 则(区分病人和正常人的界限的方法),使得按此 准则来判断这批样本归属的正确率达到最高。 这就是计算机疾病辅助诊断方法,它的的理论 依据就是判别分析方法原理。
2. 建立Fisher判别准则 3. 令判别临界点是:
设y* 是某个样本的判别函数值,则, Fisher判别准则是:
如果 y* < y0,则 y* ∈B类 如果 y* > y0,则 y* ∈A类
3. 估计各项指标对判别函数的贡献率
对贡献率很小的指标可以剔除,重新建立 只含有重要指标的判别函数。
第三节 Bayes判别分析法
• 回代样本:即计算出每一个样本的判别函数值, 并根据判别准则将样本归类。
• 估计回代的错误率:即比较新的分组结果和原 分组结果的差别,并以此确定判别函数的效能;
• 判别新的样本:如果判别函数效能较高,可用 以对新样本进行归类判别。
判别分析的方法
• Fisher判别分析法 • 采用Fisher判别准则: • 它使得类间点的距离最大,而类内点的距离最小。 • 适合于两类的判别分析。 • Bayes判别分析法 • 采用Bayes判别准则: • 它使得每一类中的每个样本都以最大的概率进入
函数的判别能力有显著性意义。
5. 多元方差分析:检验所有指标变量是否联合对判 别函数的判别能力有显著性意义。