判别分析简介
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
距离判别 线性判别 Fisher (属于确定性判别) 判别分析方法 非线性判别 典型判别 Bayes判别(属于概率性判别)
二、线性判别分析 最早提出合理的判别分析法者首推 R. A.Fisher (1936) ,Fisher 提出将线性判别函数用 于花卉分类上,将花卉的各种特征(如花瓣长与宽、花萼长于宽等)利用线性组合方法变成单 变量值,再以单值比较法来判别事物间的差别。 下面我们以两类判别为例说明线性判别分析。 设有两类样品,其分别含 n1 , n2 个样品,各测得 p 指标,观察值如下表所示。 变量 例号 分类
X1 x11 x21
X2 x12 x22
Xp
Y
1 1
1
ຫໍສະໝຸດ Baidu
x1 p
x2 p
2
n1
1
xn11
xn1 2
xn1 p
1
2
2
xn2 1
xn2 2
xn2 p
当Y1 Y2时, 若Y Y0 , 则X G1 , 否则X G2 当Y1 Y2时, 若Y Y0 , 则X G2 , 否则X G1 当Y Y , 待判 0
判别分析 一、判别分析的概念 判别分析是多变量统计分析中用于判别样品所属类型的一种统计分析方法。 它所要解决 的问题是在一些已知研究对象已经用某种方法分成若干类的情况下, 确定新的样品属于已知 类别中的哪一类。 判别分析在处理问题时, 通常要给出一个衡量新样品与已知类别接近程度 的描述统计模型,即判别函数,同时也需指定一种判别规则,借以判定新样品的归属。判别 分析主要分为 Fisher 判别和 Bayes 判别这两大类。 所谓判别分析法,就是在已知的分类之下,一旦遇到新的样品,可以利用此法选定一判 别标准,以判定将该新样品放置于哪个类中。换句话说,事先设有数个群体,此时,取数个 变量,作成适当的判别标准,即可辨别该群体的归属。 判别分析法用途很广,如动植物分类、医学疾病诊断、社区种类划分、气象区(或农业 气象区)划分、商品等级分类、职业能力分类,以及人类考古学上年代及人种分类等均可利 用。例如,在医学中,临床医师根据患者的主诉、体征及检查结果作出诊断,有时还需作鉴 别诊断或分型、分类的诊断;根据病人各种症状的严重程度预测病人的病症,或某些治疗方 法的疗效评估。又如环境污染程度的鉴定及环保措施、劳保措施的效果评估;流行病学中对 某些疾病的早期预报,疾病的病因学研究及影响因素的分析等。 判别分析的方法较多,我们主要介绍以下五中常用的方法:
于是, max max 2、计算判别界值
求得 ai 后,代入判别函数式即得判别函数。 求判别界值 Y0 :把类 1 、类 2 中各指标的均数分别代入判别函数式:
' Y1 a X 1 ' Y2 a X 2
然后以两均数的中点作为两类的界点:
Y0
Y1 Y2 2
3、建立判别标准
2 2
n1
设欲建立的线性判别函数( linear discriminatory function )为:
Y a1 X 1 a p X p aX '
其中 a (a1 , , a p ) , X ( X 1 , , X p ) 。使得该判别函数能根据指标 X 1 , , X p 之值区分 各样品应归属哪一类。式中, ai (i 1,2, , p) 称为判别系数。在判别函数式建立后,还需 求得临界值,作为判断的标准。 1、求 Fisher 线性判别函数 Fisher 判别准则要求各类之间的变异尽可能地大,而各类内部的变异尽可能地小,变 异用离均差平方和表示。用分离度 来表示即要求:
(Y Y )2 | Y1 Y2 | 或 1 2 2 Sp Sp
2 p
2 (n1 1) S12 (n2 1) S2 2 其中, S 为合并协方差矩阵, S , S12 和 S 2 为各组的协方差 n1 n2 2
2 p
矩阵。
Fisher 判别的目标是选择适当的 x 的线性组合, 使得均值 Y1 和 Y2 之间的分离度达到最
大。 定理:线性组合 Y aX ( X 1 X 2 ) S p X 对所有可能的线性系数向量 a ,使得 达
' ' 1
到最大,且最大值为 D ( X 1 X 2 ) S p ( X 1 X 2 ) 。
2 '
1
证明:
(Y1 Y2 )2 (a X 1 a X 2 )2 (ad )2 ,其中, d ( X 1 X 2 ) 。 2 Sp aS p a ' aS p a ' (ad )2 1 1 d 'S p d ( X 1 X 2 )' S p ( X1 X 2 ) D2 。 aS p a '