判别分析模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
下规则进行判别:
如果 d x, G1 d x, G2 则判 x G1 如果 d x, G1 d x, G2 则判 x G2 如果 d x, G d x, G 不判 1 2
点到点的距离,最熟悉的是欧氏距离。 但这里G1 , G2 都是 p 维随机变量总体而不是具体的点,对此,容易想到的解决办法 是:在 G1 , G2 中各找一个最具代表性的点,用样品点到代表点的距离定义样品点到相应 总体的距离。各总体的均值向量u1 , u 2 就是这样的代表点。 p 维总体的距离不合适。因为总 深入分析后会发现,欧氏距离用来度量p 维样品到 体各分量的量纲可能不同,导致距离的量纲比较复杂;最难以容忍的是距离的大小关系 可能与分量在各自量纲下所取的单位有关。
判别分析模型
在生产、科研和日常生活中经常会遇到需要作出判别的问题,这类问题往往是 由于我们对事物的了解还不够充分,问题尚可能存在几种不同结论的情况下提出 的。 例如一个病人经胸部透视发现肺部有阴影。大夫要依据这一症状以及阴影的大 小、阴影的部位、边缘是否光滑、是否咳嗽、是否有痰、是否低烧等项指标,对该 病人的病症作出判断。 肺结核、肺部肿瘤、肺癌这三种病,肺部都可能有阴影。但问题是这三种病的 症状并没有截然分明的界限。在没有获得进一步的确诊信息之前,寄希望于统计推 断方法对其作出尽量可靠的判断。处理这类问题就是判别分析。 又如,根据已有的气象信息 (如气温、气压、湿度、云图、风力、风速、风 向等)来判别明天是晴天还是阴天,是有雨还是无雨,也是这类问题
i
若 D x, G1 D x, G2 若 D x, G1 D x, G2 若 D x, G1 D x, G2
则判 则判 则不判
x G1 x G2
进行的判别,这种方法称为距离判别法。
贝叶斯判别法
设 m 个总体G1 ,, Gm ,其概率密度分别为 f1 x ,, f m x 。 根据历史数据(或经验) 给出这m 个总体各自出现的概率分别 为 q1 ,, q m ,这个概率分布叫先验分布。
m
m
j
达到最小。
x Ri x Gi 判别规则为:若样品 ,则判 .
Fiห้องสมุดไป่ตู้her 判别法
先将各总体向某个低维空间(譬如:二维平面)投影,使不同 总体的投影尽可能分散、 容易区分; 同一个总体的投影尽可能集中。 将来历不明的新样品x 也向该低维空间投影,然后用距离判别 法判别其归属。 不同的统计软件处理方法不同: SAS 软件是对每个总体建立判别函数,将新样品分别代入计算 判别函数值,哪个判别函数值大则判来自其对应的总体。 SPSS 软件是向某个二维平面投影,然后用距离判别法判别其 归属。
Gi 的样品错判 假定已量化了各种错判的损失大小, 将本该属于
到 G j 所造成的损失记为c j | i 寻求样品取值的范围的一个划分 R R1 R2 Rm ,使得 x 将一个来历不明的新样品 作出各种错判的总平均损失
m m m g R qi r i, R = qi c j | i P j | i, R = qi c j | i R f i x i 1 i 1 j 1 i 1 j 1
抽象概括地讲,判别分析的统计模型可以这样来 描述:有 m 个 p 维总体G1 ,, Gm ,分别服从一定的分 布,现在有一个新的样品 x x1 , , x p ,它可能来自 这 m 个总体中的某一个。问题是要依据该样品的p 项 指标,判别它最可能来自那一个总体。
距离判别法
G1 和 G2 的距离,分别记为 d x, G1 和 d x, G2 ,然后按如 解决方案是合理地定义x 到
无论是哪种判别法,在依据历史或样本资料确定 了判别规则后,为了能对该判别规则的可信度做到心 中有数,可以对这些历史或样本资料中的每一个有明
Gi 确归属的样品进行回代判别,即看原本属于
的样本
Gi . 根据其错判率大小来评 按规则是否仍能判它属于
价相应的判别规则。
Spss软件实现
1.银行职员级别的判别分析:spss 数据 :09-03 关注:数据格式、结果解读 2.冠心病的的判别分析:spss 数据 :冠心病的判别分析 关注:来历不明样品的判别
印度统计学家马哈拉偌比斯提出了用
D x, Gi ˆ
1
x i i 1 x i
i
作为样品 x 到总体Gi 的距离。
G 其中 i 和 分别是总体 的均值向量的协差阵。 G D x, Gi x 如此定义的距 离 称为 到总体 的马氏距离。 x G1 G2 取样品 到总体 和 的距离为马氏距离,并按规则