距离判别_
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节距离判别
距离判别
本节内容
距离判别的R 实现
3
两个总体的距离判别问题
2
距离最小判别准则
1
距离最小判别准则
距离判别的基本思想:样品和哪个总体距离最近,就判断它属于哪个总体。距离判别也称为直观判别法
如何定义观测到一个总体的距离?
问题
A
设p 维欧式空间中的两点
12(,,,)'
= p X X X X 12(,,,)'
= p Y Y Y Y 则欧式距离的定义为
222
11(,)()()
=-++- p p d X Y X Y X Y
用欧式距离衡量点到总体的距离会出现一定偏差。例如,量纲的变化就有可能影响欧式距离的计算结果
马氏距离
在企业评估中,根据企业的生产经营情况把企业分为优秀企业和一般企业两个类别。关于企业生产经营状况的指标有3个:
资金利润率=利润总额/资金占用总额
劳动生产率=总产值/职工平均人数
产品净值率=净产值/总产值
三个指标的均值向量和协方差矩阵见下页表格。现有两个企业,观测值分别为(7.8,39.1,9.6)和(8.1,34.2,6.9),问这两个企业应该属于哪一类?
“优秀”的企业,其经营状况和协方差矩阵如下:
变量
优秀企业
的均值向量
协方差矩阵
资金利润率13.568.3940.2421.41劳动生产率40.740.2454.5811.67产品净值率10.721.4111.677.90
现在有一个新的企业,其三个指标的值分别为(7.8,39.1,9.6),计算该企业到“优秀”企业这一总体的马氏距离
7.813.539.140.79.610.7X μ-⎡⎤⎢⎥-=-⎢⎥⎢⎥-⎣⎦[]1
(,)(μ)(μ)
68.3940.2421.41 5.75.7 1.6 1.140.2454.5811.67 1.63414.81221.4111.677.9 1.1D X G X X -'=-∑--⎡⎤⎡⎤
⎢⎥⎢⎥=----=⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦
这个判别规则的等价描述为:求新样品X 到G 1的距离与到G 2的距离之差,如果其值为正,X 属于G 2;否则X 属于G 1。 设有协方差矩阵∑相等的两个总体G 1和G 2,其均值分别是μ1和μ2,对于一个新的样品X ,要判断它来自哪个总体。
一般的想法是计算新样品X 到两个总体的马氏距离D 2(X ,G 1)和D 2(X ,G 2),并按照如下的判别规则进行判断
经过推导可以得到
2
2
12(,)(,)2()2()2()
''-=--=--=-D G D G W X X X μααX μX 121
()2
μ=μ+μ是两个总体均值的平均值αμμ-=-112()
Σ则判别规则可以表示为
12,()0,
()0
G W G W ∈≥⎧⎨
∈<⎩X X X X 如果如果
()
W X 称为距离判别的判别函数
现在将企业的经营状况分为“优秀”和“一般”两类,它们的协方差矩阵相等,已有的企业经营状况整体数据如下
变量
均值向量
协方差矩阵优秀一般
资金利润率13.5 5.468.3940.2421.41劳动生产率40.729.840.2454.5811.67产品净值率10.7 6.221.4111.677.90
123()0.605810.25362 1.8367918.7359W X x x x =-++-10.605817.80.2536239.1 1.836799.618.735964.08920
y =-⨯+⨯+⨯-=> 所以,该企业属于优秀企业
所以,该企业属于一般企业
20.605818.10.2536234.2 1.83679 6.918.735962.29560
y =-⨯+⨯+⨯-=-<
案例分析——距离判别的R实现
饮料公司为了降低成本,往往会在不同的地区设立加工工
厂。饮料公司将调制好的饮料原浆运送至加工工厂,这些
工厂按照一定的比例进行勾兑,就可以生产大量的饮料。
但由于各个工厂的加工条件不同,所生产的饮料可能存在
微小的差异。某果味饮料公司拥有两家加工工厂,现在有
一批饮料出现了质量问题,但饮料的标签已经丢失。现在
希望通过检验两种指标(甜度指标和颜色指标),来判断
该批饮料是由哪个工厂加工的。
从两家工厂抽取了25瓶饮料进行检测,记录其
甜度指标和颜色指标(为计算方便,均乘以一
定的倍数)在R中构建如下
classX1<-matrix(c(22,20,23,23,17,24,23,18,22,19,20,20,21,13,20,19,20,18,20,23,23,25,23,21,23, 6,14,9,1,8,9,13,18,16,18,17,31,9,13,14,18,11,17,7,6,23,9,5,12,7),ncol=2) classX2<-matrix(c(24,19,11,6,9,10,3,15,14,20,8,20,14,3,10,22,11,6,20,20,15,2,10,13,12,
38,36,43,60,32,17,17,56,43,8,46,62,36,12,51,22,30,30,61,43,48,53,43,19,4),ncol=2)
# 构建了两个25行2列的矩阵