距离判别_

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二节距离判别

距离判别

本节内容

距离判别的R 实现

3

两个总体的距离判别问题

2

距离最小判别准则

1

距离最小判别准则

距离判别的基本思想:样品和哪个总体距离最近,就判断它属于哪个总体。距离判别也称为直观判别法

如何定义观测到一个总体的距离?

问题

A

设p 维欧式空间中的两点

12(,,,)'

= p X X X X 12(,,,)'

= p Y Y Y Y 则欧式距离的定义为

222

11(,)()()

=-++- p p d X Y X Y X Y

用欧式距离衡量点到总体的距离会出现一定偏差。例如,量纲的变化就有可能影响欧式距离的计算结果

马氏距离

在企业评估中,根据企业的生产经营情况把企业分为优秀企业和一般企业两个类别。关于企业生产经营状况的指标有3个:

资金利润率=利润总额/资金占用总额

劳动生产率=总产值/职工平均人数

产品净值率=净产值/总产值

三个指标的均值向量和协方差矩阵见下页表格。现有两个企业,观测值分别为(7.8,39.1,9.6)和(8.1,34.2,6.9),问这两个企业应该属于哪一类?

“优秀”的企业,其经营状况和协方差矩阵如下:

变量

优秀企业

的均值向量

协方差矩阵

资金利润率13.568.3940.2421.41劳动生产率40.740.2454.5811.67产品净值率10.721.4111.677.90

现在有一个新的企业,其三个指标的值分别为(7.8,39.1,9.6),计算该企业到“优秀”企业这一总体的马氏距离

7.813.539.140.79.610.7X μ-⎡⎤⎢⎥-=-⎢⎥⎢⎥-⎣⎦[]1

(,)(μ)(μ)

68.3940.2421.41 5.75.7 1.6 1.140.2454.5811.67 1.63414.81221.4111.677.9 1.1D X G X X -'=-∑--⎡⎤⎡⎤

⎢⎥⎢⎥=----=⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦

这个判别规则的等价描述为:求新样品X 到G 1的距离与到G 2的距离之差,如果其值为正,X 属于G 2;否则X 属于G 1。 设有协方差矩阵∑相等的两个总体G 1和G 2,其均值分别是μ1和μ2,对于一个新的样品X ,要判断它来自哪个总体。

一般的想法是计算新样品X 到两个总体的马氏距离D 2(X ,G 1)和D 2(X ,G 2),并按照如下的判别规则进行判断

经过推导可以得到

2

2

12(,)(,)2()2()2()

''-=--=--=-D G D G W X X X μααX μX 121

()2

μ=μ+μ是两个总体均值的平均值αμμ-=-112()

Σ则判别规则可以表示为

12,()0,

()0

G W G W ∈≥⎧⎨

∈<⎩X X X X 如果如果

()

W X 称为距离判别的判别函数

现在将企业的经营状况分为“优秀”和“一般”两类,它们的协方差矩阵相等,已有的企业经营状况整体数据如下

变量

均值向量

协方差矩阵优秀一般

资金利润率13.5 5.468.3940.2421.41劳动生产率40.729.840.2454.5811.67产品净值率10.7 6.221.4111.677.90

123()0.605810.25362 1.8367918.7359W X x x x =-++-10.605817.80.2536239.1 1.836799.618.735964.08920

y =-⨯+⨯+⨯-=> 所以,该企业属于优秀企业

所以,该企业属于一般企业

20.605818.10.2536234.2 1.83679 6.918.735962.29560

y =-⨯+⨯+⨯-=-<

案例分析——距离判别的R实现

饮料公司为了降低成本,往往会在不同的地区设立加工工

厂。饮料公司将调制好的饮料原浆运送至加工工厂,这些

工厂按照一定的比例进行勾兑,就可以生产大量的饮料。

但由于各个工厂的加工条件不同,所生产的饮料可能存在

微小的差异。某果味饮料公司拥有两家加工工厂,现在有

一批饮料出现了质量问题,但饮料的标签已经丢失。现在

希望通过检验两种指标(甜度指标和颜色指标),来判断

该批饮料是由哪个工厂加工的。

从两家工厂抽取了25瓶饮料进行检测,记录其

甜度指标和颜色指标(为计算方便,均乘以一

定的倍数)在R中构建如下

classX1<-matrix(c(22,20,23,23,17,24,23,18,22,19,20,20,21,13,20,19,20,18,20,23,23,25,23,21,23, 6,14,9,1,8,9,13,18,16,18,17,31,9,13,14,18,11,17,7,6,23,9,5,12,7),ncol=2) classX2<-matrix(c(24,19,11,6,9,10,3,15,14,20,8,20,14,3,10,22,11,6,20,20,15,2,10,13,12,

38,36,43,60,32,17,17,56,43,8,46,62,36,12,51,22,30,30,61,43,48,53,43,19,4),ncol=2)

# 构建了两个25行2列的矩阵

相关文档
最新文档