多个总体距离判别法(DOC)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多个总体距离判别法

及其应用

课程名:

年级:

专业:

姓名:

学号:

目录

一、摘要 (1)

二、引言 (1)

三、原理 (1)

3.1定义 (1)

3.2思想 (1)

3.3判别分析过程 (1)

四、具体应用 (3)

4.1判别分析在医学上的应用 (3)

4.2距离判别法在居民生活水平方面的应用 (9)

4.3判别分析软件的使用 (12)

五、参考文献 (14)

六、附录 (15)

一、 摘要

近年来随着信息化社会的进行,数据分析对我们来说日趋重要,为了对数据的分类进行判别,本文介绍了数据分类判别的一种方法:距离判别法。本文从多个总体距离判别法理论出发并结合例题详细介绍了多个总体距离判别法的在医学领域以及居民生活水平方面的应用,同时也简单介绍了spss 软件一般判别法的具体操作。

关键词: 距离判别法 判别分析 一般判别分析

二、 引言

随着科技的发展,判别分析在经济,医学等很多领域以及气候分类,农业区划,土地类型划分等有着重要的应用, 本文从多个总体距离判别分析理论出发,介绍了多个总体距离判别法在医学以及人民生活方面的应用,并介绍了spss 一般判别分析的应用。

三、 原理

3.1 定义

距离判别法:距离判别分析方法是判别样品所属类别的一应用性很强的多因素决方法,其中包括两个样本总体距离判别法,多个样本距离判别法。

多个总体距离判别法:多个总体距离判别法是距离判别法的一种,是两个总体距离判别法的推广,具有多个总体,将待测样本归为多个样本中的一类。 3.2 思想

计算待测样本与各总体之间的距离,将待测样本归为与其距离最进的一类。 3.3 判别分析过程

对于k 个总体k 21G G G ⋯,

,,假设其均值分别为:k 21u u u ,,,⋯,协方差阵

分别为:∑)

(i ,(其中i=1,2,…k ),待测样本为)

,,,(p 21x x x X ⋯= ,其中p 21x x x ,,,⋯为样本X 的p 个检测指标,假设X 的均值为)x ,x ,x (X p 21,⋯=,协

方差为∑

,判断X

属于哪个总体。

3.3.1 步骤:

从k 21G G G ⋯,

,,k 个总体中,取n 个样本,分别记为k 21G G G ⋯,,总体样本,再结合上面p 个指标,这k 个样本可以表述如下:

第j 个总体样本(j=1,2…k)

(1)当待测样本与各总体样本的均值相等时,即

∑)

(1 = ∑)(2……=∑)

(k =∑;

则相应的判别函数为:

)()](2

1[]G X D -)G ([21X W )()(1')()(j

2

j 2ij 'j i j i u u u u X X D -+-==∑-),(,)( (其中i,j=1,2…k,)G (X,D j 2表示X 与j G 的马氏距离);

判断准则:如果对所有i ≠j 有0W ij >成立,则i G X ∈,若存在i 和j 使得0W ij =成立,则待判。

当各样本总体的均值i u 和协方差阵∑未知时,可以从i G 中抽取

)

(n

)

(2)

(1X ,X i i i X ⋯,i=1,2…k;则i u 和∑)

(i 的无偏估计∑

^i ^u ,可以表示为:

∑===n j i j i i X n X

1

)

()

(^

1u (i=1,2…,k ) ∑∑=-=^1

n 1k i i S k (其中n=1+2+……+n ,)')((S )()

(1j )()(i i i n n

i i n X X X X --=∑=) (2)当各样本总体样本的均值不相等时,相应的判别函数为:

)u -(X ][V )'u -(X -)u -(X ][V 'u -X X W (i)-1(i)(j)(j)-1(j)(j)ji )()

(= 判别准则:若对所有i ≠j 有0W ij >则i G X ∈,若存在i 和j 使得0W ij =成立,则待判。

四、 具体应用

4.1 判别分析在医学上的应用

为了研究某地区人口死亡状况,已按某种方法将15个已知样品分为三类(如下表所示),指标及原始数据见下表,试建立判别函数并判定另外4个待判样品分别属于哪类。

我们假设两样本的协方差相等;

本题中变两个数p=6,三类总体各有5个样本,故n1=n2=n3=5; 利用Matlab 软件并结合Excel 表格进行下列计算(具体计算见附录) 4.1.1 计算各组的样本的均值为:

1X =(37.94 11.90 1.50 12.25 100.06 67.46)

2X =(39.54 11.50 2.94 27.83 151.02 66.05 )' 3X =(38.50 10.12 0.68 10.33 93.95 67.42)' 4.1.2 计算样本协方差:

∑=--=n

1k )

1(1)1()1(1)

1(k

1)'(*S X X X X )(

=

'*)(S 1

k )

2(2)

2()

2(2)

2(2∑=--=n

k

k

X X X X )(

=

')(*)(S

k )

3(2)

3()

3(2)

3(3∑=--=n

k k

X X X X

= 从而

222.23 197.45

22.06 204.82 216.83 -78.73 197.45 184.16 19.95 189.14 202.76 -72.48 22.06 19.95 2.31 20.64 22.12 -7.70 204.82 189.14 20.64 194.65 208.18 -74.58 216.83 202.76 22.12 208.18 223.65 -79.32 -78.73 -72.48

-7.70

-74.58 -79.32 29.09

相关文档
最新文档