实验设计 第五讲_多元统计分析1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计 方 法
G1 G2 G3 G4 G5 G6 G7
G3 G4 G5 G6 G7 G8
G2 1 G3 3 2
G3 G4 8
第 五
G4 11 10 8
G5 10 2

G5 13 12 10 2
G6 8 12 14
G6 7 6 8 12 14 G7 6 5 7 9 11 3 G8 15 14 16 16 16 10 9
5.1 逐步回归分析(已经讲述)
第 五

多 元 统 计 分 析
广东工业大学环境科学与工程学院_____环境科学教研室
____
实 验 设 计 方 法
5.2 通径分析
第 五 讲
多 元 统 计 分 析
广东工业大学环境科学与工程学院_____环境科学教研室


1、通径分析的意义
设 计


____
通径分析将自变量对依变量的作用分解

1、系统聚类分析
验 设


A、最短距离法;

____
B、最长距离法;
C、中间距离法;

D、重心法; E、类平均法;
五 讲
F、可变类平均法; G、可变法;
多 元
H、离差平方和法; I、加权类平均法;
统 计 分

广东工业大学环境科学与工程学院_____环境科学教研室


1、系统聚类分析
设 计 方

法。

____
与基他多元统计方法相比,聚类分析方法比
较粗放,理论上尚不够完善,目前正处于发展阶 第
段。由于这种方法能解决许多实际问题,因此受 到人们的关注。
五 讲
动色态聚聚 类常类 、见、 概的最 率聚优聚类分类分割等析。、方图法论:聚系类统、聚信类息、聚模类糊、聚灰类、多元统
计 分 析
广东工业大学环境科学与工程学院_____环境科学教研室
作用对依变量产生的影响。
多 元




广东工业大学环境科学与工程学院_____环境科学教研室


3、通径系数的显著性检验
设 计


____
决定系数 R2

剩余系数
e 1 R2
五 讲 多





广东工业大学环境科学与工程学院_____环境科学教研室




4、数据变换
方 法
____
为了解决原始数据矩阵中各观测值因量纲
相似系数:性质越接近的样品相似系数越

接近于1,彼此无关的样品之间的相似系数则接 五
近于0。

距离系数:将每一个样品或数据看成m维空 多
间的一个点,距离较近的点归于一类,距离较
元 统
远的点归于不同的类。
计 分

广东工业大学环境科学与工程学院_____环境科学教研室

5.3 聚类分析
验 设

聚类分析是研究分类问题的一种多元统计方 方





第五讲

____

多元统计分析
五 讲
(12学时含6学时上机)
多 元 统 计 分 析
广东工业大学环境科学与工程学院_____环境科学教研室




学习本章内容的方法
方 法
____
由于多元统计分析的计算过程极为复杂,第

所以大家在了解其基本原理的基础上,重 讲
点是掌握其应用范围、对软件的正确使用、
多 元
类。
统 计


广东工业大学环境科学与工程学院_____环境科学教研室


1、系统聚类分析
设 计

基本术语:

____
类:G;

类中的元素:xi,xj ;
五 讲
xi,xj间的距离:dij;

类Gp与类Gq间的距离:Dpq;
元 统
类中对任意的xi,xj : dij<T。
计 分 析
广东工业大学环境科学与工程学院_____环境科学教研室
1、样本的归属:判别分析、聚类分析;
2、降低变量维数,将变量变成独立变量:
第 五
主成分分析、因子分析、典型相关分析; 讲
3、一个变量与多个变量之间的关系:多因 多
素方差分析、多元回归、多元相关、时间 序列。
元 统 计


广东工业大学环境科学与工程学院_____环境科学教研室
实 验 设 计 方 法
____

1、系统聚类分析
验 设


基本原理:从一批样本的多个观测值中,找 法
____
出能度量样本(变量)之间相似度的统计量:相
似系数或距离,构成相似距阵,按相似程度的大
第 五
小将样本 (变量)逐一归类,相似度高的聚到一 讲
个小分类单位,关系疏远的聚集到一个大的分类
单位,直到把所有样本(变量)都聚集到统一大

数据处理结果的分析。





广东工业大学环境科学与工程学院_____环境科学教研室

主要内容
验 设

1、逐步回归分析
方 法
____
2、通径分析
Biblioteka Baidu

3、聚类分析
五 讲
4、主成分分析

5、因子分析
元 统



广东工业大学环境科学与工程学院_____环境科学教研室


多元统计分析法分类
设 计


____
第 五
不同、大小相差悬殊而影响样本或变量间的相 讲
互可比性,引入数据变换的方法。
多 元 统 计 分 析
广东工业大学环境科学与工程学院_____环境科学教研室


常用的数据变换方法
设 计


____
(1)中心化变换 xi'j xij x j

(2)规格化变换
xi'j
(xij
min 1in
G7 7 9 11 3 G8 16 16 16 10 9
多 元
G9 2 10 12 6 5 14

D9,3 min(D1,3, D2,3 ) 2, D9,4 min(D1,4 , D2,4 ) 10, D9,5 min(D1,5, D2,5 ) 12
计 分
D9,6 min(D1,6 , D2,6 ) 6, D9,7 min(D1,7 , D2,7 ) 5, D9,8 min(D1,8, D2,8 ) 14
xij
)
/(max 1in
xij
min 1in
xij
)
五 讲
(3)标准化变换 xi'j (xij x j ) / S j

(4)对数变换 xi'j ln xij
元 统



广东工业大学环境科学与工程学院_____环境科学教研室

5、相似系数与距离系数
验 设


表达变量或样本间亲疏程度

____
维希特统一递推公式:
____


Dk2r p Dk2p q Dk2q Dk2q Dk2p Dk2q

多 元 统 计 分 析
广东工业大学环境科学与工程学院_____环境科学教研室
____
D(1) D(0)
1、系统聚类分析
实 验 设
系统聚类分析步聚的实例说明: 例8.4-1废水处理情况分类
为直接作用和间接作用,以揭示各自变量对 第

依变量的相对重要性。

通径分析比相关分析或回归分析更为精 多
确。





广东工业大学环境科学与工程学院_____环境科学教研室


2、通径系数的种类
设 计


____
直接通径系数:反映自变量对依变量的直接 第
作用大小。
五 讲
间接通径系数:一自变量通过另一自变量的
相关文档
最新文档