多重分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(n 2 p)
( n p 1)( MS 残 ) p ( n 2 p ) ( MS 残 ) m
C p 接近 ( p 1) 的模型为最佳
(二) AIC准则的计算公式
1973年由日本学者赤池提出 AIC nln[(n p)/ nSy2.12 p]2p (最小二乘法 ) AIC越小越好
应用以上准则如何选择模型?
求出所有可能的回归模型 (共有2m-1个)对应的准则 值;按上述准则选择最优模 型
多元回归分析数据格式
第一节 多元线性回归 一、回归模型简介
(一)多元线性回归模型的一般形式
(二)多元线性回归分析的一般步骤
二、多元线性回归方程的建立
各变量的离差矩阵
各变量的离差矩阵
建立多元回归方程
三、多元线性回归方程的 假设检验及其评价
(一)回归方程的方差分析 (所有回归系数为0)
t j bj Sbj bj (SY,12...m Cj ),
n m1;
Cj (XX)1对应于X j的对角线元素
(二)标准化回归系数
bj bj
llYjjYbj
ljj/n (1) lYY/n (1)
bj
Sj SY
(三)偏回归平方和(sum of squares for partial regression)及其F检验
多变量分析
多重线性回归(Multiple linear regression ) 多元线性回归(Multivariable linear regression ) Logistic回归(Logistic regression) Cox回归(Cox regression) 主成分分析(principle component analysis) 因子分析(factor analysis) 聚类分析(Cluster Analysis ) 判别分析(Discriminant Analysis)
5.94327 0.14245 0.35147 -0.27059 0.63820
2.82859 0.36565 0.20420 0.12139 0.24326
2.10 0.39 1.72 -2.23 2.62
0.0473 0.7006 0.0993 0.0363 0.0155
0 0.07758 0.30931 -0.33948 0.39774
(一)各回归系数的t检验
Parameter Standard
Standardized
Variable DF Estimate
Error t Value Pr > |t| Estimate
变量 自由度 回归系数 标准误 t值
P值 标准化回归系数
Intercept 22
X1
22
X2
22
X3
22
X4
22
❖ 当因变量个数大于1时称为多重回归
多元线性回归分析 (Mulit variable linear regession)
❖ 人的体重与身高、胸围
❖ 血压值与年龄、性别、劳动强度、饮食习惯、吸 烟状况、家族史
❖ 糖尿病人的血糖与胰岛素、糖化血红蛋白、血清 总胆固醇、甘油三脂
❖ 射频治疗仪定向治疗脑肿瘤过程中,脑皮质的毁 损半径与辐射的温度、与照射的时间
多元线性回归分析
❖ 多元线性回归分析是研究多个变量之间关系的回 归分析方法, 按因变量和自变量的数量对应关系可 划分为一个因变量对多个自变量的回归分析(简称 为“一对多”回归分析)及多个因变量对多个自变 量的回归分析(简称为“多对多”回归分析), 按回 归模型类型可划分为线性回归分析和非线性回归 分析。
(YYˆ)2 /(nm1)
SS残(nm1) MS残
4.03822.0095
反映了回归方程的精度,其值越小说明回归 效果越好
2.决定系数 ( determination coefficient)
R2 SS回 1 SS残
SS总
SS总
133.7107=1 88.84120.6008 222.5519 222.5519
说明所有自变量能解释Y变化的百分比。取 值(0,1),越接ple correlation coefficient)
R R2 0.60080.7751
➢说明所有自变量与Y间的线性相关程度。
即➢如观果察只值有Y一与个估自计变值量,Yˆ之此时间的R相|r关| 程度。
➢校正决定系数(考虑了自变量的个数) ➢Cp准则(C即criterion,p为所选模型中变 量的个数;Cp接近(p+1)模型为最优) ➢AIC(Akaike’s Information Criterion)准则; AIC越小越好
校正决定系数( Adjusted determination coefficient)
H 0:j 0 ; H 1:j 0
FjSS残 回 SS(nS回 m S( j1));11;2nm1
实例计算
第二节 自变量的选择
1. 变量多增加了模型的复杂度 2. 计算量增大 3. 估计和预测的精度下降 4. 模型应用费用增加
一、全局择优法
根据一些准则(criterion)建立 “最优”回归模 型
Rc2
1(1R2)
n1
S 1
S残/(n1p)
(n1)p
S S总/ (n1)
=1-M残 S=1 88.841/2220.5282 M总 S 22.5251/296
Rc2 R2,考虑了自变量个数响 的影
(一) Cp准则的计算公式
1964 年 CL Mallows 提出
Cp
( SS 残 ) p ( MS 残 ) m
有关计算公式
(二)有关评价指标
软件有关结果
Root MSE (残差标准差)
2.00954
R-Square (决定系数)
0.6008
Adj R-Sq (校正决定系数) 0.5282
Dependent Mean 应变量的均值=11.92593
1.残差标准差( Root MSE )
SY,12..m.

4.校正决定系数( Adjusted determination coefficient)
Rc2
1(1R2)
n1
S 1
S残/(n1p)
(n1)p
S S总/ (n1)
=1-M残 S=1 88.841/2220.5282 M总 S 22.5251/296
Rc2 R2,考虑了自变量个数响 的影
四、各自变量贡献大小的 假设检验及其评价
相关文档
最新文档