多因素分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14 23.37 6.0 4.31 6.3 25.64 29 30.69 1.5 22.06 8.1 5.18
15 20.81 7.0 3.46 7.1 32.26 30 29.39 3.0 20.56 7.5 6.12
3
根据样本得到的回归方程
Yˆ b0 b1 x1 b2 X 2 bk x k
所建立的回归方程进行比较,从而选出一 个“最优”的回归方程。
10
评价指标:
1 残差平方和与决定系数
R2 SSR 1 SSE
SST
SST
残差平方和越小越好,R2越大越好
11
2 残差均方与调整确定系数
Ra 2
R2
百度文库
p(1 R2 ) n p 1
MS E
SSE n p 1
考虑了引入变量的个数p
5 19.49 4.0 2.83 7.3 42.82 20 25.93 6.0 7.21 8.9 15.92
6 24.38 6.0 6.86 7.3 22.76 21 26.99 12.0 8.75 7.0 15.34
7 19.03 2.9 3.22 7.7 31.00 22 25.71 7.0 13.07 13.5 8.05
11 23.82 8.0 8.47 9.1 18.94 26 27.46 16.0 19.44 6.5 8.89
12 22.86 20.0 9.92 8.1 16.08 27 27.99 10.0 17.33 6.1 14.10
13 24.49 12.0 6.01 7.0 29.50 28 28.41 2.0 14.59 6.8 11.74
• 多因素的分析更加切合实际;提高回归方程的 估计精度;从多个可能的因素中选择真正有意 义的因素
4
• 偏回归系数的计算:最小二乘原理 • 假设检验:偏回归系数检验-t检验
模型整体检验-方差分析 • 前提条件:线性、独立性、正态性、方
差相等,LINE
SPSS操作步骤
• 分析→回归→线性→因变量:Y;自变量:x1-x4 →ok
30名糖尿病患者脂联素ADI(Y,ng/ml)与体重指数BMI(x1,kg/m2)、病程 (x2,year)、 瘦素LEP(x3,ng/ml)、空腹血糖FPG(x4,mmol/L)关系分析
Obs x1 x2 x3 x4 y
Obs
x1 x2 x3 x4
y
1 24.22 10.0 5.75 13.6 29.36 16 24.14 5.0 10.21 7.4 16.01
是不是每个自变量的偏回归系数均有统计学 意义呢?t检验
N为个体数,k为自变量个数 并不是每个自变量都有意
ti
bi sbi
~ t(nk 1)
义!,在alpha=0.05,x1 x2 x4三个
变量没有统计学意义
自变量筛选常用方法
All possible subsets selection 最优子集回归,全局择优法
多因素分析
多元线性回归 Logistic回归
生存分析
第一部分 多元线性回归
• 简单线性回归只考虑一个X对Y的影响;多元线性回 归(multiple linear regression)考虑多个自变量X对Y 的影响
• 此时要考虑: 1. Y是否满足LINE 2.所建回归方程是否有意义:AVOVA 3.回归方程中的每个自变量是否都有意义:t检验 4.如何获得变量最少,解释Y变异又较多的方程? 筛选变量方法
average decrease in Y of 1.030ng/ml.
方程的假设检验
整个模型的假设检验: 方差分析法 (ANOVA)
H0 : 1 2 3 4 0
F=17.000,P<0.001,拒绝H0,以下模型是有意义的.
Yˆ 58.1991.030X1 0.131X2 0.811X3 0.579X4
Stepwise selection include 逐步回归法
◦ forward selection 前向选择 ◦ backward elimination 后向选择 ◦ stepwise regression 逐步选择
由于变量之间是有关联的,因此并不是简单 地将三个变量从方程中去除!
9
一 最优子集法 最优子集法是对自变量各种不同的组合
• 偏回归系数 partial regression coefficient 表示在其他自变量固定条件下,某自变量每 增减一个单位对y的平均效应影响。
• 标准化偏回归系数(standardized ~) ,表示 在其他自变量固定条件下,某自变量每增减 一个标准单位,y改变的平均标准单位数。其 大小反映了该自变量的重要性
2 24.22 3.0 9.32 6.2 14.31 17 26.45 4.0 19.31 5.1 19.03
3 19.03 15.0 2.50 11.1 26.08 18 25.22 2.3 8.65 7.6 17.46
4 23.39 3.0 5.66 9.7 19.62 19 27.22 3.0 8.54 8.6 20.36
8 21.11 9.0 4.90 6.0 17.28 23 28.41 4.0 8.90 13.5 12.31
9 23.32 5.0 3.54 6.7 30.25 24 26.39 4.0 23.26 8.2 5.59
10 24.34 2.0 4.51 7.2 24.28 25 28.73 10.0 19.05 6.9 8.59
Yˆ 58.1991.030X1 0.131X2 0.811X3 0.579X4
体重指数
病程
瘦素 空腹血糖
-1.030意思为在x2、x3、x4为给定值的情况下,体重指数每增加一个单
位,脂联素平均减少1.030 (ng/ml)
For a given x2,x3,x4, each 1kg/m2 increase in x1 is associated with an
12
3 Cp统计量( Cp statistic)
• 由Mallows CL.提出。
Cp
(n
p 1)[ ( MS残 )p ( MS残 )all
1]
p1
当p个自变量拟合的方程理论上“最优”时,Cp
的期望值为p+1,因此应选择Cp越接近于p+1