医学统计学第五章线性回归

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

a Y bX
b
nX iYi X i Yi nX X i
2 i 2
l XY l XX
F检验:
F MS回 MS剩
H0:β=0
SS回 SS剩 /(n 2) ~ F (1, n 2)
当 时:
(


(b ) l XX b l XX t ~ t (n 2) SY X SY X

Enter 强迫进入 Stepwise 逐步回归 Remove 只出不进 Backward 向后剔除,只出不进 Forward 向前选择,只进不出
【Estimates】 输出有关回归 系数和相关测量 【Confidence interval】输 出回归系数95% 的置信区间 【Descriptives】 描述性统计量
体表 5.283 5.299 5.358 5.602 5.292 6.014 5.830 6.102 6.075 6.411
判断X和Y是否是线性相关的。
5.1 相关分析原理 1.直线相关: (1)两个变量均服从正态分布
Pearson简单相关分析
总体相关系数: 样本相关系数:
性质: r绝对值愈接近1,两个变量样本间的线性相关越密切 r绝对值越接近0,两个变量样本的线性相关越不密切
血压
5.3 回归分析原理
(反映了观测值 总的分散程度)
(回归平方和 ) 反映了回归值 的分散程度(由于线性影响引起的离散性) (剩余平方和) 反映了观测值偏离回归直线的程度(由于随机误差引起的离散性)
df总 n 1, df回 1 ,df剩 n 2
SS剩 SS剩 MS回 SS回 , MS剩 , SY . X (剩余标准差或标准估计误差) n2 n2
决定系数 R2=SS回/SS总=1-SS剩/SS总 0≤R2≤1,越接近于1,回归效果越好。 临床:R2≥0.7就认为回归效果不错 高精度医药实验研究: R2 >0.9
R2= r2 一元线性回归方程中:
校正决定系数
2 RC 1-MS剩/MS总
SS剩 (n 1) n 1 2 =1 1 (1 R ) SS总 (n m 1) n m 1
相关系数的检验
原假设 则: ( × )
(2)如果不服从正态分布,则应考虑变量变换,或采用 等级相关来分析。


Spearman等级相关
Kendall
等级相关
注:列联表可用“Crosstabs 过程 ”中的“Contingency Coefficie 计算Pearson列联相关系数
2.曲线相关:两变量存在相关趋势,但非线性,而是呈某种可能的 曲线趋势。一般都先将变量变换,再将趋势变换为直 线来分析,或者采用曲线回归方法来分析。
结果输出和讨论:
D e s c ri p t i v e St a t i s t i cs Mean 63.8333 118.3333 Std. Deviation 10.14292 24.73986 N 12 12
体重 血压
分析:左图给出了体重和 血压的平均值、标准差和 样本数目。
C o r r el a t i o n s 体重 体重 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 1 12 -.112 .728 12 血压 -.112 .728 12 1 12
Model 1
(Constant) 体重
t 5.616 6.542
Sig. .001 .000
a. Dependent Variable: 体表
分析:非标准化系数

t统计量分别为5.616和6.542,其P值分别为0.001和 0.000,均小于0.005,有显著性意义。 其回归方程为
多元线性回归分析
Coefficientsa Unstandardized Coefficients B Std. Error 2.655 .473 .229 .035 Standardized Coefficients Beta .918 95% Confidence Interval for B Lower Bound Upper Bound 1.565 3.745 .148 .309
实现步骤: 1. 将数据录入SPSS并整理加工 定义变量 weight:体重; 输入数据 pressure:血压; 保存
保存为:“体重与血压.sav”
2.正态性检验:Analyze | Descriptive Statistics | Explore(探索性)
T e s t s o f N o r ma l i t y Kolmogorov-Smirnova Shapiro-Wilk Statistic df Sig. Statistic df .160 12 .200* .946 12 .140 12 .200* .932 12 Sig. .573 .397
D e s c ri p t i v e St a t i s t i cs Mean 5.7266 13.4400 Std. Deviation .41418 1.66346 N 10 10
体表 体重
分析:给出了体表和体重的均数和标准差情况。
C o r r el a t i o n s Pearson Correlation Sig. (1-tailed) N 体表 体重 体表 体重 体表 体重 体表 1.000 .918 . .000 10 10 体重 .918 1.000 .000 . 10 10
研究在线性相关条件下,两个或两个以上自 变量对一个因变量的数量变化关系,称为多元线 性回归分析。
ˆ y b0 b1 x1 b2 x2 b0 ,b1 , bk
bk xk
是偏回归系数
多元线性回归模型是一元线性回归模型的扩展, 其基本原理与一元线性回归模型类似,在计算上 更为复杂,一般需借助计算机来完成。
做体表Y关于体重X的回归方程。 做散点图 实现步骤: 1. 将数据录入SPSS并整理加工 定义变量 输入数据 保存 建立回归方程并检验
x:体重;
y:体表;
保存为:“体重与体表.sav”
菜单“Graphs”|“Legacy Dialogs”|“Scatter/Dot” 点击 “simple scatter” 命令,点击“Define”按钮。 2.利用Scatter/Dot命令做散点图
体重 血压 *. This is a lower bound of the true significance. a. Lilliefors Significance Correction
可以认为体重值、血压值服从正态分布。
3.相关分析过程 菜单 “Analyze” | “Correlate ” | “Bivariate ”命令
分析:R=0.918(即相关系数r),决定系数 R 0.843
2
校正的决定系数为0.823,估计值的标准误差为0.17434
ANOVAb Model 1 Sum of Squares 1.301 .243 1.544 df 1 8 9 Mean Square 1.301 .030 F 42.798 Sig. .000a
将“体重[x]”变量 选入“X Axis”框, 将“体表[y]”选入“Y Axis”框中,点击 “OK”按钮输出结果。
(2)正态性检验:Analyze | Descriptive Statistics | Explore(探索性)
T e s t s o f N o r ma l i t y Kolmogorov-Smirnova Shapiro-Wilk Statistic df Sig. Statistic df .213 10 .200* .886 10 Sig. .153
越接近于1,回归效果越好。
例 测某地10名三岁儿童的体重X(kg)与体表面 积Y(10-1m2),
体重
11.0 11.8 12.0 12.3 13.Fra Baidu bibliotek 13.7 14.4 14.9 15.2 16.0
体表 5.283 5.299 5.358 5.602 5.292 6.014 5.830 6.102 6.075 6.411
5.2 Bivariate过程
例 某次体检中抽取12名学生的体重和血压,现通过相 关分析过程来观测学生的体重与血压是否相关?
体重
血压
68
95
48
98
56
87
60
96
83
110
56
155
62
135
59
128
77
113
58
168
目的:检验 问题: 两变量数据是否服从正态分布? (需提前进行) 否 是
Pearson相关分析 数据转换或进行等级相关分析
分析:此表给出了体重和体表的相关系数阵和P值。
b V a r ia b l e s En t e r e d /R e m o v e d
Model Method 1 . Enter a. All requested variables entered. b. Dependent Variable: 体表
Variables Entered 体重a
Variables Removed
M o d el S u m m ar yb Model R R Square 1 .918a .843 a. Predictors: (Constant), 体重 b. Dependent Variable: 体表 Adjusted R Square .823 Std. Error of the Estimate .17434
体表 *. This is a lower bound of the true significance. a. Lilliefors Significance Correction
3.Regression过程 菜单 “Analyze” | “Regression ” | “linear ”命令
将“体表[y]”选入 【Dependent框】; 将“体重[x]”选入 【Independent(s) 框】中, 点击 “Statistics”按 钮
第五章
线性相关与线性回归分析
5.1 一元相关与回归 1. 相关分析原理
2. Bivariate过程
3. 回归分析原理 4. Regression过程 5.2 多元回归方程 5.3 logistic回归
例 测某地10名三岁儿童的体重X(kg)与体表面积Y (10-1m2),
体重
11.0 11.8 12.0 12.3 13.1 13.7 14.4 14.9 15.2 16.0
Regression Residual Total
a. Predictors: (Constant), 体重 b. Dependent Variable: 体表
分析:可见回归平方和 SS回为1.301,剩余平方和 SS剩 为0.243,F=42.798,P=0.000<0.05, 拒绝原假设,认 为是线性相关的,即回归方程有意义。
【Variables框】用于选 入需要进行相关分析的 变量,至少需要选入两个。
【Correlation Coefficients 复选框组】用于选择需要 计算的相关分析指标。
【Flag significant correlations】用于确定是否在结果中用星号 标记有统计学意义的相关系数,一般选中。此时P<0.05的系数 值旁会标记一个星号,P<0.01的则标记两个星号。
将“体重[weight]”、“血压[pressure]”点入 “Variables”框,点击“Options”按钮。
【Options钮】弹出 Options对话框,选择需 要计算的描述统计量和 统计分析:
选择“Means and standard deviations”,点击 “Continue”返回上一层对话框。 点击“OK”按钮
2 R 【Model fit】输出复相关系数R,其平方 R ,校正决定系数 c
2
和标准差,以及方差分析表。
选择“Estimates”、 “Confidence interval”、“Model fit”、 “Descriptives” ,点击“continue”返回。
点击“OK”按钮输出结果
结果输出和讨论:
相关文档
最新文档