SPSS统计分析基础3

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应变量的方差不齐,有随自变量增加而加大的趋势。 由于不符合建立一般线性回归模型。应进行加权线 性回归。 2 计算权重变量 w=1/x2 3 加权线性回归操作步骤:
散点图示有直线趋势
图示 应变量的残差有随自变量增大而加大的趋 势。故应行加权线性回归。
Model Summabry, c
Model 1
本例中冠心病复发者参加体育锻炼的比例为1020冠心病复发者未参加体育锻炼的比例为1080二者比值为0208025无冠心病复发者参加体育锻炼的比例为62104596无冠心病复发者未参加体育锻炼的比例为42104404二者比值为05960404148参加体育锻炼者冠心病复发的or0251480169结论
Coe fficie na,tbs
UnstandardizeSdtandardized Coefficients Coefficients
Model
B Std. Error
1
(Constan-t.)172 1.051
年龄 40.951 4.808
Beta .949
t -.164 8.517
Sig. .874 .000
1
.813 20.968
Residual .233
6
.039
Total
1.046
7
a.Predictor s : (Constant), 年龄
b.Dependent Variable: 尿肌酐含量(m m ol/24h)
Sig. .004a
Coefficien a ts
UnstandardizS etdandardized CoefficientsCoefficients
决定系数r2
由自变量x解释的部分占y的百分数,例如
r2 =0.7403×0.7403=0.5408,
表明由自变量x解释的部分只占y的54.8%,还远未认清影响y 变异的其他因素,
三、计量资料常用统计分析
简单线性相关作图方法:Graphs→Scatter/Dot→Simple Scatter→ 单击“Define” →Y 轴输入“因变量”,X轴输入“自变量”→
a.Dependent Variable: LgG抗体水平
b.W eighted Leas t Squares Regression - W eighted by w
y= 40.951x - 0.172
三、计量资料常用统计分析
相关系数r
在P<0.05, 样本N较大的前提下,
︱r︱<0.4 弱相关 ︱r︱0.4~0.7 中度相关 ︱r︱>0.7 强相关
例 某研究生论文中 TsO最大与最小差与TsO标准差相关关系
Cor r elatio ns
TsO最 大
与 最 小 差 TsO标 准 差
TsO最 大 与 最 小 差 Pearson Correlation
1
.991**
Sig. (2-tailed)
.000
TsO标 准 差
N
107
107
Pearson Correlation
.991**
1
Sig. (2-tailed)
.000
N
107
107
**. Correlation is signif icant at the 0.01 level (2-tailed).
E m/ A m E m/ A m
二 3.0 尖 瓣 2.5 环 平 均 2.0
1.5
1.0
.5
10
20
30
40
Coefficien a ts
UnstandardizS etdandardized CoefficientsCoefficients
Model
B Std. Error Beta
t
1
(Con1s1ta0n.0t)60 4.095
26.875
lnx 15.685 1.289
.99012.169
a.Dependent Variable: ACTH(pmol/L)
OK →然后在图形编辑窗口编辑图形
简单线性回归方程计算方法:Analyze→Regression→Linear→选择 “自变量”及 “应变量” →Method默认为“Enter” →单 击“Statistics”→选取 “Estimates”、“Model fit”、“DurbinWatson” →单击“Continue” →再单击“Plots” →选择“* SRESID”作为Y轴,“DEPENDNT”作为X轴 →Continue→Option → 选择“Useprobality of F”, “Entre 0.05” → 选择:Includeconstantinequation” → Continue → OK
a.Dependent Variable: LgG抗体水平
b.W eighted Leas t Squares Regression - W eighted by w
上图为简单直线相关图,下表包含有回归方程中的a与b
三、计量资料常用统计分析
4 曲线回归
(1) 变量转换法

Model Summary
取“Estimates”、“Model fit”、“Durbin-Watson” →单
击“Continue” →再单击“Plots” →选择“*SRESID” 作
为Y轴,“DEPENDNT”作为X轴→Continue→OK
Model Summary
三、计量资料常用统计分析
Adjusted R
Model
R
R Square Square
1
.882(a)
.778
.740
a Predictors: (Constant), ÄêÁä
ANOVbA
Std. Error of the Estimate
.19696
Sum of
Model
Squares
1
R egres s ion.813
df Mean Square F
Residu2a3l 4.335
Tota1l 1801.562
df Mean Square F 111567.227148.086 3 78.112 4
a.Predictors: (Constant), lnx
b.Dependent Variable: ACTH(pm ol/L)
Sig. .001a
50
60
70
80
年龄 (岁)
三 3.0 尖 瓣 2.5 环
2.0
1.5
1.0
.5
0.0
10
20
30
40
50
60
70
80
年龄 (岁)
图示:某篇论文中年龄与左、右心室功能的相关关系 分别为r=-0.73, r=-0.71
正相关:0<r≤1 负相关:-1<r≤0 不相关:r=0
相关类型
线性回归的概念
Adjusted Std. Error of
R
R Square R Square the Es tim ate
.949a
.901
.888
8.99592
a.Predi ctors: (C ons tant), 年 龄
b.Dep endent Var ia ble: L gG抗 体 水 平
c. Weighted Leas t Squares Regres s ion - Weighted by w
b.Dep ende nt Variable: Lg G抗体水平
c.Weighted Least Squares Regression - Weighted by w
上图:模型拟合优度, R=0.949 中图:拟合模型有统计学意义
P<0.0001 下图:常数项a=-0.172;
回归系数=40.951
简单线性相关
应用条件
1 X、Y双变量均为正态分布的资料。 2 相关的变量应有内在联系。如年龄与体重,年龄与
身高有内在联系;而儿童身高与树高是伴随关系, 变量“时间”与身高及树高的潜在联系造成了身高
与 树高似有正相关关系的假象。 3 奇异值应剔除。 4 P>0.05时,r 无意义。P<0.05,如果r过小,相关 程度较低,例如r=0.20, r2=0.04,说明因变量中只有 4%的量与自变量相关。
简单线性回归
知道双变量相关后,可建立线性回归方程 Y=a+bX
例8-1
三、计量资料常用统计分析
SPSS统计方法
三、计量资料常用统计分析
1 首先按LINE做判断(线性、独立、正态、方差齐)
Analyze→Regression→Linear→选择“自变量”及 “应
变量” →Method默认为“Enter” →单 击”Statistics→选
.138
N
10
10
肺 活 量(L) Pearson Correlation .504
1
Sig. (2-tailed)
.138
N
10
10
结果:胸围与肺活量无相关关系。

某地一年级12名女大学生的体重与肺活量侧值如 表,二者是否直线相关?
体重 42 42 46 46 46 50 50 50 52 52 58 58

统计分析方法
● Correlate ● Bivariate ● 进入双变量 ● 选择相关分析指标
默认“Pearson” 默认“双尾检验” ● OK
Correlations
胸 围 ( cm)肺 活 量(L)
胸 围 ( cm)Pearson Correlation
1
.504
Sig. (2-tailed)
SPSS统计分析基础
3 简单线性相关与回归
三、计量资料常用统计分析
医学研究中经常要研究两个变量的关系问题,
如年龄与体重,血压与病死率等。在弄清两个变 量关系之后,可以从一个变量的数值去估计另一 个变量的数值,例如可根据前人研究“体重 (Kg)=年龄(周岁)×2+8” 对体重做出估计, 从而省去测量体重的麻烦。
Model
B Std. Error Beta
t
1
(Consta 1n .6t)62 .297
5.595
年龄
.139 .030
.882 4.579
Sig. .001 .004
a.Dependent Variable: 尿肌酐含量(mmol/24h)
结果:上图:模型的拟合优度良好, 相关系数 r=0.882 中图:模型的检验结果有统计学意义, p=0.004 下图:常数项及自变量均有统计学意义, 常数a=1.662, 回归系数0.139
Coe fficie na,tbs
UnstandardizeSdtandardized Coefficients Coefficients
Model
B Std. Error
1
(Constan-t.)172 1.051
年龄 40.951 4.808
Beta .949
t -.164 8.517
Sig. .874 .000
AdjusteSdtd. Error of
Model R R SquarR e Squatrhee Estimate
1
.990a .980
.974 8.83807
a.Predictors: (Constant), lnx
ANOVbA
Sum of
Model
Squares
1
Regr1e1s5s6io7n.227
Corr elations
QRS时 限 A ET- PET
QRS时 限 Pearson Correlation
1
.440**
Sig. (2-tailed)
.000
N
rrelation
.440**
1
Sig. (2-tailed)
.000
N
64
71
**. Correlation is significant at the 0.01 level (2-tailed).
.749**
1
Sig. (2-tailed)
.005
N
12
12
**. Correlation is significant at the 0.01 level (2-tailed).
上图为原始散点图及编辑后相关关系图 下表为相关关系分析结果:
P=0.005,r= 0.749, 强正相关
例 某研究生论文中 AET-PET与QRS相关
ANOVbA,c
Sum of
Model
Sq u ar es
1
Regres5s8i6o9n.963
df Mean Square F 1 5869.963 72.534
Sig. .000a
Residua6l47.412
8 80.927
Total 6517.375
9
a.Predictors: (Constan t), 年龄
Y=0.139X+1.662,即尿肌肝含量=0.139×年龄+1.662
注意:本图为以尿肌酐含量为横轴,学生化残差为纵轴的散点 图,用以观察残差是否有随应变量增大而改变的趋势, 也就是诊断应变量的独立性,本例残差较集中。否则, 应采用下述“加权的简单线性回归”方法。
加权的简单线性回归

1 首先绘制散点图,可见IgG水平与年龄呈直线相关。 2 拟合一般的线性回归模型,绘制残差散点图。发现
(Kg)
肺活 2.55 2.20 2.75 2.40 2.80 2.81 3.41 3.10 3.46 2.85 3.50 3.00
量(L)
Correlations
x
y
x
Pearson Correlation
1
.749**
Sig. (2-tailed)
.005
N
12
12
y
Pearson Correlation
相关文档
最新文档