spss 双变量回归与相关
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
表2 某省1995年到1999年居民死因构成与WYPLL构成
死因类别
例2
某省调查了1995年
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
到1999年当地居民18
类死因的构成以及每
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
(二)直线相关与秩相关
2017年6月22日星期四8时38分27秒
2.统计分析 (1)散点图
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
(2)直线回归
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
操作提示 左侧列表框 DEPENDNT ZRESID ADJPRED SDRESID ZPRED DRESID SRESID Scatter Previous Next X Y Standardized Residual Plots Histogram Normal probability Produces all partial plots 列出 7 个变量名 因变量 标准化残差 调节预测值 学生化剔除残差 标准化预测值 剔除残差 学生化残差 绘制散点图 上一组坐标的变量名 下一组坐标的变量名 输入变量名,作为图形的 X 轴 输入变量名,作为图形的 Y 轴 绘制标准残差图 直方图 正态 P-P 图 绘制出模型中每一个自变量与应变量残差的散点图
(三)曲线拟合
例3 以不同剂量的标准促肾上腺皮质激素释放因子CRF(nmol/L)刺激离 体培养的大鼠垂体前叶细胞,监测其垂体合成分泌肾上腺皮质激素 ACTH的 量(pmol/L)。根据表3中得的5对数据建立CRF-ACTH工作曲线。
1.建立数据文件同前
表3 标准CRF刺激大鼠垂体 前叶细胞分泌ACTH测定结果
WYPLL构成(%) Y 0.05 0.34 0.93 0.69 0.38 0.79 1.19 4.74 2.31 5.95 1.11 3.53 3.48 5.65 33.95 17.16 8.42 9.33
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
结果如下:
ANOVAb Model 1 Sum of Squares .813 .233 1.046 df 1 6 7 Mean Square .813 .039 F 20.968 Sig. .004a
Regression Residual Total
a. Predict ors: (Cons tant), 年龄 b. Dep enden tV ariable: 尿肌酐
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
操作提示 Predicted Values Unstandardized Standardized Adjusted S.E of mean predictions Residuals Unstandardized Standardized Studentized Delected Studentized Delected Prediction Intervals Mean Individual Confidence Interval: 设置预测值选项 应变量原始预测值 标准化后的预测值,预测值的均数为 0,标准差为 1 不考虑当前记录,当前模型对该记录应变量的预测值 预测值的标准差 设置残差选项,用于模型诊断 原始残差 标准化后的残差,均数为 0,标准差为 1 采用 t 变换产生的残差,即学生化残差 不考虑当前记录, 当前模型对该记录应变量的预测值对观察值的 原始残差,即剔除残差,可发现可疑的强影响点 学生化剔除残差 设置预测区间 条件均数的置信区间 个体 y 值的容许区间 设置置信度,默认 95%
种死因导致的潜在工 作损失年数WYPLL的
构成,结果见表2。
以死因构成为X, WYPLL构成为Y,作等
级相关分析。
死因构成(%) X 0.03 0.14 0.20 0.43 0.44 0.45 0.47 0.65 0.95 0.96 2.44 2.69 3.07 7.78 9.82 18.93 22.59 27.96
操作提示 Dependent Independent Method Selection Variable 定义回归分析的应变量,只能选一个。在左侧框内单击应变量 名,其前面的小三角符号变成黑色(即被激活) ,单击选入 定义回归分析的自变量。用法同上 选择自变量的入选方式,默认的是 Enter( 即强行进入法 )。本 章自变量只有一个,就选择 Enter 法 当只分析某变量符合一定条件的记录时,选入该变量,并用右 侧的 Rule 键建立选择条件。 它和我们在分析前利用 Data 菜单中 Select Case 选择记录的功能是一样的 Case Labels WLS Weight 选择一个变量,它的取值将作为每条记录的标签 进行加权最小二乘法的回归分析
SPSS双变量回归与相关
河北医科大学公共卫生学院 卫生统计学教研组
内容
1 2
直线回归
直线相关与秩相关
曲线拟合
3
2017年6月22日星期四8时38分27秒
(一)直线回归
例1 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表1。
估计尿肌酐含量(Y)对其年龄(X)的回归方程。 表1 编号 8名正常儿童的年龄(岁)与尿肌酐含量(mmol/24h) 1 2 3 4 5 6 7 8
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
操作提示 Include constant in equation Missing values Exclude cases listwise Exclude cases pairwise Replace with mean 模型中是否包含常数项,默认选择 设置缺失值的处理方式 凡是有缺失值的记录不分析 多元回归中,不分析进入模型变量有缺失的记录 用该变量的均数来替代缺失值
编号
1 2
X
0.005 0.050
Y
34.11 57.99
3Fra Baidu bibliotek
4 5
0.500
5.000 25.000
94.49
128.50 169.98
2017年6月22日星期四8时38分27秒
2.统计分析 (1)散点图(同前)
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
2017年6月22日星期四8时38分27秒
操作提示 Distances Mahalanobis Cook’s Leverage values Influence Statistics DfBeta(s) Standardized DfBeta(s) DfFit Standardized DfFit Covariance ratio Save to new file Coefficient statistics Produces all partial plots 设置测量数据点离拟合模型的距离指标 马哈拉诺夫距离,所示的是观察值距样本平均值的距离 表示不考虑该记录,模型残差发生的变化。若 Cook’s 距离大于 1, 该记录可能为影响点 杠杆值。测量数据点的影响强度,若值大于 2*P/N(P 为变量数,N 为 样本含量) ,该记录可能为影响点 设置诊断影响点的统计量选项 Difference in Beta 的缩写,表示不考虑该观察值后回归系数的变化值 标准化的 DfBeta ,当它大于 2/Sqrt(N) 时,该点可能是强影响点 Difference in fit value 的缩写, 表示不考虑该观察值后预测值的变化值 标准化的 DfFit 值,当它大于 2/Sqrt(N) 时,该点可能是强影响点 在多重回归中表示不考虑该观察值后 协方差矩阵与含该观察值协方差 矩阵的比率。它的绝对值大于 3*P/N 时,该点可能为强影响点 保存结果到新文件,默认在当前数据集中生成新的变量 可以将新变量存到新的 SPSS 数据文件中 绘制出模型中每一个自变量与应变量残差的散点图
2017年6月22日星期四8时38分27秒
残差的独立性检验
2017年6月22日星期四8时38分27秒
操作提示 Regression Coefficients Estimates 设置回归系数选项 输出回归系数 及其标准误,t 值,P 值,标准化回归系数 , 默认选项 Confident Intervals Covariance matrix Model fit 输出回归系数的 95%置信区间 多重回归中输出各个自变量的相关矩阵和方差、协方差矩阵 输出进入、 退出模型的变量列表, 并给出有关拟合优度的检验: 相关系数 R,决定系数 R2,和调整的 R2,标准误及方差分析表, 默认选项 Descriptives Residuals 输出变量的描述统计量,如有效记录数、均数、标准差等。在 多重回归中,还给出一个自变量的相关矩阵 设置残差选项
2017年6月22日星期四8时38分27秒
操作提示 Variable 选入进行相关分析的两个变量。 如果选入多个, 会以矩阵的形式给 出两两直线相关的分析结果 Correlation Coefficients Pearson Kendall’s tau -b 设置相关分析指标 进行积差相关分析,即常用的相关分析,是默认选项 Kendall’s 相关系数,用于反映分类变量一致性的指标,只能在两 个变量均为有序分类时使用 Spearman Test of significance One-tailed Two-tailed Flag significant correlations Spearman 相关系数 设置相关系数检验的单双侧 单侧 双侧 在结果中用星号标记有统计学意义的相关系数,默认选项。 “ *”表 示 P 0.05 的系数, “**”表示 P 0.01 的系数
2017年6月22日星期四8时38分27秒
操作提示 Dependent Independent Variable Time Models Linear Quadratic Compound Growth Logarithmic 选入曲线回归分析的应变量,可以选入多个,如果这样则 对各个应变量分别拟合模型 曲线回归分析的自变量 选入普通的自变量 选择时间作为自变量,数据为时间序列数据格式 曲线拟合的模型。根据两变量散点图显示的曲线趋势,选择 适宜的拟合模型,是该对话框的重点 拟合直线方程,与 Linear 过程的直线回归相同
年龄X 尿肌酐含量Y
13 3.54
11 3.01
9 3.09
6 2.48
8 2.56
10 3.36
12 3.18
7 2.65
2017年6月22日星期四8时38分27秒
1.建立数据文件 取两个变量: X变量(本例为“年龄”)、 Y变量(本例为“尿肌酐含量”)
2017年6月22日星期四8时38分27秒