相关分析和一元线性回归分析SPSS报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用下面的数据做相关分析和一元线性回归分析:选用普通高等学校毕业生数和高等学校发表科技论文数量做相关分析和一元线性回归分析。
一、相关分析
1.作散点图
两相关变量的Pearson相关系数=0.0998,表示呈高度正相关;相关系数检验对应的概率P值=0.000,小于显著性水平0.05,应拒绝原假设(两变量之间不具有相关性),即毕业生人数好发表科技论文数之间的相关性显著。
3.求两变量之间的相关性
选择相关系数中的全部,点击确定:
呈
N 14 14
**. Correlation is significant at the 0.01 level (2-tailed).
注解: 两相关变量(普通高校毕业生数和发表论文数)的偏相关系数=0.998,呈正相关;对应的偏相关系数双侧检验p值0,小于显著性水平0.05,应拒绝原假设(两变量之间不具有相关性),即普通高校毕业生数与发表论文数之间相关性显著。
二、一元线性回归
从前面的相关分析可以看出普通高等学校毕业生数和高等学校发表科技论文数量呈高度正相关关系,所以,下面对这两个变量做一元线性回归分析。
1.建立回归方程
点击选项,选中使用F的概率,如上图所示。
点击继续,确定:
Variables Entered/Removed b
Model Variables
Entered
Variables
Removed Method
1 (篇)a. Enter
a. All requested variables entered.
b. Dependent Variable: (万人)
此图显示的是回归分析方法引入变量的方式。
Model Summary
Model R R Square Adjusted R
Square
Std. Error of the
Estimate
1 .998a.996 .996 11.707
a. Predictors: (Constant), (篇)
此图是回归方程的拟合优度检验。
注解:上图是回归方程的拟合优度检验。
第二列:两变量(被解释变量和解释变量)的相关系数R=0.998.
第三列:被解释变量(毕业人数)和解释变量(发表科技论文数)的判定系数=0.996是一元线性回归方程拟合优度检验的统计量;判定系数越接近1,说明回归方程对样本数据的拟合优度越高,被解释变量可以被模型解释的部分越多。
第四列:被解释变量(毕业人数)和解释变量(发表科技论文数)的调整判定系数=0.996。
这主要适用于多个解释变量的时候。
ANOVA b
Model Sum of Squares df Mean Square F Sig.
1 Regression 448318.664 1 448318.664 3271.335 .000a
Residual 1644.535 12 137.045
Total 449963.199 13
a. Predictors: (Constant), (篇)
b. Dependent Variable: (万人)
注解:回归方程的整体显著性检验—回归分析的方差分析
第二列:被解释变量(毕业人数)的总离差平方和=449963.199,被分解为两部分:回归平方和=448318.664;剩余平方和=1644.535.
F检验统计量的值=3271.335,对应概率的P值=0.000,小于显著性水平0.05,应拒绝回归方程显著性检验的原假设(回归系数与0不存在显著性差异),结论:回归系数不为0,被解释变量(毕业人数)与解释变量(发表科技论文数)的线性关系是显著的,可以建立线性模型。
Coefficients a
Model Unstandardized Coefficients
Standardized
Coefficients
t Sig.
B Std. Error Beta
1 (Constant) -316.259 14.029 -22.543 .000
(篇) .001 .000 .998 57.196 .000 a. Dependent Variable: (万人)
注解:回归方程的回归系数和常数项的估计值,以及回归系数的显著性检验。
第二列:常数项估计值=-316.259;回归系数估计值=0.001.
第三列:回归系数的标准误差=0.000
第四列:标准化回归系数=0.998.
第五、六列:回归系数T检验的t统计量值=57.196,对应的概率P 值=0.000,小于显著性水平0.05,拒绝原假设(回归系数与0不存
在显著性差异),结论:回归系数不为0,被解释变量(毕业人数)与解释变量(发表科技论文数)的线性关系是显著的。
于是,回归方程为:
=-316.259+0.001x
2.回归方程的进一步分析
(1)在统计量中选中误差条图的表征,水平百分之95.
点击继续,然后点击确定,输出每个非标准化回归系数的95%置信区间:
选中统计量中的描述性,点击继续,然后确定,输出变量的均值、标准差相关系数矩阵和单侧检验概率值:
Descriptive Statistics
Mean Std. Deviation N
(万人) 465.92 186.044 14
(篇) 932780.57 221459.019 14
Correlations
(万人) (篇)
Pearson Correlation (万人) 1.000 .998
(篇) .998 1.000
Sig. (1-tailed) (万人) . .000
(篇) .000 .
N (万人) 14 14
(篇) 14 14
(2)残差分析
Residuals Statistics a
Minimum Maximum Mean Std. Deviation N Predicted Value 137.72 707.16 465.92 185.704 14 Std. Predicted Value -1.767 1.299 .000 1.000 14
3.153 6.536
4.320 .995 14 Standard Error of Predicted
Value
Adjusted Predicted Value 139.53 713.78 466.40 185.620 14。