spss实例 简单线性回归
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
作业12:简单线性回归
data1203-bird是25种鸟类动物的体重和骨骼重量,1进行体重和骨骼重的相关分析。
分析过程:
结果输出:
结论:用两种方法测得鸟类动物体重和骨骼重的相关性很好。
2,进行骨骼重(因变量)和体重(自变量)的回归分析,内容至少包括:回归方程,回归效果分析(R square、回归估计标准误、回归系数假设检验),回归分析前提条件的检验(Linearity、Homoscedasticity、Normality)。
分析过程:
结果输出:
描述性统计量;
结论:用两种方法测得鸟类动物体重和骨骼重的相关性很好。
Pearson r=0.999, R2=r2=0.997,也可以R2=SS R/SS Y=(SS Y−SS E)/SS Y=1−SS E/SS Y=0.997,即Y变量的99.7%变异可以被回归模型解释,越大说明回归效果越好,
回归估计标准误即s Y|X=4.2859,
回归方差分析,SSY=1570.312,DFY =n−1=24,SSR=1566.087,DFR=1,
SSE=4.225,DFE =n−2=23,
SSY=SSR +SSE,DFY =DFY+DFE,
p=P(F >8525)<0.001,说明估计的回归方程有意义,即β不等于0,
回归系数估计,β=20.323,se(β) =0.221,t =92.335,p=2P(t>92.335)<0.001,说明回归有意义,即β不等于0,
95% CI for β: β±t13,0.975∗ se(β) =(19.867,20.778)
因是单元回归,所以t2=F,
α=y(平均)−βx(平均)=−0.144,se(α) =0.089,t= −1.627,p=2P(t<−1.627)=0.117,说明截距可能等于0,
95% CI for α: α±t13,0.975∗se(α)=(−0.328,0.039)
估计的回归方式是:y=−0.144+20.323x
Linearity,Homoscedasticity、Normality检验过程:
对于nearity ,Homoscedasticity检验由于最小值和最大值差距太大,,效果并不明显。
但也可以看出数据分布在RES_1=0直线的周围。
正态性分布检验。
3,数据中有一种鸟的体重是0.02kg,该鸟骨骼重的平均数95%置信区间是?
鸟的体重是0.02kg,该鸟骨骼重的平均数95%置信区间是(-0.00063,0.01733)
4,假设有另一种鸟的体重是2kg,根据回归方程,该鸟的骨骼重是?
把y=2,代入y=−0.144+20.323x得:x=0.1055
data1204-mammals是25种哺乳类动物的体重和骨骼重量,
1,进行体重和骨骼重的相关分析。
分析过程;
结论:用两种方法测得体重和骨骼重的相关性很好
2,进行骨骼重(因变量)和体重(自变量)的回归分析,内容至少包括:回归方程,回归效果分析(R square、回归估计标准误、回归系数假设检验),回归分析前提条件的检验(Linearity、Homoscedasticity、Normality)
分析过程;
描述性统计量
体重和骨骼重的相关性很好
Pearson r=1, R2=r2=1,也可以R2=SS R/SS Y=(SS Y−SS E)/SS Y=1−SS E/SS Y=1,即Y变量的100%变异可以被回归模型解释,越大说明回归效果越好,
回归估计标准误即sY|X=6.2759,
回归方差分析,SS Y=,D FY =n−1=24,SS R=,D FR=1,
SS E=905.914,D FE =n−2=23,
SS Y=SS R +SS E,D FY =D FY+D FE ,
p=P(F >)<0.001,说明估计的回归方程有意义,即β不等于0,
回归系数估计,β=3.365,se(β) =0.004,t =935.68,p=2P(t>935.68)<0.001,说明回归有意义,即β不等于0,
95% CI for β: β±t13,0.975∗ se(β) =(3.357,3.372)
因是单元回归,所以t2=F,
α=y(平均)−βx(平均)=4.003,se(α) =1.282,t= 3.123,p=2P(t<3.123)=0.005,说明截距可能不等于0,
95% CI for α: α±t13,0.975∗se(α)=(1.352,6.655)
估计的回归方式是:y=4.003+3.365x
生成数据的描述性统计量
Linearity的前提条件检验:
Homoscedasticity的前提条件检验:
Normality的前提条件检验
3,数据中有一种哺乳动物的体重是20kg,骨骼重的平均数95%置信区间是?
哺乳动物的体重是20kg,骨骼重的平均数95%置信区间是(3.96998,5.54178)4,假设有另一种哺乳动物的体重是2kg,根据回归方程,该哺乳动物的骨骼重是?
把体重是2kg代入y=4.003+3.365x得x=-0.595kg。
该模型是错误的,主要原因在于有1782.00006000.0000极值的出现,影响了找整个数值拟合过程。