一元线性回归分析论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一元线性回归分析的应用
——以微生物生长与温度关系为例
摘要:一元线性回归预测法是分析一个因变量与一个自变量之间的线性关系的预测方法。应用最小二乘法确定直线,进而运用直线进行预测。本文运用一元线性回归分析的方法,构建模型并求出模型参数,对分析结果的显著性进行了假设检验,从而了微生物生长与温度间的关系。
关键词:一元线性回归分析;最小二乘法;假设检验;微生物;温度
回归分析是研究变量之间相关关系的统计学方法,它描述的是变量间不完全确定的关系。回归分析通过建立模型来研究变量间的这种关系,既可以用于分析和解释变量间的关系,又可用于预测和控制,进而广泛应用于自然科学、工程技术、经济管理等领域。本文尝试用一元线性回归分析方法为微生物生长与温度之间的关系建模,并对之后几年的情况进行分析和预测。
1 一元线性回归分析法原理
1.1 问题及其数学模型
一元线性回归分析主要应用于两个变量之间线性关系的研究,回归模型模型为εββ++=x Y 10,其中10,ββ为待定系数。实际问题中,通过观测得到n 组数据(X i ,Y i )(i=1,2,…,n ),它们满足模型i i i x y εββ++=10(i=1,2,…,n )并且通常假定E(εi )=0,V ar (εi )=σ2各εi 相互独立且服从正态分布。回归分析就是根据样本观
察值寻求10,ββ的估计10ˆ,ˆββ,对于给定x 值, 取x Y 10ˆˆ
ˆββ+=,作为x Y E 10)(ββ+=的估计,利用最小二乘法得到10,ββ的估计10ˆ
,ˆββ,其中
⎪⎪⎩
⎪
⎪⎨⎧⎪⎪⎭⎫
⎝⎛-⎪⎪⎭⎫ ⎝⎛-=-=∑
∑
==n i i n
i i i x n x xy n y x x y 1221110ˆˆˆβββ。
1.2 相关系数
上述回归方程存在一些计算相关系数。设L XX =∑
∑==-=-=n
i i n
i i def
xx x n x x x L 1
2
2
1
2
)(,称为关于X 的离
差平方和;L yy =2
1)(∑=-=n
i i y y S 总称为关于Y 的离差平方和,L xy =∑∑==-=-=n
i i n i i def
xx x n x x x L 1
2
2
12
)(1)(∑=-=n
i i y y S 总称为
关于X 与Y 的离差积和。
相关系数r =yy
xx xy n
i i
n i i
n
i i
i
L L L Y Y x x Y Y x x =
----=
∑∑∑===1
2
1
2
1
)
()()
)((ρ,0≤ | r |≤1。| r |=1时表示完全
线性相关,| r |=0时表示不存在线性相关;0< | r |≤0.3为微弱相关,0.3< | r |≤0.5时为低度相关,0.5< | r |≤0.8为显著相关,0.8< | r |≤1为高度相关。 1.3 样本统计量的假设检验
从总体中随机抽取一个样本,根据样本的数据导出的线性回归方程由于受到抽样误差的影响,所确定的变量之间的线性关系是否显著,以及按照这个模型用给定的自变量X 估计因变量Y 是否有效,必须通过显著性检验才可以作出结论,通常所用的检验方法是F 检验。
线性回归模型εββ++=x Y 10,),0(~2σεN 可知,当01=β时,就认为Y 与x 之
间不存在线性回归关系,故需检验如下假设:,0:10=βH 0:11≠βH ,2
1
)(∑=-=n
i i y y S 总=
2
1
2
1
)ˆ()ˆ(∑∑==-+-n
i i
n
i i i
y y
y
y
为总偏差平方和,令2
1
)ˆ(∑=-=
n
i i
y y
S 回,21
)ˆ(∑=-=
n
i i i
y
y
S 剩。当H 0为真时,取统计量)2,1(~)
2(--=
n F n S S F 剩回
,由给定显著性水平α,查表得
Fα(1,n-2),根据实验数据),(,),,(),,(2211n n y x y x y x 计算F 的值,若F > Fα(1,n-2)时,拒绝H 0,表明回归效果显著;若F ≤Fα(1,n-2),接受H 0,此时回归效果不显著。
2 一元回归分析法的应用
2.1 分析实例
某微生物的生长天数与当年三月上旬平均气温的数据如表1所示,分析三月上旬平均温度与微生物生长之间的关系。
表1 三月上旬温度与微生物生长天数的情况表
年份2001200220032004200520062007200820092010温度℃8.68.39.78.57.58.47.39.7 5.4 5.5天数3531445275
2.2 分析结果
将数据输入SPSS中进行运算,选择线性回归分析。分析结果如表2所示。自变量是“温度”,因变量是“微生物生长天数”。
表2 全回归模式
Model R R Square Adjusted R
Square Std,Error of the Estimate
计算=1
10.7710.5950.544 1.167
表2中R为相关系数,R Square为相关系数的平方,即判定系数用来判定线性回归的拟合程度,用自变量解释因变量的变异程度(所占比例);Adjusted R Square为调整后的判定系数,Std,Error of the Estimate为估计标准误差。
表3 方差分析表
Model Sum of Squares df Mean Square F Sig Regression16.003116.00311.4780.009 Residual10.8978 1.362
Total26.9009
由表3可以看出F值为11.748,显著性概率为0.009,表明回归极显著。