统计学第九章相关与回归分析教学指导与习题解答
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章相关与回归分析
Ⅰ. 学习目的和要求
本章所要学习的相关与回归分析是经济统计分析中最常重要的统计方法之一。具体要求:1.掌握有关相关与回归分析的基本概念;2.掌握单相关系数的计算与检验的方法,理解标准的一元线性回归模型,能够对模型进行估计和检验并利用模型进行预测;3.理解标准的多元线性回归模型,掌握估计、检验的基本方法和预测的基本公式,理解复相关系数和偏相关系数及其与单相关系数的区别;4.了解常用的非线性函数的特点,掌握常用的非线性函数线性变换与估计方法,理解相关指数的意义;5.能够应用Excel软件进行相关与回归分析。
Ⅱ. 课程内容要点
第一节相关与回归分析的基本概念
一、函数关系与相关关系
当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,这种关系称为确定性的函数关系。当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但仍按某种规律在一定的范围内变化。这种关系,称为具有不确定性的相关关系。变量之间的函数关系和相关关系,在一定条件下是可以互相转化的。
116
117
二、相关关系的种类
按相关的程度可分为完全相关、不完全相关和不相关。按相关的方向可分为正相关和负相关。按相关的形式可分为线性相关和非线性相关。按所研究的变量多少可分为单相关、复相关和偏相关。
三、相关分析与回归分析
相关分析是用一个指标来表明现象间相互依存关系的密切程度。回归分析是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。
通过相关与回归分析虽然可以从数量上反映现象之间的联系形式及其密切程度,但是无法准确地判断现象内在联系的有无,也无法单独以此来确定何种现象为因,何种现象为果。只有以实质性科学理论为指导,并结合实际经验进行分析研究,才能正确判断事物的内在联系和因果关系。 四、相关图
相关图又称散点图。它是以直角坐标系的横轴代表变量X ,纵轴代表变量Y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形。
第二节 简单线性相关与回归分析
一、相关系数及其检验 (一)相关系数的定义 总体相关系数的定义式是:γ =
)
()(),(Y Var X Var Y X Cov
样本相关系数的定义公式是:
∑∑--∑--=2
2)
()())((Y Y X X Y Y X X r t t t t
样本相关系数是总体相关系数的一致估计量。 (二)相关系数的特点
1.r的取值介于-1与1之间。
118
2.当r=0时,X与Y的样本观测值之间没有线性关系。
3.在大多数情况下,0<|r|<1,即X与Y的样本观测值之间存在着一定的线性关系,当r>0时,X与Y为正相关,当r<0时,X与Y为负相关。
4.如果|r|=1,则表明X与Y完全线性相关,当r=1时,称为完全正相关,而r=-1时,称为完全负相关。
5.r是对变量之间线性相关关系的度量。r=0只是表明两个变量之间不存在线性关系,它并不意味着X与Y之间不存在其他类型的关系。
(三)相关系数的计算公式:
∑∑-∑∑-∑∑∑-=
)
)(())((2222t t t t t
t t t Y Y n X X n Y X Y X n r
(四)相关系数的检验
对总体相关系数是否等于0进行检验: 首先,计算相关系数r的t值:t=
2
12r n r --
其次,根据给定的显著性水平和自由度(n-2),查找t分布表中相应的临界值tα/2。若|t|≥tα/2,表明r在统计上是显著的。 若|t|≤tα/2,表明r在统计上是不显著的。
二、标准的一元线性回归模型 (一)总体回归函数
Yt =β1+β2Xt +u t
式中的β1和β2是未知的参数,又叫回归系数。Yt 和Xt 分别是Y和X的第t个观测值。u t 是随机误差项。
(二)样本回归函数
t
t
e X Y ++=2
1
ˆˆββ (t=1,2,...n) (7.9)
式中et 称为残差,在概念上,et 与总体误差项u t 相互对应;n是样本
的容量。
样本回归函数与总体回归函数之间的区别。1.总体回归线是未知的,它只有一条。而样本回归线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归线。2.总体回归函数中的β1和β2是未知的参数,表现
为常数。而样本回归函数中的1
ˆβ
和2
ˆβ是随机变量。3.总体回归函数中的u t
119
是Yt 与未知的总体回归线之间的纵向距离,它是不可直接观测的。而样本回归函数中的et 是Yt 与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算出et 的具体数值。 (三)误差项的标准假定
假定1:误差项的期望值为0,即E(u t )=0;
假定2:误差项的方差为常数,即Var(u t )=E(2t u )=2
σ 假定3:误差项之间不存在序列相关关系,其协方差为零,即当t≠s时有:Cov(u t u s )=E(u t u s )=0
假定4:自变量是给定的变量,与随机误差项线性无关。 假定5:随机误差项服从正态分布。
满足以上标准假定的一元线性模型,称为标准的一元线性回归模型。
三、一元线性回归模型的估计 (一)回归系数的点估计
最小二乘法是通过使残差平方和为最小来估计回归系数的一种方法。 利用最小二乘法可得正规方程组:
∑=∑+t
t
Y X n 2
1
ˆˆββ
∑=∑+∑t
t t t Y X X X 221ˆˆββ 求解这一方程组可得:
∑∑-∑∑∑-=2
22
)(ˆt t t t t t X X n Y X Y X n β ∑∑-=-=X Y n X n Y t t 221ˆˆˆβββ (二)总体方差的估计
σ2的无偏估计S 2
=2
2-∑n e t
式中,分子是残差平方和;分母是自由度,其中n是样本观测值的个数,2是一元线性回归方程中回归系数的个数。
S2的正平方根又叫做回归估计的标准误差。 一般采用以下公式计算残差平方和:
∑∑∑∑--=t t t t
t
Y X Y Y
e 212
2ˆˆββ
(三)最小二乘估计量的性质