统计学教案习题10直线相关与回归

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十章 直线相关与回归

一、教学大纲要求

(一) 掌握内容

⒈ 直线相关与回归的基本概念。 ⒉ 相关系数与回归系数的意义及计算。 ⒊ 相关系数与回归系数相互的区别与联系。 (二)熟悉内容

⒈ 相关系数与回归系数的假设检验。 ⒉ 直线回归方程的应用。 ⒊ 秩相关与秩回归的意义。 (三)了解内容 曲线直线化。

二、

学内容精要

(一) 直线回归 1. 基本概念

直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression )。

直线回归方程bX a Y

+=ˆ中,a 、b 是决定直线的两个系数,见表10-1。 表10-1 直线回归方程a 、b 两系数对比

a

b

含义

回归直线在Y 轴上的截距(intercept )。 表示X 为零时,Y 的平均水平的估计值。

回归系数(regression coefficient ),即直线的斜率。表示X 每变化一个单位时,Y 的平均变化量的估计值。 系数>0 a >0表示直线与纵轴的交点在原点的上方

b >0,表示直线从左下方走向右上方,即Y 随X 增大而增大 系数<0 a <0表示直线与纵轴的交点在原点的下方

b <0,表示直线从左上方走向右下方,即Y 随X 增大而减小

系数=0 a =0表示回归直线通过原点 b =0,表示直线与X 轴平行,即Y 不随X 的变化而变化

计算公式

X b Y a -=

XX XY l l X X Y Y X X b =---=

∑∑2

)())(( 2. 样本回归系数b 的假设检验(1)方差分析;(2)t 检验。

3. 直线回归方程的应用(1)描述两变量的依存关系;(2)用回归方程进行预测; (3)用回归方程进行统计控制;(4)用直线回归应注意的问题。 (二) 直线相关 1. 基本概念

直线相关(linear correlation )又称简单相关(simple correlation ),用于双变量正态分布资料。有正相关、负相关和零相关等关系。直线相关的性质可由散点图直观的说明。

相关系数又称积差相关系数(coefficient of product-moment correlation ),以符号r 表示样

本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。

2.

计算公式

YY

XX XY l l l Y Y X X Y Y X X r =

----=

∑∑2

2

)

()()

)((

相关系数r 没有单位,其值为-1≤r ≤1。其绝对值愈接近1,两个变量间的直线相关愈密切;愈接近0,相关愈

不密切。r 值为正表示正相关,说明一变量随另一变量增减而增减,方向相同;r 值为负表示负相关,说明一变量增加、另一变量减少,即方向相反;r 的绝对值等于1为完全相关。

3. 样本相关系数r 的假设检验 (1)r 界值表法; (2)t 检验法。

(三)直线回归与相关的区别与联系 1. 区别

(1) 资料要求:直线回归要求因变量Y 服从正态分布,X 是可以精确测量和严格控制的变量,一般称为Ⅰ型回归;直线相关要求两个变量X 、Y 服从双变量正态分布。这种资料若进行回归分析称为Ⅱ型回归。

(2) 应用情况:直线回归是说明两变量依存变化的数量关系;直线相关是说明两变量间的相关关系。 (3) 意义:b 表示X 每增(减)一个单位时,Y 平均改变b 个单位;r 说明具有直线关系的两个变量间关系的密切程度与相关方向。

(4) 计算:b= l xy / l xx ;r = l xy /yy xx l l 。 (5) 取值范围:—∞<b <+∞ ;-1≤r ≤1 。 (6) 单位:b 有单位;r 没有单位。 2. 联系

(1) 方向一致:对一组数据若能同时计算b 和r ,它们的符号一致。

(2) 假设检验等价:对同一样本,r 和b 的假设检验得到的t 值相等,即t b =t r 。 (3) 用回归解释相关:决定系数总回SS SS l l l r yy

xx xy

==2

2

,回归平方和越接近总平方和,

则r 2越接近1,说明引入相关的效果越好。 (四)秩相关

秩相关,又称等级相关(rank correlation ),是用双变量等级数据作直线相关分析,适用于下列资料: ⒈ 不服从双变量正态分布而不宜作积差相关分析; ⒉ 总体分布型未知; ⒊ 用等级表示的原始数据。

三、典型试题分析

1.回归系数的假设检验( )

A .只能用r 的检验代替

B .只能用t 检验

C .只能用F 检验

D .三者均可

答案:D [评析] 本题考点:回归系数假设检验方法的理解。

回归系数的假设检验常用的方法有:①方差分析;②t 检验。对同一样本,r 和b 的假设检验等价,r 和b 的假设检验得到的t 值相等,即t b =t r 。故回归系数的假设检验用三者均可。

2.已知r 1=r 2,那么( )

A .b 1=b 2

B .t b 1=t b 2

C .t r 1=t r 2

D .两样本决定系数相等

答案: D [评析] 本题考点:直线相关系数与回归系数关系的理解。

因为相关系数r 和回归系数b 的计算公式不同,不能推导出b 1=b 2 ;r 和b 的假设检验等价,即t r 1= t b 1,t r 2=t b 2,而不是t b 1=t b 2,t r 1=t r 2 ;样本决定系数为r 2,已知r 1=r 2,则两样本决定系数相等,即r 12

=r 22

3.|r |>r 0.05( n-2)时,可认为两变量X 与Y 间( )

A .有一定关系 B. 有正相关关系 C .一定有直线关系 D. 有直线关系

答案: D [评析] 本题考点:直线相关系数假设检验的理解。

因为直线相关系数r 是样本的相关系数,它是相应总体相关系数ρ的估计值。由于抽样误差的影响,必须进行显

相关文档
最新文档