第10章 直线回归与相关分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
➢ yˆ i 是+βxi的估计值
回归方程的基本条件(性质):
性质1 性质2
Q (y yˆ)2 最小; ( y yˆ) 0 ;
性质3 回 归 直 线 通 过 点 (x, y) 。
Q (yi yˆi )2 yi (a bxi )2
➢利用最小二乘法,即Q最小的方法求a与b的 值。根据微积分学中求极值的原理,将Q对a 与b求偏导数并令其等于0:
数学式来表示。 统计关系这一类变量间的关系就是统计学中回归分析与
相关分析所要讨论的问题。
华南热带农业大学农学院 唐燕琼制
二、回归、相关分析的任务与类型
常用x、y来表示两个变量,(x,y)的各对观察值用 (x1,y1),(x2,y2),…,(xn,yn)表示。 在统计上,x和y变量的关系有两种理论模型: 回归模型和相关模型。
回归模型(因果关系)中: x表示原因的变量;y是表示结果的变量。
回归分析目的:导出由x 来预测或控制y的回归方程, 即确定当自变量x为某一值时依变量y将会在什么范围内 变化。
➢在相关模型中,其x和y变量是平行变化 关系,不能区别哪一个是自变量,哪一个 是依变量。
➢相关分析目的:确定两个变量在数量关 系上的密切程度和性质。不能用一个或多 个变量去预测、控制另一个变量的变化。
a y bx
简记为:
b xy ( x)( y) / n x2 ( x)2 / n
a y bx
x与y的离均差乘积和,简称为乘积和,记为 SPxy 。
spxy (x x)(y y) xy x y / n
记 ssx=∑x2-(∑x)2/n,则
b SPxy / SSx a y bx
yˆ 在应用 =48.5-1.1x于预测时,需限定x的
区间为[31.7,44.2];如要在x<31.7或>
44.2的区间外延,则必须有新的依据。
二、直线回归的显著性检验
➢ 回归关系的假设测验: 对于样本的回归方程,必须测定其来自无
直线回归关系总体的概率大小。只有当这种概 率小于0.05或0.01时,我们才能冒较小的危 险确认其所代表的总体存在着直线回归关系。 这就是回归关系的假设测验 。
一、直线回归方程的建立
设变量x与y间存在直线关系,根据n对观察 值所描出的散点图如下。
yˆ a bx
图9—2 直线回归散点图
总体直线回归方程:y=α+βx
实际观察值可表示为:
yi =α+βxi+i (i=1,2,…,n)
i为随机误差,与α、β相互独立,且服从 N(0,2)。这就是直线回归的数学模型
b=-1.1 当3月下旬至4月中旬的积温(x)每提高1 旬·度时,一代三化螟的盛发期平均将提早1.1天; a=48.5 若积温为0,则一代三化螟的盛发期将在 6月27—28日(x=0时,=48.5;因y是以5月10 日为0,故48.5为6月27—28日)。
由于x变数的实测区间为[31.7,44.2],
积累温(x) 35.5 34.1 31.7 40.3 36.8 40.2 31.7 39.2 44.2 盛发期(y) 12 16 9 2 7 3 13 9 -1
解: n 9
x 333.7
x 37.0778
SS
x
(n
1)
S
2 x
Hale Waihona Puke Baidu
144.6356
y 70
y 7.7778
SS
y
(n
1)
S
2 y
回归分析的类型: 一元回归分析(直线和曲线回归分析); 多元回归分析(多元线性回归分析和曲面
回归分析)。
相关分析的类型:直线相关分析; 复相关分析。 偏相关分析。
三、两个变数资料的散点图
➢ 对具有统计关系的两个变数的资料进行初步考察 的简便而有效的方法,是将这两个变数的n对观 察值(x1,y1)、(x2,y2)、…、(xn,yn)分别以 坐标点的形式标记于同一直角坐标平面上,获得 散点图(scatter diagram)。
a、b是α、β的最小二乘估计也是无偏估计。
SAS分析
例[9.1]一些夏季害虫盛发期的早迟和春季温度高 低有关。江苏武进连续9年测定3月下旬至4月中旬 旬平均温度累积值(x,旬.度)和水稻一代三化螟 盛发期(y,以5月10日为0)的关系,得结果于表 9.1。试计算其直线回归方程。
表9.1 累积温和一代三化螟盛发期的关系
Q 2
a
( yi a bxi ) 0
Q 2
b
( yi a bxi ) xi 0
整理后可得:
na ( xi )b yi
( xi )a ( xi )2 b xi yi
上式叫做a与b的正规方程组。
解之可得:
b
xi yi ( xi )( yi ) / n xi2 ( xi )2 / n
249.5556
SP
xy
x
n
y
159 .0444
因而有: b SP 1.0996[天 /(旬• 度)]
ssx
a y bx 48.5485 (天)
回归方程有:yˆ 48.54851.0996x 或简化为:yˆ 48.5 1.1x
yˆ 48.5 1.1x
上述方程中回归系数b和回归截距a的意义为:
根据样本实际观察值对α、β以及误差方差 2作出估计, 即建立样本回归方程并估计 出误差的大小。
➢设样本直线回归方程为:
yˆ a bx
➢总体直线回归方程:y=α+βx
➢其中a是的估计值,称为回归截距; ➢b是β的估计值,称为回归系数,表示自变量 每改变一个单位数时, 依变量y平均改变的单位 数(b>0时,增加;b<0时,减少)
例如:
根据散点图可初步判定双变数X和Y间的关系:
➢ ①X和Y相关的性质(正或负)和密切程度 ➢ ②X和Y的关系是直线型的还是非直线型的 ➢ ③是否有一些特殊的点表示着其他因素的干扰
&10.2 直线回归分析
一、直线回归方程的建立 二、直线回归的显著性检验 三、直线回归的区间估计
华南热带农业大学农学院 唐燕琼制
第十章 直线回归与相关分析
&10.1 回归和相关分析概述 &10.2 直线回归分析 &10.3 直线相关分析
华南热带农业大学农学院 唐燕琼制
&10.1 回归和相关分析概述
一、变量间的关系分为两类: 函数关系:完全确定性的关系——可用精确的数学式来
表示; 统计关系:不存在完全确定性的关系——不能用精确的
相关文档
最新文档