气象统计方法课件 3回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、相关系数与线性回归
因为回归方差不可能大于预报量的方差,可以用它们的比 值来衡量方程的拟合效果。即:
1n
s
2 yˆ
s
2 y
n 1
i 1 n
n i1
yˆi y yi y
2 2
U s yy
wenku.baidu.comxy2
回归方程 判决系数
上式表明预报因子x对预报量y的方差的线性关系程 度,这一比值又称为解释方差。
回归分析与相关分析的区别:
1. 相关分析中,变量x、y处于平等的地位;回归分析中,
变量y称为因变量,处在被解释的地位,x称为自变量, 用于预测因变量的变化。 2. 相关分析中所涉及的变量x和y都是随机变量;回归分 析中,因变量y是随机变量,自变量x可以是随机变量, 也可以是非随机的确定变量。 3. 相关分析主要是描述两个变量之间线性关系的密切程 度;回归分析不仅可以揭示变量x对变量y的影响大小, 还可以由回归方程进行预测和控制。
(4)式两边同时乘以n变成各变量离差平方和的关系。
syy U Q
n
总离差平方和:s yy ( yi y )2 i 1
反映因变量y的n个观测值与其均值的总离差.
n
回归平方和:U ( yˆi y)2 i 1 反映回归值的分散程度. n
残差平方和:Q ( yi yˆ)2 i 1 反映观测值偏离回归直线的程度.
第三章 回归分析
1. 一元线性回归分析 2. 多元线性回归分析 3. 逐步回归方法
回归分析是用来寻找若干变量之间统计联系 (关系)的一种方法。 它是一种统计模型,分为线性回归和非线性 回归。线性回归在气象中最为常用。
利用回归分析得到的统计关系对某一变量作 出未来时刻的估计,称为预报值(量)。前 期已发生的多个与之有关的气象要素称为预 报因子。
冬季环流 5月平均 指标(x) 气温T(y)
32
0.9
25
1.2
20
2.2
26
2.4
27
-0.5
24
2.5
28
-1.1
24
0
15
6.2
16
2.7
24
3.2
30
-1.1
22
2.5
30
1.2
24
1.8
33
0.6
26
2.4
20
2.5
32
1.2
35
-0.8
气温T
气温T
7
40
6
气温T
环流指标 35
5
30
4
25
3
20 2
1
15
0
10
-1
5
-2
0
1951 1953 1955 1957 1959 1961 1963 1965 1967 1969
年
7
6
y = -0.2343x + 7.5095
5
R2 = 0.5313
4
3
2
1
0
-1
-2 14 16 18 20 22 24 26 28 30 32 34 36 环流指标
当b<0,回归直线斜率为负,预报量y随预报因子x增加而减少, 反映预报量与因子是负相关; 当b>0,回归直线斜率为正,预报量y随预报因子x增加而增加, 反映预报量与因子是正相关。
二、回归问题的方差分析
1、意义 评价回归方程的优劣。
2、预报量的方差可以表示成回归估计值的方差 (回归方差)和误差(残差)方差之和。
判决系数是衡量两个变量线性关系密切程度的量, 也等于两变量相关系数的平方。
判决系数的物理含义:
1. 回归平方和占总离差平方和的比例; 2. 反映回归直线的拟合程度; 3. 取值范围在[0,1] 4. r2→1,说明回归方程拟合的越好;
r2→0,说明回归方程拟合的越差; 5. 判决系数等于相关系数的平方.
四、回归方程的显著性检验
显著性检验的主要思想是检验预报因子与预报量是否有 线性关系。 可以证明在原假设总体回归系数为0的条件下,统计量
yˆi b0 bxi i 1, 2, , n (1)
或写为一般的回归方程:
yˆ bb0为0 截b距x,b为斜率
年份
1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970
全部观测值与回归直线的离差平方和记为 :
n
Q(b0 , b) (yi yˆi )2 i 1
(2)
(2)式刻画了全部观测值与回归直线偏离程度。
显然,Q值越小越好, Q是待定系数a和b的函数。 根据极值原理,要求 :
Q 0 b0
Q 0 b
整理得到求回归系数b0、b的方程组:
nb0
n
b
i 1
到:
yˆi y b(xi x)
或
yˆdi bxdi
----距平形式回归方程
b Sxy Sx2
S xy SxSy
Sy Sx
rxy
Sy Sx
yˆ zi rxy xzi
----标准化形式回归方程
回归系数b与相关系数之间的关系:
b
S xy
S
2 x
Sy Sx
rxy
相关系数 r与回归系数b同号。
xi
n i 1
yi
n
n
n
b0
i 1
xi
b
i 1
xi 2
i 1
xi
yi
(3)
(3)式称为求回归系数的标准方程组。
回归系数也可直接表示为:
b0 y bx
n
b
xi yi nxy
i 1
n
xi2 nx 2
i 1
Sxy Sx2
将 b0 =y bx 代入回归方程 yˆi =b0 bxi,得
第一节 一元线性回归
一元回归分析处理的是两个变量之间 的关系,即一个预报量和一个预报因子之 间的关系。
一、回归模型
基本原理:对抽取容量为n的预报量y与预报因子x
的一组样本,如认为y与x是一元线性统计关系,则线
性回归方程为: y b0 bxi i 1, 2, , n
那么预报量的估计量yˆ 与x有如下关系:
环流指标
最小二乘法求回归系数
y (xn , yn)
(x2 , y2)
ei = yi^-yi
(x1 , y1)
(xi , yi)
yˆ b0 bx
x
对所有的xi,若 yˆi 与 yi 的偏差最小,就认为 (1)式所确定的直线能最好地代表所有实 测点的散布规律。为了消除偏差符号的影 响,可以用偏差的平方来反映偏差的绝对 值偏离情况。
1
n
n i 1
( yi
y)2
1 n
n i 1
( yˆi
y)2
1 n
n i 1
( yi
yˆ )2
(4)
即: sy2 syˆ2 se2
• 方差分析表明,预报量y的变化可以看成由 前期因子x的变化所引起的,同时加上随机 因素e变化的影响,这种前期因子x的变化影 响可以用回归方差的大小来衡量。如果回 归方差大,表明用线性关系解释y与x的关系 比较符合实际情况,回归模型比较好。