一元线性回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率论与数理统计优质学案
第一节 一元线性回归分析
一、问题的提出 二、一元线性回归方程的求法 三、估计量的性质 四、回归方程的显著性检验
五、预报与控制
一、问题的提出 变量间的关系分为:
(1)确定性关系 (2)相关关系 (即变量间有统计规律,但关系是不确定的) 回归分析方法就是寻找变量间相关关系的数学 关系式并进行统计推断的一种方法.
1.F检验
平方和分解 总平方和
n
S Syy ( yi y)2 i 1
反映了原始数据 y1, y2 yn 的全部差异性
回归平方和
n^
U ( yi y)2 反映了因素x的作用. i 1
剩余平方和
n
^
Q ( yi yi )2
i 1
反映了观测值偏离回归直线的程度,这种差异性通常
i 1
n
Sxx (xi x)2
i 1
则
a^
y
^
b
x
^
b
S xy
S xx
^ ^^
^
拟合直线为: y a b x y b(x x)
下面用矩法求 2的估计
2 D E( 2 )
由矩法,令E( 2 )
1 n
n
2 i
i 1
(xi x)(yi y)
n
xi yi nx y
解出b
i 1
n
(xi x)2
i 1
i 1 n
xi2
2
nx
i 1
^
^
a y b x
其中
x
1 n
n i 1
xi
y
1 n
n i 1
yi
n
记
Sxy (xi x)( yi y)
2. 作散点图。发现这 些点分布在一条直线附 近。
y
6
5
4
3
2
1
0
0
1
2
3x 4
2.一元线性回归的数学模型
Y a bx ~ N (0, 2 )
yi a bxi i
(i 1, 2 n)
i ~ N (0, 2 )且1,2 n相互独立.
上式所描述的X,Y之间的线性关系的模型,我们 称为一元线性回归模型.
i 1
^
2
2.b ~ N (b, n
);
(xi x)2
i 1
n
3. 2
^
2
~
2(n
2);
^
^
4. 2 分别与a,b 独立
四、回归效果的检验 要检验Y与x之间是否有线性关系,就是要检验b 是否为零.
检验假设 H0:b 0, H1 : b 0
若接受H0,表明线性关系不显著 若拒绝H0,表明线性关系显著
例1 以家庭为单位,某商品年需求量与其价格之间的调查数 据如下:
价格x(元) 1 2 2 2.3 2.5 2.6 2.8 3 3.3 3.5
需求量y(500g) 5 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2
1. x与y之间是相关关 系,不能用解析表达式 y = f(x) 表示。
3.回归方程
^^
根据数据(xi , yi ),(i 1,2n),求出a,b的估计值a,b.
^ ^^
称方程 y a b x为y对x的线性回归方程(简称回归方程) 其图形称为回归直线, 称a,b为回归系数.
y a b x 称为Y对x的线性回归方程
回归截距
回归系数
4.一元线性回归方程的求法(参数的最小二乘估计)
9
^
xi yi 9x y
由上表得到b
i 1 9
xi2
2
9x
1.175
i 1
^
^
a y b x 63.588
^
故所求回归方程为: y 63.588 1.175x
三、估计量的性质(证明略)
n
2 xi2
1.a ~ N (a,
i 1 n
)
n (xi x)2
是由随机误差所引起的,其大小表示除线性相关性以外
的所有其他因素(统称为随机因素)对试验结果的影响.
Baidu Nhomakorabea
三个平方和的关系为: S U Q
n
n
^^
证明: S (yi y)2 (yi yi yi y)2
i 1
i 1
一元回归分析
回归分析(按变量个数) 多元回归分析
回归分析解决以下两个问题: 1.判断变量间是否存在相关关系. 2.找出变量间相关关系最适合(近似的)定量表达式, 同时利用表达式作预测或控制,并估计出这种预测 或控制可以达到什么样的精度.
二、一元线性回归方程的求法
1.散点图
设X 是解释变量(可以控制或精确观 测),Y是一个具有确定分布的随机变量. 对X的不同的值x1, x2 xn做独立试验, 得到Y的相应观测值y1, y2 yn.我们用点 (x1, y1), (x2 , y2 ), (xn , yn )描成的图称为 散点图.
42.6 42.6 40.6 40.3 38.7 37.2 36
34
求回归方程.
列出回归计算表
序号
12
3
4
5
6
7
8
9
脂肪 16.5 17.5 18.5 19.5 20.5 21.5 22.5 23.5 24.5 184.5
蛋白质 43.5 42.6 42.6 40.6 40.3 38.7 37.2 36 34 355.5
n
n
设Q
2 i
[ yi (a bxi )]2 ,要使Q最小,
i 1
i 1
必须满足:
Q
a Q
0 0
b
n
即
2
i 1 n
( yi
a bxi )
0
2
i 1
( yi
a
bxi )xi
0
^
n
x2 i 272.3 306.3 342.3 380.3 420.3 462.3 506.3 552.3 600.3 3842
yi2 1892 1815 1815 1648 1624 1498 1384 1296 1156 14128
xi yi 717.8 745.5 788.1 791.7 826.2 832.1 837 846 833 7217
1 n
n i 1
( yi
a bxi )2
^
2
1 n
n i 1
( yi
^^
a b xi )2
例2 某种大豆的脂肪含量x(%)与蛋白质含量y(%)的 测定结果如下表:
序号 1 脂肪 16.5 蛋白质 43.5
2
3
4
17.5 18.5 19.5
5
6
78
9
20.5 21.5 22.5 23.5 24.5
第一节 一元线性回归分析
一、问题的提出 二、一元线性回归方程的求法 三、估计量的性质 四、回归方程的显著性检验
五、预报与控制
一、问题的提出 变量间的关系分为:
(1)确定性关系 (2)相关关系 (即变量间有统计规律,但关系是不确定的) 回归分析方法就是寻找变量间相关关系的数学 关系式并进行统计推断的一种方法.
1.F检验
平方和分解 总平方和
n
S Syy ( yi y)2 i 1
反映了原始数据 y1, y2 yn 的全部差异性
回归平方和
n^
U ( yi y)2 反映了因素x的作用. i 1
剩余平方和
n
^
Q ( yi yi )2
i 1
反映了观测值偏离回归直线的程度,这种差异性通常
i 1
n
Sxx (xi x)2
i 1
则
a^
y
^
b
x
^
b
S xy
S xx
^ ^^
^
拟合直线为: y a b x y b(x x)
下面用矩法求 2的估计
2 D E( 2 )
由矩法,令E( 2 )
1 n
n
2 i
i 1
(xi x)(yi y)
n
xi yi nx y
解出b
i 1
n
(xi x)2
i 1
i 1 n
xi2
2
nx
i 1
^
^
a y b x
其中
x
1 n
n i 1
xi
y
1 n
n i 1
yi
n
记
Sxy (xi x)( yi y)
2. 作散点图。发现这 些点分布在一条直线附 近。
y
6
5
4
3
2
1
0
0
1
2
3x 4
2.一元线性回归的数学模型
Y a bx ~ N (0, 2 )
yi a bxi i
(i 1, 2 n)
i ~ N (0, 2 )且1,2 n相互独立.
上式所描述的X,Y之间的线性关系的模型,我们 称为一元线性回归模型.
i 1
^
2
2.b ~ N (b, n
);
(xi x)2
i 1
n
3. 2
^
2
~
2(n
2);
^
^
4. 2 分别与a,b 独立
四、回归效果的检验 要检验Y与x之间是否有线性关系,就是要检验b 是否为零.
检验假设 H0:b 0, H1 : b 0
若接受H0,表明线性关系不显著 若拒绝H0,表明线性关系显著
例1 以家庭为单位,某商品年需求量与其价格之间的调查数 据如下:
价格x(元) 1 2 2 2.3 2.5 2.6 2.8 3 3.3 3.5
需求量y(500g) 5 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2
1. x与y之间是相关关 系,不能用解析表达式 y = f(x) 表示。
3.回归方程
^^
根据数据(xi , yi ),(i 1,2n),求出a,b的估计值a,b.
^ ^^
称方程 y a b x为y对x的线性回归方程(简称回归方程) 其图形称为回归直线, 称a,b为回归系数.
y a b x 称为Y对x的线性回归方程
回归截距
回归系数
4.一元线性回归方程的求法(参数的最小二乘估计)
9
^
xi yi 9x y
由上表得到b
i 1 9
xi2
2
9x
1.175
i 1
^
^
a y b x 63.588
^
故所求回归方程为: y 63.588 1.175x
三、估计量的性质(证明略)
n
2 xi2
1.a ~ N (a,
i 1 n
)
n (xi x)2
是由随机误差所引起的,其大小表示除线性相关性以外
的所有其他因素(统称为随机因素)对试验结果的影响.
Baidu Nhomakorabea
三个平方和的关系为: S U Q
n
n
^^
证明: S (yi y)2 (yi yi yi y)2
i 1
i 1
一元回归分析
回归分析(按变量个数) 多元回归分析
回归分析解决以下两个问题: 1.判断变量间是否存在相关关系. 2.找出变量间相关关系最适合(近似的)定量表达式, 同时利用表达式作预测或控制,并估计出这种预测 或控制可以达到什么样的精度.
二、一元线性回归方程的求法
1.散点图
设X 是解释变量(可以控制或精确观 测),Y是一个具有确定分布的随机变量. 对X的不同的值x1, x2 xn做独立试验, 得到Y的相应观测值y1, y2 yn.我们用点 (x1, y1), (x2 , y2 ), (xn , yn )描成的图称为 散点图.
42.6 42.6 40.6 40.3 38.7 37.2 36
34
求回归方程.
列出回归计算表
序号
12
3
4
5
6
7
8
9
脂肪 16.5 17.5 18.5 19.5 20.5 21.5 22.5 23.5 24.5 184.5
蛋白质 43.5 42.6 42.6 40.6 40.3 38.7 37.2 36 34 355.5
n
n
设Q
2 i
[ yi (a bxi )]2 ,要使Q最小,
i 1
i 1
必须满足:
Q
a Q
0 0
b
n
即
2
i 1 n
( yi
a bxi )
0
2
i 1
( yi
a
bxi )xi
0
^
n
x2 i 272.3 306.3 342.3 380.3 420.3 462.3 506.3 552.3 600.3 3842
yi2 1892 1815 1815 1648 1624 1498 1384 1296 1156 14128
xi yi 717.8 745.5 788.1 791.7 826.2 832.1 837 846 833 7217
1 n
n i 1
( yi
a bxi )2
^
2
1 n
n i 1
( yi
^^
a b xi )2
例2 某种大豆的脂肪含量x(%)与蛋白质含量y(%)的 测定结果如下表:
序号 1 脂肪 16.5 蛋白质 43.5
2
3
4
17.5 18.5 19.5
5
6
78
9
20.5 21.5 22.5 23.5 24.5