一元线性回归方程
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Upper 95% 238.4541 -118.508
第二十六页,编辑于星期六:十三点 五十五分。
Y
140 120 100
80 60 40 20
0 0
X Variable 1 Line Fit Plot
0.2
0.4
0.6
0.8
1
X Variable 1
Y 预测 Y
1.2
第二十七页,编辑于星期六:十三点 五十五分。
i 1
y )2
第八页,编辑于星期六:十三点 五十五分。
散点图
以(xi ,yi)为坐标在平面直角坐标系中描 点,所得到的这张图便称之为散点图.
第九页,编辑于星期六:十三点 五十五分。
北京市城市居民家庭生活抽样调查表1
Y:人均收入
14 12 10 8 6 4 2 0
1976
1978
1980 1982 1984
第二节
一元线性回归方程
第一页,编辑于星期六:十三点 五十五分。
一 回归直线方程
两个变量之间的线性关系,其回归模型为:
yi a bxi i
y称为因变量,x称为自变量, 称为随
机扰动,a,b称为待估计的回归参数, 下标i表示第i个观测值。
第二页,编辑于星期六:十三点 五十五分。
对于回归模型,我们假设:
4.代入样本信息,F落入否定域则否定原假设,
线性关系显著;落入接受域则接受原假设,
线性关系不显著.
第二十一页,编辑于星期六:十三点 五十五分。
相关系数检验法:
1.提出原假设:H0:b=0;
2.选择统计量 R lxy lxxl yy
3.对给定的显著性水平α,查临界值rα (n-2),
得否定域为R >rα (n-2); 4.代入样本信息,R落入否定域则否定原假设,线性关
ε是随机误差,假定ε~N(0,σ2).
第十九页,编辑于星期六:十三点 五十五分。
H0:b=0成立,则(11.1)变成 Y= a +ε,自 变量 x 对因变量 Y 没有线性影响,即回
归方程不显著;若假设不成立,则自变量
x 对因变量 Y 有线性影响,即线性方程
是显著的.
因此对于给定的显著性水平α,则否定原假
aˆ y bˆx
则
bˆ lxy l xx
其中
x
1 n
n i 1
xi , y
1 n
n i 1
yi ,
S12
1 n1
n
( xi
i 1
x )2 ,
1 2
S n 1 ( y y ) 2
n
i i 1
2
第十八页,编辑于星期六:十三点 五十五分。
三 回归方程的显著性检验
假设变量Y与x变量满足 Y=a + bx+ε (11.1)
第十四页,编辑于星期六:十三点 五十五分。
以下求
n
n
Q(a,b) i2 [ yi (a bxi )]2
的最小值
i1
i1
Q
a
n
2
i1
(
yi
(a
bxi
))
0
Q b
n
2
i1
[
yi
(a
bxi
)] xi
0
na nxb ny
nxa
(
n i1
xi 2
)b
n
xi
i1
yi
n nx
D nx
xi 2 n(
n
xi 2 nx 2 ) n( ( xi x )2 n( n 1 )S 2 0
i 1
第十五页,编辑于星期六:十三点 五十五分。
解方程得
aˆ y bˆx
bˆ
n
i1 xi yi nxy
n
( xi x )2
i 1
n
( xi x )( yi
i 1
n
( xi x )2
设,即认为回归方程是显著的.
第二十页,编辑于星期六:十三点 五十五分。
(F-检验)显著性检验一般步骤:
1.提出原假设:H0:b=0; 2.选择统计量 F ( n 2 )U ~ F( 1,n 2 )
Q
3.对给定的显著性水平α,查临界值
Fα (1,n-2),得否定域为F >Fα (1,n-2);
系显著;落入接受域则接受原假设,线性关系不显著.
第二十二页,编辑于星期六:十三点 五十五分。
预测
设一元线性回归模型为Y=a + bx+ε (11.1)
其中,ε是随机误差,假设ε~N(0,σ2 ). (xi,yi) i=1,2,…,n 为样 本点,逐一代入一元线性回归模型得
i
yi a bxi i i 1,2,, n (i 1,2,, n) i.i.d , N (0, 2)
进一步可得总体需求函数的95%置信带
300
250
200
150
100
50
0
0
0.2
0.4
0.6
0.8
1
1.2
1.4
此置信带有95%的置信度包含了相应的总体值。
第二十八页,编辑于星期六:十三点 五十五分。
销量 yi (斤)
55 70 90 100 90 105 80 110 125 115 130 130
第二十四页,编辑于星期六:十三点 五十五分。
应用Excel 可得下面成果:
Multiple R R Square Adjusted R Square 标准误差 观测值
回归统计
0.942903 0.889065 0.877972 8.359957
)一元线性回归模型
第十三页,编辑于星期六:十三点 五十五分。
i
yi a bxi i i 1,2,, n (i 1,2,, n) i.i.d , N (0, 2)
(11.2)
记
n
n
Q(a,b) i2 [ yi (a bxi )]2
i1
i1
二元函数 Q(a,b) 的最小值点 (aˆ,bˆ)称为a,b的最 小二乘估计(简记为OLSE ).
12
第二十五页,编辑于星期六:十三点 五十五分。
Coefficients 标准误差 t Stat P-value
Байду номын сангаас
Intercept
210.4444 12.57086 16.74065 1.21E-08
X Variable 1 -157.778 17.62434 -8.95227 4.34E-06
Lower 95% 182.4348 -197.047
量) Y 的取值记为 y .现给定 x 的 n 个值 x1,…, xn,观察 Y
得到相应的 n 个值 y1,…,yn,(xi ,yi) i=1,2,…,n 成为样本
点.
记
1 n
1n
x n i1 xi , y n i1 yi ,
S12
1 n1
n
( xi
i 1
x )2 ,S22
1 n1
n
( yi
i 1
y)
第十六页,编辑于星期六:十三点 五十五分。
一般地,记
n
lxx
( xi
x )2
( n 1 )S12
n
2 1
i 1
n
l yy
( yi y )2
( n 1 )S2 2
n
2 2
i 1
n
n
lxy ( xi x ) ( yi y ) xi yi nxy
i 1
i 1
第十七页,编辑于星期六:十三点 五十五分。
的销售价格,单位为:元):
第四页,编辑于星期六:十三点 五十五分。
pt
qt
2.5
1
2.0
3
1.5
5
1.0
7
0.5
9
0
11
这是一个确定性关系: qt 11 4 pt
第五页,编辑于星期六:十三点 五十五分。
若x、y之间的关系是随机的,例如
若x、y之间p的t 关系是随机的,qt例如
概率
0
0.25
2.5
i ~ N( 0, 2 ),i 1,2,,n E( i j ) 0,i j
可得到:
yi ~ N( a bxi , 2 )
第三页,编辑于星期六:十三点 五十五分。
如果给出a和b的估计量分别为 aˆ ,bˆ,
则经验回归方程为: ˆyi aˆ bˆxi
例如 某市场在t时刻西瓜销量的数据如下(其中qt表 示时刻销售黄瓜的数量,单位为:斤,pt表示t时刻
x:年份
1986 1988
第十页,编辑于星期六:十三点 五十五分。
Y:人均食品支出
北京市城市居民家庭生活抽样调查图表 2
10
8
6
4
2
0
x:人均生活费收入
0 2 4 6 8 10 12 14 16 18
第十一页,编辑于星期六:十三点 五十五分。
记以上直线为 ˆy a bx
回归值 回归常数
回归系数
1
0.50
2
0.25
2
0.25
2.0
3
0.50
4
0.25
…
…
…
10
0.25
0
11
0.50
12
0.25
第六页,编辑于星期六:十三点 五十五分。
这时,方程的形式为
qt 11 4 pt t
其中
t 为随机变量.
第七页,编辑于星期六:十三点 五十五分。
以下设 x 为自变量(普通变量) Y 为因变量(随机变
注意:这种几何作图的方法简单直观, 但精度差,局限性大.
第十二页,编辑于星期六:十三点 五十五分。
二 最小二乘法(OLSE) :
若散点图呈直线变化趋势,则可以假设变量
Y与x变量满足 Y=a + bx+ε
(11.1)
并称(11.1)为(理论的)一元线性回归模型,ε是
随机误差,通常假定ε~N(0,σ2).将(xi,yi) i=1,2,…,n逐一代入(11.1)便得到(数据结构的
(11.2)
一元线性回归方程为 ˆy aˆ bˆ x
第二十三页,编辑于星期六:十三点 五十五分。
例如 某市场连续12天卖出黄瓜的价格和数量的
调查数据如下:
价格 xi (元/斤)
1.00 0.90 0.80 0.70 0.70 0.70 0.70 0.65 0.60 0.60 0.55 0.50