5第五章 一元线性回归的假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、稻草人假设
回归分析是要判断解释变量X是否是被解释变量Y 的一个显著性的影响因素。 在一元线性模型中,就是要判断X是否对Y具有显 著的线性性影响。这就需要进行变量的显著性检验。
计量经计学中,主要是针对变量的参数真值是 否为“零”来进行显著性检验的。即
H 0 : bi 0 H1 : bi 0
2 xi2 nX 2 (X i X) nX 2 2 2 ( ) 2 2 nxi nxi
X i2 nX 2 nX 2 2 X i2 2 2 2 nxi nxi
** 再证明最小方差性:在所有线性无偏估计量中, ols估计量方差最小:
ˆ ˆ 设b1* ciYi为b1的任一线性无偏估计。则E (b1* ) b1 ˆ* ) 2 (c xi ) 2 Var (b ) Var (b ) ˆ ˆ Var (b1 i 1 1 xi2
b
i
(n 2) Sb2i
b2
i
~ 2 (n 2)
ˆ bi bi 则t ~ t (n 2), 可以利用该信息进行统计检验 Sbi
返回
第三节 一元线性回归模型的假设检验 p130
一、检验 二、参数的显著性检验 三、回归的拟合优度检验 四、回归分析结果的报告 五、综合实例:美国商业部门工资和生产 率的关系 返回
返回
4、小结:估计量的统计性质
ˆ 1 )线性性:参数的估计量b j ( j 1, 2,, k )是Yi的线性组合
ˆ 2)无偏性:E (b j ) b j ( j 1, 2,, n)
3)最小方差性:
b0、b1的方差分别为:
ˆ Var (b1 )
2
x
2 i
X i2 2 ˆ Var (b0 ) 2 nxi
如同需要指明样本均值服从何种分布,才可对
总体均值进行统计推断一样。
样本回归系数是Y的线性函数,因此其概率 分布取决于Y,而Y的概率分布取决于随机 误差项 返回
有了样本回归系数的OLS估计量的分布信息, 就可以利用它进行总体回归系数的统计推断
1、正态性假定:随机误差项服从正态分布,
i ~ N (0, 2 )
第五章:一元线性回归模型的假 设检验
目录
第一节 经典线性回归模型的基本假定 第二节 OLS估计量的性质:高斯-马尔可夫 定理 第三节 一元线性回归模型的假设检验 第四节 预测 考核要求和作业
第一节 经典线性回归模型的基本假定
经典线性回归模型:classical liner regression model ,CLRM 一、9个假定 二、假定的意义 返回
这样的零假设也称为“稻草人假设”,如果稻草人假设 成立,说明解释变量X不是被解释变量Y的一个显著性的 影响因素 返回
2、ols估计量服从t分布
ˆ bi bi 由于t ~ t (n 2), 稻草人假设为 i 0 b Sbi ˆ bi 则t ~ t (n 2) Sbi ˆ bi、Sbi 都由OLS法估计得来
一、9个假定
1、零均值假定 2、同方差假定 3、无自相关假定 4、随机误差项和解释变量不相关假定 5、正态性假定 6、样本容量N>待估参数个数 7、解释变量 X值有变异性 8、无多重共线性假定 9、参数线性假定
零均值假定
假定1:随机误差项均值为零 随机误差项囊括了大量未包括进模型的各 种变量影响之和,他们相互抵消,对被解 释变量没有系统性影响 E(µ|Xi)=0,简写为E(µi)=0
x i 2 E (b0 b1 X i ui ) xi
ˆ E (Y ) XE (b1 )
b0 b1 X ) Xb1 ( b0
返回
注:令
xi K i , K i 是常数),且K i 0; K i X i 1 ( 2 xi
3、最小方差性
ˆ ˆ 先求b0、b1的方差:
返回
3、检验步骤:
(1)对总体参数提出假设 H0: b1=0,
ˆ b1 t S bˆ
H1:b10
(2)以原假设H0构造t统计量,并由样本计算其值
1
(3)给定显著性水平,查t分布表,得临界值t /2,df=(n2)
(4) 比较,判断 若 |t|> t /2(n-2),则拒绝H0 ,接受H1 ;
一、检验
对模型和所估计的参数加以评定,判断在 经济理论上是否有意义,在统计上是否显 著等。 检验包括:
1)经济意义的检验 2)统计推断检验* 3)计量经济学检验* 4)预测检验* 返回
二、参数的显著性检验 p132
1、“稻草人假设” 2、ols估计量服从t分布 3、检验步骤 4、例题 返回
对被解释变量Y的系统影响。 例:如果收入差异不大,我们无法观察支出Y的变动
假定8 :如果有多个解释变量,要求解释变量间 没有很强的线性关系
无多重共线性
假定9:线性:回归模型对参数而言是线性的
二、假定的意义
如果满足这些假定,则高斯-马尔可夫定理 成立:
在所有线性无偏估计量中,普通最小二乘
返回
三、拟合优度检验P134
对样本回归直线与样本观测值之间拟合程 度的检验。度量拟合优度的指标:判定系 数(可决系数)R2 1、 总离差平方和的分解 2、几个概念 3、判定系数R2统计量 4、例题 返回
随机扰动项代表了未引入模型的随机影响之和,依据中
心极限定理,大量独立同分布的随机变量之和趋向于正 态分布
2、服从正态分布的变量的线性组合依然服从正态 分布,则
X i2 2 ˆ b0 ~ N (b0 , ) 2 nxi
ˆ b1 ~ N (b1 ,
2
x
2 i
)
3、由于随机误差项的方差 2未知,则OLS 估计量的 ˆ bi bi 2 的总体方差 bi 也未知。但 ~ N (0,1);
且在所有线性无偏估计量中方差最小
4)前面的等式中包含了随机误差项的方差 2,多数时候 2是未知的, ˆ (Yi Yi ) 2 ei2 2 2 ˆ 需要做出估计,随机误差项的方差 的估计量为: (n 2) (n 2) ˆ ˆ 则OLS 估计量b 、b 的方差和标准差的估计量为:
2 ˆ Var (b1 )
xi2
,
1
ˆ Var (b1 )也记为 b2 ,其余类推。 ˆ
注 : Var (Yi ) Var (b0 b1 X i i ) Var ( i ) 2
ˆ 证:Var (b1 ) Var (K i Y) i K i2Var Yi) 2K i2 ( xi xi ( 2 )( 2 ) xi xi
随机误差项均值为零 p123 图7-1
Y X=1000
X=1100
X=900
具体的 支出水 平是围 绕其条 件均值 波动的, 这种波 动的 “均值 为0”
X
散点图
同方差假定
假定2:随机误差项方差相同
VAR(i ) ,随机误差项的方差俱为
2
2
即与给定X相对应的Y值以相同方差分布在其条件 均值周围。 如果不满足这个假定,即为“异方差” 异方差的图示
异方差的图示
X=1000时,Y的 分布更靠拢均值。 即方差相对较小。
X=1000 X=900
无自相关假定
假定3:无自相关,即两个随机误差项之间不相关
cov(i , j ) 0, i j
也称无序列自相关,两个随机误差项之间不相关,即两
个Y之间也不相关。
假定4:随机误差项和解释变量不相关
ˆ E (b1 ) b1
ˆ 证:E(b1)
ˆ E (b0 ) b0
ˆ 证:E(b0) ˆ E (Y b X )
1
xi E (Yi ) 2 xi
xi b1 2 E (ui ) xi b1 K i E (ui ) b1
xi E( Yi) 2 xi
xi ˆ 令 2 K i , K i 是常数),则b1 K iYi ( xi 且K i 0; K i X i 1
ˆ ˆ b0 Y b1 X
xi xi 1 Y X Yi ( X )Yi 2 2 xi n xi
源自文库
返回
2、无偏性,估计量的均值=其对应参数的真值
回归结果(括号里数据为标准误差)
Ln(price) 0.240age 0.608temp (0.0075) (0.116)
0.0038rain 0.00115wrain (0.00095) (0.00051) R 2 0.828, S 0.287 以5%的显著性水平对回归参 数进行T检验,每一个参数都是 显著的。
二、ols估计量的概率分布 返回
一、高斯-马尔可夫定理
在所有线性无偏估计量中,普通最小二乘 (OLS)估计量有最小方差。
即OLS估计量是最佳线性无偏估计量
1、线性
2、无偏性 3、最小方差性 4、小结 返回
高斯-马尔科夫理论所考虑的 各种估计值分类图
最 小 二 乘 估 计 值 | 方 差 最 小
线性无 偏估计 值
线 性 估 计 值
所 有 的 估 计 值
返回
1、线性性:参数估计量是被解释变量Yi的线性组合:
ˆ ˆ b1、b0都是Yi的线性函数
ˆ xi yi xi (Yi Y ) xiYi (xi ) Y xi Y b1 i 2 2 xi2 xi2 xi2 xi xi
当X是非随机的时,该假定自动满足 X是抽样时候人为设定的:比如前例中把家庭收入分

假定5:正态性假定:随机误差项服从正态分布
i ~ N (0, )
2
假定6:样本容量N>待估参数个数 假定7:解释变量 X值有变异性
即X有一个相对较大的取值范围 如果X只在一个狭窄的范围内变动,则无法充分估计X

|t| t /2(n-2),则拒绝H1 ,接受H0 ;返回
4、例题:葡萄酒拍卖价格的回归分 析
数据 应变量: ln(price): 1952~1980年间共10批, 用来自六个葡萄种植场的的葡萄酿造的60种不同 葡萄酒的价格,取其对数形式 自变量:
Age: 葡萄酒存放年数 Temp:葡萄生长期平均气温 Rain:8/9月份降雨量 Wrain:葡萄生长期前一年10月到次年3月降雨量
(OLS)估计量有最小方差。这使得OLS估计 量有着优良的性质可以进行统计推断
完全满足这些假定的方程在现实中是不存 在的,但这些假定为我们提供了一个比较 的基准,本课其他部分主要是围绕假定不 被满足时,分析后果,提出解决办法。返 回
第二节 OLS估计量的性质:高斯-马 尔可夫定理 p127
一、高斯-马尔可夫定理
2
xi2 xi2 2 2 2 2 2 2 2 2 (xi ) (xi ) xi
X i2 ˆ Var (b0 ) 2 nxi2
附:证明
ˆ ) Var[( 1 X xi )Y ] Var(b0 i n xi2 xi 2 1 1 2 ( X 2 ) (Yi) ( XK i) 2 Var n xi n 1 2 XK i 1 X 2 K i2) 2 ( X 2 K i2) 2 n2 n n xi xi 1 1 X2 ( X 2 2 2 ) 2 ( 2 ) 2 n xi xi n xi (
0 1
S
2 ˆ b1
ˆ
2 2 i
x

(n 2)x
e
2 i 2 i
, Sbˆ S
1
2 ˆ b1
X ˆ S 2 , Sb0 2 nx n(n 2)xi
2 b0 2 i 2 i
ei2 X i2
2 Sb0
返回
二、ols估计量的概率分布 p129
假设检验需要指明总体参数(即总体回归 系数)的估计量(即样本回归系数)服从 何种分布
相关文档
最新文档