四多元回归分析推断
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
j ~ Normal ( j ,Var ( j ))
^
^
因此
( j j ) / sd ( j ) ~ Normal (0,1)
^ ^
检验对单个总体参数的假设:t检验
• 定理4.2 在CLM假定MLR1—MLR6下,有
( j j ) / se( j ) ~ tnk 1
• 虚拟假设是 H0 : enroll 0 ,而对立假设是 H1 : enroll 0
• 估计方程(标准误在括号中)是
math10 2.274 0.00046totcomp 0.048staff 0.00020enroll (0.040) (6.113) (0.00010) (0.00022)
^
R 2 0.0541 • 由回归结果的p值0.3592可知,我们不能拒绝零假 设。
• 为了解释函数形式对我们已有结论的影响,我们将 自变量都取对数后再进行回归。结果如下:
math10 207.66 21.155log(totcomp ) 3.98log( staff ) 1.268log(enroll )
(3)H0 : exp er 0, H1 : exp er 0
拒绝;
• 下面这个例子说明,有的时候改变模型设定 会改变一个自变量的显著性。 • 一种观点认为,在所有其他条件相同的情况 下,小学校的学生比大学校的学生情况要好 一些。利用数据文件MEAP93.RAW。被解 释变量是数学测验(math10)成绩,学校规 模由注册人数(enroll)来度量。另外我们还控 制其他两个因素:平均教师工资(totcomp) 和平均每千名学生拥有的教师数量(staff). 前者是对教师质量的一种度量,后者大致度 量了学生所受关注程度。
式中,k+1是总体模型
^
^
y 0 1x1 2 x2 中未知参数个数。
k xk u
单侧检验和双侧检验
• 以小时工资方程为例。利用数据WAGE1.RAW,得到如下 估计方程
log( wage) 0.284 0.092educ 0.0041exp er 0.022tenure
log( price) 0 1 log(nox) 2 log(dist )
3rooms 4 stratio u
• 我们的假设如下: H0 : 1 1, H1 : exp er 1
• 利用HPRICE2.RAW中数据,估计模型为
log( price) 11.08 0.954log(nox) 0.134log(dist ) (0.043) (0.117) (0.32)
H0 : j a j
t
• 相应的t统计量为
j aj
se( j )
^
^
• 下面以两个例子来说明这种检验方法。
校园犯罪与注册人数
• 考虑大学校园内犯罪次数(crime)和学生注册人数的一个简 单模型
log(crime) 0 1 log(enroll ) u
• 利用美国1992年97个大学和学院的数据,针对 1 1 来检验 1 1 。数据来源于联邦调查局的《统 一犯罪报告》。回归结果如下:
H 0 ”。
检验关于参数的一个线性组合的假设
• 我们利用一个简单模型来说明这个方法如何使用: 比较两年制大专教育和四年制本科教育(大学教育) 的回报(Kane & Rouse,1995)。基本模型如下
^
R 2 0.0654
• Log(enroll)系数估计量的p值为0.0681,在10%的 显著性水平上我们可以拒绝零假设 H0 : enroll 0 从而支持对立假设 H1 : enroll 0
检验斜率的其他假设
• 尽管检验参数是否为零是最常见的假设,但是还 是有时候希望检验参数是否等于其他常数。此时 虚拟假设为
y | x ~ Normal (0 1x1 2 x2 k xk , 2 )
问题
• 假设独立于解释变量,而且以相同概率取 值-2、-1、0、1、2。这样会违背高斯—马 尔可夫假定吗?会违背CLM假定吗? • 还能举出一些例子吗?
• 定理4.1(正态抽样分布) 在CLM假定MLR1—MLR6下,给定自变量的样 本值,有
log(crime) 6.63 1.27 log(enroll ) (1.03) (0.11)
^
R2 0.585
• t值为(1.27-1)/0.11=2.45大于显著性水平为5%的单侧检验 临界值1.66,从而我们可以拒绝零假设支持备择假设。
住房价格和空气质量
• 对于一个由波士顿地区506个社区组成的样本, 我们估计一个联系社区中平均住房价格(price) 与社区各种特征的模型:nox表示空气中氧化亚 氨的含量;dist表示该社区相距五个商业中心的 加权距离;rooms表示该社区平均每套住房的房 间数;而stratio则为该社区学校的平均学生—教 师比。总体模型如下:
OLS估计量的抽样分布
• 假定MLR6(正态性) 总体误差 u 独立于解释变量 x1 , x2 , , xk ,而且服从均值为零和方差为 2的正态分Βιβλιοθήκη Baidu,即 u ~ N (0, 2 )
就横截面回归中的应用而言,这6个假定被称为经典 线性模型(CLM,classical linear model)假定 . 总结CLM总体假定的一个简洁方法是:
^
0.255rooms 0.52stratio
R 2 0.581 • 零假设对应的t统计量为(-0.954+1)/0.117=0.393
(0.019)
(0.006)
对经典假设用语的一个提醒
• 当 H 0 未被拒绝时,我们喜欢说“在x%的显
著性水平上不能被拒绝”,而不是说“我们在 x%的显著性水平上接受
(0.104)
(0.007)
~
(0.0017)
(0.003)
R2 0.316 • 针对exper对log(wage)的影响,考察下面三种检验: (1)H0 : exp er 0, H1 : exp er 0 拒绝零假设;
(2)H0 : exp er 0, H1 : exp er 0 不拒绝;