第7章 双变量模型:假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
稻草人假设:斜率参数为零
解释变量的显著性 Yi 0 1 X i i
如果1等于零,则X对Y没有影响
1的估计值不等于零
但是
1真的不等于零吗?
问题: 如何说服我们相信你高考的数学成绩不 是零分?
1、假设检验概述
•假设检验采用的逻辑推理方法是反证法。 先假定原假设正确,然后根据样本信息,观察由 此假设而导致的结果是否合理,从而判断是否接受 原假设。 • 判断结果合理与否,是基于“小概率事件不易发 生”这一原理的。 •如果结果是个小概率事件,那我们认为这是不可 能发生的。会发生不可能发生的事情,一定是假设 前提错了。 •上述“小概率事件”的概率被称为检验的“显著 性水平”,或者“犯第一类错误的概率”(拒绝了 正确的虚拟假设)
2、OLS估计量的方差
E (Y | X i ) 0 1 X i
2、OLS估计量的方差
xi y i ˆ 1 2 xi Y X ˆ ˆ 1 0
斜率和截距估计量的方差
2 xi 2 2 ˆ var( 2 Y ) var( 1 ) k i i k i 2var( 0 1 X i i ) xi x i 2
(3)给定显著性水平a,查t分布表,得临界值c=t a/2(n-2)
(4) 比较,判断 若 |t|> t a/2(n-2),则拒绝H0 ,接受H1 ;
若
|t| t a/2(n-2),则拒绝H1 ,接受H0 ;
简易判断法则
当n > 30时,t分布近似于正态分布 给定显著性水平为5%,临界值c约为2 如果t的绝对值大于2,就可以拒绝稻草 人假设,说明斜率1显著地不等于零 因此,解释变量X对被解释变量Y具有影 响
线性:β 帽是Y的线性函数
xi y i ˆ 1 2 xi Y X ˆ ˆ 1 0
7.4 OLS估计量的概率分布
1的正态分布
ˆ 1 ~ N ( 1 ,
x
2
) 2
i
7.5 假设检验
不同的样本,得到不同的估计值, 根据某一个具体样本得到的估计值质量 如何? 可以通过特定的检验指标来衡量
(1 a) a) (1
0 c
a/2 a
双侧检验
yi = 0 + 1x i + µi
H0: 1 = 0
拒绝域
H 1: 1 0
拒绝域
a/2 -c
(1 a)
0 c
a/2
双边检验的步骤
(1)对总体参数提出假设 H0: 1=0, H1:10
ˆ 1 t ˆ se(1 )
(2)以原假设H0构造t统计量,并由样本计算其值
案例分析
工资 被解释变量:工资(1976年每小时美元数) 解释变量:教育(年数) 计量模型:
wage = 0 + 1 educ +
p=0.0000
思考题
假设p值为0.01, 如果研究者采用的显著性水平为5%,我 们能否拒绝虚拟假设? 如果研究者采用的显著性水平为0.5%, 我们能否拒绝虚拟假设
7.2 普通最小二乘估计量的方差
Y = f(X) + µ
µ被称为随机误差项,代表所有其他影响因素的总 和 因此,Y是一个随机变量 刻划随机变量的两个参数: ①期望值 ②方差
计量研究目标
1、X对Y的具体影响:
E (Y | X i ) 0 1 X i
2、其他因素对Y的平均影响幅度: Var(Y)= Var(µ) = σ² Y的标准差:σ
k i2 var( i )
2 i 2
ˆ var( 0 )
1 X2 2 2 n var( wii Yi ) x
x nX X wi2x var( 0 1 X i i ) (1 / n x n
7.1 古典线性回归模型(CLRM)
假设1、随机误差项与解释变量X之间不相关
问题: 回归分析的基本原理是什么?
如果假设1不成立:第8章
假设2、随机误差项具有零均值 E(i)=0 i=1,2, …,n
如果假设2不成立:
0
假设3、随机误差项具有同方差 Var (i)=2 i=1,2, …,n
估计量
估计总体的公式 总体均值的估计量:样本均值
估计量
估计总体的公式 总体均值的估计量:样本均值
Baidu Nhomakorabea
估计量与估计值
随机样本:无数个样本 一个具体的样本: 1、样本中每个随机变量都取定一个观察 值 2、根据估计量的公式计算估计值
高斯—马尔可夫定理 给定CLRM的假设1-4,最小二乘估计量是 具有最小方差的线性无偏估计量。
问题
显著性水平 或犯错误概率 在反证法推理中应当设定得越小越好, 还是越大越好?
t分布
t分布
t分布的均值为0 t分布的方差为n/(n-2); n=30, 1.07
n n n
t分布
2.5%
-2
(1 a)
0 2
2.5% a
t落在红色区域中的概率为5% |t| > 2被认为是一个小概率事件
假设检验的基本思想
请解释斜率方差的决定因素
斜率方差的决定因素
1、解释变量的变化程度 解释变量的变化程度越大,对斜率的估 计越精确
0
1
0
1
斜率方差的决定因素
2、总体方差 总体方差越小,对斜率的估计越精确
0
1
Y
X
斜率估计量的标准差
sd() x
2
斜率估计量的标准误
7.3 OLS估计量的性质
当模型参数估计出后,需考虑参数估计值的 精度,即是否能代表总体参数的真值。 可从如下几个方面考察估计量的优劣性: (1)无偏性,即它的均值或期望值是否等 于总体的真实值; (2)有效性,即它是否在所有线性无偏估 计量中具有最小方差。 说明:线性指估计量为随机变量Y的线性函数
近似但已知的样本回归模型
ˆ ˆ ˆ e X e Yi Yi i 0 1 i i
可以证明,双变量模型中2的无偏估计量为
ˆ
2
e
2 i
n2
回归标准误:SER
ˆ2
e
2 i
n2
2
=
RSS
n-2
2 i
e ˆ :SER
n2
Eviews
估计Salary 的标准误
ˆ 1 t = ˆ se(1 )
统计量t的解释
ˆ 1 t = ˆ ) se(1
t是一个随机变量,对应于不同的样本,t取 不同的值 给定一个具体样本,t是斜率的估计值和斜 率的样本标准差的比率。被称为t比率
t分布
a/2
-c
临界值c |t| > c的概率? 在实践中,一般取α=5%,确定一个小概率事件 t~t(n-2) 给定样本容量n和显著性水平α,就可以计算c
( 支 y 出 200 )
150
第一个样本 第二个样本
第二个样本回 归直线
100
第一个样本回 归直线
80 100 120 140 160 180 200 220 240 260
50
x(收入)
显著性检验法 回归分析是要判断解释变量X是否是被解 释变量Y的一个显著性的影响因素。 计量经计学中,主要是针对变量的参数真 值是否为零来进行显著性检验的。
第二部分 线性回归模型
第7章 双变量模型:假设检验
思考题: 1、CLRM关于随机误差项的五个假设是什么? 2、影响SRF中斜率估计量方差的两个因素是 什么? 3、OLS估计量具有哪两个优良性质? 4、假设检验的基本原理是什么? 5、显著性水平和第一类错误指的是什么?
第7章 双变量模型:假设检验
思考题: 6、对稻草人假设进行检验的标准是什么? 7、拟合优度的含义和度量指标是什么? 8、正态性检验的目的是什么?
无偏性成立的关键条件
• CLRM的假设1:µ 和Xi不相关
案例分析
学生的数学考试成绩 被解释变量:在一次高中10年级标准化数学考 试中通过学生的百分比 解释变量:有资格接受联邦政府午餐补助学生 的百分比
math10 = 0 + 1 lnchprg+ 1的含义 1 > 0
Eviews
案例分析
工资 被解释变量:工资(1976年每小时美元数) 解释变量:教育(年数) 计量模型:
wage = 0 + 1 educ +
t=10.17 问题:如何对待稻草人假设?
关于5%
拒绝域
2.5% -2
95%
0 2
拒绝域
2.5%
p值
p值是给定t比率后,能拒绝稻草人假设的最 小显著性水平(犯错误水平) 即给定显著性水平为p,根据样本计算的t比 率刚好可以拒绝稻草人假设 如果显著性水平大于p,则仍然可以拒绝 如果显著性水平小于p,则不可以拒绝 问题: 对于计量研究而言,p值越大还是越小好?
2 i 2
ˆ var( 0 )
1 X2 2 2 n var( wii Yi ) x
x nX X wi2x var( 0 1 X i i ) (1 / n x n
2 i 2 2 2 i 2 i
x
2
2 i
)
ˆ 1 1 t ~ t (n 2) 2 2 ˆ se(1 ) ˆ xi
ˆ 1 1
斜率1的显著性检验
ˆ 1 1 t ~ t (n 2) 2 2 ˆ se(1 ) ˆ xi
在上述t统计量中假设1等于零,得到
ˆ 1 1
如果假设3不成立:第13章
假设4、各个随机误差项之间无自相关 Cov(i, j)=0 i≠j i,j= 1,2, …,n 如果假设4不成立:第14章
假设5、服从正态分布 i~N(0, 2 )
i=1,2, …,n
如果假设5不成立: 样本容量n>30 中心极限定理 被解释变量服从正态分布
1、设计一个服从特定分布的随机变量,例 如t 2、选择一个取值范围,上述随机变量落在 该取值范围内的概率很小,例如5% 3、根据样本数据计算上述随机变量的数值 4、判断该数值是否落在上述取值范围之内 5、如果是,则认为发生了不可能发生的事 情。因此得出结论:假设前提错了
2、解释变量的显著性检验
ˆ 1 ~ N ( 1 ,
7.6 判定系数 拟合优度检验:对样本回归直线与样本 观测值之间拟合程度的检验。 度量拟合优度的指标:判定系数 R2
问题:采用普通最小二乘估计方法,已 经保证了模型最好地拟合了样本观测值, 为什么还要检验拟合程度?
2 i 2 2 2 i 2 i
斜率和截距估计量的方差
2 xi 2 2 ˆ var( 2 Y ) var( 1 ) k i i k i 2var( 0 1 X i i ) xi x i 2
k i2 var( i )
1、随机误差项的方差2的估计
Y的方差: Var(Y)= Var(µ) = σ² 2称为总体方差,反映了随机变量 Y围绕其均值波动的平均幅度。
由于随机误差项i不可观测,只能从i的 估计——残差ei出发,对总体方差进行估计。
理想但未知的总体回归模型
Yi E (Y | X i ) i 0 1 X i i
复习
第6章思考题: 1、回归分析中的变量有何特点? 2、被解释变量的两个组成部分的含义是什么? 3、刻划被解释变量的两个参数分别是什么? 4、样本回归模型与总体回归模型有何区别? 5、最小二乘估计法的核心思想是什么? 6、回归模型参数的估计量是什么?
复习
第6章思考题: 7、一元线性回归具有哪三个性质? 8、如何解释回归模型参数的含义?
MATH10 = 32.14 - 0. 319*LNCHPRG 请解释-0.319的含义 其他影响因素:例如学生的贫穷率 学生的贫穷率与受补助学生比例正相关, 学生的贫穷率与数学考试通过率负相关
3、有效性(最小方差性) ,即在所有线性无偏估计量
ˆ ˆ 中,最小二乘估计量 0 、 1 具有最小方差。
ˆ ˆ 2、无偏性,即估计量 0 、 1 的均值(期望)等于总体回归
参数真值 0 与 1
ˆ E (1 ) E (1 ki i ) 1 ki E ( i ) 1
ˆ E ( 0 ) E ( 0 wi i ) E ( 0 ) wi E ( i ) 0