第二章两变量线性回归分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5
模型的假设
变量X和Y之间的函数关系Y=α+βX+ε,对两变量的所有观察 i ( X i ,( Yii=1,…,n ) 数据组 )都成立,其中 为随机误差 项 对应每组变量观测数据的误差项 i ,都为零均值的随机 (i ) 0 对 i=1,…,n 都成立 变量,即 E 2 2 2 [ E ( )] E [ ] 误差项 i 的方差为常数,即 E i i i 对i=1,…,n 都成立 对应不同观测值数据组的误差项不相关,即
4
经济变量关系中的随机性(二)
影响经济变量严格函数关系因素的存在,使得我们 所研究的两变量线性关系,实际上都是有一定随机 性的随机函数关系,应该表示为Y=α+βX+ε 两个变量的随机线性函数由两部分组成 一部分由严格的线性函数E(Y)= α+βX构成,我们 称之为两变量关系的趋势部分,也称为总体回归直 线,是两变量关系的主要方面,也是我们研究的主 要目标和对象 另一部分是随机误差项ε,代表了影响Y的各种较小 因素的综合影响,是两变量关系中的次要方面
E [( E ( ))( E ( ))] E ( ) 0 i i j j ij
wk.baidu.com
对任意的i ≠ j都成立 解释变量X是确定性变量,而非随机变量 误差项 i 服从正态分布
6
零均值
零均值是线性回归模型最基本的假设,它是两变量线性随机 函数的本质特征,是识别这种关系的根本标准 识别变量之间的随机函数关系,只能根据平均情况或概率分 布来进行 如果两个变量的关系中确实线性函数是主导的,误差项只是 次要的随机扰动因素,那么Y的个别观测会因为随机扰动偏 离线性函数规定的基本趋势,但如果对同样的X多次重复观 测对应的Y值,则Y值的概率均值应该能消除随机扰动的影响, 符合线性函数的基本趋势 [ Y X 该标准可等价地表示为 E i] i对 i=1,…,n 都成立, 也就是被解释变量的期望值始终落在总体回归直线上,是参 数估计方法有有效性和良好性质的必要保证
7
26页图2-3
8
同方差
误差项的方差反映误差项作为随机函数的分布分散程度 同方差假设的意义是对于不同观测数据组,误差项的发散 趋势相同,或有相同形状的概率密度函数 如果 i 的方差随i变化而变化,就意味着这部分因素对被解 释变量的影响力度会随着i而变化,因此就不能再理解为一 些微小的可以忽略的随机扰动因素的影响 同方差假设排除模型误差项对被解释变量影响程度的变化, 对保证线性回归分析的性质和价值,有非常重要的作用
9
26页图2-4
10
无自相关
无自相关假设的意义是对应不同观测值的误差项之间没有相 关性。如果这一点不成立,则意味着调养项的取值变化存在 某种规律性,这与模型认为误差项只是没有规律的微小随机 因素的综合影响的思想不符 当误差项之间存在相关性时,会对线性回归分析的效果产生 不利的影响 同时满足零均值、同方差、无自相关三条假设的随机误差项, 有时也称为“球形扰动项
11
解释变量是确定性变量
解释变量X是确定性变量而不是随机变量的假设,在于方便 线性回归分析的讨论和证明;这个假设不成立时,虽然多数 情况下参数估计和相关的统计分析仍然有效,但证明比较困 难 当X既是随机变量又与误差项有强相关性时,回归分析的有 效性和价值会受到严重影响 这条假设有很大的人为性,因为X作为一个经济变量,也是 不可重复的调查统计数据,而且也必然有观测误差。由于我 们研究的是X决定Y的因果关系,可以认为X是可以任意选择 的确定性变量,只有Y是随机的 可以证明,只要X与误差项没有多在的相关性,X是否是随 机变量一般并不会影响参数估计的性质和相关的统计分析
第二章 两变量线性回归分析
两变量线性回归模型 参数估计和最小二乘法 最小二乘估计量的性质 回归拟合度评价和决定系数 统计推断 预测
1
两变量线性回归模型
两变量线性回归模型的核心是两个变量之间,存在着用线性 函数表示的因果关系 如果用Y表示因果关系中被影响或决定的变量,用X表示影 响或决定Y的变量,那么两变量线性回归模型的核心就是线 性函数Y=α+βX,这个线性函数的截距α和斜率β是两个待定 参数,是决定这个特定因果关系(或经济规律)的关健变数 由于计量分析是的问题导向的,Y应该是与所考察问题最紧 密相关的指标;解释变量应该根据所研究问题的具体情况和 特征,以及相关的经济理论和研究经验等进行判断选择;两 个变量关系是否直接用线性函数反映,则需要利用相关的经 济理论和经验,以及根据变量数据的分布情况进行判断
2
教材20页图
3
经济变量关系中的随机性(一)
线性回归分析是以经济变量之间存在线性的因果关系为基础 的,但这种因果关系不是严格意义上的函数关系,一个变量 通常不可能被另一个经济变量完全精确地决定 人类经济行为本身有随机性 一个经济变量总是受众多因素的影响,虽然众多因素的单独 影响可能较小,甚至可以忽略不计,但这些因素的总体影响 是存在的,会对所考察的变量产生明显的影响或扰动,从而 使只考虑两 个变量之间的函数难以严格成立 任何函数反映经济变量之间的关系都只是一种简化反映,常 常忽略一些高阶项的次要部分,这种简化也会导致变量之间 的函数关系不能严格成立 经济数据来源于调查统计而非控制条件下的严格实验和测度, 因而难免有一定的偏差
12
误差项服从正态分布
误差项 i 服从正态分布是参数估计量分布性质和相关统计 推断的基础 实际上只要变量关系确定满足线性回归分析的基本思想,其 误差项代表许多微小扰动因素的综合,那么根据中心极限定 理,误差项服从正态分布是很自然的 误差项服从正态分布在进行参数估计时并一定需要,除了会 对统计检验和推断造成一定影响外,也不会影响最小二乘估 计量的基本性质,因此有时误差项服从正态分布并不作为线 性回归分析模型的基本假设,线性回归分析中的“古典假设” 中也不包括它 回归模型假设目的是为了明确回归分析的对象,方便分析, 以及保证回归分析的性质和价值
模型的假设
变量X和Y之间的函数关系Y=α+βX+ε,对两变量的所有观察 i ( X i ,( Yii=1,…,n ) 数据组 )都成立,其中 为随机误差 项 对应每组变量观测数据的误差项 i ,都为零均值的随机 (i ) 0 对 i=1,…,n 都成立 变量,即 E 2 2 2 [ E ( )] E [ ] 误差项 i 的方差为常数,即 E i i i 对i=1,…,n 都成立 对应不同观测值数据组的误差项不相关,即
4
经济变量关系中的随机性(二)
影响经济变量严格函数关系因素的存在,使得我们 所研究的两变量线性关系,实际上都是有一定随机 性的随机函数关系,应该表示为Y=α+βX+ε 两个变量的随机线性函数由两部分组成 一部分由严格的线性函数E(Y)= α+βX构成,我们 称之为两变量关系的趋势部分,也称为总体回归直 线,是两变量关系的主要方面,也是我们研究的主 要目标和对象 另一部分是随机误差项ε,代表了影响Y的各种较小 因素的综合影响,是两变量关系中的次要方面
E [( E ( ))( E ( ))] E ( ) 0 i i j j ij
wk.baidu.com
对任意的i ≠ j都成立 解释变量X是确定性变量,而非随机变量 误差项 i 服从正态分布
6
零均值
零均值是线性回归模型最基本的假设,它是两变量线性随机 函数的本质特征,是识别这种关系的根本标准 识别变量之间的随机函数关系,只能根据平均情况或概率分 布来进行 如果两个变量的关系中确实线性函数是主导的,误差项只是 次要的随机扰动因素,那么Y的个别观测会因为随机扰动偏 离线性函数规定的基本趋势,但如果对同样的X多次重复观 测对应的Y值,则Y值的概率均值应该能消除随机扰动的影响, 符合线性函数的基本趋势 [ Y X 该标准可等价地表示为 E i] i对 i=1,…,n 都成立, 也就是被解释变量的期望值始终落在总体回归直线上,是参 数估计方法有有效性和良好性质的必要保证
7
26页图2-3
8
同方差
误差项的方差反映误差项作为随机函数的分布分散程度 同方差假设的意义是对于不同观测数据组,误差项的发散 趋势相同,或有相同形状的概率密度函数 如果 i 的方差随i变化而变化,就意味着这部分因素对被解 释变量的影响力度会随着i而变化,因此就不能再理解为一 些微小的可以忽略的随机扰动因素的影响 同方差假设排除模型误差项对被解释变量影响程度的变化, 对保证线性回归分析的性质和价值,有非常重要的作用
9
26页图2-4
10
无自相关
无自相关假设的意义是对应不同观测值的误差项之间没有相 关性。如果这一点不成立,则意味着调养项的取值变化存在 某种规律性,这与模型认为误差项只是没有规律的微小随机 因素的综合影响的思想不符 当误差项之间存在相关性时,会对线性回归分析的效果产生 不利的影响 同时满足零均值、同方差、无自相关三条假设的随机误差项, 有时也称为“球形扰动项
11
解释变量是确定性变量
解释变量X是确定性变量而不是随机变量的假设,在于方便 线性回归分析的讨论和证明;这个假设不成立时,虽然多数 情况下参数估计和相关的统计分析仍然有效,但证明比较困 难 当X既是随机变量又与误差项有强相关性时,回归分析的有 效性和价值会受到严重影响 这条假设有很大的人为性,因为X作为一个经济变量,也是 不可重复的调查统计数据,而且也必然有观测误差。由于我 们研究的是X决定Y的因果关系,可以认为X是可以任意选择 的确定性变量,只有Y是随机的 可以证明,只要X与误差项没有多在的相关性,X是否是随 机变量一般并不会影响参数估计的性质和相关的统计分析
第二章 两变量线性回归分析
两变量线性回归模型 参数估计和最小二乘法 最小二乘估计量的性质 回归拟合度评价和决定系数 统计推断 预测
1
两变量线性回归模型
两变量线性回归模型的核心是两个变量之间,存在着用线性 函数表示的因果关系 如果用Y表示因果关系中被影响或决定的变量,用X表示影 响或决定Y的变量,那么两变量线性回归模型的核心就是线 性函数Y=α+βX,这个线性函数的截距α和斜率β是两个待定 参数,是决定这个特定因果关系(或经济规律)的关健变数 由于计量分析是的问题导向的,Y应该是与所考察问题最紧 密相关的指标;解释变量应该根据所研究问题的具体情况和 特征,以及相关的经济理论和研究经验等进行判断选择;两 个变量关系是否直接用线性函数反映,则需要利用相关的经 济理论和经验,以及根据变量数据的分布情况进行判断
2
教材20页图
3
经济变量关系中的随机性(一)
线性回归分析是以经济变量之间存在线性的因果关系为基础 的,但这种因果关系不是严格意义上的函数关系,一个变量 通常不可能被另一个经济变量完全精确地决定 人类经济行为本身有随机性 一个经济变量总是受众多因素的影响,虽然众多因素的单独 影响可能较小,甚至可以忽略不计,但这些因素的总体影响 是存在的,会对所考察的变量产生明显的影响或扰动,从而 使只考虑两 个变量之间的函数难以严格成立 任何函数反映经济变量之间的关系都只是一种简化反映,常 常忽略一些高阶项的次要部分,这种简化也会导致变量之间 的函数关系不能严格成立 经济数据来源于调查统计而非控制条件下的严格实验和测度, 因而难免有一定的偏差
12
误差项服从正态分布
误差项 i 服从正态分布是参数估计量分布性质和相关统计 推断的基础 实际上只要变量关系确定满足线性回归分析的基本思想,其 误差项代表许多微小扰动因素的综合,那么根据中心极限定 理,误差项服从正态分布是很自然的 误差项服从正态分布在进行参数估计时并一定需要,除了会 对统计检验和推断造成一定影响外,也不会影响最小二乘估 计量的基本性质,因此有时误差项服从正态分布并不作为线 性回归分析模型的基本假设,线性回归分析中的“古典假设” 中也不包括它 回归模型假设目的是为了明确回归分析的对象,方便分析, 以及保证回归分析的性质和价值