2 一元线性回归模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4、回归分析
(1)“回归”一词的古典意义 英国生物学家F.高尔顿(Francis 遗传学研究中首先提出的。
Galton)在
(2)“回归”一词的现代意义: 回归分析是研究一个被解释变量(或因变量)对一 个或多个解释变量(或自变量)数量依赖关系的数 学分析方法。 目的:通过解释变量的已知值或设定值,去估计被 解释变量的平均值,或分析解释变量变动对被解释 变量产生的影响。
相关关系:非确定现象随机变量间的关系。
函数关系:
圆面积 f , 半径 半径2
欧姆定律(电流C=V/k, V为电压)
相关关系: 农作物产量 f 气温, 降雨量, 阳光, 施肥量
高档消费品的销售量与城镇居民收入之间的关 系 储蓄额与居民收入之间的关系 广告支出与商品销售额 工业增加值与能源消耗量 数学成绩与统计学成绩 „„
问:能否从该样本估计总体回归函数PRF?
可支配收入X 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500 消费支出Y 888 1121 1340 1650 2179 2210 2398 2650 3021 3288
回答:of course
该样本的散点图: 样本散点图近 似于一条直线,画 一条直线以尽可能 地拟合该散点图, 由于样本取自总体, 该线可以近似地代 表总体回归线。该 线称为样本回归线
上例
ui Yi -E(Y Xi ) Yi 0 1X i 总体回归函数 Yi 0 1X i ui 个别值表现形式
引入随机扰动项的主要原因: 1、作为未知影响因素的代表
2、作为无法取得数据的已知因素的代表 3、作为众多细小影响因素的综合代表 4、模型的设定误差 5、变量的观测误差 6、变量的内在随机性
ˆ ˆ ˆX Y i 0 1 i
应变量Y的实际观测值Yi不完全等于样本估计 值,二者之差用ei 表示, ei 称为剩余项或残 差项。
ei Yi Yˆ i
ˆ ˆX e Yi (Y Xi ) 0 1X i
Yi 0 1X i ui
g(Y ) f(X 1,X 2 ,
Xk )
回归线:对于每一个X的取值,都有Y的条件期望 与之对应,代表这些Y的条件期望的点的轨迹所形成 的直线或曲线,称为回归线。 回归函数:因变量Y随解释变量X的变化而有规律的变 化,如果把Y的条件期望表现为X的某种函数
g(Y ) f(X 1,X 2 , X k )
样本回归线的函数形式为: 称为样本回归函数(SRF)
ˆ ˆ ˆX Y i 0 1 i
SRF的特点
每次抽样都能获得一个样本,就可以拟合一条 样本回归线,所以样本回归线,可以有许多条。 样本回归线不是总体回归线,至多只是未知总体 回归线的近似表现。
样本回归函数的表现形式
样本回归函数如果是线性函数,可以表示为:
ˆ ˆX e Yi 0 1 i i
注意几个概念
Y的条件分布: 当解释变量X取某固定值时(条件),Y的值不确 定,Y的不同取值形成一定的分布,这是Y的条件 分布
Y的条件期望: 对于X的每一个取值, 对Y所形成的分布确 定其期望或均值, 称为Y的条件期望或 条件均值E(Y|Xi)
回归模型与回归函数
回归模型:反映被解释变量与解释变量之间数量依赖 关系的随机模型。
3、相关程度的度量——相关系数
变量X、Y的总体线性相关系数为
变量X、Y的样本线性相关系数为
使用相关系数时应注意:
X和Y都是相互对称的随机变量 线性相关系数只反映变量间的线性相关程度,不 能说明非线性相关关系 样本相关系数是总体相关系数的样本估计值,由 于抽样波动,样本相关系数是个随机变量,其统 计显著性有待检验 相关系数只能反映线性相关程度,不能确定因果 关系,不能说明相关关系具体接近哪条直线 计量经济学关心:变量间的因果关系及隐藏在随 机性后面的统计规律性,这有赖于回归分析方法
第二章
一元线性回归模型
2.1
回归分析与回归模型
2.2
基本概念及普通最小二乘法
2.3 总体回归模型的基本假定及OLS估 计量的统计性质 2.4 拟合优度的度量
2.5
2.6
回归系数的假设检验及其区间估计
预测
2.1
回归分析与回归模型
2.1.1 相关分析与回归分析 1、变量间的关系
经济变量之间的关系,大体可分为两类: 函数关系:确定现象非随机变量间的关系。
回归函数分为:总体回归函数(PRF)和样本回归函数 (SRF)
随着收入的 增加,消费 “平均地说” 也在增加, 且Y的条件均 值均落在一 根正斜率的 直线上。这 条直线称为 总体回归线。
2.1.2 随机扰动项
总体回归函数说明在给定的收入水平Xi下,该社 区家庭平均的消费支出水平。 但对某一个别的家庭,其消费支出可能与该平均 水平有偏差。 ui Yi - E(Y Xi) 记 称ui为随机扰动项或随机误差项。代表排除在模型 以外的所有因素对Y的影响。
2、相关关系
相关关系最直观的描述方式——散点图
销售量和价格的散点图 80 70 60 50 40 30 20 10 0 1850 1900 1950 2000 2050 2100 2150 2200 2250 价格(元)
销售量(万台)
相关关系的类型: 1)从相关关系涉及的变量数量 简单(一元)相关 多重(复)相关 2)从变量相关的表现形式 线性相关——散点图接近一条直线 非线性相关——散点图接近一条曲线 3)从变量相关关系变化的方向 正相关——变量同方向变化,同增同减 负相关——变量反方向变化,一增一减 不相关
重要性:随机扰动项的性质决定着计量经济方法的选择
2.2
基本概念及普通最小二乘法
2.2.1 基本概念 总体的信息往往无法掌握,现实的情况只能是在一 次观测中得到总体的一个样本。
问题:能从一次抽样中获得总体的近似信息吗?如 果可以,如何从抽样中获得总体的近似信息? 例2:在例1的总体中有如下一个样本,