一元线性回归方程概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(估计的)样本回归函数:
ˆ ˆX ˆ Y i 0 1 i
(估计的)样本回归模型:
ˆ ˆ X e Yi 0 1 i i
其中ei是第i次观测的残差
Y1
u2 e1
e2
ˆ ˆX ˆ Y i 0 1 i
u3
Y3
e3
u1
Xi
三、参数估计——最小二乘法
对于所研究的经济问题,通常总体回归直线 E(Yi|Xi) = 0 + 1Xi 是 观测不到的。可以通过收集样本来对总体(真实的)回归直线做出估计。
为解决上面提到的第三个问题,及如何在忽略其他因素的同时, 又得到其他因素不变情况下X对Y的影响呢?这需要我们对无法观测 的u和X之间的关系加以约束,并且只有如此,才能从一个随机样本 数据中获得β0和β1的可靠估计量。 E(u)=0 即无法观测的因素的平均值为零,不会对结果产生影响 E(u|X)=0 根据X的不同把总体划分为若干部分,每个部分中无法 观测的因素都具有想通的平均值,且这个共同的平均值 必然等于整个总体中u的平均值,即u是均值独立的。
二、一元线性回归模型
回归分析都是从如下假设前提开始的:Y和X是代表某个总
体的变量,我们感兴趣的是“用X解释Y”或“研究Y如何随 X而变化”在写出用X解释Y的模型时,面临三个问题
Y和X的函数关系是怎么样的?
如何考虑其他影响Y的因素呢?
我们如何才能确信我们得到的是,是在其他条件不变情况下
的Y和X之间的关系?
被预测变量(predicted variable) 回归子(regressand)
控制变量(control variable)
预测变量(predictor variable) 回归元(regressor)。
回归分析中的因果关系和其他条件不变的概念
在多数对经济理论的检验中(包括对公共政策的评价),经济 学家的目标就是要退订一个变量(比如受教育程度)对另一个 变量(如犯罪率或工人的生产率)具有因果效应(causal effect)。有时可能会很简单就能发现两个或多个变量之间存 在很强的联系,但除非能得到某种因果关系,否则这种联系很 难令人信服。
其他条件不变(ceteris paribus):意味着“其他(相关因 素保持不变)”的概念,它在因果分析中有重要的作用。
这个概念看似简单,但是除非在极为特殊的条件下,很难实现 多数经验研究中的一个关键问题是:要做出一个因果推断,是 否能使其他足够多的因素保持不变呢? 只要方法得当,用计量经济方法可以模拟一个其他条件不变的 实验——通过对模型进行假定。
样本回归模型:
ˆ ˆ X e Yi 0 1 i i
ˆ ˆX ˆ 样本回归直线: Y i 0 1 i
第二章 一元线性回归模型
回归的含义 一元回归模型的建立 参数估计——最小二乘法 随机误差项的古典假定 最小二乘估计量的性质 最小二乘估计量的概率分布 回归系数的显著性检验与置信区间 用样本可决系数检验回归方程的拟合优度 案例分析
一、回归的含义
回归概念的提出
Francis Galton最先使用“回归(regression)”。 F.加尔顿是达尔文的表弟,是研究智力的先驱者之一,他非常严肃, 非常聪明,但也有些疯狂,他出生在一个贵格教徒家庭中,祖上是著名 的和平主义者,有趣的是,他家的名下却有生产枪支的企业。高尔顿是 个申通,6岁便能阅读和背诵莎士比亚的作品,他在更小的时候已经会 说了希腊语和拉丁语。他似乎对什么事情都感兴趣,成年后的高尔顿在 气象学、心理学、摄影学,甚至是刑事司法领域都有所建树(他倡导使 用指纹分析的科学方法来确定罪犯身份)。此外,他还发明了“标准差” 这一统计概念及线性回归法,并用这些数学工具来研究人类的行为。 父母高,子女也高;父母矮,子女也矮。给定父母的身高,子女 平均身高趋向于“回归”到 全体人口的平均身高。
根据上面的假定对原模型取期望得: E(Y|X)=E[(0+1X+u)|X] =0+1X+E(u|X)= 0+1X
总体回归函数 (直线)
来自百度文库
E(Y|Xi) = 0+1X
总体回归函数E(Y|X)是X的
一个线性函数,它表示Y中可以 由X解释的部分,线性意味着X 变化一个单位,Y的期望改变β1 个单位。对于任意给定的X值, Y的分布都是以E(Y|X)为中心的。
通常总体回归函数E(Y) = 0+ 1X是观测不到的,利用样本得到的是
对它的估计,即对0和1的估计。令{(Xi,Yi):i=1,…,n}表示从总体中抽取 的一个样本容量为n的随机样本,对于每个i,可以写出:
Yi 0 1 X i ui
其中ui是第i次观测的误差项
Yi
Y2
E(Y|Xi) = 0 + 1 Xi
回归的现代释义
等式左边的变量被称为 被解释变量(explained variable) 因变量 (dependent variable)
等式右边的变量被称为 解释变量(explanatory variable) 自变量(independent variable)
响应变量(response variable)
回归的现代释义
回归分析用于研究一个变量关于另一个(些)变量的具 体依赖关系的计算方法和理论。
inflation a b 1 unem ploymnt e
商品需求函数: Q a bP 生产函数:
ln Q ln A ln K ln L
菲利普斯曲线:
2 Tax a b ( TR ) 拉弗曲线:
我们可以通过建立一个如下的关于Y和X的方程来解决上述三个问 题
总体回归模型
Y= 0 + 1 X+ u
其中: Y——被解释变量; X——解释变量; u——随机误差项;表示除X之外其他影响Y的因素,一元回 归分析 将除X之外的其他所有影响Y的因素都看成了无法观测 的因素
0,1—回归系数(待定系数或待估参数) 1是斜率系数,是主要的研究对象 0 是常数项,也被称作截距参数,很少被当做分析的核心