计量经济学-第二部分 统计学基础知识复习
计量经济学复习笔记要点
计量经济学 总复习第一部分:统计基础知识均值的概念:通常人们所说的均值就是“平均数”,统计意义上的均值是“期望值”。
方差:变量的每个样本与均值的距离大小的概念。
标准差:对方差开根号就是标准差。
数学期望值与方差的数学性质总体方差: 1.常量aE (a )=a 2σ(a)=0抽样方差: 2.变量 y=a+bxE(y)=a+bE(x)总体标准偏差: 2σ(y)=b^2 * 2σ(x)抽样标准偏差:假设检验的定义:事先做一个假设,然后再用统计方法来检验这个假设是否有统计意义。
假设检验的步骤:第一步,设定假设条件。
原定假设,H0:u=u0,和替代假设,Ha:u ≠u0。
第二步,决定用哪种检验, 如果n ≥30,用Z 检验,如果n<30, 用t 检验。
第三步,找出临界值, 根据给定的定义域的大小,即α=1%、α=5%、或 α=10% 从概率分布表中查出Zc 值,或tc 值。
第四步,计算统计值, 或者第五步,比较统计值与临界值而得出结论。
如果统计值的绝对值大于临界值,那么我们就否定原定假设; 如果统计值的绝对值小于临界值,那么我们就不能否定原定假设。
第二部分 最小二乘法最小二乘法的假设条件:(1) (2) (3) (4) (5) 文字解释:Nu x Ni ∑-=22)(σ1)(22--=∑n x xs ni2σσ=2s s =nux Z σ0*-=n s u x t 0*-=)(=X E i ε∞<=22,)(σσεi Var 0),(=j i Cov εε0),(=i i X Cov ε1),(±≠j i X X Cov(1)每个误差必须是随机的,其误差的期望值是零;(2)误差都是雷同的,其方差相等,同时其方差的变化量必须是有限的; (3)每个误差之间必须是相互独立的; (4)误差项与方程式中的自变量是无关的; (5)自变量之间无直接的线性关系。
通用最小二乘法的步骤:第一步:求出误差项:第二步:求误差的平方和最小。
计量经济学复习资料2
2、如果假设 4 满足,则假设 2 也满足。
以上假设也称为线性回归模型的经典假设或高斯(Gauss)假设,满足该假设的线性回归模
型,也称为经典线性回归模型
二、参数的普通最小二乘估计(OLS)
给定一组样本观测值(Xi, Yi)(i=1,2,…n)要求样本回归函数尽可能好地拟合这组值.
普通最小二乘法给出的判断标准是:二者之差的平方和最小。
R 2 1 RSS /(n k 1) TSS /(n 1) 其中:n-k-1 为残差平方和的自由度,n-1 为总体平方和
的自由度。
R 2 1 (1 R 2 ) n 1 n k 1
三、方程的显著性检验(F 检验) H0: ß0= ß1= ß2= … =ßk=0 H1: ßj 不全为 0
TSS yi2 (Yi Y )2 总体平方和
ESS yˆi2 (Yˆi Y )2 回归平方和
RSS ei2 (Yi Yˆi )2 残差平方和
1、TSS=ESS+RSS 2、可决系数 R2 统计量
记
R 2 ESS 1 RSS
TSS
TSS
称 R2 为(样本)可决系数/判定系数 可决系数的取值范围:[0,1] R2 越接近 1,说明实际观测点离样本线越近,拟合优度越高。 T 检验 检验步骤: (1)对总体参数提出假设
n
n
Q (Yi Yˆi )2 (Yi (ˆ0 ˆ1 X i ))2
1
1
xi2
(X i X )2
X
2 i
1 n
Xi 2
xi yi
(X i X )(Yi Y )
X
iYi
1 n
X i Yi
上述参数估计量可以写成:
ˆ1
《计量经济学》各章主要知识点
第一章:绪论1.计量经济学的学科属性、计量经济学与经济学、数学、统计学的关系;2.计量经济研究的四个基本步骤(1)建立模型(依据经济理论建立模型,通过模型识别、格兰杰因果关系检验、协整关系检验建立模型);(2)估计模型参数(满足基本假设采用最小二乘法,否则采用其他方法:加权最小二乘估计、模型变换、广义差分法等);(3 )模型检验:经济意义检验(普通模型、双对数模型、半对数模型中的经济意义解释,见例1、例2 ),统计检验(T检验,拟合优度检验、F检验,联合检验等);计量经济学检验(异方差、自相关、多重共线性、在时间序列模型中残差的白噪声检验等);(4 )模型应用。
例1:在模型中,y某类商品的消费支出,x收入,P商品价格,试对模型进行经济意义检验,并解释A"》的经济学含义。
In X = 0.213 +0.25 In 一0.31£其中参数卩'",都可以通过显著性检验。
经济意义检验可以通过(商品需求与收入正相关、与商品价格负相关\商品消费支出关于收入的弹性为0.25 ( 1心/畑)=0.251】心/仏));价格增加一个单位,商品消费需求将减少31%。
例2 :硏究金融发展与贫富差距的关系,认为金融发展先使贫富差距加大(恶化), 尔后会使贫富差距降<氐(好转),成为倒U型。
贫富差距用GINI系数表示,金融发展用(贷款余额/存款总额)表示。
回归结果G/^VZ r =2.34 + 0.641;-1.29x;/模型参数都可以通过显著性检验。
在X的有意义的变化范围内,GINI系数的值总是大于1 ,细致分析后模型变的毫无意义;同样的模型还有:GINI系数的值总是为负= —13.34 + 7.12 兀一14.31#O3.计量经济学中的一些基本概念数据的三种类型:横截面数据、时间序列数据、面板数据;线性模型的概念;模型的解释变量与被解释变量,被解释变量为随机变量(如果—个变量为随机变量,并与随机扰动项相关,这个变量称为内生变量),被解释变量为内生变量,有些解释变量也为内生变量。
计量经济学的统计学基础
计量经济学的统计学基础引言计量经济学是经济学的一个分支,它研究如何利用统计学方法和经济理论来分析经济现象。
在计量经济学中,统计学是非常重要的基础,它为我们提供了估计经济模型参数的工具。
本文将介绍计量经济学中的统计学基础知识,包括概率分布、假设检验和回归分析。
1. 概率分布概率分布是描述随机变量可能取值的概率的函数。
在计量经济学中经常使用的两个概率分布是正态分布和 t 分布。
1.1 正态分布正态分布是一种对称的连续型概率分布,它的特点是均值和标准差可以完全描述该分布。
正态分布在计量经济学中的应用非常广泛,例如在回归分析中,我们通常假设误差项服从正态分布。
在Markdown文本中,我们可以使用数学公式来表示正态分布的概率密度函数如下:$$f(x;\\mu,\\sigma) = \\frac{1}{\\sqrt{2\\pi}\\sigma} e^{-\\frac{(x-\\mu)^2}{2\\sigma^2}}$$其中,x是随机变量,$\\mu$ 是均值,$\\sigma$ 是标准差。
1.2 t 分布t 分布是一种对称的连续型概率分布,它的形状和正态分布很类似。
t 分布与正态分布的不同之处在于 t 分布有一个称为自由度的参数。
在计量经济学中,t 分布通常用于小样本情况下的假设检验。
给定一个自由度为v的 t 分布,其概率密度函数可以表示为:$$f(x;v) = \\frac{\\Gamma(\\frac{v+1}{2})}{\\sqrt{\\pi v}\\Gamma(\\frac{v}{2})} \\left(1+\\frac{x^2}{v}\\right)^{-\\frac{v+1}{2}}$$其中,$\\Gamma(\\cdot)$ 表示 gamma 函数。
2. 假设检验假设检验是计量经济学中常用的统计推断方法之一,它用于判断某个经济假设是否成立。
在假设检验中,我们首先提出一个原假设,然后根据样本数据来判断是否拒绝原假设。
计量经济学复习要点
计量经济学复习要点第一篇:计量经济学复习要点计量经济学复习要点第一章、概率论基础1.随机事件的概念P22.古典概行例题P5例1.1P2例1.2利用第一章的知识说明抽签的合理性如何利用第一章的知识估计一个池塘有多少鱼还有一个关于晚上紧急集合穿错鞋的题目,记不太清楚了3.期望与方差的概念,切比雪夫不等式,看例题1.4-例题1.8,不要求求出数4.变异系数的概念P175.大数定律和中心极限定律(具有独立同分布的随机变量序列的有限和近似地服从正态分布)的概念P24、P25第二章、矩阵代数1.矩阵的定义,加(page29)、减(page29)、乘(page30)、转置(page30)、逆(page31)知道怎么回事2.最小二乘法P39-P41(定义最小二乘解)3.第三节没有听,求听课学霸补充第三章、数据的分析方法和参数的统计推断1.数据的分析方法(算数平均、加权算数平均、几何平均、移动平均)(1)几种分析方法的定义(2)几中分析方法的不同(3)每种分析方法的具体作用(4)移动平均法中k的选择(5)指数平滑法的意义,α的选择,P552.t分布的概率密度函数3.矩估计法定义4.几大似然估计法P65,例题3.7例题3.85.贝叶斯估计和极大极小估计(应该是只看一下概念就可以了)6.假设检验(1)基本思想P75(2)双边假设检验(3)单边假设检验(4)参数检验P807.方差分析的思想、作用和模型第四章、一元线性回归(计算题)回归方程的求法,显著性检验,经济解释(各参数的解释),不显著的解释第六章、虚拟变量的回归模型1.虚拟变量的作用及模型2.应用虚拟变量改变回归直线的截距、斜率3.对稳定性的检验第二篇:2007计量经济学复习要点2007年计量经济学课程要点归纳1.十大经典假设的证明(关于两变量模型的性质检验)2.BLUE估计量的证明3.自相关检验方法(检验方法一定要记住)4.异方差检验方法(至少三种)5.孙老师讲过的附录要留意6.异方差与自相关的补救措施7.违反十大经典假设情况下的问题怎么解决(如多重共线性,异方差,自相关问题,虚拟变量的估计)注:以上重点均是提供参考,不做考试说明计量考察的重点是对计量模型的建立与估算,结果评价与补救思路的考察,没有大量的数学计算,请同学们放心!建议大家根据参考要点确定进度,并根据孙老师上课的重点决定自己的复习范围!希望同学们认真复习,考出好成绩!王琳第三篇:计量经济学复习笔记计量经济学复习笔记CH1导论1、计量经济学:以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
2第二章计量经济学的统计学基础知识
if
1 1
,
2
2已知
理论: H 0 : 1 2 ; H1 : 1 2
X
~
N
(1
,
1
n1
),Y
~
(2
,
2
n2
)
X
Y
~
N
(1
2
,
1
n1
2
) n2
U X Y (1 2 ) ~ N (0,1) 1 2
n1 n2
if , H 0right
U
X Y ~ N (0,1)
1 2
n1 n2
P{U u } 查附表知u, 如果U u, 则接受H1
n
P( X xi ) 1
i 1
一、概率分布
连续性的随机变量概率函数
P(a X b)
b
f (x)dx
a
x
其中f (x)为概率密度函数。密度函数满足条件
f (x) 0;
b
f (x)dx 1
a
概率分布还可用分布函数表示。分布函数是概率的累积,即
随机变量X取小于某个x值的累积概率是x的函数,记为F(x).
t0.001(9) 3.25
例3(卡方分布):设已知维尼纶纤度在正常 生产条件下服从正态分布N(1.405, 0.002304)。 在生产某段时间,抽取了5根纤维,测得其纤 度为1.32, 1.55, 1.36, 1.4, 1.44.问该段时间母体方
差是否正常?(显著性水平是0.1)
解:H0 : 2 02 0.0482
注意:这里的分母是子样标准差除以自由度, 实际上是子样均值的标准差!只有这样才与 分子保持一致性。分子被平均了,分母当然 也要平均! t分布在小样本(n<30)统计推断中占有重要的地位。
计量经济学复习要点
计量经济学复习要点第1章 绪论数据类型:截面、时间序列、面板用数据度量因果效应,其他条件不变的概念 习题:C1、C2第2章 简单线性回归回归分析的基本概念,常用术语现代意义的回归是一个被解释变量对若干个解释变量依存关系的研究,回归的实质是由固定的解释变量去估计被解释变量的平均值;简单线性回归模型是只有一个解释变量的线性回归模型; 回归中的四个重要概念1. 总体回归模型Population Regression Model,PRMt t t u x y ++=10ββ--代表了总体变量间的真实关系;2. 总体回归函数Population Regression Function,PRFt t x y E 10)(ββ+=--代表了总体变量间的依存规律;3. 样本回归函数Sample Regression Function,SRFtt t e x y ++=10ˆˆββ--代表了样本显示的变量关系; 4. 样本回归模型Sample Regression Model,SRMtt x y 10ˆˆˆββ+=---代表了样本显示的变量依存规律; 总体回归模型与样本回归模型的主要区别是:①描述的对象不同;总体回归模型描述总体中变量y 与x 的相互关系,而样本回归模型描述所关的样本中变量y 与x 的相互关系;②建立模型的依据不同;总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的;③模型性质不同;总体回归模型不是随机模型,而样本回归模型是一个随机模型,它随样本的改变而改变;总体回归模型与样本回归模型的联系是:样本回归模型是总体回归模型的一个估计式,之所以建立样本回归模型,目的是用来估计总体回归模型; 线性回归的含义线性:被解释变量是关于参数的线性函数可以不是解释变量的线性函数 线性回归模型的基本假设简单线性回归的基本假定:对模型和变量的假定、对随机扰动项u 的假定零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定 普通最小二乘法原理、推导最小二乘法估计参数的原则是以“残差平方和最小”;Min21ˆ()niii Y Y =-∑01ˆˆ(,)ββ: 1121()()ˆ()nii i n ii XX Y Y X X ==--β=-∑∑ , 01ˆˆY X β=-βOLS 的代数性质拟合优度R 2离差平方和的分解:TSS=ESS+RSS“拟合优度”是模型对样本数据的拟合程度;检验方法是构造一个可以表征拟合程度的指标——判定系数又称决定系数;121SSE SST SSR SSRR SST SST SST-===-,表示回归平方和与总离差平方和之比;反映了样本回归线对样本观测值拟合优劣程度的一种描述; 2 2[0,1]R ∈;3 回归模型中所包含的解释变量越多,2R 越大改变度量单位对OLS 统计量的影响函数形式对数、半对数模型系数的解释101ˆˆˆi iY X =β+β:X 变化一个单位Y 的变化 201ˆˆˆln ln i i Y X =β+β: X 变化1%,Y 变化1ˆβ%,表示弹性; 301ˆˆˆln i i Y X =β+β:X 变化一个单位,Y 变化百分之1001ˆβ 401ˆˆˆln i i Y X =β+β:X 变化1%,Y 变化1ˆβ%; OLS 无偏性,无偏性的证明 OLS 估计量的抽样方差 误差方差的估计 OLS 估计量的性质1线性:是指参数估计值0β和1β分别为观测值t y 的线性组合; 2无偏性:是指0β和1β的期望值分别是总体参数0β和1β; 3最优性最小方差性:是指最小二乘估计量0β和1β在在各种线性无偏估计中,具有最小方差;高斯-马尔可夫定理OLS 参数估计量的概率分布2^22()iVar x σβ=∑OLS 随机误差项μ的方差σ2的估计 简单回归的高斯马尔科夫假定 对零条件均值的理解习题:4、5、6;C2、C3、C4第3章 多元回归分析:估计1、变量系数的解释剔除、控制其他因素的影响对斜率系数1ˆβ的解释:在控制其他解释变量X2不变的条件下,X1变化一个单位对Y 的影响;或者,在剔除了其他解释变量的影响之后,X1的变化对Y 的单独影响2、多元线性回归模型中对随机扰动项u 的假定,除了零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定以外,还要求满足无多重共线性假定;3、多元线性回归模型参数的最小二乘估计式;参数估计式的分布性质及期望、方差和标准误差;在基本假定满足的条件下,多元线性回归模型最小二乘估计式是最佳线性无偏估计式;最小二乘法 OLS 公式:Y ' X X)' (X ˆ-1=β 估计的回归模型:的方差协方差矩阵:残差的方差 : 估计的方差协方差矩阵是: 拟合优度 遗漏变量偏误 多重共线性多重共线性的概念多重共线性的后果 多重共线性的检验 多重共线性的处理习题:1、2、6、7、8、10;C2、C5、C6第4章 多元回归分析:推断经典线性模型假定 正态抽样分布2^22i e n σ=-∑变量显着性检验,t 检验 检验β值的其他假设 P 值实际显着性与统计显着性 检验参数的一个线性组合假设 多个线性约束的检验:F 检验 理解排除性约束 报告回归结果习题:1、2、3、4、6、7、10、11;C3、C5、C8第6章 多元回归分析:专题测度单位对OLS 统计量的影响 进一步理解对数模型 二次式的模型 交互项的模型 拟合优度修正可决系数的作用和方法;习题:1、3、4、7;C2、C3、C5、C9、C12第7章 虚拟变量虚拟变量的定义如何引入虚拟变量:如果一个变量分成N 组,引入该变量的虚拟变量形式是只能放入N-1个虚拟变量 虚拟变量系数的解释虚拟变量系数的解释:不同组均值的差基准组或对照组与处理组 以下几种模型形式表达的不同含义;1tt t t u D X Y +++=210βββ:截距项不同; 2tt t t t u X D X Y +++=210βββ:斜率不同;3tt t t t t u X D D X Y ++++=3210ββββ:截距项与斜率都不同;其中D 是二值虚拟变量,X 是连续的变量;虚拟变量陷阱虚拟变量的交互作用习题:2、4、9;C2、C3、C6、C7、C11第8章异方差异方差的后果异方差稳健标准误BP检验异方差的检验White检验加权最小二乘法习题:1、2、3、4;C1、C2、C8、C9Eviews回归结果界面解释表计量经济学复习题第1章习题:C1、C2第2章习题:4、5、6;C2、C3、C4第3章习题:1、2、6、7、8、10;C2、C5、C6 第4章习题:1、2、3、4、6、7、10、11;C3、C5、C8 第6章习题:1、3、4、7;C2、C3、C5、C9、C12 第7章习题:2、4、9;C2、C3、C6、C7、C11 第8章习题:1、2、3、4;C1、C2、C8、C9 1、判断下列表达式是否正确2469 2、给定一元线性回归模型:1叙述模型的基本假定;2写出参数0β和1β的最小二乘估计公式; 3说明满足基本假定的最小二乘估计量的统计性质; 4写出随机扰动项方差的无偏估计公式; 3、对于多元线性计量经济学模型:1该模型的矩阵形式及各矩阵的含义; 2对应的样本线性回归模型的矩阵形式; 3模型的最小二乘参数估计量;4、根据美国1961年第一季度至1977年第二季度的数据,我们得到了如下的咖啡需求函数的回归方程:D D D P I P t t t t t t tT Q 321'0097.0157.00961.00089.0ln 1483.0ln 5115.0ln 1647.02789.1ˆln ----++-=其中,Q=人均咖啡消费量单位:磅;P=咖啡的价格以1967年价格为不变价格;I=人均可支配收入单位:千元,以1967年价格为不变价格;P '=茶的价格1/4磅,以1967年价格为不变价格;T=时间趋势变量1961年第一季度为1,…,1977年第二季度为66;D 1=1:第一季度;D 2=1:第二季度;D 3=1:第三季度; 请回答以下问题:① 模型中P 、I 和P '的系数的经济含义是什么 ② 咖啡的需求是否很有弹性③ 咖啡和茶是互补品还是替代品 ④ 你如何解释时间变量T 的系数 ⑤ 你如何解释模型中虚拟变量的作用 ⑥ 哪一个虚拟变量在统计上是显着的 ⑦ 咖啡的需求是否存在季节效应5、为研究体重与身高的关系,我们随机抽样调查了51名学生其中36名男生,15名女生,并得到如下两种回归模型:h W5662.506551.232ˆ+-= t=h D W7402.38238.239621.122ˆ++-= t=其中,Wweight=体重 单位:磅;hheight=身高 单位:英寸 请回答以下问题:① 你将选择哪一个模型为什么② 如果模型确实更好,而你选择了,你犯了什么错误 ③ D 的系数说明了什么6、简述异方差对下列各项有何影响:1OLS 估计量及其方差;2置信区间;3显着性t 检验和F 检验的使用;4预测;7、假设某研究者基于100组三年级的班级规模CS 和平均测试成绩TestScore 数据估计的OLS 回归为:(1) 若某班级有22个学生,则班级平均测试成绩的回归预测值是多少 (2) 某班去年有19个学生,而今年有23个学生,则班级平均测试成绩变化的回归预测值是多少(3) 100个班级的样本平均班级规模为,则这100个班级的样本平均测试成绩是多少(4) 100个班级的测试成绩样本标准差是多少提示:利用R 2和SER 的公式 (5) 求关于CS 的回归斜率系数的95%置信区间;(6) 计算t 统计量,根据经验法则t=2来判断显着性检验的结果; 8、设从总体中抽取一容量为200的20岁男性随机样本,记录他们的身高和体重;得体重对身高的回归为:其中体重的单位是英镑,身高的单位是英寸;(1) 身高为70英寸的人,其体重的回归预测值是多少65英寸的呢74英寸的呢(2) 某人发育较晚,一年里蹿高了英寸;则根据回归预测体重增加多少 (3) 解释系数值和的含义;(4)假定不用英镑和英寸度量体重和身高而分别用厘米和千克,则这个新的厘米-千克回归估计是什么给出所有结果,包括回归系数估计值,R2和SER;(5)基于回归方程,能对一个3岁小孩的体重假设身高1米作出可靠预测吗9、假设某研究使用250名男性和280名女性工人的工资Wage数据估计出如下OLS回归:标准误其中WAGE的单位是美元/小时,Male为男性=1,女性=0的虚拟变量;用男性和女性的平均收入之差定义工资的性别差距;1性别差距的估计值是多少2计算截距项和Male系数的t统计量,估计出的性别差距统计显着不为0吗5%显着水平的t统计量临界值为3样本中女性的平均工资是多少男性的呢4对本回归的R2你有什么评论,它告诉了你什么,没有告诉你什么这个很小的R2可否说明这个回归模型没有什么价值5另一个研究者利用相同的数据,但建立了WAGE对Female的回归,其中Female为女性=1,男性=0的变量;由此计算出的回归估计是什么10、基于美国CPS人口调查1998年的数据得到平均小时收入对性别、教育和其他特征的回归结果,见下表;该数据集是由4000名全年工作的全职工人数据组成的;其中:AHE=平均小时收入;College=二元变量大学取1,高中取0;Female女性取1,男性取0;Age=年龄年;Northeast居于东北取1,否则为0;Midwest居于中西取1,否则为0;South居于南部取1,否则为0;West居于西部取1,否则取0;表1:基于2004年CPS数据得到的平均小时收入对年龄、性别、教育、地区的回归结果概括统计量和联合检验SERR2注:括号中是标准误;(1)计算每个回归的调整R2;(2)利用表1中列1的回归结果回答:大学毕业的工人平均比高中毕业的工人挣得多吗多多少这个差距在5%显着性水平下统计显着吗男性平均比女性挣的多吗多多少这个差距在5%显着性水平下统计显着吗(3)年龄是收入的重要决定因素吗请解释;使用适当的统计检验来回答; (4)Sally是29岁女性大学毕业生,Betsy是34岁女性大学毕业生,预测她们的收入;(5)用列3的回归结果回答:地区间平均收入存在显着差距吗利用适当的假设检验解释你的答案;(6)为什么在回归中省略了回归变量West如果加上会怎样;解释3个地区回归变量的系数的经济含义;7Juantia是南部28岁女性大学毕业生,Jennifer是中西部28岁女性大学毕业生,计算她们收入的期望差距计量经济学补充复习题一、填空题1、 计量经济学常用的三类样本数据是_横截面数据__、__时间序列数据__和_面板数据;2、虚拟解释变量不同的引入方式产生不同的作用;若要描述各种类型的模型在截距水平的差异,则以 加法形式 引入虚拟解释变量;若要反映各种类型的模型的不同相对变化率时,则以 乘法形式 引入虚拟解释变量;二、选择题1、参数的估计量βˆ具备有效性是指 BA Var βˆ=0B Var βˆ为最小C βˆ-=0D βˆ-为最小2、产量x,台与单位产品成本y, 元/台之间的回归方程为yˆ=356-,这说明 DA 产量每增加一台,单位产品成本增加356元B 产量每增加一台,单位产品成本减少元C 产量每增加一台,单位产品成本平均增加356元D 产量每增加一台,单位产品成本平均减少元3、在总体回归直线E x y10)ˆ(ββ+=中,1β表示 B A 当x 增加一个单位时,y 增加1β个单位B 当x 增加一个单位时,y 平均增加1β个单位C 当y 增加一个单位时,x 增加1β个单位D 当y 增加一个单位时,x 平均增加1β个单位4、以y 表示实际观测值,yˆ表示回归估计值,则普通最小二乘法估计参数的准则是使 DA )ˆ(i i yy -∑=0 B 2)ˆ(i i y y -∑=0 C )ˆ(i i yy -∑为最小 D 2)ˆ(i i y y -∑为最小 5、设y 表示实际观测值,yˆ表示OLS 回归估计值,则下列哪项成立 D A yˆ=y B y ˆ=y C yˆ=y D y ˆ=y 6、用普通最小二乘法估计经典线性模型t t t u x y ++=10ββ,则样本回归线通过点 DA x,yB x,yˆ C x ,yˆ D x ,y 7、判定系数2R 的取值范围是 CA 2R -1B 2R 1C 02R 1D -12R 18、对于总体平方和TSS 、回归平方和RSS 和残差平方和ESS 的相互关系,正确的是 BA TSS>RSS+ESSB TSS=RSS+ESSC TSS<RSS+ESSD TSS 2=RSS 2+ESS 29、决定系数2R 是指 CA 剩余平方和占总离差平方和的比重B 总离差平方和占回归平方和的比重C 回归平方和占总离差平方和的比重D 回归平方和占剩余平方和的比重10、如果两个经济变量x 与y 间的关系近似地表现为当x 发生一个绝对量变动x 时,y 有一个固定地相对量y/y 变动,则适宜配合地回归模型是 BA i i i u x y ++=10ββB ln i i i u x y ++=10ββC i ii u x y ++=110ββ D ln i i i u x y ++=ln 10ββ 11、下列哪个模型为常数弹性模型 AA ln i i i u x y ++=ln ln 10ββB ln i i i u x y ++=10ln ββC i i i u x y ++=ln 10ββD i ii u x y ++=110ββ 12、模型i i i u x y ++=ln 10ββ中,y 关于x 的弹性为 C A i x 1β B i x 1β C iy 1β D i y 1β 13、模型ln i i i u x y ++=ln ln 10ββ中,1β的实际含义是 BA x 关于y 的弹性B y 关于x 的弹性C x 关于y 的边际倾向D y 关于x 的边际倾向14、当存在异方差现象时,估计模型参数的适当方法是 AA 加权最小二乘法B 工具变量法C 广义差分法D 使用非样本先验信息15、加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即 BA 重视大误差的作用,轻视小误差的作用B 重视小误差的作用,轻视大误差的作用C 重视小误差和大误差的作用D 轻视小误差和大误差的作用16、容易产生异方差的数据是 CA 时间序列数据B 修匀数据C 横截面数据D 年度数据17、设回归模型为i i i u x y +=β,其中var i u =22i x σ,则的最小二乘估计量为 CA. 无偏且有效 B 无偏但非有效C 有偏但有效D 有偏且非有效18、如果模型t t t u x b b y ++=10存在序列相关,则 DA cov t x ,t u =0B cov t u ,s u =0tsC cov t x ,t u 0D cov t u ,s u 0ts19、下列哪种形式的序列相关可用DW 统计量来检验i v 为具有零均值,常数方差,且不存在序列相关的随机变量 AA t t t v u u +=-1ρB t t t t v u u u +++=-- 221ρρC t t v u ρ=D ++=-12t t t v v u ρρ20、DW 的取值范围是DA -1DW0B -1DW1C -2DW2D 0 DW421、当DW =4是时,说明 DA 不存在序列相关B 不能判断是否存在一阶自相关C 存在完全的正的一阶自相关D 存在完全的负的一阶自相关22、模型中引入一个无关的解释变量 CA 对模型参数估计量的性质不产生任何影响B 导致普通最小二乘估计量有偏C 导致普通最小二乘估计量精度下降D 导致普通最小二乘估计量有偏,同时精度下降23、如果方差膨胀因子VIF =10,则认为什么问题是严重的 CA 异方差问题B 序列相关问题C 多重共线性问题D 解释变量与随机项的相关性24、某商品需求函数为i i i u x b b y ++=10,其中y 为需求量,x 为价格;为了考虑“地区”农村、城市和“季节”春、夏、秋、冬两个因素的影响,拟引入虚拟变量,则应引入虚拟变量的个数为 BA 2B 4C 5D 625、根据样本资料建立某消费函数如下:tC ˆ=+tD +t x ,其中C 为消费,x 为收入,虚拟变量D =农村家庭城镇家庭⎩⎨⎧01,所有参数均检验显着,则城镇家庭的消费函数为AA t C ˆ=+t xB tC ˆ=+t xC t C ˆ=+t xD tC ˆ=+t x 26、假设某需求函数为i i i u x b b y ++=10,为了考虑“季节”因素春、夏、秋、冬四个不同的状态,引入4个虚拟变量形式形成截距变动模型,则模型的 DA 参数估计量将达到最大精度B 参数估计量是有偏估计量C 参数估计量是非一致估计量D 参数将无法估计27、对于模型i i i u x b b y ++=10,为了考虑“地区”因素北方、南方,引入2个虚拟变量形式形成截距变动模型,则会产生 DA 序列的完全相关B 序列不完全相关C 完全多重共线性D 不完全多重共线性28、如果一个回归模型中不包含截距项,对一个具有m 个特征的质的因素要引入虚拟变量的数目为 AA mB m-1C m-2D m+129、某一时间序列经一次差分变换成平稳时间序列,此时间序列称为A;A .1阶单整B .2阶单整C .K 阶单整D .以上答案均不正确30、当随机误差项存在自相关时,进行单位根检验是由B 来实现;A . DF 检验B .ADF 检验C .EG 检验D .DW 检验三、多项选择题:1、一元线性回归模型t t t u x y ++=10ββ的经典假设包括 ABCDEA 0)(=t u EB 2)(σ=t u Var 常数C 0),cov(=j i u uD t u ~N0,1E x 为非随机变量,且0),cov(=t t u x2、以带“”表示估计值,u 表示随机误差项,如果y 与x 为线性相关关系,则下列哪些是正确的 BEA t t x y 10ββ+=B t t t u x y ++=10ββC t t t u x y ++=10ˆˆββD tt t u x y ++=10ˆˆˆββ E tt x y 10ˆˆˆββ+= 3、用普通最小二乘法估计模型t t t u x y ++=10ββ的参数,要使参数估计量具备最佳线性无偏估计性质,则要求: ABCDEA 0)(=t u EB 2)(σ=t u Var 常数C 0),cov(=j i u uD t u 服从正态分布E x 为非随机变量,且0),cov(=t t u x4、假设线性回归模型满足全部基本假设,则其参数估计量具备 CDEA 可靠性B 合理性C 线性D 无偏性E 有效性5、下列哪些非线性模型可以通过变量替换转化为线性模型 ABC A i i i u x y ++=210ββ B i ii u x y ++=110ββ C ln i i i u x y ++=ln 10ββ D i i i u x y ++=210ββE i i i i u x y ++=ββ06、异方差性将导致 BCDEA 普通最小二乘估计量有偏和非一致B 普通最小二乘估计量非有效C 普通最小二乘估计量的方差的估计量有偏D 建立在普通最小二乘估计基础上的假设检验失效E 建立在普通最小二乘估计基础上的预测区间变宽7、当模型中解释变量间存在高度的多重共线性时 ACDA 各个解释变量对被解释变量的影响将难于精确鉴别B 部分解释变量与随机误差项之间将高度相关C 估计量的精度将大幅下降D 估计量对于样本容量的变动将十分敏感E 模型的随机误差项也将序列相关8、下述统计量可以用来检验多重共线性的严重性 ACDA 相关系数B DW 值C 方差膨胀因子D 特征值E 自相关系数三、判断题1、随机误差项u i 与残差项e i 是一回事; F2、当异方差出现时,常用的t 检验和F 检验失效; T3、在异方差情况下,通常预测失效; T四、计算分析题1、指出下列模型中的错误,并说明理由;1 tt Y C 2.1180ˆ+= 其中,C 、Y 分别为城镇居民的消费支出和可支配收入;2 tt t L K Y ln 28.0ln 62.115.1ˆln -+= 其中,Y 、K 、L 分别为工业总产值、工业生产资金和职工人数;2、对下列模型进行适当变换化为标准线性模型:(1) y =0β+1βx 1+2β21x +u ; (2) Q =A u e L K βα;(3) Y =exp 0β+1βx+u ;3、一个由容量为209的样本估计的解释CEO 薪水的方程为:其中,Y 表示年薪水平单位:万元, 1X 表示年收入单位:万元, 2X 表示公司股票收益单位:万元; 321D D D ,,均为虚拟变量,分别表示金融业、消费品工业和公用事业;假设对比产业为交通运输业;(1) 解释三个虚拟变量参数的经济含义;(2) 保持1X 和2X 不变,计算公用事业和交通运输业之间估计薪水的近似百分比差异;这个差异在1%的显着性水平上是统计显着吗消费品工业和金融业之间估计薪水的近似百分比差异是多少。
计量经济学复习笔记
第一章统计概念1.什么是计量经济学计量经济学是对经济的测度,利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学。
2.计量经济学的方法论(计量经济分析步骤)(1)建立理论假说。
(2)收集数据。
(3)假定数学模型。
(4)设立统计或计量模型。
(5)估计经济模型参数(6)核查模型的适用性:模型设定检验。
(7)检验源自模型的假定(8)利用模型进行预测4.数据类型(1)时间序列数据:按时间跨度获得的数据。
特征是一般变量如 Y t、X t下标为t。
(2)截面数据:同一时点上的一个或多个变量的数据集合。
如:各地区2002年人口普查数据。
(3)合并数据:既包括时间序列数据有包括截面数据。
例:20年间10个国家的失业数据。
20年失业数据是时间序列,10个国家又是截面数据。
(4)面板数据:同一个横截面的单位的跨期调查数据。
例:对相同的家庭数量在几个时间间隔内进行的财务状况调查。
5.理解回归关系回归关系是一种统计上的相关关系,并不意味着自变量和因变量之间存在着因果关系。
第二章线性回归的基本思想1.回归分析的含义: 回归分析是反映的自变量和因变量之间的统计关系,回归分析是在自变量给定条件下的因变量的变化,是一种条件回归分析E(Y i|X i)=B1+B2X i2.随机误差项的性质(为什么要引入随机误差项)(1)随机误差项代表着未纳入模型变量对因变量的影响(2)即使模型包括了影响因变量的所有因素,模型也有不可避免的随机性。
(3)μ还代表着度量误差(4)模型设定应该尽可能简单,只要不遗漏重要变量,把因变量的次要影响因素归于随机项 μ 。
(奥卡姆剃刀原则)3.参数估计方法———普通最小二乘法的基本思想 选择参数使得残差平方和最小——Min ∑e i 2=Min ∑(Y i −Yi ̌)2=Min ∑(Y i −b 1−b 2X i )^24.根据Ols 法得出参数 b 1 b 2 称为最小二乘估计量,最小二乘估计量的性质: (1)Ols 方法获得样本回归直线过样本均值点(X ,Y ) (2)残差的均值总为0,(3)残差项与解释变量的乘积求和为0,即残差项与解释变量不相关。
计量经济学之-概率论和统计学知识习题解析复习资料
随机变量标准化:
2
Ch2:概率统计复习 概率论复习
随机变量的统一定义:(1)取一切实数;(2)用概率函数描述概率分布 概率函数:
F(x) P( x)
连续随机变量:
离散随机变量:
3
Ch2:概率统计复习 概率论复习
随机变量的数字特征: 数学期望(Expectation,mean)Ec:随机变量取值的概率加权平均。 方差(Variance) Var(c):随机变量的随机性。方差等于0?
联合密度函数 (2)矩
数学期望向量:
方差-协方差矩阵:
概率论复习
8
Ch2:概率统计复习
随机向量: 协方差和相关系数:
概率论复习
相关系数等于0意味着什么?相关系数等于1呢? (3)条件分布
条件概率分布函数: 条件概率密度函数: 乘法公式:
9
Ch2:概率统计复习
随机向量: (3)条件分布 条件矩: 条件数学期望:
14
Ch2:概率统计复习
参数估计:
总体
X ~ F(x, )
统计学复习
θ为未知参数,用样本提供的信息估计出θ
(1)矩估计:
1
n
n i1
X
r i
p E( X r ) r ( ),
r 1,2,
,k
令
1
n
n i1
X
r i
ˆr ( )
r (ˆ),
r 1,2, , k
从中解出估计量ˆ
15
Ch2:概率统计复习
条件方差:
概率论复习
条件数学期望和条件方差都是条件随机变量(ξ)的函数,是随机变量。
10
Ch2:概率统计复习 概率论复习
计量经济学 统计学基础
编辑版pppt
2
编辑版pppt
3
编辑版pppt
4
编辑版pppt
5
向下累计频率
编辑版pppt
6
第
根据上表得出
编辑版pppt
7
2.3. 连续型随机变量的分布 2.3.1. 概率密度
分布函数为
因此,若已知X的分布函数,我们就知道X落在
任一区间
上的概率。分布函数F(x)在x处的
函数值就表示X落在区间
上的概率。
编辑版pppt8来自编辑版pppt9
编辑版pppt
10
编辑版pppt
11
编辑版pppt
12
编辑版pppt
13
编辑版pppt
14
编辑版pppt
15
编辑版pppt
16
编辑版pppt
17
编辑版pppt
18
F分布其均值为 n 2
n2 2
方差为 2n22(n1 n2 2)
n1(n2 2)2(n2 4)
编辑版pppt
19
编辑版pppt
20
编辑版pppt
21
编辑版pppt
22
感谢亲观看此幻灯片,此课件部分内容来源于网络, 如有侵权请及时联系我们删除,谢谢配合!
编辑版pppt
23
分布函数fx在x处的函数值就表示x落在区间上的概率10111213141516171819f分布其均值为方差为202122感谢亲观看此幻灯片此课件部分内容来源于网络如有侵权请及时联系我们删除谢谢配合
第2章 统计学基础
编辑版pppt
1
抽样调查:部分个体数据推测总体一般结 论。
概率:某一结果、事件发生的可能性。 概率性质
第二章计量经济学的统计学基础
2、估计方法
矩估计法
点估计 区间估计
最大似然法
总体分布未知
最小二乘法
已知方差 正态总体
估计期望
一般总体(大样本) 一般总体(大样本)
单个总体
方差未知
正态总体
估计方差(常用小样本下,正态总 两个总体 体估计其它参数)
3、 对估计量的检验——假设检验
(1)对总体分布特征的假设检验
一个正态总体的假设检验 a 检验均值:已知方差和未知方差 b 检验方差:未知均值(双尾和单尾) 两个正态总体的假设检验 a 检验均值:未知方差但可假设其相等 b 检验方差:未知均值(双尾和单尾) 总体分布的假设检验 a 总体为离散型分布 b 总体为连续型分布
注意
(1) 对于线性回归方程,一般软件包报告了回归系数及 标准误,并且给出了针对双侧对立假设的p值,将其除以 2,即可得到单侧对立假设的p值;
(2) 随着样本容量的扩大,一般使用较小的显著性水平, 以作为抵偿标准误越来越小的一种办法;对于小样本容 量,可以接受较大的显著性水平,可以让大到0.20
五、随机变量函数的概念和分布
第二章 计量经济学的统计学基础
主要内容
§2.1 总体、样本 §2.2 对总体的描述——随机变量的数字特征 §2.3 对样本的描述——样本分布的数字特征 §2.4 通过样本,估计总体(一)
——估计量的特征 §2.5 通过样本,估计总体(二)
——估计方法 §2.6 通过样本,估计总体(三)
——假设检验
=P(拒绝H0 | H0)
即当H0为真时拒绝H0的概率。
(4)检验的p值
检验的p值(p-value)是指给定t统计量的观测值,能拒绝原 假设的最小显著性水平。小的p值是拒绝原假设的证据。
《计量经济学》第二章知识
第二章 数学基础 (Mathematics)第一节 矩阵(Matrix)及其二次型(Quadratic Forms)第二节 分布函数(Distribution Function),数学期望(Expectation)及方差(Variance) 第三节 数理统计(Mathematical Statistics ) 第一节 矩阵及其二次型(Matrix and its Quadratic Forms)2.1 矩阵的基本概念与运算 一个m ×n 矩阵可表示为:v a a a a a aa a a a A mn m m n n ij ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡== 212222111211][矩阵的加法较为简单,若C=A +B ,c ij =a ij +b ij但矩阵的乘法的定义比较特殊,若A 是一个m ×n 1的矩阵,B 是一个n 1×n 的矩阵,则C =AB 是一个m ×n 的矩阵,而且∑==nk kj ikij b ac 1,一般来讲,AB ≠BA ,但如下运算是成立的:● 结合律(Associative Law ) (AB )C =A (BC ) ● 分配律(Distributive Law ) A (B +C )=AB +AC 问题:(A+B)2=A 2+2AB+B 2是否成立?向量(Vector )是一个有序的数组,既可以按行,也可以按列排列。
行向量(row ve ctor)是只有一行的向量,列向量(column vector)只有一列的向量。
如果α是一个标量,则αA =[αa ij ]。
矩阵A 的转置矩阵(transpose matrix)记为A ',是通过把A 的行向量变成相应的列向量而得到。
显然(A ')′=A ,而且(A +B )′=A '+B ',● 乘积的转置(Transpose of a production ) A B AB ''=')(,A B C ABC '''=')(。
计量经济学 第二章 一元线性回归模型
计量经济学第二章一元线性回归模型第二章一元线性回归模型第一节一元线性回归模型及其古典假定第二节参数估计第三节最小二乘估计量的统计特性第四节统计显著性检验第五节预测与控制第一节回归模型的一般描述(1)确定性关系或函数关系:变量之间有唯一确定性的函数关系。
其一般表现形式为:一、回归模型的一般形式变量间的关系经济变量之间的关系,大体可分为两类:(2.1)(2)统计关系或相关关系:变量之间为非确定性依赖关系。
其一般表现形式为:(2.2)例如:函数关系:圆面积S =统计依赖关系/统计相关关系:若x和y之间确有因果关系,则称(2.2)为总体回归模型,x(一个或几个)为自变量(或解释变量或外生变量),y为因变量(或被解释变量或内生变量),u为随机项,是没有包含在模型中的自变量和其他一些随机因素对y的总影响。
一般说来,随机项来自以下几个方面:1、变量的省略。
由于人们认识的局限不能穷尽所有的影响因素或由于受时间、费用、数据质量等制约而没有引入模型之中的对被解释变量有一定影响的自变量。
2、统计误差。
数据搜集中由于计量、计算、记录等导致的登记误差;或由样本信息推断总体信息时产生的代表性误差。
3、模型的设定误差。
如在模型构造时,非线性关系用线性模型描述了;复杂关系用简单模型描述了;此非线性关系用彼非线性模型描述了等等。
4、随机误差。
被解释变量还受一些不可控制的众多的、细小的偶然因素的影响。
若相互依赖的变量间没有因果关系,则称其有相关关系。
对变量间统计关系的分析主要是通过相关分析、方差分析或回归分析(regression analysis)来完成的。
他们各有特点、职责和分析范围。
相关分析和方差分析本身虽然可以独立的进行某些方面的数量分析,但在大多数情况下,则是和回归分析结合在一起,进行综合分析,作为回归分析方法的补充。
回归分析(regression analysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。
2.计量经济学第二讲-计量经济分析的统计学基础
二、随机变量与概率分布
2.
随机变量的概率分布和概率密度函数:
一个随机变量的概率分布:是该随机变量取给定值或属于 一给定值集的概率所确定的函数。概率分布反映的是随机 变量所有可能取值的概率的分配方式。一旦与所有可能结 果相联系的概率被确定,则概率分布即完全被确定。 [“We can describe a random variable by examining the process which generates its values. This process, called a probability distribution, lists all possible outcomes and the probability that each will occur.” Pindyck, R.S. et. Al. (1991, p.19)]
离散随机变量:只能取某些离散值。
[“A discrete random variable may take on only a specific number of real values”, Pindyck, R.S. et. Al. (1991, p.19)] 如:掷骰子所得点数(1,2,3,4,5,6)。
连续随机变量:可以取一个有限(或无限)区间所有值。
[“A continuous random variable may take on any value on the real number line”, Pindyck, R.S. et. Al. (1991, p.19)] 如:零件的直径。
随机变量通常用大写字母X, Y, Z来表示,它们所取的值用小 写字母x, y, z等表示。
计量经济学复习知识点重点难点
计量经济学知识点第一章导论1、计量经济学的研究步骤:模型设定、估计参数、模型检验、模型应用。
2、计量经济学是统计学、经济学和数学的结合。
3、计量经济学作为经济学的一门独立学科被正式确立的标志:1930年12月国际计量经济学会的成立。
4、计量经济学是经济学的一个分支学科。
第二章简单线性回归模型1、在总体回归函数中引进随机扰动项的原因:①作为未知影响因素的代表;②作为无法取得数据的已知因素的代表;③作为众多细小影响因素的综合代表;④模型的设定误差;⑤变量的观测误差;⑥经济现象的内在随机性。
2、简单线性回归模型的基本假定:①零均值假定;②同方差假定;③随机扰动项和解释变量不相关假定;④无自相关假定;⑤正态性假定。
3、OLS回归线的性质:①样本回归线通过样本均值;②估计值的均值等于实际值的均值;③剩余项ei的均值为零;④被解释变量的估计值与剩余项不相关;⑤解释变量与剩余项不相关。
4、参数估计量的评价标准:无偏性、有效性、一致性。
5、OLS估计量的统计特征:线性特性、无偏性、有效性。
6、可决系数R²的特点:①可决系数是非负的统计量;②可决系数的取值范围为[0,1];③可决系数是样本观测值的函数,可决系数是随抽样而变动的随机变量。
第三章多元线性回归模型1、多元线性回归模型的古典假定:①零均值假定;②同方差和无自相关假定;③随机扰动项和解释变量不相关假定;④无多重共线性假定;⑤正态性假定。
2、估计多元线性回归模型参数的方法:最小二乘估计、极大似然估计、矩估计、广义矩估计。
3、参数最小二乘估计的性质:线性性质、无偏性、有效性。
4、可决系数必定非负,但是根据公式计算的修正的可决系数可能为负值,这时规定为0。
5、可决系数只是对模型拟合优度的度量,可决系数越大,只是说明列入模型中的解释变量对被解释变量的联合影响程度越大,并非说明模型中各个解释变量对被解释变量的影响程度也大。
6、当R²=0时,F=0;当R²越大时,F值也越大;当R²=1时,F→∞。
(完整word版)计量经济学知识点总结
(完整word版)计量经济学知识点总结第一章:1计量经济学研究方法:模型设定,估计参数,模型检验,模型应用2.计量经济模型检验方式:①经济意义:模型与经济理论是否相符②统计推断:参数估计值是否抽样的偶然结果③计量经济学:是否复合基本假定④预测:模型结果与实际杜比3.计量经济学中应用的数据类型:①时间序列数据(同空不同时)②截面数据(同时不同空)③混合数据(面板数据)④虚拟变量数据(学历,季节,气候,性别)第二章:1.相关关系的类型:①变量数量:简单相关/多重相关(复相关)②表现形式:线性相关(散布图接近一条直线)/非线性相关(散布图接近一条直线)③变化的方向:正相关(变量同方向变化,同增同减)/负相关(变量反方向变化,一增一减不相关)2.引入随机扰动项的原因:①未知影响因素的代表(理论的模糊性)②无法取得数据的已知影响因素的代表(数据欠缺)③众多细小影响因素综合代表(非系统性影响)④模型可能存在设定误差(变量,函数形式设定)⑤模型中变量可能存在观测误差(变量数据不符合实际)⑥变量可能有内在随机性(人类经济行为的内在随机性)3.OLS回归线数学性质:①剩余项的均值为零②OLS回归线通过样本均值③估计值的均值等于实际观测值的均值④被解释变量估计值与剩余项不相关⑤解释变量与剩余项不相关4.OLS估计量”尽可能接近”原则:无偏性,有效性,一致性5.OLS估计式的统计性质/优秀品质:线性特征,无偏性特征,最小方差性特征第三章:1.偏回归系数:控制其他解释变量不变的条件下,第j个解释变量的单位变动对被解释变量平均值的影响,即对Y平均值直接或净的影响2.多元线性回归中的基本假定:①零均值②同方差③无自相关④随机扰动项与解释变量不相关⑤无多重共线性⑥正态性…一元中有123463. OLS回归线数学性质:同第二章34. OLS估计式的统计性质:线性特征,无偏性特征,最小方差性特征5.为什么用修正可决系数不用可决系数?可决系数只涉及变差没有考虑自由度,如果用自由度去校正所计算的变差,可纠正解释变量个数不同引起的对比困难第四章:1.多重共线性背景:①经济变量之间具有共同变化趋势②模型中包含滞后变量③利用截面数据建立模型可出现..④样本数据自身原因2.后果:A完全①参数估计值不确定②csgj值方差无限大B不完全①csgj量方差随贡献程度的增加而增加②对cs区间估计时,置信区间区域变大③假设检验用以出现错误判断④可造成可决系数较高,但对各cs 估计的回归系数符号相反,得出错误结论3.检验:A简单相关系数检验法:COR 解释变量.大于0.8,就严重B方差膨胀因子法:因子越大越严重;≥10,严重C直观判断法:增加或剔除一个解释变量x,估计值y发生较大变化,则存在;定性分析,重要x标准误差较大并没通过显著性检验时,则存在;x回归系数所带正负号与定性分析结果违背,则存在;x相关矩阵中,x之间相关系数较大,则存在D逐步回归检验法:将变量逐个引入模型,每引入一个x,都进行F检验,t检验,当原来引入的x由于后面引入的x不显著是,将其剔除.以确保每次引入新的解释变量之前方程种植包含显著变量.4.补救措施:①剔除变量法②增大样本容量③变换模型形式:自相关④利用非样本先验信息⑤截面数据与时序数据并用:异方差⑥变量变换第五章:1.异方差产生原因:①模型中省略了某些重要的解释变量②模型设定误差③数据测量误差④截面数据中总体各单位的差异2.后果:A参数估计统计特性:参数估计的无偏性仍然成立;参数估计方差不再是最小B参数显著性检验:t统计量进行参数检验失去意义C 预测影响:将无效3检验:A图示①相关图形分析data x y,看散点图,quick→graph→x,y→OK→scatter diagram→OK,可以看到x,y散点图②残差图形分析data x y,sort x;ls y c x;再回归结果的子菜单点resid,可以看残差分析图Bgoldfeld-quanadt:data x y;sort x;smpl 1 n1;ls y c x(RSS1);smpl n2 n;ls y c x(RSS2);计算F*=RSS2/RSS1,取α=0.05,查F分布表,得F0.05((n-c)/2,(n-c)/2),将F值与此对比.若F*>F(0.05),拒绝原假设,存在异方差Cwhite:data x y;ls y c x;在回归结果的子菜单中点击view-residual test-white heteroskedasticity,可以看到辅助回归模型的估计结果D arch;E:glejser:data x y;ls y c x;genr E1=resid;genr E2=abs(E1);genr XH=X^h;ls E2 c xh;依次根据XH的T值判断E2与XH之间是否存在异方差4.补救措施:A模型变换法:genr y1=y/根号x^h; genr x2=1/根号x^h ; genr x3=x/根号x^h;ls y1 x2 x3;B加权最小二乘法wls:权数:w1t=1/xt;w2t=1/xt^2;w3t=1/根号xt.电脑操作:genr w1=1/x;genr w2=1/(x^2);genr w3=1/sqr(x);ls (w=w1t) y c x;ls (w2=w2t) y c x;ls (w3=w3t) y c x. 第六章:1.自相关产生原因:①经济系统的惯性②经济活动的滞后效应③数据处理造成的相关④蛛网现象⑤模型设定偏误2.表现形式:自相关性质可以用自相关系数符号判断.即ρ<0为负相关, ρ>0为正相关.当|ρ|接近1时,表示相关的程度很高.自相关形式:见公式.3.后果:见公式.4.检验:A图示检验:data x y;ls y c x;再回归模型的子菜单点击resids,可以看到模型残差分布图;genr e=resid;data e e(-1);view-graph-scatter-simple scatter.B.DW检验:data x y;ls y c x;根据回归结果得出DW值,然后判断是否自相关.(正相关0~dl,无法判断dl~du,正相关du~2~4-du,无法判断4-du~4-dl,负相关4-dl~4).5.补救:A广义差分法:data x y;ls y c x;根据DW求ρ尖>(ρ尖=1-DW/2);smpl 2 n;genr yi=y-ρ尖*y(-1); genr xi=x-ρ尖*x(-1);ls y1 c x1;运用DW检验判断是否消除了自相关B:Cochrane orcutt迭代法:data x y;la y c x ar(1);运用DW检验判断C其他方法:①一阶差分法:data x y;ls y c x;smpl 2 n;genr y1=y-y(-1); genr x1=x-x(-1);ls y1 c x1; 运用DW检验判断②德宾两步法:data x y;smpl 2 n;ls y c y(-1)根据输出结果看y(-1)前系数,求出ρ尖; genr yi=y-ρ尖*y(-1); genr xi=x-ρ尖*x(-1);ls y1 c x1;运用DW检验判断第七章:1.虚拟变量0和1选取原则:0基期,比较的基础,参照物;1报告期:被比较类型2.虚拟变量数量的设置规则:①若定性因素具有m≥2个相互排斥属性,当回归模型有截距项时,只能引入m-1个变量②当回归模型无截距项时,引入m个变量3.虚拟解释变量的回归:加法截距:①解释变量只有一个分为两种相互排斥类型的定性变量而无定量变量②解释变量包含一个定量变量和一个分为两种类型的定性变量③解释变量包含一个定量变量和一个两种以上类型的定性变量④解释变量包含一个定量变量和两个定性变量.乘法斜率:①截距不变情形②结局斜率均发生变化③分段回归分析描述的精度.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图2-1表示的是我国货币供应量M2(y)与经过 季节调整的GDP(x)之间的关系(数据为
1995年第一季度到2004年第二季度的季度数
据)。
5
但有时候我们想知道当x变化一单位时,y平均 变化多少,可以看到,由于图中所有的点都相
对的集中在图中直线周围,因此我们可以以这
条直线大致代表x与y之间的关系。如果我们能
(1)E ut 0 ,即残差具有零均值;
(2)var ut 2<∞,即残差具有常数方差,且对 于所有x值是有限的; (3)cov ui , u j 0 ,即残差项之间在统计意义 上是相互独立的;
(4)covut , xt 0,即残差项与变量x无关;
(2.32)
ˆ ~ N 0,1 var
(2.33)
31
但是,总体回归方程中的系数的真实标准差是 得不到的,只能得到样本的系数标准差
ˆ )。用样本的标准差去替代总体 ( SE ˆ 、 SE
标准差会产生不确定性,并且
ˆ ˆ ˆ 将不再服从正态分布,而 ˆ 、 SE SE 服从自由度为T-2的t分布,其中T为样本容量
金融、经济变量之间的关系,大体上可以分 为两种:
(1)函数关系:Y=f(X1,X2,….,XP),其中Y的 值是由Xi(i=1,2….p)所唯一确定的。 (2)相关关系: Y=f(X1,X2,….,XP) ,这里Y的 值不能由Xi(i=1,2….p)精确的唯一确定。
3
图2-1 货币供应量和GDP散点图
(一) 方法介绍
本章所介绍的是普通最小二乘法(ordinary least squares,简记OLS);
最小二乘法的基本原则是:最优拟合直线应该 使各点到直线的距离的和最小,也可表述为距 离的平方和最小。
假定根据这一原理得到的α、β估计值为 、 , ˆx ˆ ˆ yt 。 ˆ 则直线可表示为 t
ˆ ~ N , var
(2.30) (2.31)
ˆ ~ N , var
30
需要注意的是:如果残差不服从正态分布,即 假设(5)不成立,但只要CLRM的其他假设条件
还成立,且样本容量足够大,则通常认为系数
估计量还是服从正态分布的。
其标准正态分布为:
ˆ- ~N0,1 var
(2.5) (2.6)
ˆx ˆ y
15
(二)一些基本概念 1.总体(the population)和样本(the sample)
总体是指待研究变量的所有数据集合,可以是 有限的,也可以是无限的;而样本是总体的一 个子集。
2、总体回归方程(the population regression function,简记PRF),样本回归方程(the sample regression function,简记SRF)。
16
总体回归方程(PRF)表示变量之间的真实关 系,有时也被称为数据生成过程(DGP), PRF中的α、β值是真实值,方程为:
yt xt + u t
(2. 7)
样本回归方程(SRF)是根据所选样本估算的 变量之间的关系函数,方程为:
ˆx ˆ ˆ y t
(2.8)
注意:SRF中没有误差项,根据这一方程得到 的是总体因变量的期望值
34
二
一元线性回归模型的统计检验
一、拟合优度(goodness of fit statistics)检验
拟合优度可用R2 表示:模型所要解释的
是y相对于其均值的波动性,即 y t y
(总平方和,the total sum of squares,
2
简记TSS),这一平方和可以分成两部分:
x x ˆ u 其中, s 是残差的估计标准差。 T 2
2 t
2 t
1
s
1 2 2 x T x t
(2.22)
25
参数估计量的标准差具有如下的性质: (1)样本容量T越大,参数估计值的标准差越 小;
ˆ 都取决于s2。 s2是残差的方差 (2) ˆ 和SE SE
ห้องสมุดไป่ตู้
27
图2-2 直线拟合和散点集中度的关系
28
2 x (4) t
项只影响截距的标准差,不影响斜率
的标准差。理由是: xt2 衡量的是散点与y轴的
2 距离。 x t 越大,散点离y轴越远,就越难准确
地估计出拟合直线与y轴的交点(即截距); 反之,则相反。
29
2.OLS估计量的概率分布 给定假设条件(5),即u t ~N 0, 2 ,则 yt 也服 从正态分布 系数估计量也是服从正态分布的:
(dependent variable)、 (independent variable)、
被解释变量
(explanatory variable)、 (explained variable)、
结果变量 原因变量
(effect variable);
(causal variable)
10
α、β为参数(parameters),或称回归系数 (regression coefficients); ut通常被称为随机误差项(stochastic error term),或随机扰动项(random disturbance term),简称误差项, 在回归模型中它是不确定的,服从随机分布 (相应的,yt也是不确定的,服从随机分布)。
ln yt ln A lnxt ut
(2.11)
可以看到,模型2.12即为一线性模型。
20
4.估计量(estimator)和估计值(estimate)
估计量是指计算系数的方程;而估计值是指估
计出来的系数的数值。
21
三、最小二乘估计量的性质和分布
(一) 经典线性回归模型的基本假设
在本课程中,线性回归一词总是对指参数β为 线性的一种回归(即参数只以一次方出现), 对解释变量x则可以是或不是线性的。
19
有些模型看起来不是线性回归,但经过一些基 本代数变换可以转换成线性回归模型。例如,
yt Axt e
ut
(2.10)
可以进行如下变换:
X t lnxt ,则方程 令 Yt ln yt 、 ln A、 (2. 11)变为: (2.12) Yt X t ut
即:
ˆ ~ ˆ SE
tT 2
(2.34)
ˆ t T 2 (2.35) ~ ˆ SE
32
3.正态分布和t分布的关系
图2-3 正态分布和t分布形状比较
33
从图形上来看,t分布的尾比较厚,均值处 的最大值小于正态分布。 随着t分布自由度的增大,其对应临界值显 著减小,当自由度趋向于无穷时,t分布就服从 标准正态分布了。 所以正态分布可以看作是t分布的一个特例。
(5)ut~N 0, 2 ,即残差项服从正态分布
22
(二)最小二乘估计量的性质 如果满足假设(1)-(4),由最小二乘法得到的估 计量 ˆ 具有一些特性,它们是最优线性无 ˆ 、 偏估计量(Best Linear Unbiased Estimators, 简记BLUE)。
24
(三) OLS估计量的方差、标准差和其概率分布 1.OLS估计量的方差、标准差。 给定假设(1)-(4),估计量的标准差计算方程如 下:
ˆ s SE
x T x x
2 t t
2
s
x T x Tx
2 t 2 t 2
(2.21)
ˆ s SE
35
ˆt y yt y = y
2
2
2 ˆ u + t
(2.36)
2 ˆ 是被模型所解释的部分,称为回归平方 y y
和(the explained sum of squares,简记ESS);
13
ˆt ,称为拟合值(fitted 直线上的yt值,记为 y ˆt ,称 value),实际值与拟合值的差,记为u 为残差(residual) ,可以看作是随机误差
项u t 的估计值。 根据OLS的基本原则,使直线与各散点的距 离的平方和最小,实际上是使残差平方和T 2 ˆ u (residual sum of squares, 简记RSS) t t 1 最小,即最小化:
(regression equation)或回归模型
(regression model)。
7
图2-1中的直线可表示为
y= x
(2.1)
根据上式,在确定α、β的情况下,给定一个x 值,我们就能够得到一个确定的y值,然而根 据式(2.1)得到的y值与实际的y值存在一个 误差(即图2-1中点到直线的距离)。
8
如果我们以u表示误差,则方程(2.1)变为:
y= x u
即:
(2.2)
(2.3)
yt xt ut
其中t(=1,2,3,…..,T)表示观测数。 式(2.3)即为一个简单的双变量回归模型(因其仅 具有两个变量x, y)的基本形式。
9
其中yt被称作因变量
xt被称作自变量 解释变量
估计量。 s2越大,残差的分布就越分散,这样
模型的不确定性也就越大。如果s2很大,这意
味着估计直线不能很好地拟合散点;
26
2 x x (3)参数估计值的方差与 t 成反比。
其值越小,散点越集中,这样就越难准确地估 计拟合直线;相反,如果 xt x 越大,散点
2
越分散,这样就可以容易地估计出拟合直线, 并且可信度也大得多。 比较图2-2就可以清楚地看到这点。