伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解-第1~4章【圣才出品】

合集下载

《计量经济学导论》考研伍德里奇考研复习笔记二

《计量经济学导论》考研伍德里奇考研复习笔记二

《计量经济学导论》考研伍德里奇考研复习笔记二第1章计量经济学的性质与经济数据1.1 复习笔记一、什么是计量经济学计量经济学是以一定的经济理论为基础,运用数学与统计学的方法,通过建立计量经济模型,定量分析经济变量之间的关系。

在进行计量分析时,首先需要利用经济数据估计出模型中的未知参数,然后对模型进行检验,在模型通过检验后还可以利用计量模型来进行预测。

在进行计量分析时获得的数据有两种形式,实验数据与非实验数据:(1)非实验数据是指并非从对个人、企业或经济系统中的某些部分的控制实验而得来的数据。

非实验数据有时被称为观测数据或回顾数据,以强调研究者只是被动的数据搜集者这一事实。

(2)实验数据通常是通过实验所获得的数据,但社会实验要么行不通要么实验代价高昂,所以在社会科学中要得到这些实验数据则困难得多。

二、经验经济分析的步骤经验分析就是利用数据来检验某个理论或估计某种关系。

1.对所关心问题的详细阐述问题可能涉及到对一个经济理论某特定方面的检验,或者对政府政策效果的检验。

2构造经济模型经济模型是描述各种经济关系的数理方程。

3经济模型变成计量模型先了解一下计量模型和经济模型有何关系。

与经济分析不同,在进行计量经济分析之前,必须明确函数的形式,并且计量经济模型通常都带有不确定的误差项。

通过设定一个特定的计量经济模型,我们就知道经济变量之间具体的数学关系,这样就解决了经济模型中内在的不确定性。

在多数情况下,计量经济分析是从对一个计量经济模型的设定开始的,而没有考虑模型构造的细节。

一旦设定了一个计量模型,所关心的各种假设便可用未知参数来表述。

4搜集相关变量的数据5用计量方法来估计计量模型中的参数,并规范地检验所关心的假设在某些情况下,计量模型还用于对理论的检验或对政策影响的研究。

三、经济数据的结构1横截面数据(1)横截面数据集,是指在给定时点对个人、家庭、企业、城市、州、国家或一系列其他单位采集的样本所构成的数据集。

伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解(2-8章)

伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解(2-8章)

使用普通最小二乘法,此时最小化的残差平方和为()211niii y x β=-∑利用一元微积分可以证明,1β必须满足一阶条件()110niiii x y x β=-=∑从而解出1β为:1121ni ii nii x yxβ===∑∑当且仅当0x =时,这两个估计值才是相同的。

2.2 课后习题详解一、习题1.在简单线性回归模型01y x u ββ=++中,假定()0E u ≠。

令()0E u α=,证明:这个模型总可以改写为另一种形式:斜率与原来相同,但截距和误差有所不同,并且新的误差期望值为零。

证明:在方程右边加上()0E u α=,则0010y x u αββα=+++-令新的误差项为0e u α=-,因此()0E e =。

新的截距项为00αβ+,斜率不变为1β。

2(Ⅰ)利用OLS 估计GPA 和ACT 的关系;也就是说,求出如下方程中的截距和斜率估计值01ˆˆGPA ACT ββ=+^评价这个关系的方向。

这里的截距有没有一个有用的解释?请说明。

如果ACT 分数提高5分,预期GPA 会提高多少?(Ⅱ)计算每次观测的拟合值和残差,并验证残差和(近似)为零。

(Ⅲ)当20ACT =时,GPA 的预测值为多少?(Ⅳ)对这8个学生来说,GPA 的变异中,有多少能由ACT 解释?试说明。

答:(Ⅰ)变量的均值为: 3.2125GPA =,25.875ACT =。

()()15.8125niii GPA GPA ACT ACT =--=∑根据公式2.19可得:1ˆ 5.8125/56.8750.1022β==。

根据公式2.17可知:0ˆ 3.21250.102225.8750.5681β=-⨯=。

因此0.56810.1022GPA ACT =+^。

此处截距没有一个很好的解释,因为对样本而言,ACT 并不接近0。

如果ACT 分数提高5分,预期GPA 会提高0.1022×5=0.511。

(Ⅱ)每次观测的拟合值和残差表如表2-3所示:根据表可知,残差和为-0.002,忽略固有的舍入误差,残差和近似为零。

伍德里奇-计量经济学(第4版)答案

伍德里奇-计量经济学(第4版)答案

伍德里奇-计量经济学(第4版)答案计量经济学答案第二章2.4 (1)在实验的准备过程中,我们要随机安排小时数,这样小时数(hours )可以独立于其它影响SAT 成绩的因素。

然后,我们收集实验中每个学生SAT 成绩的相关信息,产生一个数据集{}n i hours sat i i ,...2,1:),(=,n 是实验中学生的数量。

从式(2.7)中,我们应尽量获得较多可行的i hours 变量。

(2)因素:与生俱来的能力(天赋)、家庭收入、考试当天的健康状况①如果我们认为天赋高的学生不需要准备SAT 考试,那天赋(ability )与小时数(hours )之间是负相关。

②家庭收入与小时数之间可能是正相关,因为收入水平高的家庭更容易支付起备考课程的费用。

③排除慢性健康问题,考试当天的健康问题与SAT 备考课程上的小时数(hours )大致不相关。

(3)如果备考课程有效,1β应该是正的:其他因素不变情况下,增加备考课程时间会提高SAT 成绩。

(4)0β在这个例子中有一个很有用的解释:因为E (u )=0,0β是那些在备考课程上花费小时数为0的学生的SAT平均成绩。

2.7(1)是的。

如果住房离垃圾焚化炉很近会压低房屋的价格,如果住房离垃圾焚化炉距离远则房屋的价格会高。

(2)如果城市选择将垃圾焚化炉放置在距离昂贵的街区较远的地方,那么log(dist)与房屋价格就是正相关的。

也就是说方程中u包含的因素(例如焚化炉的地理位置等)和距离(dist)相关,则E(u︱log(dist))≠0。

这就违背SLR4(零条件均值假设),而且最小二乘法估计可能有偏。

(3)房屋面积,浴室的数量,地段大小,屋龄,社区的质量(包括学校的质量)等因素,正如第(2)问所提到的,这些因素都与距离焚化炉的远近(dist,log(dist))相关2.11(1)当cigs(孕妇每天抽烟根数)=0时,预计婴儿出生体重=110.77盎司;当cigs(孕妇每天抽烟根数)=20时,预计婴儿出生体重(bwght)=109.49盎司。

伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解-第5~9章【圣才出品】

伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解-第5~9章【圣才出品】
2.推导 OLS 的不一致性 误差项和 x1,x2,…,xk 中的任何一个相关,通常也会导致所有的 OLS 估计量都失去 其一致性。 总结为:如果误差与任何一个自变量相关,那么 OLS 就是有偏而又不一致的估计。它 就意味着,随着样本容量的增加,偏误将继续存在。
βˆ1 的不一致性为:
plimβˆ1 β Cov x1,u /Var x1
圣才电子书 十万种考研考证电子书、题库视频学习平台

第 5 章 多元回归分析:OLS 的渐近性
5.1 复习笔记
一、一致性
1.定理 5.1:OLS 的一致性
在假定 MLR.1~MLR.4 下,对所有的 j=0,1,2,…,k,OLS 估计量 βˆ j 都是 βj 的一
致估计。
其次,零条件均值假定意味着已经正确地设定了总体回归函数(PRF)。也就是说,在 假定 MLR.4 下,可以得到解释变量对 y 的平均值或期望值的偏效应。如果只使用假定 MLR.4',那么,β0+β1x1+β2x2+…+βkxk 就不一定代表了总体回归函数,也就面临着 xj 的某些非线性函数可能与误差项相关的可能性。
三、OLSHale Waihona Puke 的渐近有效性4 / 162
圣才电子书

1.简单回归模型
标准正态分布在式中出现的方式与 tn-k-1 分布不同。这是因为这个分布只是一个近似。
实际上,由于随着自由度的变大,tn-k-1 趋近于标准正态分布,所以如下写法也是合理的:
βˆj βj
/ se
βˆ j
a
~ tnk 1
2.其他大样本检验:拉格朗日乘数统计量
(1)包含 k 个自变量的多元回归模型
①假定 MLR.4'是一个更自然的假定,因为它直接得到普通最小二乘估计值。

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第一篇(第4~6章)【圣才出品】

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第一篇(第4~6章)【圣才出品】

考点五:对多个线性约束的检验:F 检验 ★★★★★
1.对排除性约束的检验 对排除性约束的检验是指检验一组自变量是否对因变量都没有影响,该检验不适用于不 同因变量的检验。F 统计量通常对检验一组变量的排除有用处,特别是当变量高度相关的时 候。 含有 k 个自变量的不受约束模型为:y=β0+β1x1+…+βkxk+u,其中参数有 k+1 个。 假设有 q 个排除性约束要检验,且这 q 个变量是自变量中的最后 q 个:xk-q+1,…,xk, 则受约束模型为:y=β0+β1x1+…+βk-qxk-q+u。 虚拟假设为 H0:βk-q+1=0,…,βk=0,对立假设是列出的参数至少有一个不为零。 定义 F 统计量为 F=[(SSRr-SSRur)/q]/[SSRur/(n-k-1)]。其中,SSRr 是受约束模型 的残差平方和,SSRur 是不受约束模型的残差平方和。由于 SSRr 不可能比 SSRur 小,所以 F 统计量总是非负的。q=dfr-dfur,即 q 是受约束模型与不受约束模型的自由度之差,也是 约束条件的个数。n-k-1=分母自由度=dfur,且 F 的分母恰好就是不受约束模型中σ2= Var(u)的一个无偏估计量。 假设 CLM 假定成立,在 H0 下 F 统计量服从自由度为(q,n-k-1)的 F 分布,即 F~ Fq,n-k-1。如果 F 值大于显著性水平下的临界值,则拒绝 H0 而支持 H1。当拒绝 H0 时,就 说,xk-q+1,…,xk 在适当的显著性水平上是联合统计显著的(或联合显著)。





注:β1,β2,…,βk 的任何线性组合也都符合正态分布,且βj 的任何一数检验:t 检验 ★★★★
1.总体回归函数 总体模型的形式为:y=β0+β1x1+…+βkxk+u。假定该模型满足 CLM 假定,βj 的 OLS 量是无偏的。

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

伍德⾥奇《计量经济学导论》笔记和课后习题详解(⼀个经验项⽬的实施)【圣才出品】第19章⼀个经验项⽬的实施19.1 复习笔记⼀、问题的提出提出⼀个⾮常明确的问题,其重要性不容忽视。

如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚⾄收集错误时期的数据。

1.查找数据的⽅法《经济⽂献杂志》有⼀套细致的分类体系,其中每篇论⽂都有⼀组标识码,从⽽将其归于经济学的某⼀⼦领域之中。

因特⽹(Internet)服务使得搜寻各种主题的已发表论⽂更为⽅便。

《社会科学引⽤索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论⽂时⾮常有⽤,包括那些时常被其他著作引⽤的热门论⽂。

⽹络搜索引擎“⾕歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。

2.构思题⽬时⾸先应明确的⼏个问题(1)要使⼀个问题引起⼈们的兴趣,并不需要它具有⼴泛的政策含义;相反地,它可以只有局部意义。

(2)利⽤美国经济的标准宏观经济总量数据来进⾏真正原创性的研究⾮常困难,尤其对于⼀篇要在半个或⼀个学期之内完成的论⽂来说更是如此。

然⽽,这并不意味着应该回避对宏观或经验⾦融模型的估计,因为仅增加⼀些更新的数据便对争论具有建设性。

⼆、数据的收集1.确定适当的数据集⾸先必须确定⽤以回答所提问题的数据类型。

最常见的类型是横截⾯、时间序列、混合横截⾯和⾯板数据集。

有些问题可以⽤任何⼀种数据结构进⾏分析。

确定收集何种数据通常取决于分析的性质。

关键是要考虑能够获得⼀个⾜够丰富的数据集,以进⾏在其他条件不变下的分析。

同⼀横截⾯单位两个或多个不同时期的数据,能够控制那些不随时间⽽改变的⾮观测效应,⽽这些效应通常使得单个横截⾯上的回归失效。

2.输⼊并储存数据⼀旦你确定了数据类型并找到了数据来源,就必须把数据转变为可⽤格式。

通常,数据应该具备表格形式,每次观测占⼀⾏;⽽数据集的每⼀列则代表不同的变量。

伍德里奇《计量经济学导论》复习笔记和课后习题详解-含有定性信息的多元回归分析:二值变量

伍德里奇《计量经济学导论》复习笔记和课后习题详解-含有定性信息的多元回归分析:二值变量

伍德里奇《计量经济学导论》复习笔记和课后习题详解-含有定性信息的多元回归分析:二值变量第7章含有定性信息的多元回归分析:二值(或虚拟)变量7.1复习笔记考点一:带有虚拟自变量的回归★★★★★1.对定性信息的描述定性信息是指通常以二值信息(0-1)的形式出现的信息,如性别、是否结婚等。

在计量经济学中,二值变量又称为虚拟变量。

2.只有一个虚拟自变量(1)只有一个虚拟自变量的简单模型考虑决定小时工资的简单模型:wage=β0+δ0female+β1educ +u。

根据多元回归的解释方式,δ0表示控制educ不变时,female 变化1单位给wage带来的变化。

假定零条件均值假定E(u|female,educ)=0成立,那么:δ0=E(wage|female=1,educ)-E (wage|female=0,educ),其中female=1表示女性,female =0表示男性。

可以发现,在任意教育水平下,男性与女性的工资差异是固定的,女性工资比男性工资多δ0。

除了β0之外,模型中只需要引入一个虚拟变量。

因为female+male=1,所以引入两个虚拟变量会导致完全多重共线性,即虚拟变量陷阱。

(2)当因变量为log(y)时,对虚拟解释变量系数的解释当变量中有一个或多个虚拟变量,且因变量以对数的形式存在时,虚拟变量的系数可以理解为百分比的变化。

将虚拟变量的系数乘以100,表示的是在保持所有其他因素不变时y 的百分数差异,精确的百分数差异为:100·[exp(∧β1)-1]。

其中∧β1是一个虚拟变量的系数。

3.使用多类别虚拟变量(1)在方程中包括虚拟变量的一般原则如果回归模型具有g 组或g 类不同截距,一种方法是在模型中包含g-1个虚拟变量和一个截距。

基组的截距是模型的总截距,某一组的虚拟变量系数表示该组与基组在截距上的估计差异。

如果在模型中引入g 个虚拟变量和一个截距,将会导致虚拟变量陷阱。

另一种方法是只包括g 个虚拟变量,而没有总截距。

伍德里奇《计量经济学导论》笔记和课后习题详解(简单回归模型)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(简单回归模型)【圣才出品】

β1 就是斜率参数。
②给定零条件均值假定 E(u|x)=0,把斱程中的 y 看成两个部分是比较有用的。一
部分是表示 E(y|x)的 β0+β1一个
部分是被称为非系统部分的 u,即丌能由 x 觋释的那一部分。
二、普通最小二乘法的推导
1.最小二乘估计值
表 2-1 简单回归的术语
3.零条件均值假定 (1)零条件均值 u 的平均值不 x 值无关。可以把它写作:E(u|x)=E(u)。当斱程成立时,就说 u 的均值独立亍 x。 (2)零条件均值假定的意义 ①零条件均值假定给出 β1 的另一种非常有用的觋释。以 x 为条件叏期望值,幵利用 E
1 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台

第 2 章 简单回归模型
2.1 复习笔记
一、简单回归模型的定义 1.双发量线性回归模型 一个简单的斱程是:y=β0+β1x+u。 假定斱程在所关注的总体中成立,它便定义了一个简单线性回归模型。因为它把两个发 量 x 和 y 联系起来,所以又把它称为两发量戒者双发量线性回归模型。 2.回归术语
E x y β0 β1x 0
得到
1 n
n i1
yi βˆ0 βˆ1xi
0

2 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台

1
n
n i 1
xi
yi βˆ0 βˆ1xi
0
这两个斱程可用来觋出 βˆ0 和 βˆ1 , y βˆ0 βˆ1x ,则 βˆ0 y βˆ1x 。
量了 yi 的样本发异,SSR 度量了 ui 的样本发异。y 的总发异总能表示成觋释了的发异和未
觋释的发异 SSR 乊和。因此,SST=SSE+SSR。

伍德里奇计量经济学导论第四版

伍德里奇计量经济学导论第四版



(ii) plim(W1) = plim[(n – 1)/n] ⋅ plim( Y ) = 1 ⋅ µ = µ. plim(W2) = plim( Y )/2 = µ/2. Because plim(W1) = µ and plim(W2) = µ/2, W1 is consistent whereas W2 is inconsistent.
m
(ii) This follows from part (i) and the fact that the sample average is unbiased for the population average: write
W1 = n −1 ∑ (Yi / X i ) = n −1 ∑ Z i ,
i =1 i =1
n
n
where Zi = Yi/Xi. From part (i), E(Zi) = θ for all i. (iii) In general, the average of the ratios, Yi/Xi, is not the ratio of averages, W2 = Y / X . (This non-equivalence is discussed a bit on page 676.) Nevertheless, W2 is also unbiased, as a simple application of the law of iterated expectations shows. First, E(Yi|X1,…,Xn) = E(Yi|Xi) under random sampling because the observations are independent. Therefore, E(Yi|X1,…,Xn) = θ X i and so

《计量经济学导论》伍德里奇-第四版-笔记和习题答案(2-8章)

《计量经济学导论》伍德里奇-第四版-笔记和习题答案(2-8章)


inc e inc incE e inc 0 。


inc e inc

inc

2
Var e inc inc e2 。
(Ⅲ)低收入家庭支出的灵活性较低,因为低收入家庭必须首先支付衣食住行等必需品。而高收入家庭具有 较高的灵活性,部分选择更多的消费,而另一部分家庭选择更多的储蓄。这种较高的灵活性暗示高收入家庭中储 蓄的变动幅度更大。
(Ⅲ)在(Ⅱ)的方程中,如果备考课程有效,那么 1 的符号应该是什么? (Ⅳ)在(Ⅱ)的方程中, 0 该如何解释? 答: (Ⅰ)构建实验时,首先随机分配准备课程的小时数,以保证准备课程的时间与其他影响 SAT 的因素是
houri :i 1 , , n , n 表示试验中所包括的学 独立的。然后收集实验中每个学生 SAT 的数据,建立样本 sati ,
因此 GPA 0.5681 0.1022 ACT 。 此处截距没有一个很好的解释, 因为对样本而言,ACT 并不接近 0。 如果 ACT 分数提高 5 分,预期 GPA 会提高 0.1022× 5=0.511。 (Ⅱ)每次观测的拟合值和残差表如表 2-3 所示: 表 2-3
i
GPA
GPA^^源自 7.利用 Kiel and McClain(1995)有关 1988 年马萨诸塞州安德沃市的房屋出售数据,如下方程给出了房屋 价格( price )和距离一个新修垃圾焚化炉的距离( dist )之间的关系:
log price 9.40 0.312log dist n 135 , R 2 0.162
y 0 0 1 x u 0
令新的误差项为 e u 0 ,因此 E e 0 。 新的截距项为 0 0 ,斜率不变为 1 。 2.下表包含了 8 个学生的 ACT 分数和 GPA(平均成绩) 。平均成绩以四分制计算,且保留一位小数。 GPA ACT student 1 2 3 4 5 6 7 8

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第一篇(第4~6章)【圣才出品】

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第一篇(第4~6章)【圣才出品】

型中未知参数的个数(即 k 个斜率参数和截距β0)。


t 统计量服从 t 分布而不是标准正态分布的原因是 se(βj)中的常数σ已经被随机变量σ
所取代。t


统计量的计算公式可写成标准正态随机变量(βj-βj)/sd(βj)与
σ∧ 2/σ2
的平方
根之比,可以证明二者是独立的;而且(n-k-1)σ∧ 2/σ2~χ2n-k-1。于是根据 t 随机变量
有一个联合正态分布。
考点二:单个总体参数检验:t 检验 ★★★★
1.总体回归函数 总体模型的形式为:y=β0+β1x1+…+βkxk+u。假定该模型满足 CLM 假定,βj 的 OLS 量是无偏的。
2.定理 4.2:标准化估计量的 t 分布


在 CLM 假定 MLR.1~MLR.6 下,(βj-βj)/se(βj)~tn-k-1,其中,k+1 是总体模
定理 4.1(正态抽样分布):在 CLM 假定 MLR.1~MLR.6 下,以自变量的样本值为条




件,有:βj~Normal(βj,Var(βj))。将正态分布函数标准化可得:(βj-βj)/sd(βj)~
Normal(0,1)。
1 / 89




注:β1,β2,…,βk 的任何线性组合也都符合正态分布,且 βj 的任何一个子集也都具
1.对排除性约束的检验 对排除性约束的检验是指检验一组自变量是否对因变量都没有影响,该检验不适用于不 同因变量的检验。F 统计量通常对检验一组变量的排除有用处,特别是当变量高度相关的时 候。 含有 k 个自变量的不受约束模型为:y=β0+β1x1+…+βkxk+u,其中参数有 k+1 个。 假设有 q 个排除性约束要检验,且这 q 个变量是自变量中的最后 q 个:xk-q+1,…,xk,则 受约束模型为:y=β0+β1x1+…+βk-qxk-q+u。 虚拟假设为 H0:βk-q+1=0,…,βk=0,对立假设是列出的参数至少有一个不为零。 定义 F 统计量为 F=[(SSRr-SSRur)/q]/[SSRur/(n-k-1)]。其中,SSRr 是受约束模型 的残差平方和,SSRur 是不受约束模型的残差平方和。由于 SSRr 不可能比 SSRur 小,所以 F 统计量总是非负的。q=dfr-dfur,即 q 是受约束模型与不受约束模型的自由度之差,也是 约束条件的个数。n-k-1=分母自由度=dfur,且 F 的分母恰好就是不受约束模型中σ2= Var(u)的一个无偏估计量。 假设 CLM 假定成立,在 H0 下 F 统计量服从自由度为(q,n-k-1)的 F 分布,即 F~ Fq,n-k-1。如果 F 值大于显著性水平下的临界值,则拒绝 H0 而支持 H1。当拒绝 H0 时,就 说,xk-q+1,…,xk 在适当的显著性水平上是联合统计显著的(或联合显著)。

计量经济学导论伍德里奇课后答案中文

计量经济学导论伍德里奇课后答案中文

2.10(iii) From (2.57), Var(1ˆβ) = σ2/21()n i i x x =⎛⎫- ⎪⎝⎭∑. 由提示:: 21n ii x =∑ ≥ 21()n i i x x =-∑, and so Var(1β) ≤ Var(1ˆβ). A more direct way to see this is to write(一个更直接的方式看到这是编写) 21()ni i x x =-∑ = 221()n i i x n x =-∑, which is less than21n i i x=∑unless x = 0.(iv)给定的c 2i x 但随着x 的增加, 1ˆβ的方差与Var(1β)的相关性也增加.0β小时1β的偏差也小.因此, 在均方误差的基础上不管我们选择0β还是1β要取决于0β,x ,和n 的大小 (除了 21n i i x=∑的大小).3.7We can use Table 3.2. By definition, 2β > 0, and by assumption, Corr(x 1,x 2) < 0. Therefore, there is a negative bias in 1β: E(1β) < 1β. This means that, on average across different random samples, the simpleregression estimator underestimates the effect of the training program. It is even possible that E(1β) isnegative even though 1β > 0. 我们可以使用表3.2。

根据定义,> 0,由假设,科尔(X1,X2)<0。

因此,有一个负偏压为:E ()<。

这意味着,平均在不同的随机抽样,简单的回归估计低估的培训计划的效果。

伍德里奇计量经济学第四章

伍德里奇计量经济学第四章

name: <unnamed>log: /Users/wangjianying/Desktop/Chapter 4 Computer exercise.smcl log type: smclopened on: 25 Oct 2016, 22:20:411. do "/var/folders/qt/0wzmrhfd3rb93j2h5hhtcwqr0000gn/T//SD19456.000000"2. ****************************Chapter 4***********************************3. **C14. use "/Users/wangjianying/Documents/data of wooldridge/stata/VOTE1.DTA"5. desContains data from /Users/wangjianying/Documents/data of wooldridge/stata/VOTE1.DTA obs: 173vars: 10 25 Jun 1999 14:07size: 4,498storage display valuevariable name type format label variable labelstate str2 %9s state postal codedistrict byte %3.0f congressional districtdemocA byte %3.2f =1 if A is democratvoteA byte %5.2f percent vote for AexpendA float %8.2f camp. expends. by A, $1000sexpendB float %8.2f camp. expends. by B, $1000sprtystrA byte %5.2f % vote for presidentlexpendA float %9.0g log(expendA)lexpendB float %9.0g log(expendB)shareA float %5.2f 100*(expendA/(expendA+expendB)) Sorted by:6. reg voteA lexpendA lexpendB prtystrASource SS df MS Number of obs = 173F( 3, 169) = 215.23 Model 38405.1096 3 12801.7032 Prob > F = 0.0000Residual 10052.1389 169 59.480112 R-squared = 0.7926Adj R-squared = 0.7889 Total 48457.2486 172 281.728189 Root MSE = 7.7123voteA Coef. Std. Err. t P>|t| [95% Conf. Interval] lexpendA 6.083316 .38215 15.92 0.000 5.328914 6.837719 lexpendB -6.615417 .3788203 -17.46 0.000 -7.363246 -5.867588 prtystrA .1519574 .0620181 2.45 0.015 .0295274 .2743873 _cons 45.07893 3.926305 11.48 0.000 37.32801 52.829857. gen cha=lexpendB-lexpendA // variable cha is a new variable//8. reg voteA lexpendA cha prtystrASource SS df MS Number of obs = 173F( 3, 169) = 215.23 Model 38405.1097 3 12801.7032 Prob > F = 0.0000Residual 10052.1388 169 59.4801115 R-squared = 0.7926Adj R-squared = 0.7889 Total 48457.2486 172 281.728189 Root MSE = 7.7123 voteA Coef. Std. Err. t P>|t| [95% Conf. Interval]lexpendA -.532101 .5330858 -1.00 0.320 -1.584466 .5202638cha -6.615417 .3788203 -17.46 0.000 -7.363246 -5.867588prtystrA .1519574 .0620181 2.45 0.015 .0295274 .2743873_cons 45.07893 3.926305 11.48 0.000 37.32801 52.829859. clear10.11. **C312. use "/Users/wangjianying/Documents/data of wooldridge/stata/hprice1.dta"13. desContains data from /Users/wangjianying/Documents/data of wooldridge/stata/hprice1.dta obs: 88vars: 10 17 Mar 2002 12:21size: 2,816storage display valuevariable name type format label variable labelprice float %9.0g house price, $1000sassess float %9.0g assessed value, $1000sbdrms byte %9.0g number of bdrmslotsize float %9.0g size of lot in square feetsqrft int %9.0g size of house in square feetcolonial byte %9.0g =1 if home is colonial stylelprice float %9.0g log(price)lassess float %9.0g log(assessllotsize float %9.0g log(lotsize)lsqrft float %9.0g log(sqrft)Sorted by:14. reg lprice sqrft bdrmsSource SS df MS Number of obs = 88F( 2, 85) = 60.73 Model 4.71671468 2 2.35835734 Prob > F = 0.0000Residual 3.30088884 85 .038833986 R-squared = 0.5883Adj R-squared = 0.5786 Total 8.01760352 87 .092156362 Root MSE = .19706 lprice Coef. Std. Err. t P>|t| [95% Conf. Interval]sqrft .0003794 .0000432 8.78 0.000 .0002935 .0004654bdrms .0288844 .0296433 0.97 0.333 -.0300543 .0878232_cons 4.766027 .0970445 49.11 0.000 4.573077 4.95897815. gen cha=sqrft-150*bdrms16. reg lprice cha bdrmsSource SS df MS Number of obs = 88F( 2, 85) = 60.73 Model 4.71671468 2 2.35835734 Prob > F = 0.0000Residual 3.30088884 85 .038833986 R-squared = 0.5883Adj R-squared = 0.5786 Total 8.01760352 87 .092156362 Root MSE = .19706lprice Coef. Std. Err. t P>|t| [95% Conf. Interval] cha .0003794 .0000432 8.78 0.000 .0002935 .0004654 bdrms .0858013 .0267675 3.21 0.002 .0325804 .1390223 _cons 4.766027 .0970445 49.11 0.000 4.573077 4.95897817. clear18.19. **C520. use "/Users/wangjianying/Documents/data of wooldridge/stata/MLB1.DTA"21. desContains data from /Users/wangjianying/Documents/data of wooldridge/stata/MLB1.DTA obs: 353vars: 47 16 Sep 1996 15:53size: 45,537storage display valuevariable name type format label variable labelsalary float %9.0g 1993 season salaryteamsal float %10.0f team payrollnl byte %9.0g =1 if national leagueyears byte %9.0g years in major leaguesgames int %9.0g career games playedatbats int %9.0g career at batsruns int %9.0g career runs scoredhits int %9.0g career hitsdoubles int %9.0g career doublestriples int %9.0g career tripleshruns int %9.0g career home runsrbis int %9.0g career runs batted inbavg float %9.0g career batting averagebb int %9.0g career walksso int %9.0g career strike outssbases int %9.0g career stolen basesfldperc int %9.0g career fielding percfrstbase byte %9.0g = 1 if first basescndbase byte %9.0g =1 if second baseshrtstop byte %9.0g =1 if shortstopthrdbase byte %9.0g =1 if third baseoutfield byte %9.0g =1 if outfieldcatcher byte %9.0g =1 if catcheryrsallst byte %9.0g years as all-starhispan byte %9.0g =1 if hispanicblack byte %9.0g =1 if blackwhitepop float %9.0g white pop. in cityblackpop float %9.0g black pop. in cityhisppop float %9.0g hispanic pop. in citypcinc int %9.0g city per capita incomegamesyr float %9.0g games per year in leaguehrunsyr float %9.0g home runs per yearatbatsyr float %9.0g at bats per yearallstar float %9.0g perc. of years an all-starslugavg float %9.0g career slugging averagerbisyr float %9.0g rbis per yearsbasesyr float %9.0g stolen bases per yearrunsyr float %9.0g runs scored per yearpercwhte float %9.0g percent white in citypercblck float %9.0g percent black in cityperchisp float %9.0g percent hispanic in cityblckpb float %9.0g black*percblckhispph float %9.0g hispan*perchispwhtepw float %9.0g white*percwhteblckph float %9.0g black*perchisphisppb float %9.0g hispan*percblcklsalary float %9.0g log(salary)Sorted by:22. reg lsalary years gamesyr bavg hrunsyrSource SS df MS Number of obs = 353F( 4, 348) = 145.24 Model 307.800674 4 76.9501684 Prob > F = 0.0000 Residual 184.374861 348 .52981282 R-squared = 0.6254Adj R-squared = 0.6211 Total 492.175535 352 1.39822595 Root MSE = .72788lsalary Coef. Std. Err. t P>|t| [95% Conf. Interval] years .0677325 .0121128 5.59 0.000 .0439089 .091556 gamesyr .0157595 .0015636 10.08 0.000 .0126841 .0188348 bavg .0014185 .0010658 1.33 0.184 -.0006776 .0035147 hrunsyr .0359434 .0072408 4.96 0.000 .0217021 .0501847 _cons 11.02091 .2657191 41.48 0.000 10.49829 11.5435323. reg lsalary years gamesyr bavg hrunsyr runsyr fldperc sbasesyrSource SS df MS Number of obs = 353F( 7, 345) = 87.25 Model 314.510478 7 44.9300682 Prob > F = 0.0000 Residual 177.665058 345 .514971181 R-squared = 0.6390Adj R-squared = 0.6317 Total 492.175535 352 1.39822595 Root MSE = .71761lsalary Coef. Std. Err. t P>|t| [95% Conf. Interval] years .0699848 .0119756 5.84 0.000 .0464305 .0935391 gamesyr .0078995 .0026775 2.95 0.003 .0026333 .0131657 bavg .0005296 .0011038 0.48 0.632 -.0016414 .0027007 hrunsyr .0232106 .0086392 2.69 0.008 .0062185 .0402027 runsyr .0173922 .0050641 3.43 0.001 .0074318 .0273525 fldperc .0010351 .0020046 0.52 0.606 -.0029077 .0049778 sbasesyr -.0064191 .0051842 -1.24 0.216 -.0166157 .0037775 _cons 10.40827 2.003255 5.20 0.000 6.468139 14.348424. test bavg fldperc sbasesyr( 1) bavg = 0( 2) fldperc = 0( 3) sbasesyr = 0F( 3, 345) = 0.69Prob > F = 0.561725. clear26. **C727. use "/Users/wangjianying/Documents/data of wooldridge/stata/twoyear.dta"28. sum phsrankVariable Obs Mean Std. Dev. Min Maxphsrank 6763 56.15703 24.27296 0 9929. reg lwage jc totcoll exper phsrankSource SS df MS Number of obs = 6763F( 4, 6758) = 483.85 Model 358.050568 4 89.5126419 Prob > F = 0.0000 Residual 1250.24552 6758 .185002297 R-squared = 0.2226Adj R-squared = 0.2222 Total 1608.29609 6762 .237843255 Root MSE = .43012 lwage Coef. Std. Err. t P>|t| [95% Conf. Interval] jc -.0093108 .0069693 -1.34 0.182 -.0229728 .0043512 totcoll .0754756 .0025588 29.50 0.000 .0704595 .0804918 exper .0049396 .0001575 31.36 0.000 .0046308 .0052483 phsrank .0003032 .0002389 1.27 0.204 -.0001651 .0007716 _cons 1.458747 .0236211 61.76 0.000 1.412442 1.50505230. reg lwage jc univ exper idSource SS df MS Number of obs = 6763F( 4, 6758) = 483.42 Model 357.807307 4 89.4518268 Prob > F = 0.0000 Residual 1250.48879 6758 .185038293 R-squared = 0.2225Adj R-squared = 0.2220 Total 1608.29609 6762 .237843255 Root MSE = .43016 lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]jc .0666633 .0068294 9.76 0.000 .0532754 .0800511univ .0768813 .0023089 33.30 0.000 .0723552 .0814074exper .0049456 .0001575 31.40 0.000 .0046368 .0052543id 1.14e-07 2.09e-07 0.54 0.587 -2.97e-07 5.24e-07_cons 1.467533 .0228306 64.28 0.000 1.422778 1.51228831. reg lwage jc totcoll exper idSource SS df MS Number of obs = 6763F( 4, 6758) = 483.42 Model 357.807307 4 89.4518267 Prob > F = 0.0000Residual 1250.48879 6758 .185038293 R-squared = 0.2225Adj R-squared = 0.2220 Total 1608.29609 6762 .237843255 Root MSE = .43016 lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]jc -.010218 .0069366 -1.47 0.141 -.023816 .00338totcoll .0768813 .0023089 33.30 0.000 .0723552 .0814074exper .0049456 .0001575 31.40 0.000 .0046368 .0052543id 1.14e-07 2.09e-07 0.54 0.587 -2.97e-07 5.24e-07_cons 1.467533 .0228306 64.28 0.000 1.422778 1.51228832. clear33. **C934. use "/Users/wangjianying/Documents/data of wooldridge/stata/discrim.dta"35. desContains data from /Users/wangjianying/Documents/data of wooldridge/stata/discrim.dta obs: 410vars: 37 8 Jan 2002 22:26size: 47,150storage display valuevariable name type format label variable labelpsoda float %9.0g price of medium soda, 1st wavepfries float %9.0g price of small fries, 1st wavepentree float %9.0g price entree (burger or chicken), 1st wave wagest float %9.0g starting wage, 1st wavenmgrs float %9.0g number of managers, 1st wavenregs byte %9.0g number of registers, 1st wavehrsopen float %9.0g hours open, 1st waveemp float %9.0g number of employees, 1st wavepsoda2 float %9.0g price of medium soday, 2nd wavepfries2 float %9.0g price of small fries, 2nd wavepentree2 float %9.0g price entree, 2nd wavewagest2 float %9.0g starting wage, 2nd wavenmgrs2 float %9.0g number of managers, 2nd wavenregs2 byte %9.0g number of registers, 2nd wavehrsopen2 float %9.0g hours open, 2nd waveemp2 float %9.0g number of employees, 2nd wavecompown byte %9.0g =1 if company ownedchain byte %9.0g BK = 1, KFC = 2, Roy Rogers = 3, Wendy's = 4 density float %9.0g population density, towncrmrte float %9.0g crime rate, townstate byte %9.0g NJ = 1, PA = 2prpblck float %9.0g proportion black, zipcodeprppov float %9.0g proportion in poverty, zipcodeprpncar float %9.0g proportion no car, zipcodehseval float %9.0g median housing value, zipcodenstores byte %9.0g number of stores, zipcodeincome float %9.0g median family income, zipcodecounty byte %9.0g county labellpsoda float %9.0g log(psoda)lpfries float %9.0g log(pfries)lhseval float %9.0g log(hseval)lincome float %9.0g log(income)ldensity float %9.0g log(density)NJ byte %9.0g =1 for New JerseyBK byte %9.0g =1 if Burger KingKFC byte %9.0g =1 if Kentucky Fried ChickenRR byte %9.0g =1 if Roy RogersSorted by:36. reg lpsoda prpblck lincome prppovSource SS df MS Number of obs = 401F( 3, 397) = 12.60 Model .250340622 3 .083446874 Prob > F = 0.0000Residual 2.62840943 397 .006620679 R-squared = 0.0870Adj R-squared = 0.0801 Total 2.87875005 400 .007196875 Root MSE = .08137 lpsoda Coef. Std. Err. t P>|t| [95% Conf. Interval]prpblck .0728072 .0306756 2.37 0.018 .0125003 .1331141lincome .1369553 .0267554 5.12 0.000 .0843552 .1895553prppov .38036 .1327903 2.86 0.004 .1192999 .6414201_cons -1.463333 .2937111 -4.98 0.000 -2.040756 -.885909237. corr lincome prppov(obs=409)lincome prppovlincome 1.0000prppov -0.8385 1.000038. reg lpsoda prpblck lincome prppov lhsevalSource SS df MS Number of obs = 401F( 4, 396) = 22.31 Model .529488085 4 .132372021 Prob > F = 0.0000 Residual 2.34926197 396 .00593248 R-squared = 0.1839Adj R-squared = 0.1757 Total 2.87875005 400 .007196875 Root MSE = .07702lpsoda Coef. Std. Err. t P>|t| [95% Conf. Interval] prpblck .0975502 .0292607 3.33 0.001 .0400244 .155076 lincome -.0529904 .0375261 -1.41 0.159 -.1267657 .0207848 prppov .0521229 .1344992 0.39 0.699 -.2122989 .3165447 lhseval .1213056 .0176841 6.86 0.000 .0865392 .1560721 _cons -.8415149 .2924318 -2.88 0.004 -1.416428 -.266601939. test lincome prppov( 1) lincome = 0( 2) prppov = 0F( 2, 396) = 3.52Prob > F = 0.030440.end of do-file41. log closename: <unnamed>log: /Users/wangjianying/Desktop/Chapter 4 Computer exercise.smcl log type: smclclosed on: 25 Oct 2016, 22:21:04。

计量经济学第四版习题及参考答案

计量经济学第四版习题及参考答案

ncq?0孵' 1档编制存计量经济学(第四版)习题参考答案潘省初第一章绪论试列出计量经济分析的主要步骤。

一般说来,计量经济分析按照以下步骤进行:(1)陈述理论(或假说)(2)建立计量经济模型(3)收集数据 (4)估计参数(5)假设检验(6)预测和政策分析计量经济模型中为何要包括扰动项为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因 素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。

什么是时间序列和横截面数据试举例说明二者的区别。

时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民 生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。

横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。

如人 口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面 数据的例子。

估计量和估计值有何区别 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。

在一项应用中,依据估计量算出的一个具体的数值,称为估计值。

如「就是一个估 n 计量,F = J 。

现有一样本,共4个数,100, 104, 96, 130,则根据这个样本的数据 n第二章 计量经济分析的统计学基础略,参考教材。

请用例中的数据求北京男生平均身高的99%置信区间运用均值估计量得出的均值估计值为100 + 104 + 96 +130 =107.5 oS _5用二,N-l=15个自由度查表得%105f 故99%置信限为± Z0.0055.V =174±X = 174±也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在至厘米之间。

25个雇员的随机样本的平均周薪为130元,试问此样本是否取自一个均值为120元、标准差为10元的正态总体原假设“o:〃 = 12O备择假设”1:〃工120检验统计量查表Z0.o25 =1% 因为Z=5>Z O.025 = 1.96,故拒绝原假设,即此样本不是取自一个均值为120元、标准差为10元的正态总体。

计量经济学导论第四版第一章

计量经济学导论第四版第一章

第三篇 高深专题探讨
■ 第十三章 跨时横截面的混合:简单面板 数据方法
■ 第十四章 高深的面板数据方法
5 ■ 第十六章 联立方程模型
第一章:计量经济学的性质 与经济数据
什么是计量经济学 经验经济分析的步骤 经济数据的结构
计量经济分析中的因果关系和其他条件 不变的概念
6
什么是计量经济学
计量经济学的用处
■ 检验经济模型 ■ 解释经济人的行为 ■ 政策制定
非实验数据与实验数据
■ 非实验数据(nonexperimental data) ■ 实验数据(experimental data)
7
经验经济分析的步骤
经验分析(empirical analysis)
■ 定义:利用数据来检验某个理论或者估计某 种关系
12336
185808.6 184937.4 22420.0 87598.1 77230.8 10367.3 74919.3
14185
217522.7 216314.4 24040.0 103719.5 91310.9 12408.6 88554.9
16500
267763.7 265810.3 316228.8 314045.4 343464.7 340506.9
2012 邢恩泉
20
计量经济分析中的因果关系和 其他条件不变的概念
因果效应
■ 经济学家的目标就是要推定一个变量对另一 个变量具有因果关系
其他条件不变
■ 在因果关系中,其他条件不变是具有重要作 用的
21
5
12
5
1
0
9
3.6
12
26
1
0
10
18.18

伍德里奇计量经济学导论(第四版)课后习题答案和讲解

伍德里奇计量经济学导论(第四版)课后习题答案和讲解
本手册为《伍德里奇计量经济学导论(第四版)》的学生解决方案手册,提供了书中奇数编号的习题答案和计算机练习讲解。内容覆盖了从引言到高级时间序主题的各个章节,具体包括简单回归模型、多元回归分析、异方差性、时间序列数据的回归分析、面板数据方法等关键领域。此外,附录部分还提供了基础数学工具、概率论、数理统计和矩阵代数的概要,以辅助读者更深入地理解计量经济学的原理和应用。本手册旨在帮助学生巩固理论知识,提高实际应用能力,是学习和研究计量经济学的宝贵资料。

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第1章及第一篇(第2~3章)【圣才出品】

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第1章及第一篇(第2~3章)【圣才出品】

品数(output)方面的信息。 (i)仔细陈述这个政策问题背后其他情况不变的思维试验。 (ii)一个企业培训其员工的决策看起来有可能独立于工人特征吗?工人可观测与不可
观测的特征各有哪些? (iii)除工人特征之外,再列出一个影响工人生产力的因素。 (iv)你若发现 training 和 output 之间成正相关关系,你令人信服地证明了工作培训
2.工作培训项目的理由之一是能提高工人的生产力。假设要求你评估更多的工作培训 是否使工人更有生产力。不过,你没有工人的个人数据,而是有俄亥俄州制造企业的数据。 具体而言,对每个企业,你都有人均工作培训小时数(training)和单位工时生产的合格产
4 / 91
圣才电子书 十万种考研考证电子书、题库视频学习平台
十万种考研考证电子书、题库视频学习平台
表 1-1 经济数据的结构
2.面板数据与混合横截面数据的比较(见表 1-2) 表 1-2 面板数据与混合横截面数据的比较
2 / 91
圣才电子书 十万种考研考证电子书、题库视频学习平台

考点三:因果关系和其他条件不变 ★★
1.因果关系 因果关系是指一个变量的变动将引起另一个变量的变动,这是经济分析中的重要目标之 一。计量分析虽然能发现变量之间的相关关系,但是如果想要解释因果关系,还要排除模型 本身存在因果互逆的可能,否则很难让人信服。
答:讲不通。因为找出每周学习小时数(study)和每周工作小时数(work)之间的关 系,是说每周学习小时数(study)和每周工作小时数(work)之间有关系,但没有说是因 果关系,每周学习小时数可能与其他因素有关或每周工作小时数与其他因素有关。
4.对税收有控制权的州或省份有时候会减少税收来刺激经济增长。假设你被某州政府 雇佣来估计公司税率的影响,比如说对每单位州生产总值增长的影响。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、经验经济分析的步骤 经验分析就是利用数据来检验某个理论或估计某种关系。 1.对所关心问题的详细阐述 在某些情形下,特别是涉及到对经济理论的检验时,就要构造一个规范的经济模型。经 济模型总是由描述各种关系的数理方程构成。 2.经济模型变成计量模型 先了解一下计量模型和经济模型有何关系。与经济分析不同,在进行计量经济分析之前, 必须明确函数的形式。 通过设定一个特定的计量经济模型,就解决了经济模型中内在的不确定性。
Байду номын сангаас
2.假设让你进行一项研究,以确定较小的班级规模是否会提高四年级学生的成绩。
4 / 119
圣才电子书 十万种考研考证电子书、题库视频学习平台

(i)如果你能设定你想做的任何实验,你想做些什么?请具体说明。 (ii)更现实地,假设你能搜集到某个州几千名四年级学生的观测数据。你能得到他们 四年级班级规模和四年级末的标准化考试分数。你为什么预计班级规模与考试成绩存在负相 关关系? (iii)负相关关系一定意味着较小的班级规模会导致更好的成绩吗?请解释。 答:(i)假定能够随机的分配学生们去不同规模的班级,也就是说,在不考虑学生诸如 能力和家庭背景等特征的前提下,每个学生被随机的分配到不同的班级。因此可以看到班级 规模(在伦理考量和资源约束条件下的主体)的显著差异。 (ii)负相关关系意味着更大的班级规模与更差的考试成绩是有直接联系的,因此可以 发现班级规模越大,导致考试成绩越差。 通过数据可知,两者之间的负相关关系还有其他的原因。例如,富裕家庭的孩子在学校 可能更多的加入小班,而且他们的成绩优于平均水平。 另外一个可能性是:学校的原则是将成绩较好的学生分配到小班。或者部分父母可能坚 持让自己的孩子进入更小的班级,而同样这些父母也更多的参与子女的教育。 (iii)鉴于潜在的其他混杂因素(如 ii 所列举),负相关关系并不一定意味着较小的班 级规模会导致更好的成绩。控制混杂因素的方法是必要的,而这正是多重回归分析的主题。
三、经济数据的结构 1.横截面数据 (1)横截面数据集,就是在给定时点对个人、家庭、企业、城市、州、国家或一系列 其他单位采集的样本所构成的数据集。有时,所有单位的数据并非完全对应于同一时间段。 在一个纯粹的横截面分析中,应该忽略数据搜集中细小的时间差别。 (2)横截面数据的重要特征 ①假定它们是从样本背后的总体中通过随机抽样而得到的。 当抽取的样本(特别是地理上的样本)相对总体而言太大时,可能会导致另一种偏离随 机抽样的情况。这种情形中潜在的问题是,总体不够大,所以不能合理地假定观测值是独立 抽取的。 ②数据排序不影响计量分析这一事实,是由随机抽样而得到横截面数据集的一个重要特 征。 2.时间序列数据 (1)时间序列数据集,是由对一个或几个变量不同时间的观测值所构成。与横截面数 据的排序不同,时间序列对观测值按时间先后排序,这也传递了潜在的重要信息。 (2)时间序列数据的特征
系,否则这种联系很难令人信服。
2.其他条件不变
“其他(相关)因素保持不变”的概念在因果分析中有重要作用。在研究两个变量之间
的关系时,所有其他的相关因素都必须固定不变。因为社会科学中所搜集到的多数数据都具
有非实验特征,所以发现其中的因果关系极具挑战性。
1.2 课后习题详解
一、习题 1.假设你所在的大学要求你“找出每周学习小时数(study)和每周工作小时数(work) 之间的关系”。把这个问题说成“推断 study 是否‘导致’work 或 work 是否‘导致’study” 的问题是否讲得通?请解释。 答:把这个问题描述为因果关系是无意义的。经济学家会假设学生理性的选择学习时间 和工作时间(以及其他活动,如上课、娱乐和休息)的组合,使得他们在每周总共 168 小 时的时间约束下获得最大的效用。可以使用统计方法如回归分析方法去衡量学习和工作时间 之间的关系,但是不能判断哪一个变量“导致”另一个变量。他们同属于学生选择的变量之 一。
2 / 119
圣才电子书 十万种考研考证电子书、题库视频学习平台

①很少(即使能够)假设经济数据的观测独立于时间,使得对它的分析比对横截面数据 的分析更为困难。
②数据搜集时的数据频率,最常见的频率是每天、每周、每月、每个季度和每年。 3.混合横截面数据 有些数据既有横截面数据的特点,又有时间序列的特点。为了扩大样本容量,可以将数 据合并成一个混合横截面数据。 对混合横截面数据的分析与对标准横截面数据的分析十分相似,不同之处在于,前者通 常要对变量在不同时间的长期差异做出解释。实际上,除了能扩大样本容量之外,混合横截 面分析通常是为了看出一个基本关系如何随时间而变化。 4.面板或纵列数据 (1)面板数据(或纵列数据)集,是由数据集中每个横截面单位的一个时间序列组成。 (2)面板数据与横截面数据的比较 ①面板数据有别于混合横截面数据的关键特征是,同一横截面数据的数据单位都被跟踪 了一段特定的时期。 ②由于面板数据要求同一单位不同时期的重复观测,所以要得到面板数据(特别是那些 个人、家庭和企业的数据),比得到混合横截面数据更加困难。 ③对同一观测单位观测一段时间,应该比横截面数据甚至混合横截面数据更有优越性。 对同一单位的多次观测,能控制个人、企业等观测单位的某些观测不到的特征。 ④面板数据的第二个优点是,它通常能够研究决策行为或结果中滞后的重要性。由于预 期许多经济政策在一段时间之后才产生影响,所以面板数据所反映的信息就更有意义。
四、计量经济分析中的因果关系和其他条件不变的概念
3 / 119
圣才电子书

1.因果关系
十万种考研考证电子书、题库视频学习平台
在多数对经济理论的检验中,经济学家的目标就是要推定一个变量对另一个变量具有因
果效应。虽然简单地发现两个或多个变量之间有某种联系很诱人,但除非能得到某种因果关
1 / 119
圣才电子书 十万种考研考证电子书、题库视频学习平台

在多数情况下,计量经济分析是从对一个计量经济模型的设定开始的,而没有考虑模型 构造的细节。一旦设定了一个计量模型,所关心的各种假设便可用未知参数来表述。
3.搜集相关变量的数据 4.用计量方法来估计计量模型中的参数,并规范地检验所关心的假设 在某些情况下,计量模型还用于对理论的检验或对政策影响的研究。
圣才电子书 十万种考研考证电子书、题库视频学习平台

第 1 章 计量经济学的性质与经济数据
1.1 复习笔记
一、计量经济学 由于计量经济学主要考虑在搜集和分析非实验经济数据时的固有问题,计量经济学已从 数理统计分离出来并演化成一门独立学科。 1.非实验数据是指并非从对个人、企业或经济系统中的某些部分的控制实验而得来的 数据。非实验数据有时被称为观测数据或回顾数据,以强调研究者只是被动的数据搜集者这 一事实。 2.实验数据通常是在实验环境中获得的,但在社会科学中要得到这些实验数据则困难 得多。
相关文档
最新文档