(完整版)第10讲 面板数据模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
varlist代表变量的名称,if代表条件语句。xtsum命令实际 是summarize命令的扩展,该命令还会给出组内和组间的 描述统计量。
我们要获得“wage.dta”中变量hours的描述统计量,可输 入命令:
xtsum hours
3 显示面板数据的结构 为了直观地了解面板数据的分布,我们可以对其结构进行
① xtset panelvar
② xtset panelvar timevar [, tsoptions]
③ tsset panelvar timevar [, tsoptions]
其中,xtset是“定义面板数据”的基本命令,panelvar代表截面 变量的名称,timevar代表时间变量的名称,tsoptions代表其他 选项。tsset作为定义时间序列的基本命令,也可以用来定义面 板数据,如③所示。此外,可用的tsoptions选项与十二章中时 间序列变量的设定相同,详见表12.2和表12.3。
描述。命令为: xtdescribe [if ] [in] [, options] 其中,xtdescribe是“显示面板数据结构”的基本命令,if
代表条件语句,in代表范围语句,options为其他选项。可 用的选项包括patterns(#)和width(#)。patterns(#)用于指 定显示结构的种数,默认为patterns(9);而width(#)用于 指定每一行的显示宽度,默认为width(100)。
需要注意的是,截面变量和时间变量都必须为数值型,还要是整数。 如果某个变量是字符串型,我们可以通过如下命令将其转换为数值型:
encode varname, gen(newvar) 其中,命令encode表示生成带标签的数值变量,varname是原字符串
变量的名称,生成的新变量命名为newvar,其类型为数值型,且每个 数值以原变量varname的值为标签。
对于“wage.dta”的数据,我们要知道其数据分布情况, 可输入命令:
xtdescribe
4 显示面板数据的分布频率 获得面板数据分布频率的基本命令为: xttab varname [if] 其中,xttab是“计算面板数据分布频率”的基本命令,
varname代表变量的名称,if代表条件语句。xttab命令实 际是tabulate命令的扩展,该命令还会给出组内和组间的 分布频率。
利用这些数据,我们来讲解面板数据的定义、描述统计量的获 得、数据结构的描述、分布频率和转移概率的获得以及各个截 面时间趋势图的绘制等操作。
实验操作指导
1 面板数据的设定
与时间序列分析类似,在对面板数据进行分析之前,我们要先 对面板数据进行设定。只有定义过面板数据之后,才能使用相 关的面板数据命令。设定面板数据的命令有三种:
在第一种格式当中,我们只设定了截面变量,这样,每一截面中,各 个观测值的顺序是无关紧要的。例如,我们有对多个家庭的调查数据, 每个家庭是一个截面,而家庭的各个成员是截面内的观测值,这种情 况下,我们就不必设定时间变量。
第二种和第三种定义面板数据的格式是等价的。这两种情况下,每一 截面中的观测值会被按照时间变量进行排序。这时,我们还可以使用 stata的各种时间序列算子,像滞后算子“L.”、领先算子“F.”等。
我们要获得“wage.dta”中变量msp的分布频率,可输入 命令:
xttab msp
5 显示面板数据的转移概率 获得面板数据转移概率的基本命令为: xttrans varname [if] [, freq] 其中,xttrans是“计算面板数据转移概率”的基本命令,
varname代表变量的名称,if代表条件语句,选项freq表示 同时显示频数。
我们要获得“wage.dta”中变量msp的转移概率,可输入 命令:
xttrans msp
6 面板数据绘图 对面板数据的各个截面分别绘制时间序列图的基本命令为: xtline varlist [if] [in] [, panel_options] 其中,xtline是“面板数据绘图”的基本命令,varlist代表变量的名称,
实验内容及数据来源
本书附带光盘data文件夹下的“wage.dta”工作文件给出了对 4711名妇女的调查数据,调查的时间跨度为1968年到1988年。该 文件的主要变量包括:idcode=编号,year=调查时间,hours= 平均每周的工作时间,msp=是否已婚(1代表已婚且随配偶居住, 0代表其他情况),ln_wage=小时工资的自然对数,grade=受教 育年数,age=年龄,ttl_exp=总工作年数,tenure=现有岗位的 任职时间,race=种族(1表示白人,2表示黑人,3表示其他人 种),not_smsa=是否居住在SMSA区(1表示不住在SMSA区Standard Metropolitan Statistical Area),south=是否生活在南 方(1表示住在南方),union=是否为工会成员(1表示是工会成 员)。
对于数据文件“wage.dtawenku.baidu.com,我们定义idcode为截面变量,year为时间 变量。输入命令:
xtset idcode year
2 获得面板数据的描述统计量 获得面板数据描述统计量的基本命令为: xtsum [varlist] [if ] 其中,xtsum是“计算面板数据描述统计量”的基本命令,
主要内容
面板数据的基本操作 固定效应与随机效应模型
面板数据的基本操作
基本原理
在利用stata对面板数据进行分析之前,我们通常需要对截 面变量和时间变量进行定义。只有定义之后,我们才可以 使用相关的面板数据分析命令以及各种时间序列算子。
另外,在对面板数据进行建模之前,我们有时会希望对数 据有一个直观的了解,像观察面板数据各截面的最大值、 最小值等描述统计量,或者是了解数据的结构和分布等。 对于这些,我们都可以通过stata的命令来实现。
相关文档
最新文档