中国工业企业数据库与Stata简介
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.help和search
2.Stat-Transfer介绍
➢ 在记录选择上,可选择全部记录,亦可选择部分记录。这一 部分的记录选取,用户可以通过条件限定来实现。如:要求 Variable1的值大于300或者Variable2的值为偶数,在选项卡 的文本框中输入相应的约束条件:where Variable1> 300, 或者 where Variable2%2=0。还可以利用软件自带的函数来 实现一些较复杂的数据选取,例如,按20%比例进行简单随 机抽样(where samp_rand(0.2)),按10%比例进行系统抽样 (间隔抽样) (where samp_syst(10))。
• (1)数据转换( Transfer)选项卡 • (2)变量选择( Variables)选项卡 • (3)记录选择( Observations)选项卡 • (4)其他选项( Option)选项卡
2.Stat-Transfer介绍
➢ 在Transfer这个界面上,通过几个下拉式菜单,选择需要 转换数据库的源文件和目标文件的类型、名称,点击转换 (Transfer) 就可实现数据间的简单转换。软件支持的数据 类型包括我们常用的SAS、SPSS、STATA、S-Plus、 Excel、Epi Info等等。
1.数据库介绍
➢ 数据库里的企业用“法人代码”(FRDM)作为标志。数 据库覆盖的企业不会一成不变,每年都有新增企业和减少 企业,绝大部分企业的资料是连续的。尽管原则上每个企 业的法人代码不会改变,在极少数情况下,企业会改换企 业名称或法人代码。数据库从1995年开始,最近更新到 2011年。
1.数据库介绍
1.数据库介绍
➢ 截止 2011 年,数据库共收录了 58 万多家工业企业,占 中国工业总产值的95%左右,覆盖了中国工业40多个大类、 90多个中类、600多个小类,每个企业提供超过上百个变 量,是目前国内最为全面和权威的企业层面数据。该数据 库是我国经济学和管理学研究领域的重要资料,利用该数 据库已有很多学者做出了非常有价值的研究成果。受数据 取得难度的限制,拥有该数据库的研究机构在国内还并不 多,因此该数据库在研究领域有广阔的应用前景。
宏观经济分析与政策模拟讨论班
中国工业企业数据库与Stata简介
主要内容
1、中国工业企业数据库介绍 2、数据格式转换——Stat-Transfer软件介绍 3、Stata12介绍 4、Stata操作实例
1.数据库介绍
➢ 中国工业企业数据库来源于国家统计局。数据库的统计对 象为规模以上工业企业,包括全部国有工业企业和年主营 业务收入 500 万元及以上的非国有工业企业,与《中国统 计年鉴》的工业部分和《中国工业统计年鉴》的覆盖范围 一致。区别是工业企业数据库是企业层面的原始数据,而 “年鉴”是按不同维度得到的加总数据。
3.寻求帮助与网络资源
➢ 通过多种途径可以获得 Stata 的帮助,主要的途径有三个: 手册、 Stata 自带帮助和网络帮助。 Stata手册是一本学 习Stata使用的权威书籍,它按字母顺序排列出了Stata所 有相关的命令。 Stata的自带帮助系统是使用最方便,也 是最常用的方法 ,我们可以在记住极少量基本命令的基 础上,方便地运用Stata命令。
左上 “Review”(历史窗口):记录着自启动Stata以来的命令。 右上“Variables”(变量窗口):记录着Stata 内存中的所有变量。 右下“Properties”(性质窗口):显示当前数据文件与变量的性质 中上“Results”(结果窗口):显示执行Stata 命令后的输出结果。 中下“Command”(命令窗口):在此窗口输入Stata 命令。
2.Stat-Transfer介绍
➢ Transfer软件还提供了一些其它的功能, 如在转换过程中 更换变量名,自动运行变量输出类型的优化功能,设置日 期时间型数据的读写格式,对缺失值的各种处理方式的设 定,随机种子的产生或设定,设置文本格式文件的读取格 式,Excel工作簿中工作表的选取,覆盖文件前确认提示等 其它功能。
➢ 如果在转换数据时,只对其中的一部分观察值感兴趣, 可 以利用 “变量选择”或者 “记录选择”,进行部分数据转 换。
2.Stat-Transfer介绍
➢ 在变量选择上,可选择全部变量,亦可选择部分变量,同时 还可在转换中重新设置变量输出的数据类型,如浮点型(float), 日期型(dHale Waihona Puke Baidute),时间型(time),字符型(string) 等。软件还支持 优化(Optimize)功能;Use Doubles选项在转换时可将有小 数位的变量设置成双精度型 (double),保证数据的精度; Drop Constants选项,则自动将变量值恒为常数或缺失值 的变量略去,这在数据繁多时特别能体现出其优越性。
➢ 数据库对每个企业给出两类信息,一是企业经营成果有关 的信息,包括资金流量表、资产负债表和损益表的主要信 息,以及雇用员工和生产活动信息;二是对企业身份、生 产经营活动内容和状态进行定性描述的信息,以代码的形 式出现,在使用时需要使用参照代码表。
2.Stat-Transfer介绍
• Transfer软件专用于转换不同格式的数据文件,Access 数据通过 Transfer软件可转换为 Stata 格式的数据。
3.Stata12 介绍
➢ Stata软件是现今较为流行的统计计量分析软件,具有强 大的数据处理和分析功能,且操作简单、使用灵活、易学 易用、运行速度极快。Stata的另一个特点是它的许多高 级统计模块均是编程人员用宏语言写成的程序文件(ADO 文件),这些文件可以自行修改、添加和下载。
➢ 安装好 Stata 后,点击电脑桌面上的Stata 图标,即可打 开Stata。此时可以看到,在最上方有一排菜单,即“File Edit Data Graphics Statistics User Window Help”。在 此之下,有五个窗口,分别为: