STATA统计软件操作课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 使用gen…replace命令生成新变量;
• gen…replace if共同使用形成分组变量
• recode v , gen(nv)
• recode v v的取值=nv的取值 *=其他取值(*表示所有其他没有列 出的数值),gen(新变量名)
• recode yrsch 0=0 11=1 12=2 13=3 14=4 15=5 16=6 21=7 *=.,gen (edu)
STATA统计软件操作
Stata数据的读入
• 数据的读入:
• 可直接读入下列尾缀形式的数据.dta/.txt/.raw/.xls; • 读入文件中的部分变量:use a b c using“文件路径和名称”; • 读入文件中的部分样本:use “文件路径和名称” in X/Y(X、Y表示个案序
号); • 读入文件中某些特征的样本:use“文件路径和名称”if 条件句;
• egen avg=rmean(b c)
• 生成标准数值:
• egen zweight=std(weight)
• 计算每一年观察的样本,从而了解在每年的调查 中,有多少相同的样本(或相同的个体):
• gen numobs=count(personid), by(personid year)
STATA统计软件操作
STATA统计软件操作
数据库的描述
• 描述数据的基本情况:describe, d
• describe, simple:只展示变量名; • describe,short:报告变量总体情况; • describe,detail:输出全部变量的全部信息; • describe a b c:描述部分变量的情况。
• 界面:
• Command(命令)、Results(结果)、Review(回顾)、 Variables(变量)。
• 菜单基本功能:
• 文件(File)、编辑(Edit)、偏好(Prefs,用户界面设置 菜单)、数据(Data,数据的基本处理、描述、排序、改 变变量、生成新变量、整合数据、拆分数据等)、图表 (Graphics)、统计(Statistics数据分析)、使用者 (User)、窗口(Window)、帮助(help)
数据的合并(横向)
• 横向合并
• 作用:增加变量(merge)。 • 菜单:Data-Combine datasets-Merge two datasets或Data-Combine
数据的合并(纵向)
• 纵向合并:
• 作用:增加样本量 • 命令:append • 菜单:Data-Combine datasets-Append datasets; • 程序:append using“文件路径和名称”;append using“文件路径和名称”,
keep 变量名。
STATA统计软件操作
Stata数据的读入
• log文件。
• 创建文件:log using “文件路径和名称”,其后带append表 示在原有文件的基础上增加新内容,其后带replace表示取 代原记录文件;
• 暂停:log off; • 再次开始:log on; • 关闭:log close。
• 数据的存储空间:
• 增加存储空间(set mem 40m) • 清空存储空间(clear,相当于drop all)。
STATA统计软件操作
变量的生成与处理
• 生成分类变量:
• egen 新变量命=cut(旧变量名),at(取值的下限) • eg:egen agegrp1=cut(age),at(0,7,13,16,20)
• 按照变量b的分类生成均值变量:
• egen a_mean=mean(a),by (b)
• 生成一个变量b和c的行均值变量(avg),忽略缺 失值:
• 变量编码本:
• codebook。 • codebook+变量名:描述变量特征。
STATA统计软件操作
Stata数据类型及特点 • 与数据类型对应的是数据库中变量的存储类型 (storage type):。 • 字符型:保存格式为str…,省略表示的是字符位数 • 数值型:保存格式有byte, int, long, float, double。默认格式 是float,前三种只保留整数,占空间最大到最小的顺序是 double, float, long, int, byte • 压缩变量的命令为compress • Compress为压缩所有变量; • Compress yr*为压缩共同前缀的变量; • Compress a-c为压缩从a到c之间的所有变量。
• 快捷根据图表的基本功能:
• Log(记录文件窗口)、Viewer(帮助窗口)、Results(分析结果 窗口)、Do-(编程窗口)、Data Editor(数据编辑窗口)、Data Browse(数据浏览窗口)、Clear-more-Condition(显示更多 结果)、Break(不要显示STA更TA统多计软结件操果作 )。
STATA统计软件操作
数据库的描述
• 描述变量取值的基本命令参数:
• inspect。
• 显示数据:
• browse直接进入数据的浏览窗口; • list最好指定变量,否则会输出数据中所有变量的分布。
• 数据排序:
• sort。 • 例:比较城乡孩子的性别bysort urban: inspect girl或者
sort urban然后by urban: inspect girl.
STATA统计软件操作
变量的生成与处理
• 注意事项:
• 不要使用新变量取代旧变量; • 充分了解原始变量的分布以及每个数值代表的含义; • 遵循不重不漏; • 将原始变量和新变量的取值进行对比,检查是否有误;
注意原始变量的缺失值。Βιβλιοθήκη Baidu
STATA统计软件操作
• Stata入门 • Stata的数据读入 • 数据库的描述 • 变量的生成与处理 • 数据的合并 • 数据的转换 • 单变量描述 • 双变量描述
• 描述数据的统计量 • 参数估计:区间估计 • 假设检验
• 线性回归分析
STATA统计软件操作
Stata入门
• 五大功能:
• 数据管理、统计分析、图形制作、矩阵运算和程序设计。
• gen…replace if共同使用形成分组变量
• recode v , gen(nv)
• recode v v的取值=nv的取值 *=其他取值(*表示所有其他没有列 出的数值),gen(新变量名)
• recode yrsch 0=0 11=1 12=2 13=3 14=4 15=5 16=6 21=7 *=.,gen (edu)
STATA统计软件操作
Stata数据的读入
• 数据的读入:
• 可直接读入下列尾缀形式的数据.dta/.txt/.raw/.xls; • 读入文件中的部分变量:use a b c using“文件路径和名称”; • 读入文件中的部分样本:use “文件路径和名称” in X/Y(X、Y表示个案序
号); • 读入文件中某些特征的样本:use“文件路径和名称”if 条件句;
• egen avg=rmean(b c)
• 生成标准数值:
• egen zweight=std(weight)
• 计算每一年观察的样本,从而了解在每年的调查 中,有多少相同的样本(或相同的个体):
• gen numobs=count(personid), by(personid year)
STATA统计软件操作
STATA统计软件操作
数据库的描述
• 描述数据的基本情况:describe, d
• describe, simple:只展示变量名; • describe,short:报告变量总体情况; • describe,detail:输出全部变量的全部信息; • describe a b c:描述部分变量的情况。
• 界面:
• Command(命令)、Results(结果)、Review(回顾)、 Variables(变量)。
• 菜单基本功能:
• 文件(File)、编辑(Edit)、偏好(Prefs,用户界面设置 菜单)、数据(Data,数据的基本处理、描述、排序、改 变变量、生成新变量、整合数据、拆分数据等)、图表 (Graphics)、统计(Statistics数据分析)、使用者 (User)、窗口(Window)、帮助(help)
数据的合并(横向)
• 横向合并
• 作用:增加变量(merge)。 • 菜单:Data-Combine datasets-Merge two datasets或Data-Combine
数据的合并(纵向)
• 纵向合并:
• 作用:增加样本量 • 命令:append • 菜单:Data-Combine datasets-Append datasets; • 程序:append using“文件路径和名称”;append using“文件路径和名称”,
keep 变量名。
STATA统计软件操作
Stata数据的读入
• log文件。
• 创建文件:log using “文件路径和名称”,其后带append表 示在原有文件的基础上增加新内容,其后带replace表示取 代原记录文件;
• 暂停:log off; • 再次开始:log on; • 关闭:log close。
• 数据的存储空间:
• 增加存储空间(set mem 40m) • 清空存储空间(clear,相当于drop all)。
STATA统计软件操作
变量的生成与处理
• 生成分类变量:
• egen 新变量命=cut(旧变量名),at(取值的下限) • eg:egen agegrp1=cut(age),at(0,7,13,16,20)
• 按照变量b的分类生成均值变量:
• egen a_mean=mean(a),by (b)
• 生成一个变量b和c的行均值变量(avg),忽略缺 失值:
• 变量编码本:
• codebook。 • codebook+变量名:描述变量特征。
STATA统计软件操作
Stata数据类型及特点 • 与数据类型对应的是数据库中变量的存储类型 (storage type):。 • 字符型:保存格式为str…,省略表示的是字符位数 • 数值型:保存格式有byte, int, long, float, double。默认格式 是float,前三种只保留整数,占空间最大到最小的顺序是 double, float, long, int, byte • 压缩变量的命令为compress • Compress为压缩所有变量; • Compress yr*为压缩共同前缀的变量; • Compress a-c为压缩从a到c之间的所有变量。
• 快捷根据图表的基本功能:
• Log(记录文件窗口)、Viewer(帮助窗口)、Results(分析结果 窗口)、Do-(编程窗口)、Data Editor(数据编辑窗口)、Data Browse(数据浏览窗口)、Clear-more-Condition(显示更多 结果)、Break(不要显示STA更TA统多计软结件操果作 )。
STATA统计软件操作
数据库的描述
• 描述变量取值的基本命令参数:
• inspect。
• 显示数据:
• browse直接进入数据的浏览窗口; • list最好指定变量,否则会输出数据中所有变量的分布。
• 数据排序:
• sort。 • 例:比较城乡孩子的性别bysort urban: inspect girl或者
sort urban然后by urban: inspect girl.
STATA统计软件操作
变量的生成与处理
• 注意事项:
• 不要使用新变量取代旧变量; • 充分了解原始变量的分布以及每个数值代表的含义; • 遵循不重不漏; • 将原始变量和新变量的取值进行对比,检查是否有误;
注意原始变量的缺失值。Βιβλιοθήκη Baidu
STATA统计软件操作
• Stata入门 • Stata的数据读入 • 数据库的描述 • 变量的生成与处理 • 数据的合并 • 数据的转换 • 单变量描述 • 双变量描述
• 描述数据的统计量 • 参数估计:区间估计 • 假设检验
• 线性回归分析
STATA统计软件操作
Stata入门
• 五大功能:
• 数据管理、统计分析、图形制作、矩阵运算和程序设计。