stata软件基本操作和简单的一元线性回归学习资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
stata软件基本操作和简单的一 元线性回归
STATA软件的安装
1. 点SetupStata14安装,激活码在txt中,一直下 一步
2. IC版本即可,越高版本运行越慢 3. 开始菜单里找到图标运行程序,第一次输入序列
号,不要online注册
Stata界面
简单的分析功能在 Statistics里面
这两种方式都要自己查表找ta/2(n-2)临界值对比 当然,除了这些基本信息以外,一般还会列出样本区间、 DW值等重要信息。这会在后面的课程中说明。
16
• 思考:目前,无论时间序列还是截面数据, 我们导入的方式完全一样,做法也来自百度文库全一样 ,是否有区别?
此课件下载可自行编辑修改,仅供参考! 感谢您的支持,我们努力做得更好!谢谢
所有的图表绘制都 在graphs里面
分析命令在这里输入 查看历史命令
数据读入和保存(从Excel)
1. 点击data editor(edit)图标进入数据编辑器 2. 复制数据(连同第一行表头),在数据编辑器里
粘贴 3. 弹出提示,询问第一行是否要当成变量名称(表
头),选左边为是,选第二个为否 4. 点击保存,存为xxx.dta文件,便于以后使用
变量的使用
1. 查看和更改变量名 忘了有哪些变量、想把中文变量名改成其他怎么办 ? 点击红圈的variables manager图标,即可看到有哪 些变量,每个变量是什么数据类型(int表示整数, double表示双精度浮点等) 例如,可以把右侧变量名(name)改为sale,标签 (Label)只是用来显示的,可以还叫销售额,改完 后点击apply 2. 命令行查看数据:输入:list sale
如果需要查看残差值e,输入scatter e即可,list e可以列出所 有ei值,scatter e X可以看ei残差图
回归结果的提供和分析
回归结果提供的两种格式
Yˆ 3.805 0.4845X R2 0.9655 (1.79) (14.96) 注:括号内数字为t检验值
Yˆ 3.805 0.4845X R2 0.9655 se: (2.12) (0.03) 注:括号内数字为标准误(se)
为Y,收入为X
第二步描述统计/画散点图
(1)描述统计 按钮操作方法1:在data editor数据表窗口中,点击Data— Describe data—Summary statistics,如图所示选择第二个
第二步描述统计/画散点图
(1)描述统计
命令操作方法2: 若想对现在程序中已粘贴进去的全部数据进行描述, 则直接在命令栏输入:summarize, detail 注意用英文逗号,然后空格!! 若只想对某一个变量进行描述,则输入 summarize 变量名, detail 多个变量直接以空格隔开即可
变量的使用
3. 生成新变量,例如想生成变量Y,Y是sale的平方 用generate函数即可(简写为gen) gen Y=sale^2
4. 删掉变量:drop 变量名
二、一元线性回归
第一节 问题提出
进行回归分析的步骤
1. 画出散点图/描述统计 2. 模型估计 3. 模型检验:R方、t、F检验
第一步 导入数据
1. 点击data editor(edit)图标进入数据编辑器 2. 复制“时间序列”工作表的消费和收入数据(连同第一行
表头,不要第一列),在数据编辑器里粘贴 3. 弹出提示,询问第一行是否要当成变量名称(表头),选
左边为是 4. 点击variables manager按钮,更改变量名为英文,消费
第二步 画散点图/描述统计
(2)图形描述 在命令栏输入:scatter Y X 即可,注意纵轴变量在前
扩展:让图形更美观,可自行查阅help scatter的帮助文件 如:想每个点标上是第几行数据怎么做? gen n=_n scatter Y X, mlabel(n)
第三步 模型估计
设定模型为
一元回归模型的命令为:regress Y X,简写reg Y X 即可 若想做无常数项回归则为:reg Y X, noconstant
第四步 模型检验
(1)经济意义检验
斜率 为边际消费倾向,表明人均可支配收入每增加1元时,食 品消费平均增加0.135元。从经济意义上是合理的。
(2)拟合优度检验、t检验和F检验
P值为0.000,在任何显著性水平下,斜率项和截距项显然不为 零,拒绝两系数为零的假设。另外,拟合优度R方表明,食品 支出的97.5%的变化也以由收入X的变化来解释,因此拟合情况 较好。
STATA软件的安装
1. 点SetupStata14安装,激活码在txt中,一直下 一步
2. IC版本即可,越高版本运行越慢 3. 开始菜单里找到图标运行程序,第一次输入序列
号,不要online注册
Stata界面
简单的分析功能在 Statistics里面
这两种方式都要自己查表找ta/2(n-2)临界值对比 当然,除了这些基本信息以外,一般还会列出样本区间、 DW值等重要信息。这会在后面的课程中说明。
16
• 思考:目前,无论时间序列还是截面数据, 我们导入的方式完全一样,做法也来自百度文库全一样 ,是否有区别?
此课件下载可自行编辑修改,仅供参考! 感谢您的支持,我们努力做得更好!谢谢
所有的图表绘制都 在graphs里面
分析命令在这里输入 查看历史命令
数据读入和保存(从Excel)
1. 点击data editor(edit)图标进入数据编辑器 2. 复制数据(连同第一行表头),在数据编辑器里
粘贴 3. 弹出提示,询问第一行是否要当成变量名称(表
头),选左边为是,选第二个为否 4. 点击保存,存为xxx.dta文件,便于以后使用
变量的使用
1. 查看和更改变量名 忘了有哪些变量、想把中文变量名改成其他怎么办 ? 点击红圈的variables manager图标,即可看到有哪 些变量,每个变量是什么数据类型(int表示整数, double表示双精度浮点等) 例如,可以把右侧变量名(name)改为sale,标签 (Label)只是用来显示的,可以还叫销售额,改完 后点击apply 2. 命令行查看数据:输入:list sale
如果需要查看残差值e,输入scatter e即可,list e可以列出所 有ei值,scatter e X可以看ei残差图
回归结果的提供和分析
回归结果提供的两种格式
Yˆ 3.805 0.4845X R2 0.9655 (1.79) (14.96) 注:括号内数字为t检验值
Yˆ 3.805 0.4845X R2 0.9655 se: (2.12) (0.03) 注:括号内数字为标准误(se)
为Y,收入为X
第二步描述统计/画散点图
(1)描述统计 按钮操作方法1:在data editor数据表窗口中,点击Data— Describe data—Summary statistics,如图所示选择第二个
第二步描述统计/画散点图
(1)描述统计
命令操作方法2: 若想对现在程序中已粘贴进去的全部数据进行描述, 则直接在命令栏输入:summarize, detail 注意用英文逗号,然后空格!! 若只想对某一个变量进行描述,则输入 summarize 变量名, detail 多个变量直接以空格隔开即可
变量的使用
3. 生成新变量,例如想生成变量Y,Y是sale的平方 用generate函数即可(简写为gen) gen Y=sale^2
4. 删掉变量:drop 变量名
二、一元线性回归
第一节 问题提出
进行回归分析的步骤
1. 画出散点图/描述统计 2. 模型估计 3. 模型检验:R方、t、F检验
第一步 导入数据
1. 点击data editor(edit)图标进入数据编辑器 2. 复制“时间序列”工作表的消费和收入数据(连同第一行
表头,不要第一列),在数据编辑器里粘贴 3. 弹出提示,询问第一行是否要当成变量名称(表头),选
左边为是 4. 点击variables manager按钮,更改变量名为英文,消费
第二步 画散点图/描述统计
(2)图形描述 在命令栏输入:scatter Y X 即可,注意纵轴变量在前
扩展:让图形更美观,可自行查阅help scatter的帮助文件 如:想每个点标上是第几行数据怎么做? gen n=_n scatter Y X, mlabel(n)
第三步 模型估计
设定模型为
一元回归模型的命令为:regress Y X,简写reg Y X 即可 若想做无常数项回归则为:reg Y X, noconstant
第四步 模型检验
(1)经济意义检验
斜率 为边际消费倾向,表明人均可支配收入每增加1元时,食 品消费平均增加0.135元。从经济意义上是合理的。
(2)拟合优度检验、t检验和F检验
P值为0.000,在任何显著性水平下,斜率项和截距项显然不为 零,拒绝两系数为零的假设。另外,拟合优度R方表明,食品 支出的97.5%的变化也以由收入X的变化来解释,因此拟合情况 较好。