应用stata做统计分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1)Describe 数据的简要描述d
2)List 将所有数据列在result里面l
3)Summarize 分析统计指标su
4)correlate 统计各个变量之间的相关系数cor
5)graph twoway connected math score,yaxis(1)||connected english score,yaxis(2) title(“”)横
坐标表示score 左y轴表示数学右y轴表示英语
6)browse chinese math if score>640只显示总分大于640的数学和语文的成绩
7)edit math ability score 只显示数学基本能力和总分,可以进行编辑
8)gen any=uniform() 新建一个随机变量,从0-1
9)list math chinese english in 60/70 列出其中60-70个观测值的数学语文和英语
10)replace any=100*any 将ANY这个变量的值*100,然后取代原来的变量
11)sample 10 仅剩下随即的10%,sample 30,count随机的剩下30个观测值
12)gsort –math 按数学从高到低排序
13)gsort name 将观测值的姓名顺序排序
14)gsort –name 姓名逆序排序
15)help gesort 排序的帮助
16)tabulate math if score>600 在result窗口中显示总分600以上的数学得频数百分比及
累计百分比
17)edit math score 在编辑器窗口中只显示数学和总分
18)list in 4在result窗口中只显示第4个观测值
19)list in 10/20列出第10-20个观测值
20)sum if score>660 只对总分大于660的观测值进行统计分析
21)sun if place !=”canada”对字符串的除外统计
22)sum if score>600&score<650
23)list if score>620|(math>=140&english>=135)列出其中的总分大于620 或者数学大于140
和英语大于135 的观测值
24)help datafun寻找日期的命令
25)help strfun字符串函数
26)dispay 作为统计显示的计算器使用
27)sum math ,display r(mean),gen mathdev=math-r(menn),sum math mathdev
28)help egen生成函数的扩展
29)tabulate class,gen (class) 在编辑窗口新生成16个变量,class26-41,并且以0-1 表示
30)list class class10-class14 在result 中只显示10-14班的内容
31)sum math if class!=28 对数学进行求统计量,然后排出28班
32)replace score2=1 if score >=600&score<.主要针对缺失值的运算因为缺失值.被认为是非
常大的数。
33)gen score3=autocode(score,4,600,700) 将编辑器中的数据,按照625 650 675 700进行分
类
34)list score score2 score3 此时result窗口显示的是每一个分数对应的指标,是否是600以
上的,在哪个区间上?
35)gen score5=group(5) 将编辑器中的数据按规模分为5组
36)gen caseid=_n 在编辑器里面创建一个变量从1-2-3.。。
37)display score[45] 此时是在上一步的基础上选择第45条观测值
38)gen difscore=score-score[_n-1]生成一个新变量difscore其数值=序列2的数据减去序列
1的数据,依次排列。
39)use laizhou20;uselaizhou40;append using laizhou20注意最后那个合并命令中的using指的
是当前编辑器中的文件数据,所以后面应该是加上最开始打开的那个数据laizhou20
40)xpose,clear varname在result中转置的命令
pro v1 v2 v3 v4 v5
a 22 23 34 55 66
b 23 55 53 34 45
c 33 45 43 43 66
d 334 444 43 43 555
里面是三个变量组成的图标,现在要将其变成长格式。
Reshape long v,i(pro) j(n)
+---------------+
| pro n v |
|---------------|
1. | a 1 22 |
2. | a 2 23 |
3. | a 3 34 |
4. | a 4 55 |
5. | a 5 66 |
|---------------|
6. | b 1 23 |
7. | b 2 55 |
8. | b 3 53 |
9. | b 4 34 |
10. | b 5 45 |
|---------------|
11. | c 1 33 |
12. | c 2 45 |
13. | c 3 43 |
14. | c 4 43 |
15. | c 5 66 |
|---------------|
16. | d 1 334 |
17. | d 2 444 |
18. | d 3 43 |
19. | d 4 43 |
20. | d 5 555 |
+---------------+
41)reshape long grow,i(pro)j(year)
42)graph twoway connected v n,yline(0) by(pro)