stata初级入门3-描述性统计指标课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的结果。
• 范例:tabstat price mpg, by(id) statistics(mean ma mi sd n) missing
Baidu Nhomakorabea
学习交流PPT
4
• 菜单:Statistics>Summaries, tables, and tests >Tables>Table of summary statistics (tabstat)
• 格式:cumul varname [if] [in] [weight], generate (newvar) [options]
• 选项:freq使用频数作为累积分布
• 范例:cumul price, generate(cprice)
•
scatter cprice price
9
• 菜单2:Statistics > Summaries, tables, and tests > Tables > Multiple one-way tables
学习交流PPT
10
三、两个分类变量的列联表
• 列联表是考察两个分类变量相关关系的方法
• 列联表给出从属于两个分类变量不同类别的观测值的 频数
• 语法: tabstat varlist [if] [in] [weight] [, options]
• 选项:默认结果是均值。
• by(varname) 按变量varname进行分组描述性统计; • statistics(statname [...]) 报告指定的描述性统计指标值。 • nototal不报告总体统计值,通常是与by()配合使用 • missing用by()选项时,显示by()变量的缺失值也作一类
学习交流PPT
7
二、单个分类变量的汇总统计
• tabulate/tab1命令 • 对分类变量的描述统计是观察其不同类别的频 数或百分数。 • 语法1:tabulate varname [if] [in] [weight] [, options]
• 语法2: tab1 varlist [if] [in] [weight] [, options]
学习交流PPT
13
• 语法2——多个变量内存在的所有可能列联分析结 果
• tab2 varlist [if] [in] [weight] [, options]
• 范例:tab2 foreign id rep78
学习交流PPT
14
• 菜单:Statistics > Summaries, tables, and tests > Tables > All possible two-way tabulations
指标。 • 范例:summarize price mpg
学习交流PPT
2
• 菜单:Statistics > Summaries, tables, and tests > Summary and descriptive statistics > Summary statistics
学习交流PPT
3
tabstat命令
• 如果两个分类变量各有r,c个类别,则列联表共有r×c 个单元格
C a r t y p e
D o m e s t i c F o r e i g n
T o t a l
i d 1
7 4
1 1
2
3 7 1 6
5 3
T o t a l
4 4 2 0
6 4
学习交流PPT
11
• tabulate命令: • 语法1——指定两个变量的列联表
• tabulate varname1 varname2 [if] [in] [weight] [, options]
• 范例:tabulate foreign id
学习交流PPT
12
• 菜单:Statistics > Summaries, tables, and tests > Tables > Two-way tables with measures of association
stata入门3 ——统计指标篇
学习交流PPT
1
一、基本描述统计量
• summarize命令
• 可概括观测值个数、平均值、标准差、最大值和最小值 五个指标。
• 语法:summarize varlist [in] [if] [weight] [,options] • 选项:detail可统计方差、偏度、峰度和各个分位数等
学习交流PPT
16
• 菜单:Statistics > Summaries, tables, and tests > Tables > One/two-way table of summary statistics
学习交流PPT
17
五、经验分布函数
• 对变量累积分布函数的估计
• cumul命令:通常与scatter(做散点图)一起使用
学习交流PPT
5
ameans命令
• 估计算术、几何和调和平均数 • 语法:ameans [varlist] [if] [in] [weight] [,options] • 范例:ameans price
学习交流PPT
6
• 菜单:Statistics > Summaries, tables, and tests > Summary and descriptive statistics > Arith./geometric/harmonic means
• 选项:missing缺失值也作一类,plot作柱状图 • 范例:tabulate foreign/tab1 foreign id
学习交流PPT
8
• 菜单1: Statistics > Summaries, tables, and tests
> Tables > One-way tables
学习交流PPT
学习交流PPT
15
四、列联表描述统计量
• tabulate, summarize() :单个或两个分类变量的描 述性统计
• 格式:tabulate varname1 [varname2] [if] [in] [weight] [, options]
• 选项:[no] means(不)包含均值,[no] standard (不)包含标准差,[no] freq(不)包含频数, [no] obs(不)包含观测值个数, missing将缺 失值作为一类
• 范例:tabstat price mpg, by(id) statistics(mean ma mi sd n) missing
Baidu Nhomakorabea
学习交流PPT
4
• 菜单:Statistics>Summaries, tables, and tests >Tables>Table of summary statistics (tabstat)
• 格式:cumul varname [if] [in] [weight], generate (newvar) [options]
• 选项:freq使用频数作为累积分布
• 范例:cumul price, generate(cprice)
•
scatter cprice price
9
• 菜单2:Statistics > Summaries, tables, and tests > Tables > Multiple one-way tables
学习交流PPT
10
三、两个分类变量的列联表
• 列联表是考察两个分类变量相关关系的方法
• 列联表给出从属于两个分类变量不同类别的观测值的 频数
• 语法: tabstat varlist [if] [in] [weight] [, options]
• 选项:默认结果是均值。
• by(varname) 按变量varname进行分组描述性统计; • statistics(statname [...]) 报告指定的描述性统计指标值。 • nototal不报告总体统计值,通常是与by()配合使用 • missing用by()选项时,显示by()变量的缺失值也作一类
学习交流PPT
7
二、单个分类变量的汇总统计
• tabulate/tab1命令 • 对分类变量的描述统计是观察其不同类别的频 数或百分数。 • 语法1:tabulate varname [if] [in] [weight] [, options]
• 语法2: tab1 varlist [if] [in] [weight] [, options]
学习交流PPT
13
• 语法2——多个变量内存在的所有可能列联分析结 果
• tab2 varlist [if] [in] [weight] [, options]
• 范例:tab2 foreign id rep78
学习交流PPT
14
• 菜单:Statistics > Summaries, tables, and tests > Tables > All possible two-way tabulations
指标。 • 范例:summarize price mpg
学习交流PPT
2
• 菜单:Statistics > Summaries, tables, and tests > Summary and descriptive statistics > Summary statistics
学习交流PPT
3
tabstat命令
• 如果两个分类变量各有r,c个类别,则列联表共有r×c 个单元格
C a r t y p e
D o m e s t i c F o r e i g n
T o t a l
i d 1
7 4
1 1
2
3 7 1 6
5 3
T o t a l
4 4 2 0
6 4
学习交流PPT
11
• tabulate命令: • 语法1——指定两个变量的列联表
• tabulate varname1 varname2 [if] [in] [weight] [, options]
• 范例:tabulate foreign id
学习交流PPT
12
• 菜单:Statistics > Summaries, tables, and tests > Tables > Two-way tables with measures of association
stata入门3 ——统计指标篇
学习交流PPT
1
一、基本描述统计量
• summarize命令
• 可概括观测值个数、平均值、标准差、最大值和最小值 五个指标。
• 语法:summarize varlist [in] [if] [weight] [,options] • 选项:detail可统计方差、偏度、峰度和各个分位数等
学习交流PPT
16
• 菜单:Statistics > Summaries, tables, and tests > Tables > One/two-way table of summary statistics
学习交流PPT
17
五、经验分布函数
• 对变量累积分布函数的估计
• cumul命令:通常与scatter(做散点图)一起使用
学习交流PPT
5
ameans命令
• 估计算术、几何和调和平均数 • 语法:ameans [varlist] [if] [in] [weight] [,options] • 范例:ameans price
学习交流PPT
6
• 菜单:Statistics > Summaries, tables, and tests > Summary and descriptive statistics > Arith./geometric/harmonic means
• 选项:missing缺失值也作一类,plot作柱状图 • 范例:tabulate foreign/tab1 foreign id
学习交流PPT
8
• 菜单1: Statistics > Summaries, tables, and tests
> Tables > One-way tables
学习交流PPT
学习交流PPT
15
四、列联表描述统计量
• tabulate, summarize() :单个或两个分类变量的描 述性统计
• 格式:tabulate varname1 [varname2] [if] [in] [weight] [, options]
• 选项:[no] means(不)包含均值,[no] standard (不)包含标准差,[no] freq(不)包含频数, [no] obs(不)包含观测值个数, missing将缺 失值作为一类