第七章 方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
STATA 从入门到精通
第七章 方差分析
方差分析
方差分析是基于样本方差对总体均值进行 统计推断的方法,它是通过实验观察某一 种或多种因素的变化对实验结果是否带来 显著影响,进而鉴别各种因素的效应,从 而选取一种最优方案。
方差分析包括单因素方差分析、多因素方 差分析和协方差分析。
Page 2
STATA从入门到精通
职工号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
性别 男职工 男职工 男职工 男职工 男职工 女职工 女职工 女职工 女职工 男职工 男职工 男职工 男职工 男职工 男职工 男职工
年龄 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45
7.1 t检验的Stata基本命令
t检验是用于小样本(样本容量小于30)两个平均值差异程度的检验方法。它 是用t分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。 t检验包括单样本t检验、两样本t检验,其中两样本t检验又包括配对样本t检 验和两独立样本t检验。
1、单样本t检验的Stata操作
单样本t检验有两种用法。一是检验样本平均数是否显著地不同于某个假设值。二是检 验同一套观察值中的两个变量的统计指标是否显著地不同。这等价于两者的差值的平 均数是否等于零。
在Stata应用中使用ttest命令来完成,单样本ttest有两种命令格式:
命令格式1(通过样本进行t检验):
ttest varname == # [if] [in] [, level(#)]
Page 6
STATA从入门到精通
【例7.2】使用文件“职工信息表.dta”的数据来对两独立样本ttest命令的应用进行说
明。表7-3给出了某厂职工的性别、年龄、职称及文化程度的信息。本例要求检验不同
性别的职工工资是否相同,使用的方法包括一般的t检验,消除同方差假定的t检验。
表7-3 某厂职工信息表
男职工
42
29
男职工
33
30
女职工
44
887
助理工程师 初中
879
工程师
专科
867
助理工程师
初中
879
工程师
专科
879
工程师
专科
827
助理工程师
高中
847
助理工程师
初中
887
助理工程师
初中
867
助理工程师
高中
867
助理工程师
高中
830
助理工程师
专科
847
助理工程师
初中
827
助理工程师
高中
867
助理工程师
基本工资 1014 984 1044 866 848 824 824 824 859 827 1014 989 938 889 887 887
职称 高级工程师 工程师 高级工程师 助理工程师 助理工程师 无技术职称 无技术职称 无技术职称 工程师 助理工程师 高级工程师 工程师 助理工程师 工程师 助理工程师 助理工程师
初中
Page 8
STATA从入门到精通
7.2 单因素方差分析
本节首先介绍单因素方差分析的原理,然后介绍实现单因素方差分析 的两个命令 oneway和 longway。
单因素方差分析用于比较多组样本的均数是否相同,并假定:每组的 数据服从正态分布,具有相同的方差,且相互独立。 单因素方差分析表
两样本t检验的Stata操作有三种基本命令格式,如下所示: 命令格式1(通过样本进行双变量t检验): ttest varname1 == varname2 [if] [in], [options] 命令格式2(通过样本进行分组t检验): ttest varname [if] [in] , by(groupvar) [options] 命令格式3(通过样本的统计指标进行t检验): ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2 [, options] 其中,#obs为样本容量,#mean为样本均值,#sd为标准差,#val为待检验
命令格式2(通过样本的统计指标进行t检验):
ttesti #obs #mean #sd #val [, level(#)]
其中,#obs为样本容量,#mean为样本均值,#sd为标准差,#val为待检验数值, level为置信度水平。
Page 3
STATA从入门到精通
2、两样本t检验的Stata操作
文化程度 本科 专科 高中 高中 本科 高中 高中 高中 专科 本科 专科 专科 初中 本科 初中 初中
Page 7
STATA从入门到精通
17
男职工 51
18
男职工
43
19
女职工
50
20
男职工
35
21
男职工
37
22
男职工
37
23
男职工
39
24
女职工
49
25
女职工
53
26
女职工
50
27
男职工
36
பைடு நூலகம்
28
Page 9
STATA从入门到精通
Oneway命令的基本格式如下:
oneway response_var factor_var [if] [in] [weight] [, options]
主要选项
描述
bonferroni scheffe sidak tabulate [no]means [no]standard [no]freq [no]obs noanova nolabel wrap missing
部分数据如下表7-2 所示:
Page 5
STATA从入门到精通
表7-2 减肥茶服用前后体重对比表
喝减肥茶前体 重(公斤)
90 95 82 91 100 87 91 90 86 87 98 88 82 87
喝减肥茶后体 重(公斤)
63 71 79 73 74 65 67 73 60 76 71 72 75 62
数值,level为置信度水平。
Page 4
STATA从入门到精通
Ttest的主要选项如下表7-1所示:
主要选项 * by(groupvar) unequal welch level(#)
描述 通过定义组变量 非配对的数据含有不同变量 使用Welch近似 置信水平默认95%
【例7.1】使用文件“减肥.dta”的数据来对样本ttest命令的应用进 行说明。该例子是通过减肥茶前后的体重数据来评估减肥茶是否有效 果。本例要求用单样本t检验验证在服用减肥药之前,体重的均值是 否为90公斤。以及使用减肥药前后,体重是否有显著变化。
第七章 方差分析
方差分析
方差分析是基于样本方差对总体均值进行 统计推断的方法,它是通过实验观察某一 种或多种因素的变化对实验结果是否带来 显著影响,进而鉴别各种因素的效应,从 而选取一种最优方案。
方差分析包括单因素方差分析、多因素方 差分析和协方差分析。
Page 2
STATA从入门到精通
职工号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
性别 男职工 男职工 男职工 男职工 男职工 女职工 女职工 女职工 女职工 男职工 男职工 男职工 男职工 男职工 男职工 男职工
年龄 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45
7.1 t检验的Stata基本命令
t检验是用于小样本(样本容量小于30)两个平均值差异程度的检验方法。它 是用t分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。 t检验包括单样本t检验、两样本t检验,其中两样本t检验又包括配对样本t检 验和两独立样本t检验。
1、单样本t检验的Stata操作
单样本t检验有两种用法。一是检验样本平均数是否显著地不同于某个假设值。二是检 验同一套观察值中的两个变量的统计指标是否显著地不同。这等价于两者的差值的平 均数是否等于零。
在Stata应用中使用ttest命令来完成,单样本ttest有两种命令格式:
命令格式1(通过样本进行t检验):
ttest varname == # [if] [in] [, level(#)]
Page 6
STATA从入门到精通
【例7.2】使用文件“职工信息表.dta”的数据来对两独立样本ttest命令的应用进行说
明。表7-3给出了某厂职工的性别、年龄、职称及文化程度的信息。本例要求检验不同
性别的职工工资是否相同,使用的方法包括一般的t检验,消除同方差假定的t检验。
表7-3 某厂职工信息表
男职工
42
29
男职工
33
30
女职工
44
887
助理工程师 初中
879
工程师
专科
867
助理工程师
初中
879
工程师
专科
879
工程师
专科
827
助理工程师
高中
847
助理工程师
初中
887
助理工程师
初中
867
助理工程师
高中
867
助理工程师
高中
830
助理工程师
专科
847
助理工程师
初中
827
助理工程师
高中
867
助理工程师
基本工资 1014 984 1044 866 848 824 824 824 859 827 1014 989 938 889 887 887
职称 高级工程师 工程师 高级工程师 助理工程师 助理工程师 无技术职称 无技术职称 无技术职称 工程师 助理工程师 高级工程师 工程师 助理工程师 工程师 助理工程师 助理工程师
初中
Page 8
STATA从入门到精通
7.2 单因素方差分析
本节首先介绍单因素方差分析的原理,然后介绍实现单因素方差分析 的两个命令 oneway和 longway。
单因素方差分析用于比较多组样本的均数是否相同,并假定:每组的 数据服从正态分布,具有相同的方差,且相互独立。 单因素方差分析表
两样本t检验的Stata操作有三种基本命令格式,如下所示: 命令格式1(通过样本进行双变量t检验): ttest varname1 == varname2 [if] [in], [options] 命令格式2(通过样本进行分组t检验): ttest varname [if] [in] , by(groupvar) [options] 命令格式3(通过样本的统计指标进行t检验): ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2 [, options] 其中,#obs为样本容量,#mean为样本均值,#sd为标准差,#val为待检验
命令格式2(通过样本的统计指标进行t检验):
ttesti #obs #mean #sd #val [, level(#)]
其中,#obs为样本容量,#mean为样本均值,#sd为标准差,#val为待检验数值, level为置信度水平。
Page 3
STATA从入门到精通
2、两样本t检验的Stata操作
文化程度 本科 专科 高中 高中 本科 高中 高中 高中 专科 本科 专科 专科 初中 本科 初中 初中
Page 7
STATA从入门到精通
17
男职工 51
18
男职工
43
19
女职工
50
20
男职工
35
21
男职工
37
22
男职工
37
23
男职工
39
24
女职工
49
25
女职工
53
26
女职工
50
27
男职工
36
பைடு நூலகம்
28
Page 9
STATA从入门到精通
Oneway命令的基本格式如下:
oneway response_var factor_var [if] [in] [weight] [, options]
主要选项
描述
bonferroni scheffe sidak tabulate [no]means [no]standard [no]freq [no]obs noanova nolabel wrap missing
部分数据如下表7-2 所示:
Page 5
STATA从入门到精通
表7-2 减肥茶服用前后体重对比表
喝减肥茶前体 重(公斤)
90 95 82 91 100 87 91 90 86 87 98 88 82 87
喝减肥茶后体 重(公斤)
63 71 79 73 74 65 67 73 60 76 71 72 75 62
数值,level为置信度水平。
Page 4
STATA从入门到精通
Ttest的主要选项如下表7-1所示:
主要选项 * by(groupvar) unequal welch level(#)
描述 通过定义组变量 非配对的数据含有不同变量 使用Welch近似 置信水平默认95%
【例7.1】使用文件“减肥.dta”的数据来对样本ttest命令的应用进 行说明。该例子是通过减肥茶前后的体重数据来评估减肥茶是否有效 果。本例要求用单样本t检验验证在服用减肥药之前,体重的均值是 否为90公斤。以及使用减肥药前后,体重是否有显著变化。