第七章 方差分析(stata统计分析与应用)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Page 3
STATA从入门到精通
2、两样本t检验的Stata操作
两样本t检验的Stata操作有三种基本命令格式,如下所示: 命令格式1(通过样本进行双变量t检验): ttest varname1 == varname2 [if] [in], [options] 命令格式2(通过样本进行分组t检验): ttest varname [if] [in] , by(groupvar) [options] 命令格式3(通过样本的统计指标进行t检验):
Page 5
STATA从入门到精通
表7-2 减肥茶服用前后体重对比表
喝减肥茶前体 重(公斤) 90 95 82 91 100 87 91 90 86 87 98 88 82 87 喝减肥茶后体 重(公斤) 63 71 79 73 74 65 67 73 60 76 71 72 75 62
Page 6
ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2 [, options]
其中,#obs为样本容量,#mean为样本均值,#sd为标准差,#val为待检验 数值,level为置信度水平。
Page 4
STATA从入门到精通
Ttest的主要选项如下表7-1所示:
协方差分析将那些人为很难控制的控制因素作为协变量,并在排除协 变量对观测变量影响的条件下,分析控制变量(可控)对观测变量的 作用,从而更加准确地对控制因素进行评价。
Page 16
STATA从入门到精通
协方差分析拓展了多因素方差分析,使之可以包含分类变量和连续变 量的情况。当出现连续变量时,定义此变量,方差分析便可进行。 Anova具有处理连续变量和分类变量的能力。方法就是在双因素和多 因素方差分析格式后,再加上continuous,指定连续变量。其基本 命令格式如下:
主要选项 mean median 描述 F分布的期望值,默认是1 F分布的中位数,默认是1
exact
level
精确置信区间
置信度,默认95%
Page 11
STATA从入门到精通
【例7.3】使用文件“大学生信息表.dta”的数据来对单因素方差分析oneway命令 的应用进行说明。表7.7来自于Ward和Ault(1990)对在校大学生的抽样调查表, 其中year代表所处的大学年级,gender代表性别,drink用一个33级别表来衡量学 生喝酒频度和程度,gpa代表学分积点,belong表示是否是大学生联谊会的会员, employed为是否就业。部分数据如表7-7所示:
多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能 够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响, 进而最终找到利于观测变量的最优组合。
Page 13
STATA从入门到精通
多因素方差分析处理的就是两个或者更多x分类变量的情况。在Stata中用命令 anova实现,其基本命令格式如下:
本例中,我们检验大学生饮酒行为平均数是否会因为是否就业而有所变化。
Page 12
STATA从入门到精通
7.3 双因素和多因素方差分析
多因素方差分析用来研究两个及两个以上控制变量是否对观测变量产 生显著影响。这里,由于研究多个因素对观测变量的影响,因此称为 多因素方差分析。若研究的是两个变量,则称为双因素方差分析。
Page 2
7.1
t检验的Stata基本命令
t检验是用于小样本(样本容量小于30)两个平均值差异程度的检验方法。它 是用t分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。 t检验包括单样本t检验、两样本t检验,其中两样本t检验又包括配对样本t检 验和两独立样本t检验。
1、单样本t检验的Stata操作
表7-15 员工信息表
minority 0 0 0 0 0 0 0 0 educ 8 8 8 8 8 8 8 8 salary 15750 15900 16200 16650 16800 16950 17400 17700 beginsalar y 10200 10200 9750 9750 10200 10200 10200 10200 gender Female Female Female Female Female Female Female Female
主要选项 bonferroni scheffe sidak tabulate [no]means 描述 bonferroni 多重比较检验 scheffe 多重比较检验 sidak 多重比较检验 产生列表 [不]显示均值
[no]standard [no]freq
[no]obs noanova nolabel wrap missing
考察工资是否因性别、少数民族与否的不同而存在差异。
Page 15
STATA从入门到精通
7.4 协方差分析
不论是单因素方差分析还是多因素方差分析,控制因素都是可控的, 其各个水平可以通过人为的努力得到控制和确定。但在许多实际问题 中,有些控制因素很难人为控制,但它们的不同水平确实对观测变量 产生了较为显著的影响。
主要选项 * by(groupvar) unequal welch level(#) 描述 通过定义组变量 非配对的数据含有不同变量 使用Welch近似 置信水平默认95%
【例7.1】使用文件“减肥.dta”的数据来对样本ttest命令的应用进 行说明。该例子是通过减肥茶前后的体重数据来评估减肥茶是否有效 果。本例要求用单样本t检验验证在服用减肥药之前,体重的均值是 否为90公斤。以及使用减肥药前后,体重是否有显著变化。 部分数据如下表7-2 所示:
anova response_var [if] [in] [weight] [,options] 要在anova中纳入任何交互项,只需要指定有关变量的名称,并用* 号连接即可。
Page 17
STATA从入门到精通
主要选项
描述
category(varlist) class(varlist) continuous(varlist)
职工号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 性别 男职工 男职工 男职工 男职工 男职工 女职工 女职工 女职工 女职工 男职工 男职工 男职工 男职工 男职工 男职工 男职工 年龄 48 49 54 41 38 41 42 41 42 35 56 59 59 41 55 45 基本工资 1014 984 1044 866 848 824 824 824 859 827 1014 989 938 889 887 887
Page 7
职称 高级工程师 工程师 高级工程师 助理工程师 助理工程师 无技术职称 无技术职称 无技术职称 工程师 助理工程师 高级工程师 工程师 助理工程师 工程师 助理工程师 助理工程师
文化程度 本科 专科 高中 高中 本科 高中 高中 高中 专科 本科 专科 专科 初中 本科 初中 初中 STATA从入门到精通
anova response_var [if] [in] [weight] [,options] 要在anova中纳入任何交互项,只需要指定有关变量的名称,并用*号连接即可。
主要wenku.baidu.com项
category(varlist) class(varlist) repeated(varlist) partial sequential noconstant regress
描述
分类变量
分类变量,与上同义。如不注明,Stata默 认所有变量都是分类变量。
重复观测因子 使用边际平方和,默认选项 使用序列平方和 没有常数项 显示回归结果
[no]anova
不显示ANOVA 表
Page 14
STATA从入门到精通
【例7.4】使用文件“员工信息表.dta”的数据来对多因素方差分析anova命令的应 用进行说明。表7.15介绍了某单位的员工信息表,其中minority代表是否属于少数 民族,这里的0是非少数民族,1表示为少数民族,educ代表教育年限,salary为年 薪,beginsalary为起始年薪,gender为性别。部分数据如表7-15所示:
单因素方差分析用于比较多组样本的均数是否相同,并假定:每组的 数据服从正态分布,具有相同的方差,且相互独立。 单因素方差分析表
Page 9
STATA从入门到精通
Oneway命令的基本格式如下: oneway response_var factor_var [if] [in] [weight] [, options]
表7-7 大学生信息表 year Freshman Freshman Freshman Freshman Freshman Freshman Freshman gender Male Female Male Female Female Male Male drink 5 9 29 22 19 19 24 gpa 3.2 3 2.85 belong nonmembe nonmembe nonmembe nonmembe nonmembe nonmembe nonmembe employed No Yes No No No No No
[不]显示标准差 [不]显示频数
[不]显示观测个数 不显示方差分析表 以数值形式显示,而不是以标签形式 列表不隔开 将缺失值作为一类
Page 10
STATA从入门到精通
longway命令的基本格式如下:
loneway response_var group_var [if] [in] [weight] [, options]
17
18 19 20 21 22 23 24 25 26 27 28 29 30
男职工
男职工 女职工 男职工 男职工 男职工 男职工 女职工 女职工 女职工 男职工 男职工 男职工 女职工
51
43 50 35 37 37 39 49 53 50 36 42 33 44
887
879 867 879 879 827 847 887 867 867 830 847 827 867
助理工程师
工程师 助理工程师 工程师 工程师 助理工程师 助理工程师 助理工程师 助理工程师 助理工程师 助理工程师 助理工程师 助理工程师 助理工程师
初中
专科 初中 专科 专科 高中 初中 初中 高中 高中 专科 初中 高中 初中
Page 8
STATA从入门到精通
7.2
单因素方差分析
本节首先介绍单因素方差分析的原理,然后介绍实现单因素方差分析 的两个命令 oneway和 longway。
单样本t检验有两种用法。一是检验样本平均数是否显著地不同于某个假设值。二是检 验同一套观察值中的两个变量的统计指标是否显著地不同。这等价于两者的差值的平 均数是否等于零。 在Stata应用中使用ttest命令来完成,单样本ttest有两种命令格式: 命令格式1(通过样本进行t检验): ttest varname == # [if] [in] [, level(#)] 命令格式2(通过样本的统计指标进行t检验): ttesti #obs #mean #sd #val [, level(#)] 其中,#obs为样本容量,#mean为样本均值,#sd为标准差,#val为待检验数值, level为置信度水平。
STATA 从入门到精通
第七章 方差分析
方差分析
方差分析是基于样本方差对总体均值进行 统计推断的方法,它是通过实验观察某一 种或多种因素的变化对实验结果是否带来 显著影响,进而鉴别各种因素的效应,从 而选取一种最优方案。
方差分析包括单因素方差分析、多因素方 差分析和协方差分析。
STATA从入门到精通
STATA从入门到精通
【例7.2】使用文件“职工信息表.dta”的数据来对两独立样本ttest命令的应用进行说 明。表7-3给出了某厂职工的性别、年龄、职称及文化程度的信息。本例要求检验不同 性别的职工工资是否相同,使用的方法包括一般的t检验,消除同方差假定的t检验。
表7-3 某厂职工信息表
相关文档
最新文档