STATA软件应用(三)定量资料的统计分析解析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
/* 不打印方差分析表
/* 将缺省值作为单独的一组
/* 打印各组的基本统计量表 简写:t
/* Scheffe法 简写:sch
/* Bonferroni法 简写:bon
/* Sidak法
简写:si
单因素方差分析
三组小鼠的FDP酶活力
对照组 水层RNA组
2.79
3.83
2.69
3.15
3.11
4.70
仅有原始数据时
ttest 变量名= #val
注: #val /*总体均数 命令可以加一些if和in条件限制
样本均数与总体均数比较的t检验
例4.4 命令:ttesti 25 5.1 0.88 4.6
样本均数与总体均数比较的t检验
例:某医生随机抽查10名某病患者的血红蛋白,如下:
病例号
1 23 4
医学统计学实习课
STATA软件的应用(3) ——定量资料的统计分析
定量资料的统计分析
➢ 样本均数与总体均数比较的t 检验 ➢ 配对设计t 检验 ➢ 成组设计t 检验 ➢ 单因素方差分析 ➢ 两因素方差分析 ➢ 方差齐性检验 ➢ 正态性检验
样本均数与总体均数比较的t检验
仅有数据之统计量时
ttesti #obs #mean #sd #val
data:oneway.dta
. oneway x g,t sch
|
Summary of x
g|
Mean Std. Dev. Freq.
------------+------------------------------------
1 | 2.7025 .50013569
8
2 | 3.66125 .98508069
Ha: mean != 14.02 Pr(|T| > |t|) = 0.0218
Ha: mean > 14.02 Pr(T > t) = 0.9891
配对设计t检验
ttest 变量1=变量2
变量1与变量2必须成对输入,样本含量必须相 等,如有缺省值,则用小数点表示,但与之对 应的记录在计算时被忽略
Ha: ratio != 1
Pr(F < f) = 0.2675 2*Pr(F < f) = 0.5349
Ha: ratio > 1 Pr(F > f) = 0.7325
单因素方差分析
oneway 因变量 分组变量,[选择项]
➢ noanova ➢ missing ➢ tabulate ➢ scheffe ➢ Bonferroni ➢ sidak
样本含量:10 均 数: 12.59 g/dl 标准差: 1.63 g/dl
统计量与参数不同的两种可能
其一:抽样误差 (偶然的、随机的、较小的)
其二:本质上的差别 (必然的、大于随机误差)
样本均数与总体均数比较的t检验
ttest x=14.02
One-sample t test
------------------------------------------------------------------------------
Variable | Obs
Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
x | 10 12.59 .5162794 1.632619 11.42209 13.75791
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
1 | 14 4.377857 .3875 1.449892 3.540714 5.215
---------+--------------------------------------------------------------------
diff | 10 -.6799999 .5204272 1.645735 -1.857288 .4972881
------------------------------------------------------------------------------
[,unequal]
➢ unpaired 表示非配对的,如不选就作配对t检验 ➢ unequal 表示假设两组方差不齐,如不选表示假设两
组方差达到齐性
成组设计t检验
例:分别测得14例老年人煤饼病人及11例正常人的 尿中17 酮类固醇排出量(mg/dl)如下,试比较 两组的均数有无差别
病人: 2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.36 2.72 2.37 2.09 7.10 5.92
mean(diff) = mean(x1 - x2)
t = -1.3066
Ho: mean(diff) = 0
degrees of freedom =
9
Ha: mean(diff) < 0 Pr(T < t) = 0.1119
Ha: mean(diff) != 0 Pr(|T| > |t|) = 0.2237
配对设计t检验
例:10例矽肺患者经某药治疗,其血红蛋白 (g/dl)如下:
病例号:
1
2
3
4
5
6
7
8
9 10
治疗前(x1): 11.3 15.0 15.0 13.5 12.8 10.0 11.0 12.0 13.0 12.3 治疗后(x2): 14.0 13.8 14.0 13.5 13.5 12.0 14.7 11.4 13.8 12.0
Number of obs = 20 R-squared = 0.7058 Root MSE = .134818 Adj R-squared = 0.5341
3.47
3.97
1.77
2.03
2.44
2.87
2.83
3.65
2.52Βιβλιοθήκη 5.09酚层RNA组 5.41 3.47 4.92 4.07 2.18 3.13 3.77 4.26
单因素方差分析
oneway x group oneway x group , t oneway x group ,t sch
Ha: mean(diff) > 0 Pr(T > t) = 0.8881
配对设计t检验
另一种思路: gen d=x0-x1 ttest d=0 结果一致
成组设计t检验
ttest 变量1=变量2, unpaired [unequal] ttest 变量,by(分组变量)[unequal] ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2
2 | .95875
| 0.111
|
3 | 1.19875
.24
| 0.038 0.859
两因素方差分析
四种抗癌药物抑瘤效果
配伍组 a1
a2
a3
a4
b1 0.80 0.36 0.17 0.28
b2 0.74 0.50 0.42 0.36
b3 0.31 0.20 0.38 0.25
b4 0.48 0.18 0.44 0.22
data:ttest_2
配对设计t检验
. ttest x1=x2
Paired t test
------------------------------------------------------------------------------
Variable | Obs
Mean Std. Err. Std. Dev. [95% Conf. Interval]
------------------------------------------------------------------------------
mean = mean(x)
t = -2.7698
Ho: mean = 14.02
degrees of freedom = 9
Ha: mean < 14.02 Pr(T < t) = 0.0109
方差齐:t检验 方差不齐:t’检验
两组资料间的方差齐性检验
sdtest 变量名1 = 变量名2 sdtest 变量,by(分组变量) sdtesti #obs1 #mean1 #sd1 #obs2
#mean2 #sd2
sdtest x,by(g)
Variance ratio test
------------------------------------------------------------------------------
------------------------------------------------------------------------------
ratio = sd(1) / sd(2)
f = 0.6980
Ho: ratio = 1
degrees of freedom = 13, 10
Ha: ratio < 1
Total
22.2125336 23 .965762331
Bartlett's test for equal variances: chi2(2) =3.4559 Prob>chi2=0.178
Comparison of x by g
(Scheffe)
Row Mean-|
Col Mean |
1
2
---------+----------------------
5
6 7 8 9 10
血红蛋白 11.3 15 15 13.5 12.8 10 11 12 13 12.3 (x,g/dl)
问:该病患者的平均Hb含量是否与正常人的平均Hb含量 相同 (正常人的平均Hb含量为14.02(g/dl) )。
data:ttest_1
问题:
正常人
0=14.02
患者
1=?
b5 0.76 0.26 0.28 0.13
两因素的方差分析 anova 因变量 分组变量1 分组变量2
两因素的方差分析
egen a=seq(), b(5) egen b=seq(), f(1) t(5) anova x a b data:anova.dta
. anova x group block
健康人:5.18 8.79 3.14 6.46 3.72 6.64 5.60 4.57 7.71 4.99 4.01
data:ttest_3.dta ttest_4.dta
成组设计t检验
ttest x1=x2, unpaired ttest x, by(g)
均数的假设检验应用条件
独立性 正态性 方差齐性
Between groups 6.43680897 2 3.21840449 4.28 0.0275
Within groups 15.7757246 21 .751224983
------------------------------------------------------------------------
---------+--------------------------------------------------------------------
x1 | 10 12.59 .5162794 1.632619 11.42209 13.75791
x2 | 10 13.27 .3415813 1.080175 12.49729 14.04271
8
3 | 3.9012501 1.0164425
8
------------+------------------------------------
Total | 3.4216667 .98273207
24
Analysis of Variance
Source
SS
df
MS
F
Prob > F
------------------------------------------------------------------------
2 | 11 5.528182 .5232431 1.735401 4.362324 6.69404
---------+--------------------------------------------------------------------
combined | 25 4.884 .3306453 1.653227 4.201582 5.566418