医学统计学之t检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、One-Samples T Test( 单个样本t检验)过程
(1)建库:点击Variable View:
Name 双顶径值
Type Numeric
…… ……
Values
(2)输入数据:点击Data View
9.95 9.33
9.49 SPSS格式
9.00 10.09 9.15 9.52 9.33 9.16 9.37 9.11 9.27
Levene's Test for Equality of Variances
对数
Equal variances assumed
Equal variances not assumed
F 5.063
Si g. .037
Independent Samples Test
t 3.149
3.345
t-test for Equality of Means
普通资料(一般t检验) 3、两独立样本比较 (Independent-samples test) 计算公式相同
抗体滴度资料(几何均数比较的t检验)
注意:读取结果时,要先看方差是否齐,若方差不齐, 必须取方差不齐的t检验的结果。
课本P430第2题(可信区间估计)
某地调查了40-50岁冠心病患者500名的血清胆固醇,其均数 为228.6mg/dl,标准差为46.8mg/dl;同时调查了60名以上冠心病患 者30名的血请胆固醇,其均数为230.mg/dl,标准差为54.9mg/dl, 试计算两个不同年龄组冠心病患者血清胆固醇99%的可信区间。
医学统计学之t检验
一、目的要求 1、了解抽样误差的概念、掌握反映抽样误差大小的指 标—标准误的计算 2、掌握可信区间估计的方法 3、掌握样本均数与总体均数比较的方法 4、掌握配对计量资料比较的方法 5、掌握两样本均数比较的方法
内容复习: 一、可信区间
从总体中作随机抽样,根据每一个样本可算得一个可信区间,如95%可信区间,意 味着对固定样本含量n作100次随机抽样,可算得100个可信区间,有95个可信区间包括 了总体均数,只有5个可信区间不包括体均数,即获错误的概率是5%,5%是小概率事件, 对一次试验而言出现的可能性小,因此,在实际应用中就认为总体均数在算得的可信区 间内。
95% Confidence
Interval of the
M ea n
Std. Error
Di ffe re nce
df
Sig. (2-tailed) Difference Difference Lower
Upper
18
.006 .52604232 .16703912 .17510614 .87697849
题意分析: 两样本均数比较的t检验
H0:μ1=μ2 (正常人与代谢综合征病人脂联素水平相同) H1:μ1 ≠μ2 (常人与代谢综合征病人脂联素水平不同) α= 0.05
SPSS操作(作业上略) (判断P值,下统计结论和专业结论)
SPSS操作过程
1、Independent-Samples T Test(两个独立样本t检验)过程
df
Sig. (2-tailed)
11
.327
M ea n Di ffe re nce
.09750
95% Confidence Interval of the Di ffe re nce
Lower
Upper
-.1117
.3067
第3题:某临床医师欲了解代谢综合征病人体内脂联素水平, 收集了正常人、代谢综合征病人脂联素水平各15例,两组 人在年龄、性别等基本人口学特征方面均衡可比,试分析 之。
Lower
Upper
4.16900 5.39100
24.488
.000 4.78000
.29828 4.16503 5.39497
方差不齐
方差齐时(P>0.05) 选择此行结果
方差不齐时(p<0.05)选
择此行结果
第4题:题略。
题意分析:配对计量资料比较的t检验
H0: μd=0 H1:μd ≠0 α=0.05
验过程
(1)Test Variable(s)框: 选入分析变量“脂联素” (2)Grouping Variable框:选入“组别”
单击Define Groups(定义分组变量) Group1:键入 1 Group2:键入 2 (3)单击Continue (4)单击ok钮
SPSS操作过程
结果
方差齐
对子
方法1
对子2
1
4.18
4.42
2
4.04
4.17
3
4.36
3.14
数据格式
4
3.01
2.94
5
1.66
1.20
6
10.31
7.96
7
5.92
9.80
8
2.50
1.43
8
5.98
3.97
10
6.56
4.83
配对设计情况下,同一 对象不同方法测得的 结果被看成是不同的 指标,因此被录成了不 同的变量
查表得:… … (判断P值,下统计结论和专业结论)
SPSS操作过程
1、Paired-Samples T Test(配对t检验)过程
(1)建库:点击Variable View:
Name
Type
……
Values
对子数
Numeric
……
方法1
方法2
Numeric
……
(2)输入数据:点击Data View
验过程
(1)Test Variable(s)框: 选入分析变量“平均效价 ” (2)Grouping Variable框:选入“组别”
单击Define Groups(定义分组变量) Group1:键入 1 Group2:键入 2 (3)单击Continue (4)单击ok钮
SPSS操作过程
分组 平均效价
分组 2 2
脂联素水平 6.7 6.4
2
7.0
2
5.0
2
6.2
2
5.7
2
4.1
2
6.2
2
6.3
2
7.9
2
7.5
25.625源自426.31
10.3
2
6.7
Values 1=正常人,2=代谢综合征病人
数据格式
SPSS操作过程
Analyze => Compare Means => Independent-Samples T Test(两个独立样本t检
医学统计学之t检验
• 本资料适合《医学统计学》(中国协和医 科大学出版社版本)研究生和本科生上机 操作实习SPSS使用。主要内容为广西医科 大学黄高明老师的课件。版权所有请勿用 于商业。山西医科大学、山西中医学院、 广西医科大学等医学院校的本科生、研究 生可以参考使用。
2019/10/24
广西医科大学卫统教研室黄高明编
1
100
1
200
1
400
1
400
1
400
1
400
1
800
1
1600
1
1600
1
1600
1
3200
2
100
2
100
2
100
2
200
2
200
2
200
2
200
2
400
2
400
SPSS数据格式
SPSS操作过程
用Compute 进行对数转 换
SPSS操作过程
转换得的对数值
用算得的对数值进行T检验
结果的选择同前的两独立样本 均数的比较
df
Sig. (2-tailed)
9
.428
第5题 方法同 第3题
补充练习: 将钩端螺旋体病人的血清分别用标准株和水生株作凝溶
试验,测得稀释倍数如下,问两组的平均效价有无差别 。
标准株11人 100 200 400 400 400 400 800 1600 1600 1600 3200
水生株9人 100 100 100 200 200 200 200 400 400
普通资料(一般t检验) 3、两独立样本比较 (Independent-samples test) 计算公式相同
抗体滴度资料(几何均数比较的t检验)
注意:读取结果时,要先看方差是否齐,若方差不齐, 必须取方差不齐的t检验的结果。
内容复习: 一、可信区间
从总体中作随机抽样,根据每一个样本可算得一个可信区间,如95%可信区间,意 味着对固定样本含量n作100次随机抽样,可算得100个可信区间,有95个可信区间包括 了总体均数,只有5个可信区间不包括体均数,即获错误的概率是5%,5%是小概率事件, 对一次试验而言出现的可能性小,因此,在实际应用中就认为总体均数在算得的可信区 间内。
题意分析:依题知,本资料需作两独立样本几何均数比较的t检验
H0:μ1=μ2 (标准株和水生株平均效价相同) H1:μ1 ≠μ2 (标准株和水生株平均效价不同) α= 0.05 SPSS操作(作业上略) (判断P值,下统计结论和专业结论)
SPSS操作过程
Analyze => Compare Means => Independent-Samples T Test(两个独立样本t检
试问该山区男婴的双顶径与一般男婴的双顶径有无差别?
题意分析: 单样本与总体均数比较t检验 H0:μ=μ0 (山区男婴的双顶径与一般男婴的双顶径有无差别) H1:μ ≠ μ0 (山区男婴的双顶径与一般男婴的双顶径有差别) α= 0.05
SPSS操作(作业上略) (判断P值,下统计结论和专业结论)
SPSS操作过程
Independent Samples Test
t 16.025
16.025
t-test for Equality of Means
M ea n
df
Sig. (2-tailed) Difference
28
.000 4.78000
Std. Error Di ffe re nce
.29828
95% Confidence Interval of the Di ffe re nce
题意分析:
(1)计算标准误
Sx
S n
(2)计算99%可信区间 ( x uα sx , x uα sx )
补充练习: 大量研究显示,汉族足月正常产男婴的双顶径(BPD)均数为9.3cm,某医生
记录了某山区12名汉族足月正常产男婴的双顶径资料如下:
9.95 9.33 9.49 9.00 10.09 9.15 9.52 9.33 9.16 9.37 9.11 9.27
一可信区间从总体中作随机抽样根据每一个样本可算得一个可信区间如95可信区间意味着对固定样本含量n作100次随机抽样可算得100个可信区间有95个可信区间包括了总体均数只有5个可信区间不包括体均数即获错误的概率是55是小概率事件对一次试验而言出现的可能性小因此在实际应用中就认为总体均数在算得的可信区间内
计算方法(1)正态分布资料 ( x uα sx , x uα sx )
(2)偏态分布资料 :用bootstrap法对百分位数作区间估计(少用)
二、t检验 1、单样本(与总体均数)比较(One sample test) 2、配对资料比较(Paired-samples test)(相应数据都有编号)
15.585
.004 .52604232 .15724601 .19197317 .86011147
方差齐性 检验
F值,P值
两样本均 数比较t检 验的t值
两样本均 数比较t检 验的t值对 应的P值
Levene's Test for Equality of Variances
脂联 素
Equal variances assumed
Equal variances not assumed
F .428
Si g. .518
M ea n .46600
Paired Differences
Std. Error Std. Deviation Mean
1.77522 .56137
95% Confidence Interval of the Di ffe re nce
Lower -.80392
Upper 1.73592
t .830
SPSS操作过程
SPSS操作过程
Analyze => Compare Means==>Paired-samples T Test
Paired Variable框:同时选入 “方法一、方法二” 单击ok钮
结果
配对t检验的t值 P值
Pair 1 方 法 1 - 方 法 2
Paired Samples Test
计算方法(1)正态分布资料 ( x uα sx , x uα sx )
(2)偏态分布资料 :用bootstrap法对百分位数作区间估计(少用)
二、t检验 1、单样本(与总体均数)比较(One sample test) 2、配对资料比较(Paired-samples test)(相应数据都有编号)
(1)建库:点击Variable View:
Name
Type
……
组别
Numeric
……
含量
Numeric
……
(2)输入数据:点击Data View
分组 1 1
脂联素水平
1
1
1
1
1
1
1
1
1
1
1
1
11.9 11.4 10.6 11.7 11.6 10.1 10.8 10.2 10.4 11.6 10.4 11.8 11.2 10.7
SAPnSalSy操ze作=>过Com程pare Means==>One-samples T Test
Test Variable(s)(检验变量)框:选入“双顶径” Test Value(检验标准值)框:键入9.3 单击ok钮
分析结果 T值
P值
95%可信 区间
双顶 径
t 1.026
One-Sample Test Test Value = 9.3
(1)建库:点击Variable View:
Name 双顶径值
Type Numeric
…… ……
Values
(2)输入数据:点击Data View
9.95 9.33
9.49 SPSS格式
9.00 10.09 9.15 9.52 9.33 9.16 9.37 9.11 9.27
Levene's Test for Equality of Variances
对数
Equal variances assumed
Equal variances not assumed
F 5.063
Si g. .037
Independent Samples Test
t 3.149
3.345
t-test for Equality of Means
普通资料(一般t检验) 3、两独立样本比较 (Independent-samples test) 计算公式相同
抗体滴度资料(几何均数比较的t检验)
注意:读取结果时,要先看方差是否齐,若方差不齐, 必须取方差不齐的t检验的结果。
课本P430第2题(可信区间估计)
某地调查了40-50岁冠心病患者500名的血清胆固醇,其均数 为228.6mg/dl,标准差为46.8mg/dl;同时调查了60名以上冠心病患 者30名的血请胆固醇,其均数为230.mg/dl,标准差为54.9mg/dl, 试计算两个不同年龄组冠心病患者血清胆固醇99%的可信区间。
医学统计学之t检验
一、目的要求 1、了解抽样误差的概念、掌握反映抽样误差大小的指 标—标准误的计算 2、掌握可信区间估计的方法 3、掌握样本均数与总体均数比较的方法 4、掌握配对计量资料比较的方法 5、掌握两样本均数比较的方法
内容复习: 一、可信区间
从总体中作随机抽样,根据每一个样本可算得一个可信区间,如95%可信区间,意 味着对固定样本含量n作100次随机抽样,可算得100个可信区间,有95个可信区间包括 了总体均数,只有5个可信区间不包括体均数,即获错误的概率是5%,5%是小概率事件, 对一次试验而言出现的可能性小,因此,在实际应用中就认为总体均数在算得的可信区 间内。
95% Confidence
Interval of the
M ea n
Std. Error
Di ffe re nce
df
Sig. (2-tailed) Difference Difference Lower
Upper
18
.006 .52604232 .16703912 .17510614 .87697849
题意分析: 两样本均数比较的t检验
H0:μ1=μ2 (正常人与代谢综合征病人脂联素水平相同) H1:μ1 ≠μ2 (常人与代谢综合征病人脂联素水平不同) α= 0.05
SPSS操作(作业上略) (判断P值,下统计结论和专业结论)
SPSS操作过程
1、Independent-Samples T Test(两个独立样本t检验)过程
df
Sig. (2-tailed)
11
.327
M ea n Di ffe re nce
.09750
95% Confidence Interval of the Di ffe re nce
Lower
Upper
-.1117
.3067
第3题:某临床医师欲了解代谢综合征病人体内脂联素水平, 收集了正常人、代谢综合征病人脂联素水平各15例,两组 人在年龄、性别等基本人口学特征方面均衡可比,试分析 之。
Lower
Upper
4.16900 5.39100
24.488
.000 4.78000
.29828 4.16503 5.39497
方差不齐
方差齐时(P>0.05) 选择此行结果
方差不齐时(p<0.05)选
择此行结果
第4题:题略。
题意分析:配对计量资料比较的t检验
H0: μd=0 H1:μd ≠0 α=0.05
验过程
(1)Test Variable(s)框: 选入分析变量“脂联素” (2)Grouping Variable框:选入“组别”
单击Define Groups(定义分组变量) Group1:键入 1 Group2:键入 2 (3)单击Continue (4)单击ok钮
SPSS操作过程
结果
方差齐
对子
方法1
对子2
1
4.18
4.42
2
4.04
4.17
3
4.36
3.14
数据格式
4
3.01
2.94
5
1.66
1.20
6
10.31
7.96
7
5.92
9.80
8
2.50
1.43
8
5.98
3.97
10
6.56
4.83
配对设计情况下,同一 对象不同方法测得的 结果被看成是不同的 指标,因此被录成了不 同的变量
查表得:… … (判断P值,下统计结论和专业结论)
SPSS操作过程
1、Paired-Samples T Test(配对t检验)过程
(1)建库:点击Variable View:
Name
Type
……
Values
对子数
Numeric
……
方法1
方法2
Numeric
……
(2)输入数据:点击Data View
验过程
(1)Test Variable(s)框: 选入分析变量“平均效价 ” (2)Grouping Variable框:选入“组别”
单击Define Groups(定义分组变量) Group1:键入 1 Group2:键入 2 (3)单击Continue (4)单击ok钮
SPSS操作过程
分组 平均效价
分组 2 2
脂联素水平 6.7 6.4
2
7.0
2
5.0
2
6.2
2
5.7
2
4.1
2
6.2
2
6.3
2
7.9
2
7.5
25.625源自426.31
10.3
2
6.7
Values 1=正常人,2=代谢综合征病人
数据格式
SPSS操作过程
Analyze => Compare Means => Independent-Samples T Test(两个独立样本t检
医学统计学之t检验
• 本资料适合《医学统计学》(中国协和医 科大学出版社版本)研究生和本科生上机 操作实习SPSS使用。主要内容为广西医科 大学黄高明老师的课件。版权所有请勿用 于商业。山西医科大学、山西中医学院、 广西医科大学等医学院校的本科生、研究 生可以参考使用。
2019/10/24
广西医科大学卫统教研室黄高明编
1
100
1
200
1
400
1
400
1
400
1
400
1
800
1
1600
1
1600
1
1600
1
3200
2
100
2
100
2
100
2
200
2
200
2
200
2
200
2
400
2
400
SPSS数据格式
SPSS操作过程
用Compute 进行对数转 换
SPSS操作过程
转换得的对数值
用算得的对数值进行T检验
结果的选择同前的两独立样本 均数的比较
df
Sig. (2-tailed)
9
.428
第5题 方法同 第3题
补充练习: 将钩端螺旋体病人的血清分别用标准株和水生株作凝溶
试验,测得稀释倍数如下,问两组的平均效价有无差别 。
标准株11人 100 200 400 400 400 400 800 1600 1600 1600 3200
水生株9人 100 100 100 200 200 200 200 400 400
普通资料(一般t检验) 3、两独立样本比较 (Independent-samples test) 计算公式相同
抗体滴度资料(几何均数比较的t检验)
注意:读取结果时,要先看方差是否齐,若方差不齐, 必须取方差不齐的t检验的结果。
内容复习: 一、可信区间
从总体中作随机抽样,根据每一个样本可算得一个可信区间,如95%可信区间,意 味着对固定样本含量n作100次随机抽样,可算得100个可信区间,有95个可信区间包括 了总体均数,只有5个可信区间不包括体均数,即获错误的概率是5%,5%是小概率事件, 对一次试验而言出现的可能性小,因此,在实际应用中就认为总体均数在算得的可信区 间内。
题意分析:依题知,本资料需作两独立样本几何均数比较的t检验
H0:μ1=μ2 (标准株和水生株平均效价相同) H1:μ1 ≠μ2 (标准株和水生株平均效价不同) α= 0.05 SPSS操作(作业上略) (判断P值,下统计结论和专业结论)
SPSS操作过程
Analyze => Compare Means => Independent-Samples T Test(两个独立样本t检
试问该山区男婴的双顶径与一般男婴的双顶径有无差别?
题意分析: 单样本与总体均数比较t检验 H0:μ=μ0 (山区男婴的双顶径与一般男婴的双顶径有无差别) H1:μ ≠ μ0 (山区男婴的双顶径与一般男婴的双顶径有差别) α= 0.05
SPSS操作(作业上略) (判断P值,下统计结论和专业结论)
SPSS操作过程
Independent Samples Test
t 16.025
16.025
t-test for Equality of Means
M ea n
df
Sig. (2-tailed) Difference
28
.000 4.78000
Std. Error Di ffe re nce
.29828
95% Confidence Interval of the Di ffe re nce
题意分析:
(1)计算标准误
Sx
S n
(2)计算99%可信区间 ( x uα sx , x uα sx )
补充练习: 大量研究显示,汉族足月正常产男婴的双顶径(BPD)均数为9.3cm,某医生
记录了某山区12名汉族足月正常产男婴的双顶径资料如下:
9.95 9.33 9.49 9.00 10.09 9.15 9.52 9.33 9.16 9.37 9.11 9.27
一可信区间从总体中作随机抽样根据每一个样本可算得一个可信区间如95可信区间意味着对固定样本含量n作100次随机抽样可算得100个可信区间有95个可信区间包括了总体均数只有5个可信区间不包括体均数即获错误的概率是55是小概率事件对一次试验而言出现的可能性小因此在实际应用中就认为总体均数在算得的可信区间内
计算方法(1)正态分布资料 ( x uα sx , x uα sx )
(2)偏态分布资料 :用bootstrap法对百分位数作区间估计(少用)
二、t检验 1、单样本(与总体均数)比较(One sample test) 2、配对资料比较(Paired-samples test)(相应数据都有编号)
15.585
.004 .52604232 .15724601 .19197317 .86011147
方差齐性 检验
F值,P值
两样本均 数比较t检 验的t值
两样本均 数比较t检 验的t值对 应的P值
Levene's Test for Equality of Variances
脂联 素
Equal variances assumed
Equal variances not assumed
F .428
Si g. .518
M ea n .46600
Paired Differences
Std. Error Std. Deviation Mean
1.77522 .56137
95% Confidence Interval of the Di ffe re nce
Lower -.80392
Upper 1.73592
t .830
SPSS操作过程
SPSS操作过程
Analyze => Compare Means==>Paired-samples T Test
Paired Variable框:同时选入 “方法一、方法二” 单击ok钮
结果
配对t检验的t值 P值
Pair 1 方 法 1 - 方 法 2
Paired Samples Test
计算方法(1)正态分布资料 ( x uα sx , x uα sx )
(2)偏态分布资料 :用bootstrap法对百分位数作区间估计(少用)
二、t检验 1、单样本(与总体均数)比较(One sample test) 2、配对资料比较(Paired-samples test)(相应数据都有编号)
(1)建库:点击Variable View:
Name
Type
……
组别
Numeric
……
含量
Numeric
……
(2)输入数据:点击Data View
分组 1 1
脂联素水平
1
1
1
1
1
1
1
1
1
1
1
1
11.9 11.4 10.6 11.7 11.6 10.1 10.8 10.2 10.4 11.6 10.4 11.8 11.2 10.7
SAPnSalSy操ze作=>过Com程pare Means==>One-samples T Test
Test Variable(s)(检验变量)框:选入“双顶径” Test Value(检验标准值)框:键入9.3 单击ok钮
分析结果 T值
P值
95%可信 区间
双顶 径
t 1.026
One-Sample Test Test Value = 9.3