医学统计学总体均数的估计与假设检验ppt-课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

六、 u 检验
•应用: 当已知;或未知,但n足够大时(此时t
分布接近u 分布)。用于两均数的比较。 常用于两大样本均数的比地抽样调查了部分健康成人的红细胞 数,其中男性360人,均数为4.6601012/L,标准 差为0.575 1012/L ;女性255人,均数为4.178 1012/L,标准差为0.291 1012/L,试问该地男、 女平均红细胞数有无差别?
30217某医生测得18例慢性支气管炎患者及1617酮类固醇排出量mgdl分别为314583735462405508498422435235289216555594440535380412412789324636348674467738495408534427654462592518310053200532成组设计的两样本几何均数的比较一般认为此类资料呈对数正态分布因此需将原始资料取对数后再作两组对数值均数的20名钩端螺旋体病人的血清随机分为两组分别用标准株和水生株做凝溶试验测得稀释倍数如下问两株的平均效价有无差别
如何判断? 统计上是通过假设检验来回答这个问题。 (1)建立假设:
H0: (检验假设或无效假设) 总体参数相等 为什么称其为无效假设?
H1: (备择假设) 总体参数不等
(2)确立检验水准 指拒绝实际上成立 H0 的所犯错误的概率
(I 类错误)。通常 = 0.05,但并不绝对。 为什么检验水准通常取0.05?
268
103
10609
443
22
484
d206 d221426
H0: d= 0
H : 0 2)
H0:
1 未知,但n足够大时;
1= 2
d
H0: d= 0
= 0.05 = 0.
4 据大量调查知,健康成年男子脉搏的均数为72次/分,某一身在山区随机调查了25名健康男子,其脉搏均数为74.
H1:两总体方差不等
H0: = 0 H1: > 0 单侧: = 0.05
t X 0
S/ n
74.2721.833 6.0/ 25
=n- 1=25 -1=24 查t界值表(P804),得单侧 t0.05,24 = 1.711 因: t =1.833> t0.05,24 所以:P < 0.05
结论:按照 = 0.05水准,拒绝H0 ,故可 认为该山区健康成年男子脉搏高于一般人群。
例:某单位研究饮食中缺乏维生素E与肝中维生 素A含量的关系,将同种属的大白鼠按性别相同,年 龄、体重相近者配成对子,共8对,并将每对中的两 头动物随机分到正常饲料组和E缺乏组,过一定时期 将大白鼠杀死,测得其肝中A的含量如下表,问不同 饲料的大白鼠肝中维生素A含量有无差别?
(3)成组设计两样本均数的比较
(3)选定检验方法和计算检验统计量 如:u、t、F、X2 等
(4)确定P值,作出推断结论 P值是指由所规定的总体中(本例
= 0)作随机抽样,获得等于或大于现 由样本计算得到的检验统计量值的概率。 即 P( t或u、F、 X2 等)。
若:P 时,则拒绝H0,接受H1 P 时,则不拒绝H0
五、 t 检验
利用总体均数的可信区间进行假设检验
(1)采用适当的变量变换,使达到方差齐性;
总体均数的95%可信区间:
第三章 总体均数的估计与假设检验
0次/分,能否认为该山区成年男子的脉搏高于一般人群?
=n- 1=11
n为对子数或差值个数
t0.10,11 = 1.796 , t0.20,11 = 1.363, 故 0.20> P > 0.10。
0.05 抽样调查得甲地100名健康男工人的血胆固醇(mg/100ml)得 X =180,S=30,假定血胆固醇呈正态分布,问:
(1) 甲地全体健康男工人的血胆固醇平均数估计在什么范围?
(2) 乙地抽样查得男工人血胆固醇 X=190,S=35,n=125,甲乙两地男工人血胆固醇是否相同?
3、柯尔莫柯罗夫-斯米尔诺夫(Kolmogorov-Smirnov)检验
本例n=11,则=10,查t界值表得:双侧 t0.0510=2.228
2) 未知,但n足够大时;
十一、 利用总体均数的可信区间进行假设检验 利用总体均数的可信区间进行假设检验
H1:两株的总体几何均数不等
u x xx
/ n S/ n S 例:某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对子,共8对
= 0.
第三章 总体均数的估计与假设检验
08, 所以 P < 0.
实际工作中, 往往未知,S 代替 , 此时就不是u代换,而是 t 代换。
观察指标测自不同受试对象或标本,但不同受试对象或标本配成对子,每对除处理因素不同外,其它非处理因素一致或基本一致。
九、 两样本方差齐性检验
怎样才能同时减少 、 ?
Wright 法 ⑵
490 397 512 401 470 415 431 429 420 275 165 421
Mini 法
d
d2

(4)
(5)
525
35
1225
415
18
324
508
-4
16
444
43
1849
500
30
900
460
45
2025
390
-41
1681
432
3
9
420
0
0
227
-48
2304
水生株(9 人) 100,100,100,200,200,200,200, 400,400
H0: 两株的总体几何均数相等 H1:两株的总体几何均数不等
= 0.05 将两组数据分别取对数,X1=lgA,X2=lgB
(A、B 分别代表两组原始数据)
注意:这里直接比较的是 lgG1 与 lgG2 ,但间接说明 了 G1 与 G2 的差别。
(4)成组设计的两样本几何均数的比较 一般认为此类资料呈对数正态分布,因此,需将
原始资料取对数后,再作两组对数值均数的t检验。
例 2.19 将 20 名钩端螺旋体病人的血清随机分为两组,分别 用标准株和水生株做凝溶试验,测得稀释倍数如下,问两株的 平均效价有无差别?
标准株(11 人) 100,200,400,400,400,400,800, 1600,1600,1600,3200
X2:4.12 7.89 3.24 6.36 3.48 6.74 4.67 7.38 4.95 4.08 5.34 4.27 6.54 4.62 5.92 5.18
H0: 1= 2 H1: 1≠2
= 0.05
= n1+n2-2
本例 t= 1.8< t0.05, 32 = 2.037, 所以,P>0.05
七、两均数的等效检验
是推断两种处理效果是否相近或相等的统计方法。
关于可信区间的准确性和精密度 例:由X光片上测得两组病人的肺门横径右侧(cm),算得结果如下,试检验两个方差的齐性。
等效检验的假设 本例n=110,双侧u0.
H0: d= 0 (4)确定P值,作出推断结论 怎样才能同时减少 、 ?
上例如用双侧检验,查表得双侧 t0.05,24 = 2.064
则: t =1.833< t0.05,24 , P > 0.05。 结论相反。
单侧检验效率要高于双侧检验。 如何选择单侧或双侧检验? 主要根据专业知识而定。 如某指标只高不低或只低不高。
2、配对设计的两均数比较
• 同源配对
观察指标测自同一受试对象或标本。
(2)样本均数的总均数等于原始总体均数。
一、 均数的抽样误差与标准误( x , sx )
均数的抽样误差: 抽样引起的样本均数与总体均数之间或样本均数 之间的差别。
标准误: 即样本均数的标准差。表示样本均数对总体均数的离散程度。
x 2
N
2
S xx n 1
x 2
x
K
n
SS
x
n
应用: 用于两均数比较的假设检验;
资料要求: (1)资料随机取自正态总体; (2)两总体方差齐性(相等)。
1、样本均数与总体均数比较
例4.4 据大量调查知,健康成年男子脉搏 的均数为72次/分,某一身在山区随机调查了 25名健康男子,其脉搏均数为74.2次/分,标 准差为6.0次/分,能否认为该山区成年男子的 脉搏高于一般人群?
一、 均数的抽样误差与标准误(x , sx )
某变量值总体分布
某变量值n相同的样本均数总体分布
反复从总体中抽取n 一定的样本,得到无数样本均数,也 构成一个总体。
其分布特点如下:
(1)原始总体呈正态分布,则样本均数抽样分布也呈正态 分布,甚至原始分布为偏态分布,若n足够大(n>60),则样 本均数也逼近正态分布。
四、 假设检验的一般步骤
例: 据大量调查知,健康成年男子脉搏的均数为72 次分,某医生在山区随机调查了25名健康男子,其 脉搏均数为74.2次/分,标准差为6.0次/分,能否认 为该山区成年男子的脉搏高于一般人群?
分析两均数不等的原因有两种可能性:
(1)仅仅由于抽样误差所致; (2)除抽样误差外还由于环境条件的影响。
• 异源配对
观察指标测自不同受试对象或标本, 但不同受试对象或标本配成对子,每对除处 理因素不同外,其它非处理因素一致或基本 一致。
统计分析是比较配对差值与总体均数 0 的差别进行的
表2.7 12 名妇女最大呼气率分别用两法测得的结果(L/min)
被测者编号 ⑴
1 2 3 4 5 6 7 8 9 10 11 12
实际工作中, 往往未知,S 代替, 此时 就不是u代换,而是 t 代换。
t X
S/ n
无数t点所组成的分布,称t分布。
t 分布的特征: (1)以 0 为中心,两侧对称的单峰分布 (2)与 u 分布比较,峰值较低,两边上翘 (3)有一个参数 ,当 ,t分布u分布
P804
0.6745 1.2816 1.6449 1.9600 2.3263 2.5758 2.8070 3.0902 3.2905
三、 总体均数的估计
(1)点估计: X µ (2)区间估计:
按一定的概率(1 - )估计总体均数所在范围 (或称可信区间),常用95%和99%的概率估计。
1)当未知时
x t /2 ,S x ,x t ,/2 S x
例2.12 11名18岁男大学生身高得均数 172.25厘米,标准差3.31厘米,试估计该地 18岁男大学生总体身高均数的95%可信区间。
统计分析是比较配对差值与总体均数 0 的差别进行的 0次/分,能否认为该山区成年男子的脉搏高于一般人群?
生总体身高均数的95%可信区间。 (4)确定P值,作出推断结论
血沉(mm/小时)如下表:
包括 d= 0 , P>0.
本例n=110,双侧u =1.96 或 未知,但n足够大时(此时t分布接近u 分布)。
医学统计学总体均数的估计与 假设检验
第三章 总体均数的估计与假设检验
• 均数的抽样误差与标准误 • t分布 • 总体均数的估计 • 假设检验的一般步骤 •t检验 • u 检验 • 两均数的等效检验 • 正态性检验 • 两样本方差齐性检验 • 假设检验时应注意的问题 • 利用总体均数的可信区间进行假设检验 • 课堂讨论
,鼠并肝将 中每维对生中素的A含两量头有动无物差随别机?分到正常饲料组和E缺乏组,过一定时期将大白鼠杀死,测得其肝中A的含量如下表,问不同饲x料的大白
= 0.
(本1例)经采计用算适当X=的92例变. 量变某换,地使达1到1方差0齐名性;18岁男大学生身高均数为172.73厘 米,标准差为4.09厘米,试估计该地18岁男大学 例:由X光片上测得两组病人的肺门横径右侧(cm),算得结果如下,试检验两个方差的齐性。
例2.17 某医生测得18 例慢性支气管炎患者及16 例健康人的尿17 酮类固醇排出量(mg/dl)分别为 X1和 X2,试问两组的均数有无不 同。
X1:3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22 4.35 2.35 2.89 2.16 5.55 5.94 4.40 5.35 3.80 4.12
H1:两株的总体几何均数不等
肺癌病人:n1=10,X1=6.
(2)确立检验水准
则 u 服从标准正态分布 N(0,1)
H0: = 2
H1:
2
= 0.
3)当已知时。
x u /2x,x u /2x
•关于可信区间的准确性和精密度 准确度反映在可信度(1 - )的大小上; 精密度反映在可信区间的长度上。
例4.1某市随机抽查12岁男孩100人, 得身高均数139.6cm,标准差6.85cm, 资料,求标准误?
S S 6.850.68(c5m ) x n 100
二、 t 分布
若X或 X服从正态分布 N( , 2),则可作正 态变量 X或 X的 u 代换。
u x
u x / n
则 u 服从标准正态分布 N(0,1)
H1:两株的总体几何均数不等
本例n=110,双侧u0.
抽样调查得甲地100名健康男工人的血胆固醇(mg/100ml)得 X =180,S=30,假定血胆固醇呈正态分布,问:
(1) 甲地全体健康男工人的血胆固醇平均数估计在什么范围?
(2) 乙地抽样查得男工人血胆固醇 X=190,S=35,n=125,甲乙两地男工人血胆固醇是否相同?
相关文档
最新文档