第6章假设检验解析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t值越小,越利于H0假设 t值越大,越不利于H0假设
t
X 0 s n
150 132 16.5 25
5.4545
计算概率P(与统计量t值对应的概率)
在H0成立的前提下,获得现有这么大的标准t
离差以及更大离差 的可能性。
P=P(|t|≥5.4545) ?
按 =25-1=24查附表2t界值表
第六章
假设检验
假设检验
假设检验的概念与原理 t检验 假设检验与区间估计的关系 假设检验的功效 假设检验应注意的问题
假设检验的概念与原理
指标描述
统计描述 图表描述 统计分析
参数估计
统计推断
假设检验
定量资料分析的 t 检验
英国统计学W.S.Gosset (1909)导出了样本均 数的确切分布,即 t分布。
配对设计的形式
自身配对
同一对象接受两种处理,如同一标本用两种方法进行检验, 同一患者接受两种处理方法;
异体配对
将条件相近的实验对象配对,并分别给予两种处理。
若两处理因素的效应无差别,差值d的总体均
数d应该为0,故可将该检验理解为样本均数 与总体均数d =0的比较
差值均数的大小及其抽样误差反应因素的效应
例6.2 现用两种测量肺活量的仪器对12名妇女测得最大呼气率 (PEER)(L/min),资料如表6.1,问两种方法的检测结果有无差别?
表 6.1 被测者号 (1) 1 2 3 4 5 6 7 8 9 10 11 12 合计 用两种方法对 12 名妇女的最大呼气率检测结果(L/min) Wright 法 (2) 490 397 512 401 470 415 431 429 420 275 165 421 Mini 法 (3) 525 415 508 444 500 460 390 432 420 227 268 443 差值 d (4)=(3)-(2) 35 18 -4 43 30 45 -41 3 0 -48 103 22 206 d2 (5) 1225 324 16 1849 900 2025 1681 9 0 2304 10609 484 21426
样本信息不支持H0,便拒绝之并接受H1,否则不拒绝H0 。
假设检验的基本步骤
建立假设 确定检验水准 计算检验统计量 计算概率P 结论
当P≤ 时,拒绝H0,接受H1,差别有统计学意义。
当P> 时,不拒绝H0,差别尚无统计学意义。
不论,拒绝拒绝H0,还是不拒绝H0都可能范错误。
同?
μ0 =132(g/L)
n=25
? =
μ
X 150 ( g / L) S 16.5( g / L)
已知总体
未知总体
目的:推断病人的平均血红蛋白(未知总体均
数)与正常女性的平均血红蛋白(已知总体均
数0)间有无差别
μ =μ0 ?
X 0 150 132 18
手头样本对应的未知总体均数 μ等于已知总体均数μ0,
2 2
sc
2
(n1 1) s1 (n 2 1) s 2 n1 n 2 2
例6.4 某医生研究转铁蛋白对病毒性肝炎诊断的临床意义,测得12名 正常人和15名病毒性肝炎患者血清转铁蛋白含量(g/dl),结果见例 4.3。问患者和正常人转铁蛋白含量是否有差异?
H0 :1=2,正常人与病毒性肝炎患者的转铁蛋白含量相等;
在两个样本均数比较时,若两组样本含量都很大,可用u检验,其计 算公式为:
X1 X 2 u s X 1 X 2
X1 X 2 s12 n1 s 2 2 n2
u为标准正态离差,按正态分布界定P值并作出结论 。
例6.5 某市于1973年和1993抽查部分12岁男童对其发育情况进行评估, 其中身高的有关资料如下,试比较这两个年度12岁男童身高均数有无 差别。
2
2
n2 7.5 2 / 120 6.3 2 / 153 0.8533
u
X1 X 2 s X1X 2
139.9 143.7 0.8533
4.4353 u 0.05 2.58
P<0.01,差别有统计学意义,可认为该市1993年12岁男童平均身高比1973年高。
假设检验应注意的问题
差别仅仅是由于抽样误差所致;
除抽样误差外,病人与正常人存在本质上的差异
建立假设 (在假设的前提下有规律可循)
零假设(null hypothesis),记为H0
H0:=132,病人与正常人的平均血红蛋白含量相等;
备择假设(alternative hypothesis),记为H1
H1:≠132,病人与正常人的平均血红蛋白含量不等。
1973 年:n1=120 =139.9cm s1=7.5cm; 1993 年:n2=153 =143.7cm s2=6.3cm。
H0 :1=2,即该市两个年度12岁男童平均身高相等; H1 :1≠2,即该市两个年度12岁男童平均身高不等。
双侧 =0.05。
s X 1 X 2 s1 n1 s 2
H0:d=0,两仪器检验结果相同; H1:d≠0,两仪器检验结果不同。
双侧 =0.05。
t
d sd n
17.17 40.33/ 12
1.48
按 = n-1=12-1=11查t值表,得t0.20,11=1.363,t0.10,11=1.796,
t0.10,11>t>t0.20,11,则0.20>P>0.10,差别无统计学意义,尚
不能认为两种仪器检查的结果不同。
例6.3 某医生研究脑缺氧对脑组织中生化指标的影响,将乳猪按出生 体重配成7对,一组为对照组,一组为脑缺氧模型组。试比较两组猪 脑组织钙泵的含量有无差别。
表 6.2 乳猪号 1 2 3 4 5 6 7 合计 对照组 0.3550 0.2000 0.3130 0.3630 0.3544 0.3450 0.3050
两样本均数比较的t检验
有些研究的设计既不能自身配对,也不便异体配对, 而只能把独立的两组相互比较。例如手术组与非手术 组、新药组与对照组。两个样本均数比较的目的在于 推断两个样本所代表的两总体均数1和2是否相等。
X1 X 2 t s X1X 2
s X 1 X 2 sc
2
1 1 n n 2 1
假设检验
先假设 等于0,再判断样本提供的信息是否支持这种假设, 若不支持,则可推断该样本并非来自已知均数的总体。
H0:=132,病人与正常人的平均血红蛋白含量相等; H1:≠132,病人与正常人的平均血红蛋白含量不等。
=0.05
t
X 0 s n
150 132 16.5 25
假设检验中需注意的几个问题
建立假设
“假设”是对总体特征的表述 H0与H1并非并列,而是以H0为主
H0与H1的表述随资料性质、分析目的和检验方法而定。
假设检验中需注意的几个问题
验证假设
各种检验方法都以统计量的分布为依据 检验统计量与H0密切相关:H0条件下产生了检验统计量t的概率分
H1 :1≠2 ,正常人与病毒性肝炎患者的转铁蛋白含量不等。 双侧 =0.05。
t
271.89 235.21 163.3679 1 12 1 15
7.402
=n1+n2-2=12+15-2=25
按自由度 25 查附表 2 , t 界值表得 t0.001,25=3.725 , t > t0.001,25 , P < 0.001 ,差别 有统计学意义,可以认为病毒性肝炎患者的转铁蛋白含量较低。
t 检 验
样本均数与总体均数的比较
目的:推断该样本是否来自某已知总体; 样本均数代表的总体均数与0是否相等。
总体均数0一般为理论值、标准值或经大量观察所得并为人们接
受的公认值、习惯值。
解决思路:
Leabharlann Baidu
区间估计
判断样本信息估计的总体均数之可信区间是否覆盖已知的 总体均数0 ?若不覆盖,则可推断该样本并非来自已知均 数的总体。
两组乳猪脑组织钙泵含量( g/g) 实验组 0.2755 0.2545 0.1800 0.3230 0.3113 0.2955 0.2870 差值 d 0.0795 -0.0545 0.1330 0.0400 0.0431 0.0495 0.0180 0.3086 d2 0.006320 0.002970 0.017689 0.001600 0.001858 0.002450 0.000324 0.033211
5.4545
∵t>t0.05,24=2.064
∴ P <0.05
按 =0.05的水准,拒绝H0,接受H1,差别有统计学意义。认为该 病女性患者的Hb含量高于正常女性的Hb含量。
配对设计定量资料的差值均数与总体差值均数0的比较
配对设计是研究者为了控制可能存在的主要的
非处理因素而采用的一种实验设计方法。
假设检验中需注意的几个问题
第一类错误与第二类错误
拒绝H0,接受H1 H0真实 H0不真实
不拒绝H0 正确推断(1-) 第二类错误()
第一类错误( ) 正确推断(1-)
统计学上规定: H0 真实时被拒绝为第一类错误 (又称Ⅰ型错误,
type Ⅰerror), H0不真实时不拒绝为第二类错误 (又称Ⅱ型错误,
假设检验的意义
得到关于总体的结论 如本例假设检验的意义在于分辨手头样本所代表的未
知总体和已知总体是否为同一总体,换句话说,即分
辨手头样本是否为已知总体的一个随机样本。
假设检验的基本思想
“反证法”的思想 先根据研究目的建立假设,从H0假设出发,先假设它是正确的, 再分析样本提供的信息是否与H0有较大矛盾,即是否支持H0,若
其中H0假设比较单纯、明确,在H0 下若能 弄清抽样误差的分布规律,便有规律可循。 而H1假设包含的情况比较复杂。因此,我 们着重考察样本信息是否支持H0假设(因 为单凭一份样本资料不可能去证明哪个假设 是正确的,哪一个不正确)。
确定检验水准 (确定最大允许误差)
设定检验水准的目的就是确定拒绝假设H0时的最大
H0:d=0,即两组乳猪脑组织钙泵含量相等; H1:d>0,即对照组乳猪脑组织钙泵含量高于实验组。 单侧 =0.05。
t d sd n 0.0441 0.05716 7 2.0412
按= n-1=7-1=6查t界值表,得单侧t0.05,6=1.943,t>t0.05,6, 则P<0.05,差别有统计学意义,可以认为脑缺氧可造成钙泵 含量的降低。
t分布的发现使小样本的统计推断成为可能, 因而它被认为是统计学发展史上的里程碑之一。 以t分布为基础的检验称为t检验。
例6.1 测得25例某病女性患者的血红蛋白(Hb),其均数为 150(g/L),标准差为16.5(g/L)。而该地正常成年女性的Hb均数为
132(g/L)。问该病女性患者的Hb含量是否与正常女性Hb含量不
布
反证法推理 :在H0条件下,抽得现有样本统计量的概率(P)很小, 就认为样本数据与H0假设有矛盾,且这种矛盾不能用抽样误差来
解释,所以可认为该样本来自H1假设,则接收H1;反之……。
判断水准 必须事先确定,一般取0.05。 P值
P值是决策的依据 P≤0.05 及其意义:首先P不指H0成立之可能,而是指从H0假设总体中 随机抽到差别至少等于现有差别的机会。
结论(根据小概率原理作出推断)
在H0成立的前提下出现现有差别或更大差别的可能性P(| t | ≥5.4545)小于0.05,是小概率事件,即现有样本信息不支持H0。 抉择的标准为:
当P≤ 时,拒绝H0,接受H1
当P> 时,不拒绝H0
本例P<0.05,按 =0.05的水准,拒绝H0,接受H1,差别有统计 学意义。认为该病女性患者的Hb含量高于正常女性的Hb含量。
允许误差。医学研究中一般取=0.05 。
检验水准实际上确定了小概率事件的判断标准。
选定检验方法计算检验统计量
(计算样本与总体的偏离)
t
X 0 s n
统计量t表示,在标准误的尺度下,样本均数与总体 均数0的偏离。这种偏离称为标准t离差。
根据抽样误差理论,在H0假设前提下,统计量t服 从自由度为n-1的t分布,即t值在0的附近的可能性 大,远离0的可能性小,离0越远可能性越小。