第5讲 区间估计和假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
均 数: 231.86ug/dL 标准差:12.17ug/dL
X1 X 2 42.32
11 9.77 12 12.17 s 122.93 12 13 2
2 2 2 C
s X1 X 2
1 1 122.93 ( ) 4.439 12 13
双侧t 0.05,23 2.069 (273.18 231.86) 2.069 4.439 32.14, 50.50
1) 未知,且n较小
( X t / 2, S X , X t / 2, S X )
例:对某人群随机抽取20人,用某批号的结核菌素 做皮试,平均直径为10.9mm,标准差为3.86mm,问 这批结核菌素在该人群中使用,皮试直径的95%可 信区间? n=20, =20-1=19, =0.05
可信区间的涵义
可信度为1-α的可信区间的确切涵义是:每 100个样本所算得的100(1-α)%可信区间, 平均有100(1-α)个包含了总体参数。 95%可信区间:从总体中作随机抽样,作 100次抽样,每个样本可算得一个可信区间, 得100个可信区间,平均有95个可信区间包括 μ (估计正确),只有5个可信区间不包括 μ (估计错误)。
计算检验统计量即计算样本与所假设总体 的偏离。 计算概率P值即与统计量t值对应的概率。 一个样本按某一检验方法只能得出一个P 值,但供研究者用来界定此P值的α水准却 有多个。
步骤4:作出推断结论
P ,拒绝H0,接受H1,差异有统计学意义
P> , 不拒绝H0,差异无统计学意义
统计结论≠专业结论 P值越小≠差别越大
假设检验的基本思想
• 提出一个假设 • 如果假设成立,得到现有样本的可能性
– 可能性很小(小概率事件),在一次试验中 本不该得到,居然得到了,说明我们的假设 有问题,拒绝之。 – 可能性较大(不是小概率事件),即有可能 得到手头的结果,故根据现有的样本无法拒 绝事先的假设(没理由)
例:根据大量调查,已知健康成年男子的脉搏
2 c
n1 n2 2
sx1 x2
两均数之差的标 准误
合并方差
2 2 n 1 s n 1 s 1 2 2 s2 1 c
n1 n2 2
正常组
1=?
肝炎组
2=?
1- 2 =?
均 数:273.18ug/dL 标准差:9.77ug/dL
2
5.00, 0.43
5.50, 0.45
Population A
Population B
X 5.135
X 4.949
X 5.442
sample
1
sample
2
sample
b
假设检验的实质是先对总体的参
数或分布做出某种假设,然后用适当 的方法根据样本对总体提供的信息, 推断此假设应当拒绝,或不拒绝,其 结果将有助于研究者做出决策,采取 措施。
则其宽度为
l 2t , s X 2t , s n
• 可信度越大,可信区间越宽,说明用该区间 来估计总体参数(总体均数)越可靠。 • 标准差越小,可信区间就越窄,意味着如果 总体内变异程度较小时,在相同的可信度下, 只需要一个比较窄的可信区间就可以估计总 体均数。 • 随着样本含量的增加,可信区间逐渐变窄。
下列说法正确吗?
算得某95%的可信区间,则: 总体参数有95%的可能落在该区间。 有95%的总体参数在该区间内。 该区间包含95%的总体参数。 该区间有95%的可能包含总体参数。 该区间包含总体参数,可信度为95%。
均数可信区间与参考值范围的区别: 区别点 意义
均数的可信区间 参考值范围 “正常人”的解 剖、生理、生化 指标的波动范围。
均数0为72次/分,某医生在一山区随机调查 了25名健康成年男子,求得其脉搏均数为74.2 次/分,标准差6.0次/分,能否认定该山区成年 男子的脉搏均数高于一般成年男子?
74.2 > 72 环境因素 抽样误差
如何回答例题中的问题?
统计上是通过假设检验,按小概率 事件和反证法相结合的原理来回答 这个问题。假设检验的方法很多, 但其检验的基本步骤是一致的。
例:n=144,x=5.38,s=0.44,求总体均数的95%
可信区间。
(5.38-1.96*0.44/ 144, 5.38+1.96*0.44/ 144) =(5.31,5.45)
两均数之差的区间估计
x1 x2 1 2 t sx1 x2
1 1 s n1 n2
1 P(t / 2, t t / 2, ) P(t / 2, X t / 2, ) SX
100(1 )%可信区间为(X t / 2, S X ,X t / 2, S X) 或写成X t / 2, S X ; 或(X t / 2, S X X t / 2, S X)
H0假设比较简单、明确,且在该假 设前提下其分布有规律可寻。而H1假设 包含的情况比较复杂。因此,检验是针 对H0分布进行的。 统计学上,将“拒绝H0 ,接受H1”称为有 统计学意义;“不拒绝H0”称为无统计学 意义。
情形1
两均数比较
H0:两总体均数相等,即1=2
H1: 1 > 2( 1 ≠ 2 )
点估计:用样本统计量 X 、S、p 参数的估计
直接作为总体参数 、 、 的 估计值
区间估计:在一定可信度 (Confidence level) 下 ,同时考虑抽样误差
点估计:这种方法简单易行,但未考虑抽样误差, 而抽样误差是不可避免的,因此样本抽的不同, 可以对总体参数做出不同的点估计。
区间估计
假设Baidu Nhomakorabea验的正确应用
• 假设检验是建立在样本随机客观的基础 上的。 • P值的含义: P值表明以多大的误差拒绝H0 ,接受H1。 • Significant的含义。 • 检验水准在假设检验结论中的意义。 按误差不超过 % 的条件拒绝 H ;接受H1
0
假设检验与参数估计的关系 区别:目标不同,对问题的直接回 答也不同
t 0.05,19=2.093
(10.9-2.093*3.86/ 20, 10.9-2.093*3.86/ 20)
=(9.10,12.70) 下限
上限
2)当样本含量n较大时,如n>100,t分布近似标准 正态分布,此时可用标准正态分布u分布代替t分布 总体均数的双侧95%可信区间
( X u / 2 S X , X u / 2 S X )
已知: X u / 2
S n
n
未知,但n较大: X u / 2
用途
估计总体均数
判断观察对象的某 项指标正常与否
假设检验的基本思想和步骤
假设检验的基本目的:
分辨两个样本是否属一个总体或两个不 同的总体,并对总体作出适当的结论。
模拟实验
• 实验1:总体A是100例正常成年男子的红 细胞数,从中随机抽取样本 1 和样本 • 实验2:总体B是不同于总体A的又一正 常成年男子的红细胞数,从中随机抽取 样本b。(样本含量均为10例)
• 步骤1:建立假设
•在假设的前提下有规律可寻
–检验假设(hypothesis to be tested) ,亦称无 效假设或零假设(null hypothesis),记为H0,表 示目前的差异是由于抽样误差引起的。 –备择假设(alternative hypothesis),记为H1, 表示目前的差异是主要由于本质上的差别引起。
X t0.05/ 2, S X , X t0.05/ 2, S X X t0.01/ 2, S X , X t0.01/ 2, S X 公式 区间范围 窄 宽 估计错误的概率 大(0.05) 小(0.01)
可信区间的宽度及影响因素
• 均数的95%可信区间 为
( X t / 2, S X , X t / 2, S X )
按预先给定的概率, 确定未知参数的可能 范围。实际上一次抽 样算得的可信区间要 么包含了总体均数, 要么不包含。但可以 说:该可信区间有多 大的可能性包含了总 体均数。
均数的可信区间
参考值范围
正态分布: X u / 2 S
偏态分布:PX P 100 X
S n
计算公式
未知: X t / 2,
联系: 可以从两个角度说明同一个 问题,两者结果可以互相印 证
情形2
多个均数间比较
H0:1 = 2 = 3…;
H1: 1、2、3…之间不等或不全等。
H0的意义与(1)相似,只不过总体均数多于2个 罢了;而H1的意义比较复杂,因为拒绝H0之后, 可供选择的结果远不止一个,如1 = 2,2≠3; 1≠2,2 = 3;……;1≠2≠3……;皆符合 与H0对立的要求。
• 在多个均数相比较时,如果拒绝H0,则 往往要再分别比较 1与 2、 1与 3、 2 与 3……,即进行多重比较,才可得到 具体的结果。
情形3 其它情形
H0:d = 0,即总体差值均数为0
H1: ≠0,则表示治疗前后有差异
• 步骤2:确立检验水准α(significance level)
95%可信区间的含义
按这种方法 构建的可信区 间,理论上平 均每 100 次,有 95 次 可 以 估 计 到总体参数。
-2
-1
0
1
2
可信区间的两个要素
可信度(Confidence):准确性,可靠性,即1-α 。
一般取90%,95%,可人为控制
精确性(Precision):区间的大小,越小越好。 95%可信区间 99%可信区间
以预先给定的概率(可信度1-α)估计总体参数 在哪个范围内的估计方法称为区间估计。其概率 用1-α表示,称为可信度或置信度。由此估计的 区间称为1-α可信区间。 可信区间的两个端点称为可信限,其中较小者 称下限或下可信限,较大者称上限或上可信限。 可信区间是一开区间(CL,CU)。
总体均数的可信区间
• 用于确定何时拒绝H0
一般取0.05
=0.05
检验水准α表示在所设H0的总体随机获得手头样本的概 率不允许超过5%。(界定小概率的标准) “手头样本”也包括与总体参数偏离更大的样本在内 。 如果在H0所规定的总体中随机抽样,获得手头样本的概率 不超过α,我们将如何抉择?
步骤3:计算检验统计量和P值
第四章 统计推断基础之二
总体均数的区间估计
总体均数的区间估计
统计描述
参数估计
点估计
统计
统计推断
假设检验
区间估计
点估计
• 直接用样本统计量作为总体参数的估计 值。 • 特点:简单直观,但却不能从样本获得 更多的信息。 • 如用均数作为总体均数的估计值。 • 示例:
点估计示例
• 用样本均数作为总体均数 的一个估计,用样本的标 准差s作为总体标准差 的一个估计。 • 某地区所有12岁正常男孩的身高是一个总体,但该总 体的参数 —— 平均身高未知。为此,随机抽取该地 区120名12岁正常男孩,测得其平均身高为142.67cm, 标准差为s=6.00cm,这是样本统计量。 • 该地区所有12岁正常男孩的平均身高为142.67cm,标 准差为6.00cm。这就是点估计。 • 如果有另一个研究者作同样的研究,测得当地另外120 名12岁男孩的平均身高为=141.95cm,当然也可以此作 为总体平均身高的另一个点估计。 • 谁的结论更可信?