第3章 抽样误差与假设检验(2)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、未知
通常未知,这时可以用其估计量 S 代替,
但
( X ) /( S / n )
已不再服从标准正态分布,而是
f (t )
服从 t 分布。
v
标准正态分布
v5 v 1
图4-2
不同自由度的 t 分布图
可信区间的计算:
计算可信区间的原理与前完全相同,仅仅是两
侧概率的界值有些差别。即
应用
供判断观察对象某项指标正常 与否(辅助诊断)
估计未知的总体均数所在范围
小 结
3.假设检验是依据样本提供的有限信息对总体 作推断的统计学方法,是在对研究总体的两种 对立的判断之间选择的决策程序。 4.假设检验的过程是:建立检验假设 计 算统计量 确定P值并与给定的a值比较 作出推断结论。
5.假设检验的基本逻辑是小概率事件在一次抽 样中不太可能出现。
准确度与精确度的关系:
四、 假设检验
(一)假设检验的思维逻辑
例 某商家宣称他的一批鸡蛋“坏蛋率为1%”。为了对 这批鸡蛋的质量(即坏蛋率是1%还是高于1%)作出判 断,顾客与商家约定,从中随机抽取5个做检查。结果为 4个“好蛋”,1个“坏蛋”。 根据这一结果,几乎任何一位顾客都会对“这批鸡蛋坏 蛋率为1%”的广告词发生怀疑。 在坏蛋率为1%的前提下,5个鸡蛋样品中出现一个坏蛋 的机会是很小的,发生机会很小的事件竟然在一次抽样 中就出现了,人们不禁怀疑前提条件(“坏蛋率为1%”) 的真实性。 这种问题需要通过假设检验来解决。
换句话说,做出市全体19岁男大学生身高均数
为171.3 -- 173.1cm的结论,说对的概率是95%, 说错的概率是5%。
Hale Waihona Puke Baidu
(2)t 分布 法
公式——x t /2, sx
应用条件—— 样本量 较小, 已知或可计算出 x 及 s x 例题 意义
例:某医生测得 25名动脉粥样硬化患者血浆纤 维蛋白原含量的均数为3.32 g/L,标准差为0.57
4.下结论
假设检验的推断结论是对“H0是否真实”作出判断。这种 判断是通过比较P值与检验水准a的大小来进行的。 在两个检验假设之间进行二者取一抉择(决策)的规则是: 如果 P ,意味着在H0成立的前提下发生了小概率事件, 根据“小概率事件在一次随机试验中不(大)可能发生” 的推断原理,怀疑H0的真实性,从而做出拒绝H0的决策。 因为 H1与H0是对立的,既然拒绝 H0 ,就只能接受 H1 。
第三章 抽样误差与假设检验
三、 参数估计
(一)参数估计的概念
参数估计: 是指用样本指标(统计量)估计总体指标(参 数)。
包括: 点估计(近似值) 区间估计(近似范围)
点估计:
用样本统计量直接作为总体参数的点估计值, 点估计的方法简单,但没有考虑抽样误差,无法评估估 计值与真值之间的差距。
2.计算统计量 (根据样本数据计算相应的统计量)
根据资料类型、研究设计方案和统计推断的目的,选择 适当的检验方法,不同检验方法各有其相应的检验统计 量及计算公式。许多假设检验方法是以检验统计量来命 名的,如 t 检验、z检验、F检验和 2 检验等。
在例6-1中,应计算t检验的统计量t 相应的自由度为 =n-l=36-l=35.
4.5 x 1.96sx 172.2 1.96 (171.3,173.1) 90
故该市2007年健康男大学生平均身高的95%置信区间 为(171.3,173.1)cm
意义: 虽然不能知道该市全体19岁男大学生身高均数
的确切数值,但有95%的把握说该市全体19岁男
大学生身高均数在171.3 -- 173.1cm之间。
*
*
*
模拟抽样成年男子红细胞数100次的95%可信区间示意图 ( 4.75, 0.39,n 140)
区间估计的准确度:说对的可能性大小, 用 (1-)
来衡量。99%的可信区间好于95%的可信区间
(n, S 一定时) 。
区间估计的精确度:指区间范围的宽窄,范围越
宽精确度越差。99%的可信区间差于95%的可信区 间(n, S 一定时) 。
练习题
1.正态曲线下,横轴上从一∞到µ+1.96σ的面积为 ( )。 A.95% B.45% C.97.5% D.47.5% E.不能确定 2. t分布与标准正态分布相比,( )。 A.均数要小 B.均数要大 C.标准差要小 D.标准差要大 E.均数和标准差都不同
练习题
有100个健康成年男子,用甲方法进行血钙值测定, 得平均数为10mg/100ml,标准差为1mg/100ml。 (1)现有一成年男子血钙值为9mg/100ml,问此人 血钙值是否正常(95%)? (2)该地健康成年男子平均血钙值95%的范围是多 少? (3)血钙值在8~12mg/100ml之间的约有几人?
无论做出哪一种推断结论(接受或是拒绝H0 ),
都面临着发生判断错误的风险。这就是假设检验
的两类错误。
以一个总体均数等于某一特定数值的推断为例,上述 步骤可以归纳为图6-1。
小 结
1.参数估计有两种方法:一是直接用样本统计 量估计总体参数,称为点估计。另一是区间估 计。即按一定的置信度估计总体参数所在范围,
g/L,试计算该种病人血浆纤维蛋白原含量总体
均数的95%可信区间。
下限: 上限:
X-t / 2 ( ) .S X 3.32 2.064 0.57 / 25 3.09 (g/L)
X t / 2 ( ) .S X 3.32 2.064 0.57 / 25 3.56 (g/L)
无效假设(null hypothesis),又称零假设,记为 H0。
备择假设(alternative hypothesis),记为 H1。
H1与 H0应该既有联系又相互对立。两个检验假设应该 包括两种(也是所有)可能的判断。研究者要按照假设 检验的规则在两个假设(即两种对立的判断)之间做出 抉择。
P (-t / 2 ( ) X- t / 2 ( ) )= 1- S/ n
可信区间:
( X-t / 2 ( ) .S X, X+t / 2 ( ) .S X )
需要注意:在小样本情况下,应用这一公式的 条件是原始变量服从正态分布。在大样本情况下
(如n>100),也可以用 Z
/2
替换 t 近似计算。
/2
(二)可信区间的计算
——总体均数的可信区间
1.正态分布近似法(Z分布法) 2. t分布法
(1)u 分布 法
公式
应用条件: 例题 意义:与参考值范围进行比较
x 1.96sx
样本量较大, 已知或可计算出
x 及 sx
某市2007年随机测量了90名19岁健康男大学生的 身高,其均数为172.2cm,标准差为4.5cm,试估 计该市2007年健康男大学生平均身高的95%置信 区间。
区间估计: 指按预先给定的概率,计算出一个区间,使它 能够包含未知的总体均数。事先给定的概率1 称为可信度,通常取 1 0.95 。
(二)可信区间的计算
1、已知
Z X / n
X P 1.96 1.96 0.95 / n
需要通过假设检验来处理的问题一般具有两个 特点:
一是需要从全局的范围,即从总体上对问题作出判断; 二是不可能或者不允许对研究总体的每一个体均做观察。
例如,某工厂生产了一批炮弹,需要检测他们 的炮弹是否合格;某药厂生产了一批用安剖瓶 封装的注射药物,需要检测他们的质量是否合 格等等。 对这类问题只能从研究总体中抽取大小合适的 随机样本,然后应用假设检验的理论和方法, 依据样本提供的有限信息对总体做判断。
(三)模拟实验
模拟抽样成年男子红细胞数。设定:
4.75, 0.39,n 140
产生100个随机样本,分别计算其95%的可信区间,
结果用图示的方法表示。从图可以看出:绝大多数
可信区间包含总体参数 4.75,只有6个可信区间 没有包含总体参数(用星号标记)。
*
μ
*
*
图4-2
最常用的是95%置信区间和99%置信区间。由
于考虑了抽样误差的大小,区间估计比点估计 更有用。
小 结
2.总体均数的区间估计
根据资料已知的条件及样本含量n的大小,总 体均数置信区间的计算公式不同。实际工作中, 估计总体均数置信区间时,要注意与参考值范围 的区别。
参考值范围
意义 计算 绝大多数人某指标的数值范围 正态分布:
(二)假设检验的基本步骤
例6-1 已知北方农村儿童前囟门闭合月龄为
14.1月。某研究人员从东北某县抽取36名儿童, 得囟门闭合月龄均值为14.3月,标准差为5.08月。 问该县儿童前囟门闭合月龄的均数是否大于一般 儿童?
返回
1.选择检验方法,建立检验假设并确定检验水准;
根据研究目的、研究设计的类型和资料特点(变量种类、 样本大小)等因素选择合适的检验方法。
P X 1 . 96 X 1 . 96 0.95 n n
可信区间:
( X 1.96 X , X 1.96 X )
一般情况
( X u / 2 X , X u / 2 X )
其中
Z / 2 为标准正态分布的双侧界值。
如果 P ,在H0成立的假设下发生较为可能的事件,没 有充足的理由对H0提出怀疑。于是做出不拒绝H0的决策。
在例6-1中由于P>0.5,自然有P>0.05 即a 这意味着,如果该县儿童前囟门闭合的平均月龄
为14.1月,观察到囟门闭合月龄均值为14.3月的
样本(以及均值更大的样本)的可能性还是比较 大的(概率大于0.5);没有理由对H0提出怀疑, 于是做出不拒绝H0的推断结论。
3.确定P值
P值的意义是:如果总体状况和H0一致,统计量获得现有 数值以及更不利于H0的数值的可能性(概率)有多大? 对于前述鸡蛋的例子,在5个鸡蛋样品中出现了 1个“坏 蛋”。那么更不利于广告词(即H0 )的可能是5个鸡蛋样 品中出现2个、3个、4个甚至5个坏蛋。于是P值就是坏蛋 数 1 的概率。 对于例 6-1,统计量越大越不利于H0 ,所以这里的 P值 应取为自由度为 35的 t分布曲线下,大于0.236的尾端的 面积。查附表2(t界值表),单侧 t0.5(35) 0.682 ,于是 得知P>0.5。
总体均数置信区间
按一定概率估计总体参数所在的可能范围 正态分布: 未知:
X Z /2 S (双侧)
X Z /2 S X
(双侧)
X Z S 或 X Z S (单侧)
X Z S X
或 X Z S X (单侧) (双侧)
已知:
X Z /2 X
X Z X 或 X Z X(单侧)
在例6-1中,根据资料的设计类型应选择t检验
=14.l(月), 为该县儿童前囟门闭合月龄总体 H0: 均数,意为“总体上该县儿童前囟门闭合月龄的平均水 平与一般儿童的平均水平相同”。
H1: >14.1(月),意为“该县儿童前囟门闭合月龄 的平均水平高于一般儿童的平均水平”。 检验水准(size of a test),用希腊字母 表示。实践 中常取0.05或 0.01等数值。它将小概率事件具体化, 即规定概率不超过 就是小概率。