第五讲-2 参数估计与假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
两均数之差的标准误
自由度v=(n1-1)+(n2-1)=n1+n2-2
单侧 (1 2 ) ( X1 X 2 ) t , S X1 X 2
( 1 2 ) ( X1 X 2 ) t , S X 1 X 2
3.参考值范围
• 参考值范围指正常值范围。由于存在个体差异,环 境数据并非常在一定范围内波动,故采用环境参考 值范围作为判定正常与异常的参考标准。 • 通常采用双侧参考值范围制定下侧和上侧值。 • 通常使用的环境参考值范围有90%,95%和99%,常 用的是95%。
假设样本来自某一特定总体,无效假设和备择假设。据资料类型, 确定要使用的检验方法。H0:μ=34.50,H1:μ≠34.50
6.2单双侧检验的确定
根据专业知识和所要解决的问题。通常选择双侧检验。
6.3确立检验水准
根据需要,确定 =0.05或0.01。此处为0.05.
6.4计算检验统计量
根据变量和资料类型、设计方案、统计推断的目的、是否满足特定 条件等(如数据的分布类型)选择相应的检验统计量。计算样本与 总体的偏离程度. 所有检验统计量都是在H0成立条件下计算来的。 有的检验不需要计算统计量,而直接计算P值。
预先给定的概率(1)称为置信度,常取95%或99%。
置信区间通常由两个数值构成,称可信限(confidence limit, CL)
可信下限(L)
μ
可信上限(U)
(θ1,θ2)是参数θ的置信区间,是一个范围;α为显著性 水平,一般为5%;
•(1-α)表明判断总体参数落在置信区间的可信程度, 由全部样本指标所确定的所有置信区间中平均有95%的 估计区间包括了总体参数θ,另外有5%的区间没有包括 总体参数θ。
• 有两种求参考值的方法。
3、参考值范围
正态分布法
• 进行正态分布检验 • 样本量足够大,通常大于100 • 双侧,1-a参考值范围: X / 2 S • 单侧,1-a参考值范围: X S 或 X S • 通常选择为平均值加减2倍标准差范围为 参考值范围
摘自,孙振球,医学统计学
2、总体均数可信区间的计算
(2)总体方差未知且样本容量较小,按t分布
双侧 单侧
s s , x t / 2,v x t / 2,v n n
X t , SX X t , SX
对于非正态总体,只要样本足够大, 仍可按上式计算置信区间
2、总体均数可信区间的计算
例,通过以往大规模调查,已知某地一般新生儿的 头围均数为 34.50cm,标准差为 1.99cm。为研究某矿 区新生儿的发育状况,现从该地某矿区随机抽取新 生儿55人,测得其头围均数为 33.89cm,问该矿区新 生儿的头围总体均数与一般新生儿头围总体均数是 否不同?
6.假设检验的基本步骤
6.1建立检验假设,确立检验方法
均数估计与假设检验
姬亚芹
1、总体均数估计的含义
• 参数估计是指用样本指标值(统计量)推断总体指标 值(参数)。 • 点估计和区间估计。 • 点估计就是用相应样本统计量直接作为其总体参数的 估计值。如, x估计 • 区间估计就是按照预先给定的概率(1-α)所确定的 包含未知总体参数的一个范围。该范围称为参数的可 信区间或置信区间(confidence interval, CI) 。
2、总体均数可信区间的计算
2.2 两总体均数之差的1–α可信区间
从总体标准差相等,总体均数不等的两个正态总体进行随 机抽样,若两样本的样本含量、均数、标准差分别用
n1、 X1、S1和n2、 X2、S2 表示,则两总体均数之差的双侧1-α可信
区间为
双侧
( X1 X 2 ) t / 2 , S X 1 X 2
4.假设检验的基本概念
4.2无效假设和备择假设 (1)无效假设又称零假设,根据检验结果准备予以拒绝 或接受的假设,记为H0(null hypothesis); (2)备择假设又称对立假设,与原假设不相容,记为H1 (alternative hypothesis)。 • 如:对总体随机变量X的均值µ 不小于一给定值µ 0的假 设的检验公式为: • H0:µ≥µ0, H1: µ <µ 0 注意:H0和H1相互联系,相互对立,缺一不可, H0与 H1的内容不能互换,结论根据H0和H1作出。
• 可能发生的两类错误
假设检验的结果 拒绝H0 不拒绝H0 I型错误() 推断正确(1) 推断正确(1) II型错误()
客观实际 H0成立 H0不成立即H1成立
第二类错误 =漏诊率 (假阴性率)
正常儿头围 H0 矿区儿头围 H1
第一类错误 =误诊率 (假阳性率)
4
5
6 6.1 7.0
8 8.4
9
10
百度文库11
肝大指数
正常儿头围与矿区儿头围均数 (所拟合的两个正态曲线各按100%面积绘制)
大,小;大,小。增加n可同时缩小,。
可取单尾亦可取双尾。
II型错误的概率大小用表示, 只取单尾,
值的大小一般未知,须在知道两总体差值 (如12等)、及n 时,才能算出。 1称检验效能(power of a test),过去称把 握度。为当两总体确有差异,按检验水准 所能发现该差异的能力。1只取单尾。 拒绝H0,只可能犯I型错误,不可能犯II型 错误;不拒绝H0,只可能犯II型错误,不 可能犯I型错误。
5.假设检验的基本思想
•反证法 根据研究目的建立假设H0,先假设H0是正确 的,再分析样本提供的信息是否支持H0,即在H0成立 的条件下计算检验统计量,查表获得相应P值。如果H1 成立,P值就小。当P小于或等于预先给定的概率0.05, 则为小概率事件。小概率事件在一次抽样中发生的可能 性很小,如果它发生了,则有理由怀疑原假设可能不成 立,认为它的对立面成立。所以,查表得到的P值小于 0.05,则H1成立。 •小概率事件原理 小概率事件(P≤0.05)在一次抽样中发 生的可能性很小,如果它发生了,则有理由怀疑H0的 正确性,认为H1成立。。
1
P
t / 2,
t
t / 2,
若P , 按所取检验水准 , 拒绝 H 0 , 接受 H1 ,下“有差别”的结论。其统计学依 据是,在 H 0 成立的条件下,得到现有检验结 果的概率小于 ,因为小概率事件不可能在 一次试验中发生,所以拒绝 H 0 。
7. I型错误和II型错误-补充
3、参考值范围
• 偏态分布法
• 样本量足够大,通常大于100 • 双侧,1-a参考值范围: P
即P2.5-P97.5之间的值
100 / 2
~P 100 100 / 2
P • 单侧,1-a参考值范围: P 100 或 100100
3、可信区间与参考值范围的区别
可信区间用于估计总体参数,总体参数只
为单样本t检验
t (33.89 34.50) /(1.99 / 55) 2.273
6.假设检验的基本步骤
6.5 计算与统计量对应的P值,做出推断
P值是决策的依据。 P值的定义:在零假设成立的条件下,出现统计量目前值及更不利 于零假设数值的概率。 根据计算得到的统计量,查临界值表即可得到相应的P概率值。 本例:V=54,查t临界值表,得到0.005<P<0.01,得到P<0.05, 根据获得的事后概率P,与事先规定的概率—检验水准进行比较, 看其是否为小概率事件而得出结论。
有一个 。 参考值范围用于估计个体值的分布范围, 个体值有很多 。
95%可信区间中的95%是可信度,即所求可
信区间包含总体参数的可信程度为95%。 95%参考值范围中的95%是一个比例,即 所求参考值范围包含了95%的正常值。
4.假设检验的基本概念
4.1假设检验(hypothesis testing) 又称显著性检验。通常先对总体的参数或分布 作出某种假设,然后用适当的方法根据样本对 总体提供的信息,推断此假设应当被拒绝或接 受。 经常被用来比较不同处理所产生的效应之间的 差别是否具有统计学意义。
•什么是置信度? •什么是显著性水平?
在实际工作中,只能根据一次试验结果计
算一个可信区间,就认为该区间包含了相应 总体参数,该结论犯错误的概率≤ 。
可信区间一旦形成,它要么包含总体参数,
要么不包含总体参数,二者必居其一,无概 率可言。可信度是事前概率。
评价可信区间估计的优劣:
正确性:可信度1,即区间包含总体参数
P≤,按检验水准,拒绝H0,接受H1;P>,按检验水准,不拒绝H0,无统计学意 义(统计结论),不拒绝H0不等于接受H0。
按所取检验水准 0.05, 则拒绝H0,接受H1,差异有统计学意义(统 计结论),可以认为矿区新生儿的头围均数与一般新生儿不同,矿 区新生儿的头围小于一般新生儿。
若P ,不拒绝H0,但不能下“无差别”或“相等”的 结论,只能下“根据目前试验结果,尚不能认为有差别” 的结论。
例:某地抽取正常成年人200名,测得其血清胆固 醇的均数为3.64mmol/L,标准差为1.20mmol/L, 估计该地正常成年人血清胆固醇均数的95%可信 区间。
N>60,可采用正态近似的方法计算
S S , x u / 2 x u / 2 n n 1.20 1.20 ,3.64 1.96 3.64 1.96 200 200 3.47,3.81
双侧-方差未知
a为风险系数
表示区间以95%(a=0.05)的可靠性包含总体,实际均值不在该区间的可能性为0.05
n n S S , x u / 2 x u / 2 n n
单侧-方差已知 单侧-方差未知
X u , X 或 X u , S X X u , X 或 X u , S X
的理论概率大小,愈接近1愈好。
精确性:区间的宽度,区间愈窄愈好。 当样本含量为定值时,上述两者互相矛盾。
若只顾提高可信度,则可信区间会变宽。
2、总体均数可信区间的计算
2.1单一总体均值的区间估计 (1)总体方差已知或方差未知,但n>60,按u分布
误差限
双侧-方差已知 , x u / 2 x u / 2
拒绝原假设。 • 常取 = 0.05或0.01。可根据不同研究目
的给予不同设置。
4.假设检验的基本概念
• 1.6单侧检验、双侧检验和临界值 单侧检验:检验统计量是一维的,拒绝域是小于(或大于)某 给定数的所有数值的集合。若从专业上看一种方法结果不可 能低于或高于另一种方法结果,此时应该用单侧检验。如静 电除尘效率高于布袋除尘效率。H1只含有大于号或小于号, 采用单侧检验。 双侧检验:检验统计量是一维的,拒绝域是小于第一个给定数 而大于第二个给定数的所有数值的集合。H1同时含有大于号 和小于号,采用双侧检验。如H1为μ1≠μ2,则H0为μ1>μ2或 μ1<μ2。双侧检验较保守和稳妥,一般采用。 临界值:作为上述拒绝域界限的给定数。
4.假设检验的基本概念
• 4.3参数检验和非参数检验
• 检验统计量的分布函数依赖于观测值的分布函数的类型, 称为参数检验。
• 反之称非参数检验。 • • • • 参数检验:正态分布和方差齐性。 非参数检验:不满足。 一元分析的参数法有:u检验,t检验,方差分析, 一元分析的非参数方法有:符号检验,符号秩检验, Wilcoxon秩和检验,Manny-Whitney检验,KruskalWallis检验,Friedman检验。
4.假设检验的基本概念
4.4拒绝域 所使用的统计量可能取值的集合的某个子集合。如果根 据观测值得出的统计量的数值属于这个集合,拒绝原假 设,否则接受原假设。
双尾检验时,拒绝域的两侧边界是检验统计量的临界值。
1
P
t /2,
t
t /2,
4.假设检验的基本概念
• 1.5检验水准 • 称显著性水准,是预先规定的概率值,它 确定了小概率事件的标准。 • 当原假设正确时,检验水平是检验统计量 落入拒绝域的概率,而被拒绝的概率的最 大值,记为。也就是一旦检验水平,就
自由度v=(n1-1)+(n2-1)=n1+n2-2
单侧 (1 2 ) ( X1 X 2 ) t , S X1 X 2
( 1 2 ) ( X1 X 2 ) t , S X 1 X 2
3.参考值范围
• 参考值范围指正常值范围。由于存在个体差异,环 境数据并非常在一定范围内波动,故采用环境参考 值范围作为判定正常与异常的参考标准。 • 通常采用双侧参考值范围制定下侧和上侧值。 • 通常使用的环境参考值范围有90%,95%和99%,常 用的是95%。
假设样本来自某一特定总体,无效假设和备择假设。据资料类型, 确定要使用的检验方法。H0:μ=34.50,H1:μ≠34.50
6.2单双侧检验的确定
根据专业知识和所要解决的问题。通常选择双侧检验。
6.3确立检验水准
根据需要,确定 =0.05或0.01。此处为0.05.
6.4计算检验统计量
根据变量和资料类型、设计方案、统计推断的目的、是否满足特定 条件等(如数据的分布类型)选择相应的检验统计量。计算样本与 总体的偏离程度. 所有检验统计量都是在H0成立条件下计算来的。 有的检验不需要计算统计量,而直接计算P值。
预先给定的概率(1)称为置信度,常取95%或99%。
置信区间通常由两个数值构成,称可信限(confidence limit, CL)
可信下限(L)
μ
可信上限(U)
(θ1,θ2)是参数θ的置信区间,是一个范围;α为显著性 水平,一般为5%;
•(1-α)表明判断总体参数落在置信区间的可信程度, 由全部样本指标所确定的所有置信区间中平均有95%的 估计区间包括了总体参数θ,另外有5%的区间没有包括 总体参数θ。
• 有两种求参考值的方法。
3、参考值范围
正态分布法
• 进行正态分布检验 • 样本量足够大,通常大于100 • 双侧,1-a参考值范围: X / 2 S • 单侧,1-a参考值范围: X S 或 X S • 通常选择为平均值加减2倍标准差范围为 参考值范围
摘自,孙振球,医学统计学
2、总体均数可信区间的计算
(2)总体方差未知且样本容量较小,按t分布
双侧 单侧
s s , x t / 2,v x t / 2,v n n
X t , SX X t , SX
对于非正态总体,只要样本足够大, 仍可按上式计算置信区间
2、总体均数可信区间的计算
例,通过以往大规模调查,已知某地一般新生儿的 头围均数为 34.50cm,标准差为 1.99cm。为研究某矿 区新生儿的发育状况,现从该地某矿区随机抽取新 生儿55人,测得其头围均数为 33.89cm,问该矿区新 生儿的头围总体均数与一般新生儿头围总体均数是 否不同?
6.假设检验的基本步骤
6.1建立检验假设,确立检验方法
均数估计与假设检验
姬亚芹
1、总体均数估计的含义
• 参数估计是指用样本指标值(统计量)推断总体指标 值(参数)。 • 点估计和区间估计。 • 点估计就是用相应样本统计量直接作为其总体参数的 估计值。如, x估计 • 区间估计就是按照预先给定的概率(1-α)所确定的 包含未知总体参数的一个范围。该范围称为参数的可 信区间或置信区间(confidence interval, CI) 。
2、总体均数可信区间的计算
2.2 两总体均数之差的1–α可信区间
从总体标准差相等,总体均数不等的两个正态总体进行随 机抽样,若两样本的样本含量、均数、标准差分别用
n1、 X1、S1和n2、 X2、S2 表示,则两总体均数之差的双侧1-α可信
区间为
双侧
( X1 X 2 ) t / 2 , S X 1 X 2
4.假设检验的基本概念
4.2无效假设和备择假设 (1)无效假设又称零假设,根据检验结果准备予以拒绝 或接受的假设,记为H0(null hypothesis); (2)备择假设又称对立假设,与原假设不相容,记为H1 (alternative hypothesis)。 • 如:对总体随机变量X的均值µ 不小于一给定值µ 0的假 设的检验公式为: • H0:µ≥µ0, H1: µ <µ 0 注意:H0和H1相互联系,相互对立,缺一不可, H0与 H1的内容不能互换,结论根据H0和H1作出。
• 可能发生的两类错误
假设检验的结果 拒绝H0 不拒绝H0 I型错误() 推断正确(1) 推断正确(1) II型错误()
客观实际 H0成立 H0不成立即H1成立
第二类错误 =漏诊率 (假阴性率)
正常儿头围 H0 矿区儿头围 H1
第一类错误 =误诊率 (假阳性率)
4
5
6 6.1 7.0
8 8.4
9
10
百度文库11
肝大指数
正常儿头围与矿区儿头围均数 (所拟合的两个正态曲线各按100%面积绘制)
大,小;大,小。增加n可同时缩小,。
可取单尾亦可取双尾。
II型错误的概率大小用表示, 只取单尾,
值的大小一般未知,须在知道两总体差值 (如12等)、及n 时,才能算出。 1称检验效能(power of a test),过去称把 握度。为当两总体确有差异,按检验水准 所能发现该差异的能力。1只取单尾。 拒绝H0,只可能犯I型错误,不可能犯II型 错误;不拒绝H0,只可能犯II型错误,不 可能犯I型错误。
5.假设检验的基本思想
•反证法 根据研究目的建立假设H0,先假设H0是正确 的,再分析样本提供的信息是否支持H0,即在H0成立 的条件下计算检验统计量,查表获得相应P值。如果H1 成立,P值就小。当P小于或等于预先给定的概率0.05, 则为小概率事件。小概率事件在一次抽样中发生的可能 性很小,如果它发生了,则有理由怀疑原假设可能不成 立,认为它的对立面成立。所以,查表得到的P值小于 0.05,则H1成立。 •小概率事件原理 小概率事件(P≤0.05)在一次抽样中发 生的可能性很小,如果它发生了,则有理由怀疑H0的 正确性,认为H1成立。。
1
P
t / 2,
t
t / 2,
若P , 按所取检验水准 , 拒绝 H 0 , 接受 H1 ,下“有差别”的结论。其统计学依 据是,在 H 0 成立的条件下,得到现有检验结 果的概率小于 ,因为小概率事件不可能在 一次试验中发生,所以拒绝 H 0 。
7. I型错误和II型错误-补充
3、参考值范围
• 偏态分布法
• 样本量足够大,通常大于100 • 双侧,1-a参考值范围: P
即P2.5-P97.5之间的值
100 / 2
~P 100 100 / 2
P • 单侧,1-a参考值范围: P 100 或 100100
3、可信区间与参考值范围的区别
可信区间用于估计总体参数,总体参数只
为单样本t检验
t (33.89 34.50) /(1.99 / 55) 2.273
6.假设检验的基本步骤
6.5 计算与统计量对应的P值,做出推断
P值是决策的依据。 P值的定义:在零假设成立的条件下,出现统计量目前值及更不利 于零假设数值的概率。 根据计算得到的统计量,查临界值表即可得到相应的P概率值。 本例:V=54,查t临界值表,得到0.005<P<0.01,得到P<0.05, 根据获得的事后概率P,与事先规定的概率—检验水准进行比较, 看其是否为小概率事件而得出结论。
有一个 。 参考值范围用于估计个体值的分布范围, 个体值有很多 。
95%可信区间中的95%是可信度,即所求可
信区间包含总体参数的可信程度为95%。 95%参考值范围中的95%是一个比例,即 所求参考值范围包含了95%的正常值。
4.假设检验的基本概念
4.1假设检验(hypothesis testing) 又称显著性检验。通常先对总体的参数或分布 作出某种假设,然后用适当的方法根据样本对 总体提供的信息,推断此假设应当被拒绝或接 受。 经常被用来比较不同处理所产生的效应之间的 差别是否具有统计学意义。
•什么是置信度? •什么是显著性水平?
在实际工作中,只能根据一次试验结果计
算一个可信区间,就认为该区间包含了相应 总体参数,该结论犯错误的概率≤ 。
可信区间一旦形成,它要么包含总体参数,
要么不包含总体参数,二者必居其一,无概 率可言。可信度是事前概率。
评价可信区间估计的优劣:
正确性:可信度1,即区间包含总体参数
P≤,按检验水准,拒绝H0,接受H1;P>,按检验水准,不拒绝H0,无统计学意 义(统计结论),不拒绝H0不等于接受H0。
按所取检验水准 0.05, 则拒绝H0,接受H1,差异有统计学意义(统 计结论),可以认为矿区新生儿的头围均数与一般新生儿不同,矿 区新生儿的头围小于一般新生儿。
若P ,不拒绝H0,但不能下“无差别”或“相等”的 结论,只能下“根据目前试验结果,尚不能认为有差别” 的结论。
例:某地抽取正常成年人200名,测得其血清胆固 醇的均数为3.64mmol/L,标准差为1.20mmol/L, 估计该地正常成年人血清胆固醇均数的95%可信 区间。
N>60,可采用正态近似的方法计算
S S , x u / 2 x u / 2 n n 1.20 1.20 ,3.64 1.96 3.64 1.96 200 200 3.47,3.81
双侧-方差未知
a为风险系数
表示区间以95%(a=0.05)的可靠性包含总体,实际均值不在该区间的可能性为0.05
n n S S , x u / 2 x u / 2 n n
单侧-方差已知 单侧-方差未知
X u , X 或 X u , S X X u , X 或 X u , S X
的理论概率大小,愈接近1愈好。
精确性:区间的宽度,区间愈窄愈好。 当样本含量为定值时,上述两者互相矛盾。
若只顾提高可信度,则可信区间会变宽。
2、总体均数可信区间的计算
2.1单一总体均值的区间估计 (1)总体方差已知或方差未知,但n>60,按u分布
误差限
双侧-方差已知 , x u / 2 x u / 2
拒绝原假设。 • 常取 = 0.05或0.01。可根据不同研究目
的给予不同设置。
4.假设检验的基本概念
• 1.6单侧检验、双侧检验和临界值 单侧检验:检验统计量是一维的,拒绝域是小于(或大于)某 给定数的所有数值的集合。若从专业上看一种方法结果不可 能低于或高于另一种方法结果,此时应该用单侧检验。如静 电除尘效率高于布袋除尘效率。H1只含有大于号或小于号, 采用单侧检验。 双侧检验:检验统计量是一维的,拒绝域是小于第一个给定数 而大于第二个给定数的所有数值的集合。H1同时含有大于号 和小于号,采用双侧检验。如H1为μ1≠μ2,则H0为μ1>μ2或 μ1<μ2。双侧检验较保守和稳妥,一般采用。 临界值:作为上述拒绝域界限的给定数。
4.假设检验的基本概念
• 4.3参数检验和非参数检验
• 检验统计量的分布函数依赖于观测值的分布函数的类型, 称为参数检验。
• 反之称非参数检验。 • • • • 参数检验:正态分布和方差齐性。 非参数检验:不满足。 一元分析的参数法有:u检验,t检验,方差分析, 一元分析的非参数方法有:符号检验,符号秩检验, Wilcoxon秩和检验,Manny-Whitney检验,KruskalWallis检验,Friedman检验。
4.假设检验的基本概念
4.4拒绝域 所使用的统计量可能取值的集合的某个子集合。如果根 据观测值得出的统计量的数值属于这个集合,拒绝原假 设,否则接受原假设。
双尾检验时,拒绝域的两侧边界是检验统计量的临界值。
1
P
t /2,
t
t /2,
4.假设检验的基本概念
• 1.5检验水准 • 称显著性水准,是预先规定的概率值,它 确定了小概率事件的标准。 • 当原假设正确时,检验水平是检验统计量 落入拒绝域的概率,而被拒绝的概率的最 大值,记为。也就是一旦检验水平,就