样本均数比较的假设检验

样本均数比较的假设检验
样本均数比较的假设检验

《实用卫生统计学》教案

任课教师:毛绍泽

教学目标:

了解:统计工作基本步骤,频率表的编制12频数分布特征,标准正态分布概念。

熟悉:

标准正态变换。

掌握:

各种平均数指标,离散指标使用条件及计算,标准正态曲线下面积分布规律和正态分布资料95%和99%的个体观察值所在范围。

教学重点、难点:

各种均数和标准差的计算

教学资源:

实用卫生统计学教材(北京大学医学出版社、康晓平主编)挂图、计算器等。

课后记:

重点辅导,举例计算、学员自学,使学员们掌握各种均数,标准差的计算方法。

一、统计工作的基本步骤

基本步骤 内 容

计划与设计 是开展医学研究的前提和依据。调查设计和实验设计均包括专业设计和统计学设计两个方面,主要内容有资料的收集、整理和分析

收集资料 概括为经常性资料和一时性资料两大类。收集的资料要求①完整、正确和及时;②要有足够的数量;③资料的代表性和可比性

整理资料

原始资料的检查与核对①数据的取值范围检错;②数据间的逻辑关系检错。以及资料的分组设计与归纳汇总①质量分组或数量分组;②编制频数分布表

分析资料

①统计描述:用一些统计指标,统计图表等方法对资料的数量特征和分布规律进行测定和描述,不涉及由样本推论总体问题。②统计推断:对样本统计指标作参数估计和假设检验,结合专业知识解释分析结果,目的是用样本信息推断总体特征。

第一节 计量资料的频数表

一、频数表编制的步骤

表2.1 频数表编制的步骤

二、频数分布的类型

1.对称分布:是指集中位置在正中,左右两侧频数分布大体对称的分布。 2.偏态分布:偏态分布是指集中位置偏向一侧,两侧频数分布不对称。

3.对数正态分布:有些偏态分布的资料,其原始数据经过对数转换后(如用原始数据的对数值lgX 代替X)服从正态分布,称为对数正态分布。

三、频数表的用途

1.便于观察资料的分布类型和分布特征。根据分布类型可以选择合适的统计指标进行计算和分析。

步骤 具体操作 注意事项

1 极差R 一最大值一最小值 根据观察单位的多少酌情增减组数

2

①组数:一般8~1 5组 ②组距t=极差/组数

③组段:指每组的下限~上限

组距一般取整数,可等组距,也可不等组距,一般多采用等组距。

一般只写下限,不用写上限。第一组段要包括最小观察值,最后一个组段包括最大观察值。 3

列表划记:采用划记法或计算机汇总将原始数据归人各组

2.常作为大样本资料的陈述形式。

3.当数据不是用计算机处理分析时,大样本资料常整理成频数表的形式,计算相应的描述指标,并进行统计分析等。

4.便于发现某些特大或特小的异常值,必要时经检查、核实后决定取舍。

第二节描述集中趋势的指标

表2.2常用描述集中趋势的指标

[附]百分位数

百分位数(percentik)是一个位置指标。将由小到大顺序排列的观察值分成100等份,对应于第x%位的观察值即为第x百分位数,用Px表示。百分位数常用于描述偏态分布资料在某百分位置上的水平及确定偏态分布资料医学参考值范围,其计算公式

(2.1)

公式中L、i、fx分别为Px所在组段的下限、组距和频数,∑f L为小于L的各组段的累计频数。

第三节描述离散趋势的指标

这种变换叫标准正态变换(或ц变换)。ц称为标准正态变量,它服从均数为O,标准差为1的标准正态分布,即ц~N(0,1)。通过标准正态变换,可将原来的正态分布变换为标准正态分布。为了应用的方便,可以通过查标准正态分布表(也称ц值表),得到标准正态曲线下,横轴上—∞到ц的面积。

二、正态曲线下面积的分布规律

正态曲线在横轴上方均数处最高,即以均数为中心,曲线下面积左右对称。正态曲线下的面积分布有一定的规律:①标准正态曲线下横轴上的总面积为100%;②横轴上从ц= 一1.64到ц= l-64的区间所对应的曲线下面积为90%;从ц= 一1.96到ц= 1.96的区间所对应的曲线下面积为95%;从u=-2.58到u=2.58的区间所对应的曲线下面积为99%,这三种情况在统计上用的最多。实际工作中,也常利用正态曲线下的面积分布规律来估计正态曲线下横轴上任一区间的面积占总面积的百分数,以估计该区间的观察例数占总例数的百分数。

三、正态分布的应用

1.估计个体观察值所在范围

医学领域或卫生事业管理中有许多数据服从正态分布或近似正态分布,因此可利用正态曲线下的面积分布规律来估计某个变量的测量值所在范围,即估计部分测量值占全部的百分数,如某变量服从正态分布,且已知其总体均数μ和总体标准差δ,可以用算是μ±1.96δ来估计95%的个体观察值所在范围,或用算式μ±2.58δ估计99%的个体观察值所在范围。在实际工作中,很多情况是

不知道总体均数μ和总体标准差δ的,我们只能得到样本均数x和样本差s,此时可用算式x±1.96s 来估计95%的个体观察值所在范围,或用算式x±2.58s估计99%的个体观察值所在范围。估计个体观察值范围的算式列于表2.4。

2.医学参考值的估计

参考值范围又称正常值范围。医学上常包括绝大多数人某项指标的数值范围称为该指标的参考值范围。医学参考值的估计方法实际上就是个体观察值所在范围的估计。根据资料的分布特点,选用正态分布和百分位数法,具体计算参阅表2.4。

3.质量控制

控制实验误差,常以x±2s作为上、下警戒值,以作为x±3s上、下控制值,这里的2s、3s分别是1.96s和2.58s的近似值。

实用卫生统计学教案(2)

任课教师:毛绍泽

课题:样本均数比较的假设检验教学时数:教学班级:

教学目标:

了解:两个独立样本的方差齐性检验,LSD法和SNK法。

熟悉:假设检验的基本原理、步骤、注意事项,单因方差分析计算。

掌握:方差分析的基本思想

教学重点、难点:

t检验和μ检验的计算

教学资源:

实用卫生统计学教材(北京大学医学出版社·康晓平主编)挂图、计算器等课后记:

重点辅导、举例计算、学员自学、使学员们掌握t检验μ检验的计算。

样本均数比较的假设检验

第一节假设检验的基本原理和基本步骤

一、假设检验的基本原理

以样本均数与已知总体均数?x比较的t检验为例(设样本所代表的未知总体均数为μ),假设检验的基本原理为:当所要检验的?x≠μ0时,考虑造成它们之间的差别有两种可能性:(1)这个样本所代表的未知总体均数与已知总体均数相等,即μ=μ0,则?x≠μ0仅仅由于抽样误差造成。

(2)这个样本所代表的未知总体均数与已知总体均数不相等,即μ=μ0,则?x≠μ0主要由于两个总体均数不相等造成。

假设检验的目的为:判断两个总体均数是否相等。

二、假设检验的基本步骤

(一)建立检验假设,确定检验水准

1.首先要明确指标的类别,是均数的比较还是率的比较。然后应该根据专业知识来确定选择单侧检验或双侧检验。①如果从专业知识的角度,判断一种方法的结果不可能低于或高于另一种方法的结果,则可以采用单侧检验。②在不能根据专业知识判断两种结果谁高谁低时,则用双侧检验。

2.建立检验假设。检验假设有两种:①无效假设,又称为零假设,用符号H0表示。②备择假设,用符号H1表示。

现在以样本均数(该样本所代表的未知总体均数为μ)与已知总体均数μ0的比较为例,用符号表示相应的检验假设,见表6.1。

表6.1样本均数与已知总体均数比较的检验假设

3.确定检验水准。检验水准,也称为显著性水准,符号位a。通常a取0.05。

(二)选定检验方法,计算检验统计量

要根据统计推断的目的、研究设计的类型和样本量的大小等适用条件,选用不同的检验方法和计算相应的统计量。例如:两个小样本均数比较的完全随机设计类型和配对设计类型应该使用不同的t检验方法,并计算相应的t统计量值;多个样本均数比较可以采用方差分析的F检验,并计算相应的F统计量值。

(三)确定P值,作出推断结论

P值的含义:是指从H0所规定的总体中作随机抽样,获得等于及大于(或等于及小于)现有样本的检验统计量值(如t值或μ值)的概率。

根据P值作出推断结论:当P≤a时,按所取检验水准a,拒绝H0,接受H1,可以认为差别有统计学意义,两总体均数不相等;当P>a时,按所取的检验水准a,不拒绝H0,差别无统计学意义,尚不能认为两总体均数不相等。

第二节t检验和μ检验

t检验的使用条件;当总体标准差δ未知,样本含量n较小时,理论上要求样本来自正态分布的总体。完全随机设计的两个小样本均数比较时还要求两总体方差相等。习惯规定样本含小于或等于50(n≤50)为小样本、

u检验的使用条件:当总体标准差δ未知,但样本含量n较大(一般μ<50)或总体标准差δ已知(该情况不常见)时,选用μ检验。常用的μ界值为,双侧u0.05/2=1.96,单侧u0.05=1.64。

一、t检验

(一)样本均数与已知总体均数比较的t检验

又称为单样式t检验。令已知总体均数为μ0,样本均数所代表的未知总体均数为μ,假设检验的目的:推断样本均数所代表的未知总体均数μ与已知总体均数μ0是否相等(双侧检验)。检验统计量t值的计算及结果判断见表6.2。

(二)完全随机设计的两样本t检验

又称为成组t检验或两个独立样本t检验。完全随机设计的两样本无数比较,目的是推断这两个独立样本所代表的未知总体均数μ1与μ2是否相等。

在对两样本方差作齐性检验,认为两总体方差相等之后,则可以进行完全随机设计样本均数比较的t检验。t检验的公式及结果判断见表6.2。

(三)配对t检验

配对t检验的目的是检验差值的总体均数μd是否为0。由于配对设计资料可以有效地控制个体差异对结果的影响,故检验效率比完全随机设计的资料要高。

配对t检验的检验统计量t值的计算及结果判断见表6.2。

二、μ检验

(一)样本均数与已知总体均数比较的u检验。

与单样本t检验的设计类型一样,不同的是样本含量较大。检验目的也是推断样本均数所代表的未知总体均数μ与已知总体均数μ0是否相等。检验统计量μ值的计算及结果判断见表6.2。

(二)完全随机设计的两样本μ检验

常用于总体标准差δ未知且两样本含量较大时的两样本均数比较,目的是推断两总体均数是否不同。检验统计量μ值的计算及结果判断见表6.2。

表6.2 t检验和u检验的使用条件、计算公式及结果判断

第三节I型错误和II型错误

了解I型错误和II型错误的目的是指假设检验的结论不能绝对化,无论拒绝H0或不拒绝H0,假设检验的结论都有犯错误的可能。这是因为假设检验是根据概率的大小作出结论。统计上常称I型错误为a错误,犯II型错误的概率是β。对两个样本均数作检验,当检验结果是P≤0.05,拒绝H0时,如果下结论太绝对,将有可能犯a错误,当检验结果是P>0.05,不拒绝H0时,如果下结论太绝对,就有可能犯β错误。

检验效能的含义:1-β称为检验效能,又称为把握度。是指当两总体确实有差别时,按规定的检验水准α,能够发现两总体间差别的能力。实际工作中,要保证比较高的检验效能,很重要的条件是具有足够的样本含量。

第四节假设检验的注意事项

一、假设检验的前提——可比性

组间比较时应具备可比性,即除了处理因素外,其他可能影响结果的非处理因素在各组间应该尽可能相同或相近,即“齐同”。

二、选用的假设检验方法应符合其应用条件

t检验和u检验都是用于比较两个平均数差别的假设检验方式。尽管同是两个计量资料的平均指标进行比较,而样本含量的大小不同,所用假设检验方式也就不同。当总体标准差未知时,t检验用于两个小样本均数的比较,也可用于两个大样本均数的比较;u检验只能用于两个大样本均数的比较,而不能用于两个小样本均数的比较。同是两个小样本均数的比较,配对资料和成组资料的设计类型不同,t检验的方法也不同。

三、正确理解假设检验过程中样本均数与总体均数间的关系

t检验和u检验是通过对两个样本均数的比较推断它们所代表的两个总体均数是否不同。也就是说我们看到的是两个有差别的样本均数,但目的并不是就样本论样本,而是想知道它们的总体情况是否不同。

四、正确理解“差别有统计学意义”的含义

假设检验结论中的“拒绝H0,接受H1”,称为差别有统计学意义,可以认为两个总体均数不同;当“不拒绝H0”时,称为差别无统计学意义,尚不能认为两个总体均数不同。注意假设检验的结论不能直接回答差异的大小,“差别有统计学意义”并不意味着两个总体均数相差很大。差别的大小及差别有无实际意义只能进一步根据专业知识来确定。

第五节方差分析

一、方差分析

方差分析简称为ANOVA的目的:检验多个总体均数是否相等。

完全随机设计的单因素方差分析的基本思想:就是根据资料设计的类型及研究目的,将总变异SS总分解为组间变异SS组内。三种变异的关系为SS总=SS组间+SS组内,且υ总=υ组间+υ组内。通过比较可能由某因素所致的变异与组内变异的均方,由F检验作出统计推断,从而了解该因素有无作用。

方差分析的适用条件:①各处理组样本来自正态总体②各样本是相互独立的随机样本③各处理组的总体方差相等,即方差齐性。

随机设计的两个样本均数比较的t检验,可以用完全随机设计的方差分析代替,反之,则不成

立,即多个样本均数比较的方法,应该用方差分析,而不能用两个样本均数比较的t检验代替,否则会增大犯I型错误的概率。

二、完全随机设计的单因素方差分析

完全随机设计的单因素方差分析,也称为组设计的单因素方差分析,只有一个研究因素,此因素有k个水平(k≥2),其研究目的是比较k个处理组总体均数是否相等。其总变异可以分解为组间变异和组内变异两个部分,总自由度也分解为组间自由度和组内自由度。当P≤0.05,按α=0.05水准拒绝H。接受H1,故可以认为各组总体均数不等或不全相等。但并不意味着任何两组总体均数都有差别,要想确定哪些组间有差别,哪些组间无差别,应该进一步作两两比较。现将完全随机设计方差分析的计算列于表6.3。

表6.3完全随机方差分析的计算公式

*三、多个样本均数间的两两比较

多个样本均数间的两两比较,在处理组数大于2时,若仍用t检验对任意两两均数之间进行假设检验,则会增大犯I型错误的概率,有可能将本来无统计学意义的差异误判为有统计学意义。因此,多个样本均数间的两两比较时不宜再用前述t检验方法分别作两两比较。

(一)SNK法:又称为q检验。一般在方差分析结果P≤0.05,即拒绝H0时,再用SNK检验进行多重比较,它常用于探索性研究中多个样本均数间每两个均数的比较。计算见《实用卫生统计学》公式6.9。

(二)LSD法:称为最小显著差法t检验。常用于检验某几个特定的总体均数是否相等,例如过个处理组分别与某一个特定组的总体均数是否相等。

实用卫生统计学教案(3)

任课教师:毛绍泽

课题:疾病统计数学时数:教学班级:

数学目标:

了解:疾病统计资料来源,疾病命名和分类概念以及残疾统计

熟悉:疾病的询问调查,国际疾病的分类。

掌握:疾病统计指标的意义。

数学重点、难点:

反映疾病发生效率的指标和对生命威胁程度指标的计算。

数学资源:

实用卫生统计学教材(北京大学医学出版社,康晓平主编),挂图,计算器等。

课后记:

重点辅导,举例说明和计算,学员自学,使学员们掌握反映疾病各种指标的计算方法。

疾病统计

第一节有关疾病统计的概念

一、疾病的诊断标准

1、要有科学而切实可行的疾病诊断方法和诊断标准。

2、统计分析,应在统一的标准下进行。

二、疾病的统计对象

1、门诊疾病的统计对象;指患者去医疗机构就诊,并经医师诊断为患病者。

2、住院疾病的统计对象;诊断为有病的住院病人。

3、疾病调查的研究对象:与门诊和住院疾病的统计对象不同,疾病调查常以特定人群(包括健康人和病人)作为研究对象,探讨疾病在人群中的分布。应根据调查目的确定观察对象,并根据研究目的确定研究的疾病及诊断方法和诊断标准。

三、疾病的统计单位

1、统计单位:可以“病人”和“病例”为统计单位。

2、以“病例”为统计单位时,可按新发(生)病例或现患病例进行统计。

(1)新发(生)病例:指在观察期间(通常为一年内)新发生的病例,以第一次诊断为准。某些急性病,在观察期间内治愈,愈后再发生同一种病,则算作2个新病例。

(2)现患病例:是指在调查时点或调查期间(一般很短时间)内的检查出的疾病,包括在此之前发生而未愈的病例及本次调查新发现的病例。

第二节疾病统计的资料来源

主要有以下几种途径:

一、疾病报告

二、疾病登记

三、疾病防治统计报表

四、医疗机构诊治疾病登记

五、病伤缺勤登记

六、疾病专题调查

第三节疾病统计的指标

表11.1 常用的疾病统计指标

分类指标的计算及意义适用条件或特点

反映疾病发生频率的指标发病率=

人口数

内可能发生某病的平均

时期

同年

新发生的某病的病例数

时期

该年

)

(

(×K 适用于急性病和慢性病

某病(时点)患病率=

检查时接受检查的人口

患病例数

检查时该人群中某病现×100% 适用于慢性病,它受发病率及病程影

响,通过现况调查得到

某病感染率=

受检人口数

感染某病病原体的人数×100% 常用于隐性感染较多的疾病。通过现况

调查得到

反映疾病严重某病病死率=

同期某病病人总数

人数

观察期间因某病而死亡×100% 反映某疾病对病人生命的威胁程度,它

受疾病严重程度及医疗水平的影响

程度的指标某病病死率=

某年平均人口数

同年内因某病而死亡人×100% 反映疾病对居民生命的危害程度。适用

于病死率高且病程短的疾病

反映疾病疗效的指标治愈率=

受治的病人数

治愈的病人数×100% 受治疗水平和病情严重程度等影响

有效率=

受治疗病人数

治疗有效人数×100% 受治疗水平和病情严重程度等影响

病死率(见某病病死率)

生存率指病人从病程的某个时点起,能活到某个时

间的生存概率。

为疾病远期疗效的指标,常用于慢性病

第四节疾病分类

一、疾病命名和疾病分类的概念

疾病命名是按一定体系(多按解剖系统)对每一种法定疾病情况给予确切的名称,一个标准化的术语,并使其对另外的疾病不可混淆,以避免同一名称表示多种疾病。

疾病分类是把数千种病伤按一定标准分成若干大类(母类),大类下面再分成若干小类(子类),所有病伤都各自分在一个类中,不应有无类可归或可归数类者。

疾病命名是以准确反映个别病伤事例为目的,为临床疾病名称的标准化服务;疾病分类是在疾病命名法的基础上建立起来的,以描述和分析疾病在人群中的分布规律为目的,为疾病的预防服务。两者既有区别又有密切联系。

二、疾病分类的历史

国际疾病及死因分类有近百年的历史,是部分国家参加的全球性统计机构共同研究制定的。各国都应参照使用,以利交流。目前,已出版了IDC-10的中文版本。

三、IDC-10简介

国际疾病分类(ICD)是将有关疾病与其他健康问题的医学描述与诊断,转化为由字母数字所组成的编码,该编码已成为国际公认的疾病统计标准分类。使用国际疾病分类的优点:(1)便于信息贮存、统计分析。(2)不同国家、不同地区或相同国家、地区的不同医院之间按照这一国际标准,获得的疾病与死因统计资料可以相互比较。

四、有关死因分类的一些问题

进行死亡统计时,按照国际疾病分类的原则确定根本死亡原因,并按确定的根本死因进行归类。

WHO规定,根据死因是指:“(a)引起直接导致死亡的一系列病态事件的那些疾病或损伤,或者(b)造成致命损伤的事故或暴力的情况。”

制定根本死因的想法是从预防死亡的角度出发,去寻找带有根本性的、引起一系列疾病并最终导致死亡的那个原因,不管它发生在死前多长时间都应给予记录。根本死因可以是一个明确的疾病诊断,可以是一个无明确诊断的医学情况(如:症状、体征、临床表现),也可以是一个意外的损伤和中毒。

第五节疾病询问调查

通过询问取得居民在调查期间内的患病资料,经统计分析用来描述一个国家或一特定地区的居民患病和医疗状况。

实施调查时,首先按户登记户中每一成员一般情况,既往健康状况和自我保健方法等有关基本健康项目。然后询问户中每个成员于调查日的患病情况,患有按规定的疾病者则填写患病调查表。一般只调查当日的患病情况,也可扩展为调查既往一周或一个月内的患病情况。

根据调查资料,可计算时点患病率或期间患病率及期间发病率等指标。

统计学习题 第十章 双样本假设检验及区间估计

第十章 双样本假设检验及区间估计 第一节 两总体大样本假设检验 两总体大样本均值差的检验·两总体大样本成数差的检验 第二节 两总体小样本假设检验 两总体小样本均值差的检验·两总体小样本方差比的检验 第三节 配对样本的假设检验 单一试验组的假设检验·一试验组与一控制组的假设检验·对实验设计与相关检验的评论 第四节 双样本区间估计 σ12和σ22已知,对双样本均数差的区间估计·σ12和σ22未知,对对双样本均值差的区间估计·大样本成数差的区间估计·配对样本均值差的区间信计 一、填空 1.所谓独立样本,是指双样本是在两个总体中相互( )地抽取的。 2.如果从N (μ1,σ12)和N (μ2,σ22 )两个总体中分别抽取容量为n 1和n 2的独立随机样本,那么两个样本的均值差(1X ―2X )的抽样分布就是N ( )。 3.两个成数的差可以被看作两个( )差的特例来处理。 4.配对样本,是两个样本的单位两两匹配成对,它实际上只能算作( )样本,也称关联样本。 5.配对样本均值差的区间估计实质上是( )的单样本区间估计 6.当n 1和n 2逐渐变大时,(1X ―2X )的抽样分布将接近( )分布。 7.使用配对样本相当于减小了( )的样本容量。 8. 在配对过程中,最好用( )的方式决定“对”中的哪一个归入实验组,哪一个归入控制组。 9. 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于( )。 10. 方差比检验,无论是单侧检验还是双侧检验,F 的临界值都只在( )侧。 二、单项选择

1.抽自两个独立正态总体样本均值差(1X ―2X )的抽样分布是( )。 A N (μ1―μ2,121n σ―2 22n σ) B N (μ1―μ2,121n σ+22 2n σ) C N (μ1+μ2,121n σ―2 22n σ) D N (μ1+μ2,121n σ+22 2n σ) 2.两个大样本成数之差的分布是( )。 A N (∧ 1p -∧ 2p ,111n q p ―222n q p ) B N (∧1p -∧2p ,111n q p +2 22n q p ) C N (∧ 1p +∧ 2p ,111n q p ―222n q p ) D N (∧1p +∧2p ,111n q p +2 22n q p ) 3.为了检验两个总体的方差是否相等,所使用的变量抽样分布是( )。 A F 分布 B Z 分布 C t 分布 D 2 χ分布 4.配对小样本的均值d 的抽样分布是( ) A Z 分布 B 自由度为n 的t 分布 C 自由度为(n —1)的t 分布 D 自由度为(n —1)的2 χ分布 5.若零假设中两总体成数的关系为p 1=p 2,这时两总体可看作成数p 相同的总体,它 们的点估计值是( ) A p 1 + p 2 B p 1p 2 C p 1 -p 2 D 2 12 211n n p n p n ++∧ ∧ 6.在σ 1 2和σ 2 2未知,但可假定它们相等的情况下,σ的无偏估计量∧ S 是( ) A 2 212 2 211-++n n nS S n B 2212 2211-++n n nS S n ?2 12 1n n n n + C 2 12 1n n n n +σ D 2 22 1 2 1n n σσ+ 三、多项选择 1.两个成数之差的假设检验所使用的测量尺度包括( )。 A 定类尺度 B 定序尺度 C 定距尺度 D 定比尺度 2.在单一实验组与一控制组的实验设计之中,对前测后测之间的变化,消除额外变量影响的基本做法包括( )。

一般总体均值的假设检验.

§7.4 一般总体均值的假设检验 一、一般总体均值的大样本假设检验 1. 一个总体均值的大样本假设检验 设样本12(,,,)n X X X 取自非正态总体X ,记总体均值μ=)(X E 。样本均值及样本方差分别为11n i i X X n ==∑,2211()1n i i S X X n ==--∑。 如果我们要做双侧检验:0100::μμμμ≠?=H H ,在大样本情况(样本容量30≥n )下可选 n S X Z /0 μ-=为检验统计量,由中心极限定理知,它在0H 成立时近 似服从)1,0(N 。检验的P 值近似为|))(|1(2)| |(20O O z z Z P Φ-==≥μμ,其中检验统计量Z 的观测值为 n s x z O /0 μ-=。 例7.4.1 一种机床加工的零件尺寸绝对平均误差为1.35mm 。生产厂家现采用一种新的 机床进行加工以期降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。50个零件尺寸的绝对误差数据(mm )如下所示: 1.26 1.19 1.31 0.97 1.81 1.13 0.96 1.06 1.00 0.94 0.98 1.10 1.12 1.03 1.16 1.12 1.12 0.95 1.02 1.13 1.23 0.74 1.50 0.50 0.59 0.99 1.45 1.24 1.01 2.03 1.98 1.97 0.91 1.22 1.06 1.11 1.54 1.08 1.10 1.64 1.70 2.37 1.38 1.60 1.26 1.17 1.12 1.23 0.82 0.86 利用这些数据,检验新机床加工的零件尺寸的平均误差是否显著降低?(0.01α=) 解:这里研究者所关心的是新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低,也就是新机床加工的零件尺寸的误差的数学期望μ=)(X E 是否小于1.35,因此属于单左侧检验。提出的假设如下: 0: 1.35H μ≥?1: 1.35H μ< 现在50=n ,检验统计量可选为 )1,0(~/35.135.1N n S X Z =-=μ; 由数据得:215.1=x ,366.0=s ,故检验统计量Z 的观测值为608.250 /366.035 .1215.1-≈-≈O z ,所以检验的P 值近似为 0046.0)608.2()35.1608.2(=-Φ≈=-≤μZ P 。 因为01.0

总体均值的假设检验

总体均值的假设检验 一、正态总体均值的检验 设n X X X ,, , 21为总体),(2 N 的一个容量为n 的样本. 1.方差2 已知, 的检验——u 检验法. 当2 02 已知时, 假设检验问题:0100 :;:H H . 选择检验统计量n X U /00 ,当0H 成立时,)1,0(~N U . 给定显著性水平 ,由标准正态分布分位点的定义, 有 }|{|2/u U P , 故拒绝域}{}{}|{|2/2/2/ u U u U u U W , 这种利用服从正态分布的检验统计量的检验方法称为u 检验法. 有时我们只关心总体的均值是否增大(或减小).比如,经过工艺改革后,产品的质量(如材料的强度)比以前是否提高,此时我们要研究的是新工艺下总体的均值 是小于等于原来的均值0 ,还是大于0 , 即检验假设 0100 :;:H H . 可以证明,在显著性水平 下,上述假设检验问题和 检验假设0100 :;:H H 有相同的拒绝域, 因此,遇到形如00 :H 的检验问题,可归结为后一个假设检验问题讨论. 类似地,形如0100 :;:H H 的检验问题, 可归结为检验假设 0100 :;:H H . 这都是单边检验问题.给定显著性水平 ,求得的临界值点是上 分位点或上 1分位点.

例1 某厂生产的某种钢索的断裂强度X 服从),(2 N ,其中 40 (kg/cm 2),现从这批钢索中抽取容量为9的样本,测得断裂强度的平均值 x 较以往正常生产的 大20(kg/cm 2 ),设总体方差不变,问在1.00 下,能否 认为这批钢索质量有显著提高? 解 依题意,检验假设0100 :;:H H , 由于40 已知,选择检验统计量n X U /0 因为0H 中的 全部都比1H 中的 要小,从直观上看,当0H 成立时,X 的取值 x 不应比 大很多,若偏差0 x 过大,则拒绝0H 而接受1H . 因为 0100 :;:H H 的拒绝域为}{ u U W , 故在显著性水平1.00 下原假设的拒绝域为 }{}{0n u X u U W . 本题中,9 n ,40 ,200 x ,33.201.0 u , 计算U 的值33.25.1/0 n x u 因此在显著性水平1.00 下不能拒绝0H ,即认为这批钢索质量没有显著提高. 2.方差2 未知, 的检验——t 检验法. 检验假设0100 :;:H H . 因为2 未知,而样本方差2S 是总体方差2 的无偏估计量,用S 代替 . 选择检验统计量 n S X T /0 , 当0H 成立时,)1(~ n t T .给定显著性水平 ,由t 分布分位点的定义, 有 )}1(|{|2/n t T P ,

§8.2总体均值的假设检验

§8.2总体均值的假设检验 一、正态总体均值的检验 设n X X X ,,, 21为总体),(2σμN 的一个容量为n 的样本. 1.方差2σ已知,μ的检验——u 检验法. 当2 02σσ=已知时, 假设检验问题:0100μμμμ≠=:;:H H . 选择检验统计量n X U /00 σμ-= ,当0H 成立时,)1,0(~N U . 给定显著性水平α,由标准正态分布分位点的定义, 有αα=>}|{|2/u U P , 故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= , 这种利用服从正态分布的检验统计量的检验方法称为u 检验法. 有时我们只关心总体的均值是否增大(或减小).比如,经过工艺改革后,产品的质量(如材料的强度)比以前是否提高,此时我们要研究的是新工艺下总体的均值μ是小于等于原来的均值0μ,还是大于0μ, 即检验假设 0100μμμμ>≤:;:H H . 可以证明,在显著性水平α下,上述假设检验问题和 检验假设0100μμμμ>=:;:H H 有相同的拒绝域, 因此,遇到形如00μμ≤:H 的检验问题,可归结为后一个假设检验问题讨论. 类似地,形如0100μμμμ<≥:;:H H 的检验问题, 可归结为检验假设 0100μμμμ<=:;:H H . 这都是单边检验问题.给定显著性水平α,求得的临界值点是上α分位点或上α-1分位点. 例1 某厂生产的某种钢索的断裂强度X 服从),(2σμN ,其中40=σ(kg/cm 2),现从这批钢索中抽取容量为9的样本,测得断裂强度的平均值x 较以往正常生产的μ大20(kg/cm 2),设总体方差不变,问在1.00=α下,能否认为这批钢索质量有显著提高?

Excel中双样本t检验之等方差异方差假设

Excel 中双样本t 检验之等方差异方差假设 成组资料(非配对资料)的t 检验,是生物统计中必须掌握的基本技能贮备之一。在Excel 完全安装情况下,加载“分析工具库”,之后会在菜单上出现“数据分析”选项,我们会发现“分析工具”中有两个选项,分别是:“t 检验:双样本等方差假设”、“t 检验:双样本异方差假设”。 那么,对于成组资料t 检验,什么时候用等方差,什么时候用异方差呢?最好的办法就是进行“F 检验 双样本方差”齐性检验。如果通过检验,两个样本方差差异不显著,则选用“t 检验:双样本等方差假设”,如果两样本方差差异显著,则选用“t 检验:双样本异方差假设”。 例:有人曾对公雏鸡作了性激素效应试验。将22只公雏鸡完全随机地分为两组,每组11只。一组接受性激素A (睾丸激素)处理;另一组接受激素C (雄甾烯醇酮)处理。在第15天取它们的鸡冠个别称重,所得数据如下表。 题解:在excel 中录入数据,在菜单“数据分析”中,选择“F 检验 双样本方差”,选择A1:A12”所在区域为“变量1的区域”,选择“B1:B12”区域为“变量2 的区域”。勾选标志“a (A )”,默认为0.05,在输出区域中随便找一个单元格(如单元格D1), “确定”(见图1)。 图1 双样本方差的F-检验

图2 t-检验:双样本等方差假设检验 从上图可以看出,p=0.4452221﹥0.05,表示激素A 与激素C 的对应的鸡冠,方差差异不显著。换言之,就是样 本A 与样本B 为等方差,在t 检验 时,就选择“t 检验:双样本等方 差假设”,得到图2结果。 从图2输出结果可以看出,t 检验的结果是p=0.003000143﹤ 0.01,表明差异极显著。也就是说, 激素A 处理的鸡冠重(97mg )极显 著地高于激素C 处理的鸡冠重 (56mg )。 目前不管是本科教材,还是高 职高专教材,生物统计仍是以公式手动计算为主,所采用的基本都是按照“t 检验:双样本等方差假设”,而且很多资料也表示,如果双样本都来源于同一总体,可以采用“t 检验:双样本等方差假设”。但,严格意义而言,应该进行“F 检验 双样本方差”之后,再判断t 检验时,到底是用等方差还是异方差。 例:用甲型流感病毒活疫苗进行预防,一组用气雾法,另一组用鼻腔喷雾法,免疫后采血,分别测定血凝抑制抗体滴度,结果如下,问两法免疫的效果有无差别? 气雾组 40 20 30 25 10 15 25 30 40 10 15 30 鼻腔喷雾法 50 40 30 35 60 70 30 20 25 70 35 25 录入数据,通过“F 检验 双样本方差”,可以看出p=0.04845332﹤0.05,所以t 检验时,应该用双样本异方差假设(见图3)。 通过“t 检验:双样本异方差假设”(见图4),得到p=0.01113641﹤0.05,所以说两种免疫的效果有显著差异。 值得说明的是:本科教材与高职教材,在利用公式手动计算时,不存在双样本方差是相等还是不相等,都采用“等方差”。所以,原教材中用传统的公

样本均数比较的假设检验

《实用卫生统计学》教案 任课教师:毛绍泽 教学目标: 了解:统计工作基本步骤,频率表的编制12频数分布特征,标准正态分布概念。 熟悉: 标准正态变换。 掌握: 各种平均数指标,离散指标使用条件及计算,标准正态曲线下面积分布规律和正态分布资料95%和99%的个体观察值所在范围。 教学重点、难点: 各种均数和标准差的计算 教学资源: 实用卫生统计学教材(北京大学医学出版社、康晓平主编)挂图、计算器等。 课后记: 重点辅导,举例计算、学员自学,使学员们掌握各种均数,标准差的计算方法。

一、统计工作的基本步骤 基本步骤 内 容 计划与设计 是开展医学研究的前提和依据。调查设计和实验设计均包括专业设计和统计学设计两个方面,主要内容有资料的收集、整理和分析 收集资料 概括为经常性资料和一时性资料两大类。收集的资料要求①完整、正确和及时;②要有足够的数量;③资料的代表性和可比性 整理资料 原始资料的检查与核对①数据的取值范围检错;②数据间的逻辑关系检错。以及资料的分组设计与归纳汇总①质量分组或数量分组;②编制频数分布表 分析资料 ①统计描述:用一些统计指标,统计图表等方法对资料的数量特征和分布规律进行测定和描述,不涉及由样本推论总体问题。②统计推断:对样本统计指标作参数估计和假设检验,结合专业知识解释分析结果,目的是用样本信息推断总体特征。 第一节 计量资料的频数表 一、频数表编制的步骤 表2.1 频数表编制的步骤 二、频数分布的类型 1.对称分布:是指集中位置在正中,左右两侧频数分布大体对称的分布。 2.偏态分布:偏态分布是指集中位置偏向一侧,两侧频数分布不对称。 3.对数正态分布:有些偏态分布的资料,其原始数据经过对数转换后(如用原始数据的对数值lgX 代替X)服从正态分布,称为对数正态分布。 三、频数表的用途 1.便于观察资料的分布类型和分布特征。根据分布类型可以选择合适的统计指标进行计算和分析。 步骤 具体操作 注意事项 1 极差R 一最大值一最小值 根据观察单位的多少酌情增减组数 2 ①组数:一般8~1 5组 ②组距t=极差/组数 ③组段:指每组的下限~上限 组距一般取整数,可等组距,也可不等组距,一般多采用等组距。 一般只写下限,不用写上限。第一组段要包括最小观察值,最后一个组段包括最大观察值。 3 列表划记:采用划记法或计算机汇总将原始数据归人各组

总体均数的估计与假设检验(练习题)

练 习 题 一、最佳选择题 1.( C )小,表示用该样本均数估计总体均数的可靠性大。 A. CV B. S C. σ X D. R E.四分位数间距 2.两样本均数比较的t 检验,差别有统计意义时,P 越小,说明( C )。 A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E.越有理由认为两总体均数相同 3.甲乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1X 和21S ;2X 和22S ,则理论上( E )。 A.12X X = B.2212S S = C.作两样本均数的t 检验,必然得出无差别的结论 D.作两方差齐性的F 检验,必然方差齐 E.由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0 4.在参数未知的正态总体中随机抽样,X μ-≥( A )的概率为5%。 A. 1.96σ B. 1.96 C. 2.58 D.0.05, t S ν E.0.05, X t S ν 5.某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的平均数为74g/L ,标准差为4g/L ,则其95%的参考值范围(B )。 A.74±4?4 B.74±1.96×4 C.74±2.58?4 D.74±2.58?4÷10 E. 74±1.96?4÷10 6.关于以0为中心的t 分布,错误的是( E )。 A. t 分布是一簇曲线 B. t 分布是单峰分布 C.当ν→∝时,t →u D. t 分布以0为中心,左右对称 E.相同ν时,|t|越大,P 越大 7.在两样本均数比较的t 检验中,无效假设是( D )。 A.两样本均数不等 B.两样本均数相等 C.两总体均数不等 D.两总体均数相等 E.样本均数等于总体均数

双样本假设检验及区间估计练习题(1)

第十章 双样本假设检验及区间估计 第一节 两总体大样本假设检验 两总体大样本均值差的检验·两总体大样本成数差的检验 第二节 两总体小样本假设检验 两总体小样本均值差的检验·两总体小样本方差比的检验 第三节 配对样本的假设检验 单一试验组的假设检验·一试验组与一控制组的假设检验·对实验设计与相关检验的评论 第四节 双样本区间估计 σ12和σ22已知,对双样本均数差的区间估计·σ12和σ22未知,对对双样本均值差的区间估计·大样本成数差的区间估计·配对样本均值差的区间信计 一、填空 1.所谓独立样本,是指双样本是在两个总体中相互( )地抽取的。 2.如果从N (μ1,σ12 )和N (μ2,σ22 )两个总体中分别抽取容量为n 1和n 2的独立随机样本,那么两个样本的均值差(1X ―2X )的抽样分布就是N ( )。 3.两个成数的差可以被看作两个( )差的特例来处理。 4.配对样本,是两个样本的单位两两匹配成对,它实际上只能算作( )样本,也称关联样本。 5.配对样本均值差的区间估计实质上是( )的单样本区间估计 6.当n 1和n 2逐渐变大时,(1X ―2X )的抽样分布将接近( )分布。 7.使用配对样本相当于减小了( )的样本容量。 8. 在配对过程中,最好用( )的方式决定“对”中的哪一个归入实验组,哪一个归入控制组。 9. 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于( )。

10. 方差比检验,无论是单侧检验还是双侧检验,F 的临界值都只在( )侧。 二、单项选择 1.抽自两个独立正态总体样本均值差(1X ―2X )的抽样分布是( )。 A N (μ1―μ2, 12 1n σ―2 22n σ) B N (μ1 ―μ2 ,121n σ+ 2 2 2 n σ) C N (μ1 +μ2 , 1 2 1n σ― 2 2 2 n σ) D N (μ1+μ2, 1 21n σ+ 2 2 2n σ) 2.两个大样本成数之差的分布是( )。 A N (∧ 1p -∧ 2p ,111n q p ―222n q p ) B N (∧1p -∧2p ,111n q p +2 2 2n q p ) C N (∧ 1p +∧ 2p ,111n q p ―222n q p ) D N (∧1p +∧2p ,111n q p +2 2 2n q p ) 3.为了检验两个总体的方差是否相等,所使用的变量抽样分布是( )。 A F 分布 B Z 分布 C t 分布 D 2χ分布 4.配对小样本的均值d 的抽样分布是( )。 A Z 分布 B 自由度为n 的t 分布 C 自由度为(n —1)的t 分布 D 自由度为(n —1)的2 χ分布 5.若零假设中两总体成数的关系为p 1=p 2,这时两总体可看作成数p 相同的总体,它们的点估计值是( )。 A p 1 + p 2 B p 1p 2 C p 1 -p 2 D 2 12 211n n p n p n ++∧ ∧ 6.在σ12 和σ22 未知,但可假定它们相等的情况下,σ的无偏估计量∧ S 是( )。 A 2212 2 211-++n n nS S n B 2212 2211-++n n nS S n ?2 12 1n n n n + C 2 12 1n n n n +σ D 2 22 1 2 1n n σσ+ 三、多项选择

小概率事件及假设检验好资料

第五章假设检验 第一节标准误 【教学目的】理解标准误的概念,掌握标准误的计算方法. 【教学重点】标准误的概念 【教学难点】标准误与标准差的区别 【导言】 在随机抽样中,抽样误差是不可避免的。抽样误差的大小是用统计量标准误来描述的,标准误愈大,抽样误差也愈大,反之愈小。【教学内容】 一、均数的标准误( S) x 1、定义:由于随机抽样而造成的样本统计量x之间或样本统计量x与 总体均数参数 之间的误差为均数的标准误。(样本均数的离 散程度的标准差) 2、 S与S的区别 x 【相同点】都表示变量的离散程度 【不同点】 (1) 描述的对象不同:S描述个体的离散程度 S描述样本均数的离散程度 x (2) 代表的意义不同:S大,说明个体间的离散程度大 S大,表示用样本均数推断总体均数的可靠小 x (3) 用途不同:S用来计算 S x S用于两均数的差异性检验 x

3、计算 n S S x = (n 愈大,个体间差异愈小,样本的代表性就愈高) 【举例】某地150名14岁女孩的肺活量的 x = 2406m l , S =404ml , 求 标准误。 解:99.32150 404≈== n S S x 二、率的标准误( S P ) 1、率:某现象在其可能发生的范围内实际发生的次数。 率= 100?可能发生的次数 实际发生的次数 % (样本含量要大) 2、率的标准误:由随机抽样而造成的样本率P 之间或样本率P 与总 体率π之间的误差. 3、计算 n p p S p ) 1(-= 【举例】在某中学随机抽取200人进行国家体育锻炼标准达标测验,其中达标者150人,求标准误? 解:75.0200 150=== n m p 031.0200 ) 75.01(75.0) 1(=-=-= n p p S p 【作业】标准误与标准差有什么区别与联系?

第五章 假设检验的功效与样本量

第五章 假设检验的功效与样本量 ? 当假设检验不拒绝H 0时,推断正确的概率称为检验功效。 ? 临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。 5.1 两类错误与功效 1. 两类错误的概率 H 0: μ=μ0, H 1: μ>μ0 (5.1) (略) Z =n X σμ0- (5.2) (略) ? 任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α (5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β (5.4a) 也可以理解为 第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β (5.4b) ? 如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病 第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病) (α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病) (β) ? 两类错误的背景: 拒绝H 0时可能犯第Ⅰ类错误 不拒绝H 0时可能犯第Ⅱ类错误 ? 两类错误的后果: 第Ⅰ类错误可能将“真实无效误作有效”∕误诊 第Ⅱ类错误可能将“真实有效误作无效”∕漏诊 ? 一般α, β的数值要在科研设计时事先确定 2. 功效 (power) ? 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β (5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β (5.5) ? 功效就是真实有效的药物被发现的概率∕疾病被诊断出 来的概率 5.2 影响功效的四要素 ? 假设检验的功效至少受四个要素的影响,参看(5.2)式 n X σμ0- ≥Z α (5.6) ? 功效的影响因素为:δ=0μ-x ,σ,n ,α X ≥μ0+Z αn σ (5.7) (略) ? 现用X 分布图形来定性地讨论四要素对功效的影响 1. 客观差异越大,功效越大

第十章 双样本假设检验及区间估计练习题

第十章 双样本假设检验及区间估计 一、填空 1.所谓独立样本,是指双样本是在两个总体中相互(独立 )地抽取的。 2.如果从N (μ1,σ12 )和N (μ2,σ22 )两个总体中分别抽取容量为n 1和n 2的独立随机样本,那么两个样本的均值 差(1X ―2X )的抽样分布就是N ((μ1―μ2,121n σ+2 2 2n σ) )。 3.两个成数的差可以被看作两个(均值 )差的特例来处理。 4.配对样本,是两个样本的单位两两匹配成对,它实际上只能算作(一个 )样本,也称关联样本。 5.配对样本均值差的区间估计实质上是( μd )的单样本区间估计 6.当n 1和n 2逐渐变大时,(1X ―2X )的抽样分布将接近(正态 )分布。 7.使用配对样本相当于减小了(一半 )的样本容量。 8. 在配对过程中,最好用(掷硬币 )的方式决定“对”中的哪一个归入实验组,哪一个归入控制组。 9. 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于(实验刺激 )。 10. 方差比检验,无论是单侧检验还是双侧检验,F 的临界值都只在( 右 )侧。 二、单项选择 1.抽自两个独立正态总体样本均值差(1X ―2X )的抽样分布是(B )。 A N (μ1―μ2,121n σ―222n σ) B N (μ1―μ2,121n σ+222n σ) C N (μ1+μ2,121n σ―2 22n σ) D N (μ1+μ2,121n σ+222n σ) 2.两个大样本成数之差的分布是(B )。 A N (∧ 1p -∧ 2p ,111n q p ―222n q p ) B N (∧1p -∧2p ,111n q p +2 22n q p ) C N (∧ 1p +∧ 2p ,111n q p ―222n q p ) D N (∧1p +∧2p ,111n q p +2 22n q p ) 7.关于配对样本,正确的说法有[ ] A . 它只有一个样本; B 对样本中每个个体要观测两次; C 样本来自于两个总体; D 样本来自于同一个总体 3.为了检验两个总体的方差是否相等,所使用的变量抽样分布是(A )。 A F 分布 B Z 分布 C t 分布 D 2 χ分布 4.配对小样本的均值d 的抽样分布是( C )。 A Z 分布 B 自由度为n 的t 分布

统计学教案习题04总体均数的估计和假设检验

第四章 总体均数的估计和假设检验 一、教学大纲要求 (一) 掌握内容 1. 抽样误差、可信区间的概念及计算; 2. 总体均数估计的方法; 3. 两组资料均数比较的方法,理解并记忆应用这些方法的前提条件; 4. 假设检验的基本原理、有关概念(如I 、II 类错误)及注意事项。 (二) 熟悉内容 两样本方差齐性检验。 (三) 了解内容 1. t 分布的图形与特征; 2. 总体方差不等时的两样本均数的比较; 3. 等效检验。 二、教学内容精要 (一) 基本概念 1. 抽样误差 抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error )。统计上用标准误(standard error ,SE )来衡量抽样误差的大小。不同的统计量,标准误的表示方法不同,如均数的标准误用X S 表示,率的标准误用S P 表示,回归系数的标准误用S b 表示等等。均数的标准误与标准差的区别见表4-1。 表4-1 均数的标准误与标准差的区别 意义 反映的抽样误差大小 反映一组数据的离散情况 记法 X σ(样本估计值X S ) σ(样本估计值S ) 计算 X σ= n σ X S = n S σ = n X 2 ) (∑-μ S= 1 )(2 --∑ n X X 控制方法 增大样本含量可减小标准误。 个体差异或自然变异,不能通过统计方法来控制。 2.可信区间 (1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval ,CI )。它的确切含义是:CI 是随机的,总体参数是固定的,所以,CI 包含总体参数的可能性是1-α。不能理解为CI 是固定随机的,总体参数是随机固定的,总体参数落在CI 范围内可能性为1-α。当0.05α=时,称为95%可信区间,记作95%CI 。当0.01α=时,称为99%可信区间,记作99%CI 。 (2)可信区间估计的优劣:一定要同时从可信度(即1-α的大小)与区间的宽度两方面来衡量。 (二) t 分布与正态分布 t 分布与标准正态分布相比有以下特点:①都是单峰、对称分布;②t 分布峰值较低,而尾部较高;③随自由

总体均数的估计和假设检验

(一)单项选择题 1.标准误的英文缩写为: A.S B.SE C. S D.SD X 2.通常可采用以下那种方法来减小抽样误差: A.减小样本标准差B.减小样本含量 C.扩大样本含量D.以上都不对 3.配对设计的目的: A.提高测量精度B.操作方便 C.为了可以使用t检验D.提高组间可比性 4.以下关于参数估计的说法不正确的是: A.区间估计优于点估计 B.样本含量越大,参数估计准确的可能性越大 C.样本含量越大,参数估计越精确 D.对于一个参数只能有一个估计值 5.关于假设检验,下列那一项说法是正确的 A.单侧检验优于双侧检验 B.采用配对t检验还是成组t检验是由实验设计方法决定的 C.检验结果若P值大于0.05,则接受H0犯错误的可能性很小 D.用u检验进行两样本总体均数比较时,要求方差齐性 6.两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小 A.α=0.05 B.α=0.01 C.α=0.10 D.α=0.20 7.统计推断的内容是 A.用样本指标推断总体指标B.检验统计上的“假设” C.A、B均不是D.A、B均是 8.当两总体方差不齐时,以下哪种方法不适用于两样本总体均数比较 A.t检验B.t’检验 C.u 检验(假设是大样本时)D.F检验 9.甲、乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得 X,21S,2X,22S,则理论上 1 A.1X=2X,21S=22S B.作两样本t检验,必然得出无差别的结论 C.作两方差齐性的F检验,必然方差齐 D.分别由甲、乙两样本求出的总体均数的95%可信区间,很可能有重叠(二)名词解释 1.统计推断 2.抽样误差 3.标准误及 σ X 4.可信区间 5.参数估计 6.假设检验中P的含义

第五章-假设检验的功效与样本量

第五章 假设检验的功效与样本量 ? 当假设检验不拒绝H 0时,推断正确的概率称为检验功效。 ? 临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。 5.1 两类错误与功效 1. 两类错误的概率 H 0: μ=μ0, H 1: μ>μ0 (5.1) (略) Z =n X σμ0- (5.2) (略) ? 任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α (5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β (5.4a) 也可以理解为 第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β (5.4b) ? 如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病 第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病) (α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病) (β) ? 两类错误的背景: 拒绝H 0时可能犯第Ⅰ类错误 不拒绝H 0时可能犯第Ⅱ类错误 ? 两类错误的后果: 第Ⅰ类错误可能将“真实无效误作有效”∕误诊 第Ⅱ类错误可能将“真实有效误作无效”∕漏诊 ? 一般α, β的数值要在科研设计时事先确定 2. 功效 (power) ? 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β (5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β (5.5) ? 功效就是真实有效的药物被发现的概率∕疾病被诊断出 来的概率 5.2 影响功效的四要素 ? 假设检验的功效至少受四个要素的影响,参看(5.2)式 n X σμ0- ≥Z α (5.6) ? 功效的影响因素为:δ=0μ-x ,σ,n ,α X ≥μ0+Z αn σ (5.7) (略) ? 现用X 分布图形来定性地讨论四要素对功效的影响 1. 客观差异越大,功效越大

双样本假设检验与区间估计练习题

第十章双样本假设检验及区间估计第一节两总体大样本假设检验 两总体大样本均值差的检验·两总体大样本成数差的检验 第二节两总体小样本假设检验 两总体小样本均值差的检验·两总体小样本方差比的检验 第三节配对样本的假设检验 单一试验组的假设检验·一试验组与一控制组的假设检验·对实验设计与相 关检验的评论 第四节双样本区间估计 σ 2和σ22已知,对双样本均数差的区间估计·σ12和σ22未知,对对双样本均1 值差的区间估计·大样本成数差的区间估计·配对样本均值差的区间信计 一、填空 1.所谓独立样本,是指双样本是在两个总体中相互()地抽取的。 2.如果从N(μ1,σ12)和N(μ2,σ22)两个总体中分别抽取容量为n1和n2的独立随机样本,那么两个样本的均值差(1X―2X)的抽样分布就是N()。 3.两个成数的差可以被看作两个()差的特例来处理。 4.配对样本,是两个样本的单位两两匹配成对,它实际上只能算作()样本,也称关联样本。 5.配对样本均值差的区间估计实质上是()的单样本区间估计 6.当n1和n2逐渐变大时,(1X―2X)的抽样分布将接近()分布。

7.使用配对样本相当于减小了( )的样本容量。 8. 在配对过程中,最好用( )的方式决定“对”中的哪一个归入实验组,哪一个归入控制组。 9. 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于( )。 10. 方差比检验,无论是单侧检验还是双侧检验,F 的临界值都只在( )侧。 二、单项选择 1.抽自两个独立正态总体样本均值差(1X ―2X )的抽样分布是( )。 A N (μ1―μ2,121n σ―222n σ) B N (μ1―μ2,121n σ+22 2n σ) C N (μ1+μ2,121n σ―2 22n σ) D N (μ1+μ2,121n σ+22 2n σ) 2.两个大样本成数之差的分布是( )。 A N (∧ 1p -∧ 2p ,111n q p ―222n q p ) B N (∧1p -∧2p ,111n q p +2 22n q p ) C N (∧ 1p +∧ 2p ,111n q p ―222n q p ) D N (∧1p +∧2p ,111n q p +2 22n q p ) 3.为了检验两个总体的方差是否相等,所使用的变量抽样分布是( )。 A F 分布 B Z 分布 C t 分布 D 2 χ分布 4.配对小样本的均值d 的抽样分布是( )。 A Z 分布 B 自由度为n 的t 分布 C 自由度为(n —1)的t 分布 D 自由度为(n —1)的2χ分布 5.若零假设中两总体成数的关系为p 1=p 2,这时两总体可看作成数p 相同的总体, 它们的点估计值是( )。 A p 1 + p 2 B p 1p 2 C p 1 -p 2 D 2 12 211n n p n p n ++∧ ∧ 6.在σ1 2 和σ2 2未知,但可假定它们相等的情况下,σ的无偏估计量∧ S 是( )。 A 2212 2 211-++n n nS S n B 2212 2211-++n n nS S n ?2 12 1n n n n +

相关文档
最新文档