7假设检验:均值与百分率
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
六、检定假设的步骤
根据研究假设(H1)成立虚无假设(H0)。 选择适当的检验统计法,列举其假定和要求。 确定抽样分布。 规定显著性水平a,确定一端还是两端检定,然后从抽样分布中求出否 定域的位置和大小。注意:所要求的显著度愈高,否定域就愈小,便愈 难否定H0;再者,二端检定比一端检定更难否定H0,故此H1最好能说清 方向。 计算检验统计量的值,作出统计决策。若检定值在否定域的范围内,则 否定H0,即H1可能是对的;否则就不能否定H0,也即H1可能是错误的。
2、非参数检定法 非参数检定法,一般不要求变量有定距测量性质,因而适用于推论定类与 定序资料。但是,因为非参数检定法不理会总体的情况,在推论时就较为困难 ,准确性也因此受影响。因此,在总体确实具备某些条件时,参数检定法比非 参数检定法更好。 社会学界很重视非参数检定法,一方面因为它无需假定总体具有特殊的条 件。另一方面是因为任何推论统计法的检定力都是与样本的大小成正比的。非 参数法的检定力虽然较弱,但只要样本加大,就可使检定力增强。社会学所抽 取的样本一般都是比较大的,超过100甚至1000都是经常的,使得非参数检定 法取得相当大的检定力。因此,当样本足够大时,我们尽可以放心使用各种非 参数检定法。
1.
三、多个均值的差异 研究时可能有三个或三个以上的样本,如比较三个或三个以上地区的家庭平 均收入。这时通常运用方差分析比较样本之间的均值差异。 H1:M1 ≠ M2 ≠ M3; H0:M1 = M2 = M3„ 倘若所研究的只有两个样本,则方差分析法(F检定)也可用来检定两个样 本均值的差异,不一定要用前面介绍的Z检定法或者t检定法。因此,在 社会学研究中,方差分析是很重要的和经常被应用的。
若样本较小,要改用二项抽样分布来检定假设。此时用于假设检定的是t检定 法。
二、两个百分率(或比例)的差异—Z检定法 1. 假定条件 两个总体是独立的 两个随机样本百分率之差的抽样分布接近正态分布 2. 计算公式:
研究的问题 假 设 没有差异 有差异 比例1 ≥比例2 比例1 < 比例2 总体1 ≤比例2 总体1 > 比例2
三、一端(单边/单尾)与二端检定(双边/双尾) 1、一端检定:否定域只在一端(可以在右端,也可在左端)。 二端检定:否定域在两端的位置。 2、一般地讲:选用一端检定还是两端检定,取决于它是否可以确定研究假 设(H1)的方向。如果根据某项理论或自己的经验,在成立H1 时可以定 出方向,则选用一端检定的方法。 例如: H1 :总体中同意的人数多于反对的人数。一端检定。 例如: H1 :总体中同意人数不等于反对人数。 两端检定。 3、如果所选定的显著度相同,两端检定比一端检定更难否定虚无假设。 研究的问题 二端检定 m ≠ m0 左侧检定 m < m0 右侧检定 m > m0
1、Z检定法(大样本) 假定H0是:总体均值是M。如果是大样本,则无限个样本均值的抽样分布 会近似正态分布,正态分布的均值就等于总体的均值M,样本标准差SE就等于 总体的 标准差S除以样本大小n的平方根。公式:
Z检定法就是用标准化公式所计算得的Z值来检定虚无建设。这个数值, 通常称为检定值。 假设检定基本逻辑:先设立H0(即总体均值是M),进而以此为基础来确 定抽样分布。倘若我们所抽取的一个随机样本中的均值( x ),在以H0为基础的 抽样分布中出现的机会是很小的,那就理应否定虚无假设(H0),改而接受 研究假设(H1)。 所选定的显著度愈高,愈难否定H0,也即愈难接受H1.
二、两个均值的差异
两个正态总体的均值检验
均值
独立样本 相关样本
比例
t 检验
方差
Z 检验
(大样本)
t 检验
(小样本) (小样本)
Z 检验
F 检验
Z检定法与t检定法属于参数检定法。 应用条件:①随机抽样②每个总体都是正态分布③两个总体的标准差相等。 样本相当大时(n≥100)用Z检定法,样本较小,特别是n≤30时,用t检定法。
第三节
单百分率与百分率差异
一个总体的检验 一个总体
均值 比例
方差
Z 检验
(单尾和双尾)
t 检验
(单尾和双尾)
Z 检验
(单尾和双尾)
2检验
(单尾和双尾)
一、单百分率(或比例)—Z检验 样本较大时,百分率的抽样分布就会近似正态分布,故可用Z 检定法。同时 如果样本较大,Z检定法不要求总体是正态分布,只要求是随机抽样, 公式如下:
第二节
一、单均值
单均值与均值差异
一个总体的单均值检验
一个总体
均值
Z 检验
(大样本)
比例
t 检验
(小样本)
方差
2检验
(小样本)
Z 检验
(大样本)
Z检定法与t检定法属于参数检定法。 应用条件:①定距变量②随机抽样③总体正态分布。 样本相当大时(n≥100)用Z检定法,样本较小,特别是n≤30时,用t检定法。
五、检定力:参数与非参数法 检定假设的推论统计法有很多种,可以分为两类:参数鉴定法和非参数 鉴定法。两者检定能力各不同,以前者较强。 统计法的检定力:是指该统计法能够准确地判断虚无假设( H0 )正误 的能力 由于统计推论之前,已经决定显著度(即甲种误差)的大小,故检定力 的大小其实是指乙种误差的大小;如果在统计推论时所犯的乙种误差越小, 该统计法的检定力就越大。 检定力=1-乙种误差之机会 1、参数检定法 参数检定法的鉴定力大于非参数检定法,是因为原则上其在检定假设时 所犯的乙种误差较小。 参数检定法的特点:要求总体具备某些条件,如正态分布、标准差相等 、要求变项的数值具有定距测量层次的特质。倘若总体具备这些特点,参数 检定法能相当准确地判断虚无假设的正误。 以后讲到的:Z检定法、F检定法、t检定法 都是参数检定法。非参数检 定法:也称分布自由检定法。其特点是不要求总体数值具备特殊的条件。以 后介绍的卡方检定法就是非参数检定的一种。
二、否定域与显著度 1、否定域(简写CR):抽样分布内一端或两端的小区域,如果样本的统计值 在此区域范围内,就否定虚无假设。 (1)否定域可以在抽样分布的一端或者两端,具体视研究假设的性质(H1) 而定。否定域只在一端称一端检定,在两端称两端检定。 (2)否定域的大小(一般是相当小的),取决于研究的需要,但最好是在抽 样之前就决定,避免放“马后炮”的问题。 如:在抽取10个青年考察他们对一胎化政策的态度例题中,CR≥9个。 2、显著度(简写 P):表示否定域在整个抽样分布中所占的比例,也即表示 样本的统计值落在否定域内的机会。 (1)显著度的大小,视乎研究的需要。在当前的社会学研究中,多用 P≤0.05 或P≤0.01. (2)显著度愈小,便愈难否定虚无假设( H0 ),也即愈难证明研究假设( H1 )是对的。
Z检定法与t检定法的分别,在于前者基于正态抽样分布,要求大样本,后者 则基于t值抽样分布,则可用于小样本。但是,当样本增大时,t值分布 会逐渐接近正态分布,这时t检定法与Z检定法的分别就不大。因此,无 论样本的大小如何,都可以用t检定法。Z检定法可以说是t检定法的一种 特殊(大样本)情况。在社会学研究中,t检定法的应用更广泛。
H0 H1
P1–P2 = 0 P1–P20
P1–P20 P1–P2<0
P1–P20 P1–P2 >0
三、多个百分率的差异—卡方检定 H1:P1 ≠ P2 ≠ P3 H0:P1 = P2 = P3 卡方检定法:非参数检定法,也可以检定两个百分率的差异。其作用在 于检定两个或两个以上的随机样本的次数分布是否有差别。
假设
H1
H0
m = m0
m m0
m m0
左侧检定
(显著性水平与拒绝域 )
抽样分布
拒绝域 置信水平
a
1-a 接受域
临界值
H0值
样本统计量
观察到的样本统计量
右侧检定
(显著性水平与拒绝域 )
抽样分布
置信水平 拒绝域 1-a
a
接受域
H0值
观察到的样本统计量
wenku.baidu.com临界值
样本统计量
二端检定
(显著性水平与拒绝域 )
抽样分布
拒绝域 a/2 1-a 置信水平
拒绝域 a/2
接受域
临界值
H0值
临界值
样本统计量
四、假设检验中的两类错误:甲种误差与乙种误差 1. 甲种错误(弃真错误):“以真为假”的第一类错误; 虚无假设为真时拒绝虚无假设的可能性 甲种错误的概率为 a 被称为显著性水平 2. 乙种错误(取伪错误):“以假为真”的第二类错误; 虚无假设为假时接受虚无假设的可能性 乙种错误的概率为 乙种错误的计算比较复杂,略去不谈。 在样本量和统计方法确定的前提下,甲种误差与乙种误差是对立的,成 a大 就小。 反比的。 a 小 就大, 一般研究中比较注意防止犯第一类错误,即不愿意“以真为假”,而不 大考虑犯第二类错误的概率,因此一般都把概率a都取得较小,这种 假设被称为显著性检验。 要完全消除两种误差是不可能的,减少两者的最简单的方法在于把样本 增大。决定样本大小的最重要准则是:在研究资源(人力、物力和时 间)许可的范围内,尽可能抽取最大的样本。同时,在决定了样本的 大小后,还可用检定能力较强的推论统计法来减少误差。
1、Z检定法. 两个样本的个案总数额大,一般在(n1+n2)≥100时,可用如下公式:
虚无假设:H0: u1 = u2 ;研究假设:H1: u1 u2 ; 如果每次抽取的两个随机样本的个案总数较大,则其平均差的抽样分布会近 似正态分布。
2、t检定法
检验具有等方差的两个总体的均值 2. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布或近似服从正态分布 3、 研究假设:H0:M1<M2; 虚无假设:H1:M1=M2 4、 计算公式:
社会学研究(尤其是抽样调查研究)最关心的,是推论两个变项之间的 关系。
第七章
假设检验:均值与百分率
第一节 基本知识
假设检验 1. 概念:先成立一个关于总体情况的假设,继而抽取一个随机样本,然后 以样本的统计值来验证假设 2. 类型:参数假设检验、非参数假设检验 3. 特点:采用逻辑上的反证法、依据统计上的小概率原理 4. 过程:提出假设、抽取样本、作出决策
一、研究假设与虚无假设 1、研究假设:科学研究一般是先成立假设,即假定在总体中存在某些情况, 如假定青年中同意一胎化政策与反对一胎化政策的比例相等,或者假设 变量X与变量Y相关。这个假设称为研究假设(简写H1)。研究的目的就 是要知道它是对还是错。 当我们用随机样本的资料作统计推论的时候,不是直接检定研究假设,而是首 先检定与研究假设相对立的假设,从而间接检定研究假设正确的可能性 。 2、虚无假设:与研究假设相对立的假设,在统计学上称为虚无假设(简写H2 )。例如研究假设是X与Y相关,则虚无假设就是X与Y不相关。 检定假设的基本原则是直接检定H0,因而间接地检定H1,目的是排除抽样误差 的可能性。
单均值Z检验
左侧:H0: 0 H1:< 0
拒绝 H0
a
右侧:H0: 0 H1: > 0
拒绝 H0 a
0
Z
0
Z
2、t检定法(小样本) 如果是小样本,尤其当n≤30,就要改用t检定法。公式:
需要注意:t的抽样分布形状(如扁平或高耸的程度)取决于自由度。 所谓自由度(简写为df)是指有多少个个案的数值可以随意变更。如样 本的均值,显然只有一个个案的数值受到限制,其余都可以自由变动。换言 之,无论其余的个案数值怎样变动,我们都可以用一个来调节,获得已知的 样本均值。因此df=n-1. 而小样本的t分布就是取决于此数值的大小,df越小(即样本越小), 则t分布就越扁平,df越大(即样本越大),则t分布就越高耸,且接近正态 分布。 既然不同自由度的t分布形状略有不同,则每个显著度所代表的否定域 的大小也就有所不同。
根据研究假设(H1)成立虚无假设(H0)。 选择适当的检验统计法,列举其假定和要求。 确定抽样分布。 规定显著性水平a,确定一端还是两端检定,然后从抽样分布中求出否 定域的位置和大小。注意:所要求的显著度愈高,否定域就愈小,便愈 难否定H0;再者,二端检定比一端检定更难否定H0,故此H1最好能说清 方向。 计算检验统计量的值,作出统计决策。若检定值在否定域的范围内,则 否定H0,即H1可能是对的;否则就不能否定H0,也即H1可能是错误的。
2、非参数检定法 非参数检定法,一般不要求变量有定距测量性质,因而适用于推论定类与 定序资料。但是,因为非参数检定法不理会总体的情况,在推论时就较为困难 ,准确性也因此受影响。因此,在总体确实具备某些条件时,参数检定法比非 参数检定法更好。 社会学界很重视非参数检定法,一方面因为它无需假定总体具有特殊的条 件。另一方面是因为任何推论统计法的检定力都是与样本的大小成正比的。非 参数法的检定力虽然较弱,但只要样本加大,就可使检定力增强。社会学所抽 取的样本一般都是比较大的,超过100甚至1000都是经常的,使得非参数检定 法取得相当大的检定力。因此,当样本足够大时,我们尽可以放心使用各种非 参数检定法。
1.
三、多个均值的差异 研究时可能有三个或三个以上的样本,如比较三个或三个以上地区的家庭平 均收入。这时通常运用方差分析比较样本之间的均值差异。 H1:M1 ≠ M2 ≠ M3; H0:M1 = M2 = M3„ 倘若所研究的只有两个样本,则方差分析法(F检定)也可用来检定两个样 本均值的差异,不一定要用前面介绍的Z检定法或者t检定法。因此,在 社会学研究中,方差分析是很重要的和经常被应用的。
若样本较小,要改用二项抽样分布来检定假设。此时用于假设检定的是t检定 法。
二、两个百分率(或比例)的差异—Z检定法 1. 假定条件 两个总体是独立的 两个随机样本百分率之差的抽样分布接近正态分布 2. 计算公式:
研究的问题 假 设 没有差异 有差异 比例1 ≥比例2 比例1 < 比例2 总体1 ≤比例2 总体1 > 比例2
三、一端(单边/单尾)与二端检定(双边/双尾) 1、一端检定:否定域只在一端(可以在右端,也可在左端)。 二端检定:否定域在两端的位置。 2、一般地讲:选用一端检定还是两端检定,取决于它是否可以确定研究假 设(H1)的方向。如果根据某项理论或自己的经验,在成立H1 时可以定 出方向,则选用一端检定的方法。 例如: H1 :总体中同意的人数多于反对的人数。一端检定。 例如: H1 :总体中同意人数不等于反对人数。 两端检定。 3、如果所选定的显著度相同,两端检定比一端检定更难否定虚无假设。 研究的问题 二端检定 m ≠ m0 左侧检定 m < m0 右侧检定 m > m0
1、Z检定法(大样本) 假定H0是:总体均值是M。如果是大样本,则无限个样本均值的抽样分布 会近似正态分布,正态分布的均值就等于总体的均值M,样本标准差SE就等于 总体的 标准差S除以样本大小n的平方根。公式:
Z检定法就是用标准化公式所计算得的Z值来检定虚无建设。这个数值, 通常称为检定值。 假设检定基本逻辑:先设立H0(即总体均值是M),进而以此为基础来确 定抽样分布。倘若我们所抽取的一个随机样本中的均值( x ),在以H0为基础的 抽样分布中出现的机会是很小的,那就理应否定虚无假设(H0),改而接受 研究假设(H1)。 所选定的显著度愈高,愈难否定H0,也即愈难接受H1.
二、两个均值的差异
两个正态总体的均值检验
均值
独立样本 相关样本
比例
t 检验
方差
Z 检验
(大样本)
t 检验
(小样本) (小样本)
Z 检验
F 检验
Z检定法与t检定法属于参数检定法。 应用条件:①随机抽样②每个总体都是正态分布③两个总体的标准差相等。 样本相当大时(n≥100)用Z检定法,样本较小,特别是n≤30时,用t检定法。
第三节
单百分率与百分率差异
一个总体的检验 一个总体
均值 比例
方差
Z 检验
(单尾和双尾)
t 检验
(单尾和双尾)
Z 检验
(单尾和双尾)
2检验
(单尾和双尾)
一、单百分率(或比例)—Z检验 样本较大时,百分率的抽样分布就会近似正态分布,故可用Z 检定法。同时 如果样本较大,Z检定法不要求总体是正态分布,只要求是随机抽样, 公式如下:
第二节
一、单均值
单均值与均值差异
一个总体的单均值检验
一个总体
均值
Z 检验
(大样本)
比例
t 检验
(小样本)
方差
2检验
(小样本)
Z 检验
(大样本)
Z检定法与t检定法属于参数检定法。 应用条件:①定距变量②随机抽样③总体正态分布。 样本相当大时(n≥100)用Z检定法,样本较小,特别是n≤30时,用t检定法。
五、检定力:参数与非参数法 检定假设的推论统计法有很多种,可以分为两类:参数鉴定法和非参数 鉴定法。两者检定能力各不同,以前者较强。 统计法的检定力:是指该统计法能够准确地判断虚无假设( H0 )正误 的能力 由于统计推论之前,已经决定显著度(即甲种误差)的大小,故检定力 的大小其实是指乙种误差的大小;如果在统计推论时所犯的乙种误差越小, 该统计法的检定力就越大。 检定力=1-乙种误差之机会 1、参数检定法 参数检定法的鉴定力大于非参数检定法,是因为原则上其在检定假设时 所犯的乙种误差较小。 参数检定法的特点:要求总体具备某些条件,如正态分布、标准差相等 、要求变项的数值具有定距测量层次的特质。倘若总体具备这些特点,参数 检定法能相当准确地判断虚无假设的正误。 以后讲到的:Z检定法、F检定法、t检定法 都是参数检定法。非参数检 定法:也称分布自由检定法。其特点是不要求总体数值具备特殊的条件。以 后介绍的卡方检定法就是非参数检定的一种。
二、否定域与显著度 1、否定域(简写CR):抽样分布内一端或两端的小区域,如果样本的统计值 在此区域范围内,就否定虚无假设。 (1)否定域可以在抽样分布的一端或者两端,具体视研究假设的性质(H1) 而定。否定域只在一端称一端检定,在两端称两端检定。 (2)否定域的大小(一般是相当小的),取决于研究的需要,但最好是在抽 样之前就决定,避免放“马后炮”的问题。 如:在抽取10个青年考察他们对一胎化政策的态度例题中,CR≥9个。 2、显著度(简写 P):表示否定域在整个抽样分布中所占的比例,也即表示 样本的统计值落在否定域内的机会。 (1)显著度的大小,视乎研究的需要。在当前的社会学研究中,多用 P≤0.05 或P≤0.01. (2)显著度愈小,便愈难否定虚无假设( H0 ),也即愈难证明研究假设( H1 )是对的。
Z检定法与t检定法的分别,在于前者基于正态抽样分布,要求大样本,后者 则基于t值抽样分布,则可用于小样本。但是,当样本增大时,t值分布 会逐渐接近正态分布,这时t检定法与Z检定法的分别就不大。因此,无 论样本的大小如何,都可以用t检定法。Z检定法可以说是t检定法的一种 特殊(大样本)情况。在社会学研究中,t检定法的应用更广泛。
H0 H1
P1–P2 = 0 P1–P20
P1–P20 P1–P2<0
P1–P20 P1–P2 >0
三、多个百分率的差异—卡方检定 H1:P1 ≠ P2 ≠ P3 H0:P1 = P2 = P3 卡方检定法:非参数检定法,也可以检定两个百分率的差异。其作用在 于检定两个或两个以上的随机样本的次数分布是否有差别。
假设
H1
H0
m = m0
m m0
m m0
左侧检定
(显著性水平与拒绝域 )
抽样分布
拒绝域 置信水平
a
1-a 接受域
临界值
H0值
样本统计量
观察到的样本统计量
右侧检定
(显著性水平与拒绝域 )
抽样分布
置信水平 拒绝域 1-a
a
接受域
H0值
观察到的样本统计量
wenku.baidu.com临界值
样本统计量
二端检定
(显著性水平与拒绝域 )
抽样分布
拒绝域 a/2 1-a 置信水平
拒绝域 a/2
接受域
临界值
H0值
临界值
样本统计量
四、假设检验中的两类错误:甲种误差与乙种误差 1. 甲种错误(弃真错误):“以真为假”的第一类错误; 虚无假设为真时拒绝虚无假设的可能性 甲种错误的概率为 a 被称为显著性水平 2. 乙种错误(取伪错误):“以假为真”的第二类错误; 虚无假设为假时接受虚无假设的可能性 乙种错误的概率为 乙种错误的计算比较复杂,略去不谈。 在样本量和统计方法确定的前提下,甲种误差与乙种误差是对立的,成 a大 就小。 反比的。 a 小 就大, 一般研究中比较注意防止犯第一类错误,即不愿意“以真为假”,而不 大考虑犯第二类错误的概率,因此一般都把概率a都取得较小,这种 假设被称为显著性检验。 要完全消除两种误差是不可能的,减少两者的最简单的方法在于把样本 增大。决定样本大小的最重要准则是:在研究资源(人力、物力和时 间)许可的范围内,尽可能抽取最大的样本。同时,在决定了样本的 大小后,还可用检定能力较强的推论统计法来减少误差。
1、Z检定法. 两个样本的个案总数额大,一般在(n1+n2)≥100时,可用如下公式:
虚无假设:H0: u1 = u2 ;研究假设:H1: u1 u2 ; 如果每次抽取的两个随机样本的个案总数较大,则其平均差的抽样分布会近 似正态分布。
2、t检定法
检验具有等方差的两个总体的均值 2. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布或近似服从正态分布 3、 研究假设:H0:M1<M2; 虚无假设:H1:M1=M2 4、 计算公式:
社会学研究(尤其是抽样调查研究)最关心的,是推论两个变项之间的 关系。
第七章
假设检验:均值与百分率
第一节 基本知识
假设检验 1. 概念:先成立一个关于总体情况的假设,继而抽取一个随机样本,然后 以样本的统计值来验证假设 2. 类型:参数假设检验、非参数假设检验 3. 特点:采用逻辑上的反证法、依据统计上的小概率原理 4. 过程:提出假设、抽取样本、作出决策
一、研究假设与虚无假设 1、研究假设:科学研究一般是先成立假设,即假定在总体中存在某些情况, 如假定青年中同意一胎化政策与反对一胎化政策的比例相等,或者假设 变量X与变量Y相关。这个假设称为研究假设(简写H1)。研究的目的就 是要知道它是对还是错。 当我们用随机样本的资料作统计推论的时候,不是直接检定研究假设,而是首 先检定与研究假设相对立的假设,从而间接检定研究假设正确的可能性 。 2、虚无假设:与研究假设相对立的假设,在统计学上称为虚无假设(简写H2 )。例如研究假设是X与Y相关,则虚无假设就是X与Y不相关。 检定假设的基本原则是直接检定H0,因而间接地检定H1,目的是排除抽样误差 的可能性。
单均值Z检验
左侧:H0: 0 H1:< 0
拒绝 H0
a
右侧:H0: 0 H1: > 0
拒绝 H0 a
0
Z
0
Z
2、t检定法(小样本) 如果是小样本,尤其当n≤30,就要改用t检定法。公式:
需要注意:t的抽样分布形状(如扁平或高耸的程度)取决于自由度。 所谓自由度(简写为df)是指有多少个个案的数值可以随意变更。如样 本的均值,显然只有一个个案的数值受到限制,其余都可以自由变动。换言 之,无论其余的个案数值怎样变动,我们都可以用一个来调节,获得已知的 样本均值。因此df=n-1. 而小样本的t分布就是取决于此数值的大小,df越小(即样本越小), 则t分布就越扁平,df越大(即样本越大),则t分布就越高耸,且接近正态 分布。 既然不同自由度的t分布形状略有不同,则每个显著度所代表的否定域 的大小也就有所不同。