第九章 总体比率的推断
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
17
第二节 总体比率的区间估计
二、查表法 例2: 向53人调查关于全国统一高考的意见,其中表示赞成者有23 人,试估计赞成全国统一高考总体比率95%及99%的置信区 间。 根据n=53,X=23,查表: n=50,相对应95%的置信限为32,61; n=60,相对应95%的置信限为26,52;
18
第二节 总体比率的区间估计
二、查表法 例2: 根据n=53,X=23,查表: n=50,相对应95%的置信限为32,61; n=60,相对应95%的置信限为26,52; 设n=53的95%置信下限为p1,上限为p2,则 (50-60):(53-60)=(32-26):(p1-26) 置信下限p1=30.2 (50-60):(53-60)=(61-52):(p2-52) 置信上限p2=58.3 同理可求得99%的置信区间为26.5%-62.3% 结论:赞成全国统一高考95%的可能在30.2%-58.3%范围内, 99%的可能在26.5%-62.3%范围内。
pq n
0.95
12
第二节 总体比率的区间估计
一、正态近似法 令Z在-1.96和1.96之间变动,在此期间的概率为95%,即
P 1.96
p p' pq
1.96
0.95
n
P p 1.96
pq p' p 1.96 n
pq n
16
第二节 总体比率的区间估计
二、查表法 例1: 从某小学三年级随机抽取24个学生,测得汉语拼音成绩优秀 者有5人,试估计该校三年级学生此次测验优秀的百分比是 多少? 根据n=24,X=5,查百分率的可信限表,成绩优秀的有95% 的可能在7%-42%的范围内,有99%的可能在5%-49%范围 内。
0.95
于是,总体比率95%的置信下限和置信上限为
p 1.96 pq n
p 1.96 pq n
13
第二节 总体比率的区间估计
一、正态近似法 令Z在-2.58和2.58之间变动,在此期间的概率为99%,即
P 2.58
p
p' pq
2.56
0.99
n
P p 2.58
当n1≠n2时,
S p1 p2
pq pq n1 n2
当n1=n2时,
pq
n1 n2 n1n2
n1 p1 n2 p2 n1q1 n2q2 n1n2n1 n2
S p1 p2
2 pq n
p1 p2 q1 q2
pq p' p 2.58 n
pq n
0.99
于是,总体比率99%的置信下限和置信上限为
p 2.58 pq n
p 2.58 pq n
14
第二节 总体比率的区间估计
例如 从某区随机抽取100个中学生,查得正常视力有65人,若用 样本比率p=65/100=0.65来估计全区中学生正常视力的比率。
6
第一节 比率的抽样分布
二、比率的抽样分布 当p=q,无论n的大小,二项分布呈对称形; 当p<q且np≥5,或p>q且nq≥5时, 即:np、nq其中一个最小频数等于或大于5时, 二项分布已经开始接近正态分布。
7
第一节 比率的抽样分布
三、比率的标准误 ——二项试验成功事件一切可能样本的比率在抽样分布上的 标准差为比率的标准误。
24
第三节 总体比率的假设检验
二、查表法 (3)统计决断 由于假设的总体比率落在样本所来自的总体比率95%两端临 界限的中间,即0.04<0.25<0.35,故应保留H0而拒绝H1。 结论:甲校高考录取率与全区录取率无显著性差异。
25
第四节 总体比率差异的假设检验
总体比率假设检验——根据一个样本的比率 比较两个相应总体的比率——根据两个样本的比率
一、两个独立样本比率差异的显著性检验
两个独立样本比率之差的标准误为
S p1 p2
p1q1 p2q2
n1
n2
p1——第一个样本的比率,q1=1-p1 p2——第二个样本的比率,q2=1-q2 n1和n2——样本容量
26
第四节 总体比率差异的假设检验
一、两个独立样本比率差异的显著性检验
在检验两个独立样本比率差异的显著性时,
检验的步骤: (1)提出假设 H0:p'=0.60
H1:p'≠0.60
20
第三节 总体比率的假设检验
一、正态近似法
(2)选择检验统计量并计算其值 本例属于二项分布,但由于最小频数nq=50×0.36=18>5, 其二项分布接近正态分布,故可选择Z作为检验统计量。
Z p p' p'q' n
p——样本的比率 p'——总体的比率,q' =1-p' n——样本的容量
其统计量为: Z p p' pq n
11
第二节 总体比率的区间估计
一、正态近似法
令Z在-1.96和1.96之间变动,在此期间的概率为95%,即
P 1.96
p p' pq
1.96
0.95
n
P p 1.96
pq p' p 1.96 n
pq n
Sp——总体比率标准误的估计量 P——样本的比率,q=1-p n——样本容量
9
第一节 比率的抽样分布
三、比率的标准误 例如 从某区随机抽取100个中学生,查得正常视力有65人,若用 样本比率p=65/100=0.65来估计全区中学生正常视力的比率 时,其抽样误差根据公式为
Sp
pq n
本例总体比率95%的置信区间为:P(0.557<p'<0.744)=0.95, 因此该区中学生正常视力比率有95%的可能在0.557(55.7%) 至0.744(74.4%)的范围内。
本例总体比率99%的置信区间为:P(0.527<p'<0.773)=0.99, 因此该区中学生正常视力比率有99%的可能在0.527(52.7%) 至0.773(77.3%)的范围内。
2n
28
第四节 总体比率差异的假设检验
一、两个独立样本比率差异的显著性检验
如果两个独立样本的最小频数都等于或大于5, 两个样本比率之差的抽样分布也接近于正态, 于是可用Z检验两个比率之差的显著性。
其检验统计量为:
Z
p1 p2
n1 p1 n2 p2 n1q1 n2q2
n1n2 n1 n2
Z p p' 0.64 - 0.60 0.58 p'q' 0.60 0.40
n
50
21
第三节 总体比率的假设检验
一、正态近似法
(3)统计决断 根据双侧Z检验统计决断规则,Z=0.58<1.96=Z0.05,则 P>0.05,差异不显著。于是保留H0而拒绝H1。 结论:该区中学教师大学本科毕业的比率与全市没有显著性 差异。也可以说,中学教师大学本科毕业的样本比率0.64是 来自于比率为0.60的总体。
《教育统计学》
职教学院 刘春雷 E-mail:lcl2156@126.com
1
第九章 总体比率的推断 第一节 比率的抽样分布 第二节 总体比率的区间估计 第三节 总体比率的假设检验 第四节 总体比率差异的显著性检验
2
第一节 比率的抽样分布
一、数据的特点
总体平均数、方差的统计推断 ——都是对由测量获得的、正态连续变量的数据所进行的统 计推断。
——以假设这两个样本比率来自同一个总体为前提,
——于是就用两个样本比率的加权平均数作为总体比率的估
计量,即
p n1 p1 n2 p2 n1 n2
q n1q1 n2q2 n1 n2
27
第四节 总体比率差异的假设检验
一、两个独立样本比率差异的显著性检验
于是,两个独立样本比率之差的标准误有两种情况:
——总体比率的标准误是由二项分布的标准差除以n而获得。
p
p'q' n
σp——总体比率的标准误; p' ——总体比率,q'=1-p' n ——样本容量
8
第一节 比率的抽样分布
三、比率的标准误 当总体比率未知时, 需用样本比率p=X/n作为总体比率p'的点估计。 总体比率标准误的估计量为
Sp
30
第四节 总体比率差异的假设检验
一、两个独立样本比率差异的显著性检验
例如:
检验的步骤:
(2)选择检验统计量并计算其值
由于实验组和对照组为两个独立样本,两组的最小频数
n1q1=100×0.30=30,n2p2=60×0.40=24,均大于5, 于是两个样本比率之差的抽样分布接近于正态,
故可用上式对两个比率差异进行显著性检验。
本例也可以不用比率(相对频数)而用绝对频数进行Z检验。
即将分子分母同乘以n。 Z np np' np'q'
22
第三节 总体比率的假设检验
二、查表法
例如: 某区高考录取率为0.25,其中甲校26个毕业生中有4人被录 取,问甲校与全区录取率是否有显著性差异?
检验的步骤: (1)提出假设 H0:p'=0.25
19
第三节 总体比率的假设检验
一、正态近似法 当p=q,无论n的大小; 或者np、nq其中一个最小频数等于或大于5, 这时二项分布近似正态分布,可用Z检验总体比率的显著性。
例如:某市中学教师中大学本科毕业的比率为0.60,现从某 区随机抽取50名中学教师,其中大学本科毕业的有32人,问 该区中学教师大学本科毕业的比率与全市中学教师大学本科 毕业的比率是否有显著性差异?
0.65 0.35 0.0477 100
10
第二节 总体比率的区间估计
总体比率的区间估计 ——根据一定概率的要求,估计总体比率的所在范围,称为 总体比率的区间估计。
一、正态近似法 当p=q,无论n的大小,二项分布呈对称形; 即便p≠q,np、nq其中一个最小频数等于或大于5,二项分 布已经开始接近正态分布,故可用正态分布近似处理。
H1:p'≠0.25
23
第三节 总体比率的假设检验
二、查表法 (2)计算总体比率的临界值 ——由于最小频数np=4<5的二项分布呈偏态, ——对于总体比率的显著性检验不能用正态分布处理, ——可通过查百分率的可信限表,求二项分布的两端临界值 加以解决。 根据n=26,X=4,查百分率的可信限表找到总体比率95%的 置信区间为4%-35%
由点计而来的间断变量的数据或比率 ——按性质不同所划分的各种类别的个体的数目或比率。 如:男女学生获奖的人数或比率;
——按一定标准将测量获得的、正态连续变量的数据划分成 不同类别。 如:考试成绩分成及格和不及格的人数及比率。
3
第一节 比率的抽样分布
一、数据的特点 对点计数据的统计推断应采用总体比率的推断方法或卡方检 验。 当事物被划分成两类——总体比率的统计推断; 当事物被划分成两类以上——卡方检验 (也可对仅有两种类别——凡是可以应用比率进行检验的资 料,都可以应用卡方检验。)
29
第四节 总体比率差异的假设检验
一、两个独立样本比率差异的显著性检验 例如: 关于人体血液循环的讲授,在实验组运用形象直观的投影片。 在对照组由教师画图说明。授课结束,当堂测验的结果如下 表,问两种教学用具的效果是否有显著性差异?
检验的步骤: (1)提出假设 H0: p1'=P2'
H1:p1'≠P2'
15
第二节 总体比率的区间估计
二、查表法 当p在0或1附近,或者样本容量n较小,二项分布呈偏态, 这时不能用正态近似法估计总体比率的置信限, 而可以采用查表法。 附表6将1≤n≤1000,p≥1%的二项分布置信限列出。 ——如已知实验的次数n和 ——二项分布成功事件出现的绝对频数X, ——就可根据此表查出总体比率95%或99%的置信限。
4
第一节 比率的抽样分布
二、比率的抽样分布 比率的抽样分布是二项分布。 二项概率分布是进行总体比率统计推断的理论依据。
5
第一节 比率的抽样分布
二、比率的抽样分布 ——假设有一个二项分布的总体,现从中随机抽取一个容量 为n的样本,成功事件出现的比率p=X/n, ——然后将其还回总体中去,再从中随机抽取一个容量为n 的样本,又可算得一个成功事件出现的比率p。 ——这样反复抽下去,就可以获得一切可能个样本,将这一 切可能个样本的p值进行频数分布,就形成一个实验性的比 率的抽样分布。
Z
n1 p1
p1 p2
n2 p2 n1q1
n2q2
ห้องสมุดไป่ตู้ 3.73
n1n2 n1 n2
31
第四节 总体比率差异的假设检验
一、两个独立样本比率差异的显著性检验 例如: 检验的步骤: (3)统计决断 根据双侧Z检验统计决断规则, ∣Z∣=3.73﹡﹡>2.58=Z0.01,则P<0.01, 于是在0.01显著性水平上拒绝H0而接受H1。 其结论为:两种方法的效果有极其显著性差异。
第二节 总体比率的区间估计
二、查表法 例2: 向53人调查关于全国统一高考的意见,其中表示赞成者有23 人,试估计赞成全国统一高考总体比率95%及99%的置信区 间。 根据n=53,X=23,查表: n=50,相对应95%的置信限为32,61; n=60,相对应95%的置信限为26,52;
18
第二节 总体比率的区间估计
二、查表法 例2: 根据n=53,X=23,查表: n=50,相对应95%的置信限为32,61; n=60,相对应95%的置信限为26,52; 设n=53的95%置信下限为p1,上限为p2,则 (50-60):(53-60)=(32-26):(p1-26) 置信下限p1=30.2 (50-60):(53-60)=(61-52):(p2-52) 置信上限p2=58.3 同理可求得99%的置信区间为26.5%-62.3% 结论:赞成全国统一高考95%的可能在30.2%-58.3%范围内, 99%的可能在26.5%-62.3%范围内。
pq n
0.95
12
第二节 总体比率的区间估计
一、正态近似法 令Z在-1.96和1.96之间变动,在此期间的概率为95%,即
P 1.96
p p' pq
1.96
0.95
n
P p 1.96
pq p' p 1.96 n
pq n
16
第二节 总体比率的区间估计
二、查表法 例1: 从某小学三年级随机抽取24个学生,测得汉语拼音成绩优秀 者有5人,试估计该校三年级学生此次测验优秀的百分比是 多少? 根据n=24,X=5,查百分率的可信限表,成绩优秀的有95% 的可能在7%-42%的范围内,有99%的可能在5%-49%范围 内。
0.95
于是,总体比率95%的置信下限和置信上限为
p 1.96 pq n
p 1.96 pq n
13
第二节 总体比率的区间估计
一、正态近似法 令Z在-2.58和2.58之间变动,在此期间的概率为99%,即
P 2.58
p
p' pq
2.56
0.99
n
P p 2.58
当n1≠n2时,
S p1 p2
pq pq n1 n2
当n1=n2时,
pq
n1 n2 n1n2
n1 p1 n2 p2 n1q1 n2q2 n1n2n1 n2
S p1 p2
2 pq n
p1 p2 q1 q2
pq p' p 2.58 n
pq n
0.99
于是,总体比率99%的置信下限和置信上限为
p 2.58 pq n
p 2.58 pq n
14
第二节 总体比率的区间估计
例如 从某区随机抽取100个中学生,查得正常视力有65人,若用 样本比率p=65/100=0.65来估计全区中学生正常视力的比率。
6
第一节 比率的抽样分布
二、比率的抽样分布 当p=q,无论n的大小,二项分布呈对称形; 当p<q且np≥5,或p>q且nq≥5时, 即:np、nq其中一个最小频数等于或大于5时, 二项分布已经开始接近正态分布。
7
第一节 比率的抽样分布
三、比率的标准误 ——二项试验成功事件一切可能样本的比率在抽样分布上的 标准差为比率的标准误。
24
第三节 总体比率的假设检验
二、查表法 (3)统计决断 由于假设的总体比率落在样本所来自的总体比率95%两端临 界限的中间,即0.04<0.25<0.35,故应保留H0而拒绝H1。 结论:甲校高考录取率与全区录取率无显著性差异。
25
第四节 总体比率差异的假设检验
总体比率假设检验——根据一个样本的比率 比较两个相应总体的比率——根据两个样本的比率
一、两个独立样本比率差异的显著性检验
两个独立样本比率之差的标准误为
S p1 p2
p1q1 p2q2
n1
n2
p1——第一个样本的比率,q1=1-p1 p2——第二个样本的比率,q2=1-q2 n1和n2——样本容量
26
第四节 总体比率差异的假设检验
一、两个独立样本比率差异的显著性检验
在检验两个独立样本比率差异的显著性时,
检验的步骤: (1)提出假设 H0:p'=0.60
H1:p'≠0.60
20
第三节 总体比率的假设检验
一、正态近似法
(2)选择检验统计量并计算其值 本例属于二项分布,但由于最小频数nq=50×0.36=18>5, 其二项分布接近正态分布,故可选择Z作为检验统计量。
Z p p' p'q' n
p——样本的比率 p'——总体的比率,q' =1-p' n——样本的容量
其统计量为: Z p p' pq n
11
第二节 总体比率的区间估计
一、正态近似法
令Z在-1.96和1.96之间变动,在此期间的概率为95%,即
P 1.96
p p' pq
1.96
0.95
n
P p 1.96
pq p' p 1.96 n
pq n
Sp——总体比率标准误的估计量 P——样本的比率,q=1-p n——样本容量
9
第一节 比率的抽样分布
三、比率的标准误 例如 从某区随机抽取100个中学生,查得正常视力有65人,若用 样本比率p=65/100=0.65来估计全区中学生正常视力的比率 时,其抽样误差根据公式为
Sp
pq n
本例总体比率95%的置信区间为:P(0.557<p'<0.744)=0.95, 因此该区中学生正常视力比率有95%的可能在0.557(55.7%) 至0.744(74.4%)的范围内。
本例总体比率99%的置信区间为:P(0.527<p'<0.773)=0.99, 因此该区中学生正常视力比率有99%的可能在0.527(52.7%) 至0.773(77.3%)的范围内。
2n
28
第四节 总体比率差异的假设检验
一、两个独立样本比率差异的显著性检验
如果两个独立样本的最小频数都等于或大于5, 两个样本比率之差的抽样分布也接近于正态, 于是可用Z检验两个比率之差的显著性。
其检验统计量为:
Z
p1 p2
n1 p1 n2 p2 n1q1 n2q2
n1n2 n1 n2
Z p p' 0.64 - 0.60 0.58 p'q' 0.60 0.40
n
50
21
第三节 总体比率的假设检验
一、正态近似法
(3)统计决断 根据双侧Z检验统计决断规则,Z=0.58<1.96=Z0.05,则 P>0.05,差异不显著。于是保留H0而拒绝H1。 结论:该区中学教师大学本科毕业的比率与全市没有显著性 差异。也可以说,中学教师大学本科毕业的样本比率0.64是 来自于比率为0.60的总体。
《教育统计学》
职教学院 刘春雷 E-mail:lcl2156@126.com
1
第九章 总体比率的推断 第一节 比率的抽样分布 第二节 总体比率的区间估计 第三节 总体比率的假设检验 第四节 总体比率差异的显著性检验
2
第一节 比率的抽样分布
一、数据的特点
总体平均数、方差的统计推断 ——都是对由测量获得的、正态连续变量的数据所进行的统 计推断。
——以假设这两个样本比率来自同一个总体为前提,
——于是就用两个样本比率的加权平均数作为总体比率的估
计量,即
p n1 p1 n2 p2 n1 n2
q n1q1 n2q2 n1 n2
27
第四节 总体比率差异的假设检验
一、两个独立样本比率差异的显著性检验
于是,两个独立样本比率之差的标准误有两种情况:
——总体比率的标准误是由二项分布的标准差除以n而获得。
p
p'q' n
σp——总体比率的标准误; p' ——总体比率,q'=1-p' n ——样本容量
8
第一节 比率的抽样分布
三、比率的标准误 当总体比率未知时, 需用样本比率p=X/n作为总体比率p'的点估计。 总体比率标准误的估计量为
Sp
30
第四节 总体比率差异的假设检验
一、两个独立样本比率差异的显著性检验
例如:
检验的步骤:
(2)选择检验统计量并计算其值
由于实验组和对照组为两个独立样本,两组的最小频数
n1q1=100×0.30=30,n2p2=60×0.40=24,均大于5, 于是两个样本比率之差的抽样分布接近于正态,
故可用上式对两个比率差异进行显著性检验。
本例也可以不用比率(相对频数)而用绝对频数进行Z检验。
即将分子分母同乘以n。 Z np np' np'q'
22
第三节 总体比率的假设检验
二、查表法
例如: 某区高考录取率为0.25,其中甲校26个毕业生中有4人被录 取,问甲校与全区录取率是否有显著性差异?
检验的步骤: (1)提出假设 H0:p'=0.25
19
第三节 总体比率的假设检验
一、正态近似法 当p=q,无论n的大小; 或者np、nq其中一个最小频数等于或大于5, 这时二项分布近似正态分布,可用Z检验总体比率的显著性。
例如:某市中学教师中大学本科毕业的比率为0.60,现从某 区随机抽取50名中学教师,其中大学本科毕业的有32人,问 该区中学教师大学本科毕业的比率与全市中学教师大学本科 毕业的比率是否有显著性差异?
0.65 0.35 0.0477 100
10
第二节 总体比率的区间估计
总体比率的区间估计 ——根据一定概率的要求,估计总体比率的所在范围,称为 总体比率的区间估计。
一、正态近似法 当p=q,无论n的大小,二项分布呈对称形; 即便p≠q,np、nq其中一个最小频数等于或大于5,二项分 布已经开始接近正态分布,故可用正态分布近似处理。
H1:p'≠0.25
23
第三节 总体比率的假设检验
二、查表法 (2)计算总体比率的临界值 ——由于最小频数np=4<5的二项分布呈偏态, ——对于总体比率的显著性检验不能用正态分布处理, ——可通过查百分率的可信限表,求二项分布的两端临界值 加以解决。 根据n=26,X=4,查百分率的可信限表找到总体比率95%的 置信区间为4%-35%
由点计而来的间断变量的数据或比率 ——按性质不同所划分的各种类别的个体的数目或比率。 如:男女学生获奖的人数或比率;
——按一定标准将测量获得的、正态连续变量的数据划分成 不同类别。 如:考试成绩分成及格和不及格的人数及比率。
3
第一节 比率的抽样分布
一、数据的特点 对点计数据的统计推断应采用总体比率的推断方法或卡方检 验。 当事物被划分成两类——总体比率的统计推断; 当事物被划分成两类以上——卡方检验 (也可对仅有两种类别——凡是可以应用比率进行检验的资 料,都可以应用卡方检验。)
29
第四节 总体比率差异的假设检验
一、两个独立样本比率差异的显著性检验 例如: 关于人体血液循环的讲授,在实验组运用形象直观的投影片。 在对照组由教师画图说明。授课结束,当堂测验的结果如下 表,问两种教学用具的效果是否有显著性差异?
检验的步骤: (1)提出假设 H0: p1'=P2'
H1:p1'≠P2'
15
第二节 总体比率的区间估计
二、查表法 当p在0或1附近,或者样本容量n较小,二项分布呈偏态, 这时不能用正态近似法估计总体比率的置信限, 而可以采用查表法。 附表6将1≤n≤1000,p≥1%的二项分布置信限列出。 ——如已知实验的次数n和 ——二项分布成功事件出现的绝对频数X, ——就可根据此表查出总体比率95%或99%的置信限。
4
第一节 比率的抽样分布
二、比率的抽样分布 比率的抽样分布是二项分布。 二项概率分布是进行总体比率统计推断的理论依据。
5
第一节 比率的抽样分布
二、比率的抽样分布 ——假设有一个二项分布的总体,现从中随机抽取一个容量 为n的样本,成功事件出现的比率p=X/n, ——然后将其还回总体中去,再从中随机抽取一个容量为n 的样本,又可算得一个成功事件出现的比率p。 ——这样反复抽下去,就可以获得一切可能个样本,将这一 切可能个样本的p值进行频数分布,就形成一个实验性的比 率的抽样分布。
Z
n1 p1
p1 p2
n2 p2 n1q1
n2q2
ห้องสมุดไป่ตู้ 3.73
n1n2 n1 n2
31
第四节 总体比率差异的假设检验
一、两个独立样本比率差异的显著性检验 例如: 检验的步骤: (3)统计决断 根据双侧Z检验统计决断规则, ∣Z∣=3.73﹡﹡>2.58=Z0.01,则P<0.01, 于是在0.01显著性水平上拒绝H0而接受H1。 其结论为:两种方法的效果有极其显著性差异。