总体比例的检测和置信区间
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
下面进一步计算在二项分布假定下,总体比例
π的100(1-α)%置信区间(π1, π2).
其上限π2应为满足 不等式的π;
i x0ini(1)ni
/2
下限π1应为满足 不等式的π。
n
ixΒιβλιοθήκη Baidu
ini(1)ni
/2
计算后例2.1中π的95%的置信区间为
(0.000506,0.106469)
可编辑版
下面进一步计算k的100(1-α)%置信区间
(k1,k2),或者π=k/N的100(1-α)%置信区间
(π1, π2)= (k1/N, k2/N)。
上限k2为满足不等式
x
P (x,k,N k,n ) p (i,k,N k,n ) /2
的最小的k;
i 0
下限k1为满足不等式P (x ,k,N k,n ) i x 0p (i,k,N k,n ) 1 /2 的最大的k。参见p29的表。
x
p=P(X 1) p(i, 40, 400 40,50) i0
40 400-40 40 400-40
0
50-0
1
50-1
0.02637
400
400
50
50
可编辑版
5
第一节 小总体情况——超几何分布
对于通常的显著性水平α=0.05,可以拒绝零 假设,得出支持出入下车的学生比例不足10% 的结论。
z x n0 9 7 9 1 7 9 2 0 .5 4 .9 2 1 5 3 n0 ( 1 0 ) 1 7 5 2 0 .5 0 .5
对应的p值=φ(z)≈1-φ(4.92153)≈0.0000.
如果考虑连续性修正 zxn00.54.897639 n0(10)
对应的p值=1-φ(z)≈0.0000.和不修正差不多。
可编辑版
11
第二节 大总体情况—二项分布及大样本正态近似
而总体比例π的95%置信区间为
z/2
(1)
n
即例2.2的总体比例π的95%置信区间为 (0.5232666,0.5693673),和二项分布得到的区 间大体相同。
小结:p35
可编辑版
12
符号检验(二项检验)在excel中的运用
例:某种超常记忆训练法声称可以让80%的普通学生
如果用二项分布模型Bin(1752,π) ,要计算x=979及 更极端情况的概率P(x≥979)作为p值。
P(X979)i17957291i7520.5i0.51752i
4.718694e070.00000
可编辑版
9
第二节 大总体情况—二项分布及大样本正态近似
因此,即使对于通常的显著性水平α=0.001, 也可以拒绝零假设,得出大部分支持减少必修 课的结论。同时可以计算出π的95%置信区间 为(0.53517,0.58221).
8
第二节 大总体情况—二项分布及大样本正态近 似
例2.2:随机调查多所大学的1752个学生,有979个支 持减少必修课。能否说该市高校中有多于50%的学生 都支持减少必修课的建议?能否找到支持这个建议的 人数总体比例π的95%置信区间?
这是一个大总体、大样本的问题。要检验的假设为:
: H0: π= 0.5与H1 π> 0.5
第二章 总体比例的检测和置信区间
第一节 小总体情况——超几何分布 第二节 大总体情况——二项分布及 大样本
正态近似
可编辑版
1
教学重点
根据不同的总体和样本选用 适当方法检验总体分布比例 计算总体比例的置信区间估 计(置信度为1-α)
可编辑版
2
第一节 小总体情况——超几何分布
在总体量N较小时检测总体比例用超几何分布。 Hyper(x,k,N-k,n),其中,x和k分别是样本或 总体中具有某种特征的个体数;N和n分别是总 体和样本数;同时,π= k/ N和π0= x / n分 别是总体和样本中具有某种特征的比例。
在1个小时内掌握60个单词,现随机抽取20个学生进
行训练,其单词记忆个数如图16.1中列B所示,试检
验该训练法的成功(1小时掌握60个单词)概率是否
能达到0.8(α=0.05)?H0:
H1:
其操作步骤为:
1.在AB列输入原始数据;
2. 将 原 始 数 据 转 换 为 二 项 数 据 , 在 C2 输 入 =IF(B2>=60,1,0) , 拖 拉 填 充 句 柄 往 下 一 直 复 制 到 C21处;
按二项分布的公式
P(Xx)i x0ini(1)ni,(0in)
得p值为
P(X 1)
1 i0
ini
(1)ni
5000.100.950 1500可.1编1辑0版.949 0.03379
7
第二节 大总体情况—二项分布及大样本正态近
似
因此,对于通常的显著性水平α=0.05,可以 拒绝零假设,得出支持出入下车的学生比例不 足10%的结论。
可编辑版
6
第二节 大总体情况—二项分布及大样本正态近
似
当总体量N很大时,超几何分布 Hyper(x,k,Nk,n)用二项分布Bin(n,π)近似。
例2.1(续)检验假设不变,二项分布的模型
是Bin(50,π),在零假设成立时为
Bin(50,0.1)。下面计算至少有1人不赞成的概
率P(x≤1)的值
正态近似:在样本量n很大时,可用均值为nπ, 方差为nπ(1-π)的正态分布来对二项分布 Bin(n,π)近似.这时,检验的假设为H0: π=π0对单边或双边的H1。检验统计量
Z n n0 n0(10)
可编辑版
10
第二节 大总体情况—二项分布及大样本正态近似
把观察到的 =x/n代入检验统计量Z,就得到 Z的实现:
例2.1:p26,学生赞成“骑自行车在校门口 应该下车”的比例检测。假设样本n=50,其 中只有1人赞成该下车,问能否说“至少有 10%的学生赞成下车的规定”?
可编辑版
3
第一节 小总体情况——超几何分布
首先,计算样本中赞成的比例π0= x / n= 1 / 50=0.02,显然低于10%,因此我们有理由怀疑 总体中赞成的比例不会超过10%,这样可以建 立如下假设:
H0: π= π0= 0.1
: H1 π<π0= 0.1
可编辑版
4
第一节 小总体情况——超几何分布
其次,假设总体量不大,N=400,应该用超几 何分布Hyper(x,k,N-k,n)来检测,如此原假设
: 就等价于如下假设H0: k=40 与H1 k<40
而超几何分布的模型为Hyper(1,k,400-k,50), 需要计算x≤1的概率p值,即