第二章 总体比例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)如何计算总体中感兴趣个体的比例 π = k N的置 信度为1 − α 的置信区间?
模型的选择
总体量N比较小 选择超几何分布 总体量 比较小,选择超几何分布 比较小 选择超几何分布Hyper(x,k,N-k,n); 总体量N比较大 可用二项分布模型Bin(n,π )近似 在 比较大,可用二项分布模型 近似;在 总体量 比较大 可用二项分布模型 近似 小样本时,可对该近似的二项分布模型求精确解 可对该近似的二项分布模型求精确解; 小样本时 可对该近似的二项分布模型求精确解 在大总体及大样本时,即 很大同时 也很大时,而且 很大同时n也很大时 在大总体及大样本时 即N很大同时 也很大时 而且 二项分布的解不易求出时,可用正态分布来近似二项分 二项分布的解不易求出时 可用正态分布来近似二项分 布.
2.2 大总体情况---二项分布及其大样本正态近似
例2.1(续)若总体量很大,则可以用二项分布来进行检验及求其置 信区间.
H 0 : π = 0.1 ⇔ H1 : π < 0.1
在零假设下,我们的模型为Bin(50,0.1)
n i P ( X ≤ 1) = ∑ π (1 − π ) n −i ≈ 0.03379 i =0 i
40 400 − 40 1 i 50 − i P ( X ≤ 1) = ∑ ≈ 0.02637 400 i =0 50
因此,对于显著性水平为0.05时,可以拒绝零假设,即支持出入 下车的学生不足十分之一的结论.
问题2 问题2的解答
在超几何分布模型中,问题2转化为: 在超几何分布模型中,问题2转化为: 求关于k 求关于k的1 − α 置信区间 ( k1 , k2 ). 不加证明地有: 不加证明地有:
1
因此,对于显著性水平为0.05时,可以拒绝零假设,即支持出入 下车的学生不足十分之一的结论.
置信区间
精确置信区间 (π 1 , π 2 ) π2 : x n i n −i
∑ i π (1 − π )
i =0
=α 2
π1 :
n i π (1 − π ) n −i = α 2 ∑i i=x
n
例2.2的解答
要检验:
H 0 : π = 0.5 ⇔ H1 : π > 0.5
在零假设下,我们的模型是Bin(1752,0.5).
1752 i P( X ≥ 979) = ∑ π (1 − π )1752−i ≈ 0.0000 i i = 979
1752
因此,对于显著性水平为0.05时,可以拒绝零假设,认为大部分学 生都支持减少必修课的建议.
p值 = Φ ( z ) = Φ (−1.885618) ≈ 0.02967322
连续性修正: x − nπ 0 + 0.5 z= ≈ −1.649916 nπ 0 (1 − π 0 )
p值 = Φ ( z ) = Φ (−1.649916) ≈ 0.04948008
π 的置信区间
必须在(0,1)内.
ˆ (π − 3
ˆ ˆ π (1 − π ) n
ˆ ,π + 3
ˆ ˆ π (1 − π ) n
)
例2.1(续)
利用大样本正态近似进行检验: H 0 : π = 0.1 ⇔ H1 : π < 0.1 检验统计量Z有实现值 x − nπ 0 1 − 50 × 0.1 = ≈ −1.885618 z= nπ 0 (1 − π 0 ) 50 × 0.1(1 − 0.1)
Z=
ˆ nπ − nπ 0 nπ 0 (1 − π 0 )
ຫໍສະໝຸດ Baidu
在零假设下,Z有近似的标准正态分布( 在零假设下,Z有近似的标准正态分布(通常用 Φ ( • )表示其累积 ,Z有近似的标准正态分布 分布函数). 分布函数).
例2.2的解答(续)
应用正态近似解答: 应用正态近似解答: 检验统计量的实现值 x − nπ 0 979 − 1752 × 0.5 z= = ≈ 4.9215 nπ 0 (1 − π 0 ) 1752 × 0.5(1 − 0.5)
第二章 总体比例的检测和置信区间
在校园中,很多学生认为乘车出入校园不用下车 很多学生认为乘车出入校园不用下车,而骑自 例2.1 在校园中 很多学生认为乘车出入校园不用下车 而骑自 行车必须下车的规定很不公平,是对无机动车族的歧视 于是, 是对无机动车族的歧视.于是 行车必须下车的规定很不公平 是对无机动车族的歧视 于是 在有N个学生的校园中对学生进行 个学生的校园中对学生进行” 在有 个学生的校园中对学生进行”骑自行车出入是否应该 下车”的调查. 下车”的调查 假定总体中支持 该规定的人数占总学生人数的比例为未 在随机调查了n=50个学生之后 结果仅有 个学生之后,结果仅有 知的 π .在随机调查了 在随机调查了 个学生之后 结果仅有x=1人认为 人认为 应该下车. 应该下车 问题:(1)能不能说该校不足有 能不能说该校不足有10%学生支持规定 学生支持规定? 问题 能不能说该校不足有 学生支持规定 (2)总体比例的置信度为 1 − α)的置信区间如何估计 总体比例的置信度为( 的置信区间如何估计? 总体比例的置信度为 的置信区间如何估计
k2 应该为满足不等式
的最小的k. 的最小的k.
k N − k x i n − k P ( x, k , N − k , n ) = ∑ ≤α 2 N i =0 n
k N − k x i 50 − k P ( x, k , N − k , n ) = ∑ ≥ 1−α 2 N i =0 n
k1应该为满足不等式
的最大的k. 的最大的k.
R软件的应用
检验问题
R软件: 软件:
H1 : π < π 0 H 0 : π = π 0 ⇔ 或H1 : π > π 0 或H : π ≠ π 1 0
PH 0 ( X ≤ x)
• phyper(x,k0,N-k0,n) phyper(x,k0,N-
在某城市多所大学校园随机抽查了n=1752个学生, n=1752个学生 例2.2 在某城市多所大学校园随机抽查了n=1752个学生,有 x=979个支持减少必修课的建议 个支持减少必修课的建议. x=979个支持减少必修课的建议. 问题:(1)能不能说本市学生中有多于50%的学生都支持这个 问题:(1)能不能说本市学生中有多于50%的学生都支持这个 :(1)能不能说本市学生中有多于50% 建议? 建议? (2)能不能找到支持这个建议的总体比例的置信区间 能不能找到支持这个建议的总体比例的置信区间? (2)能不能找到支持这个建议的总体比例的置信区间?
大样本结论(假设检验)
当样本量n大的时候, 当样本量n大的时候,可用均值为 nπ ,方差为nπ (1 − π )的正态分 布来对二项分布Bin(n, )近似 近似. 布来对二项分布Bin(n,π )近似. H1 : π < π 0 此时,对于检验: 此时,对于检验: H 0 : π = π 0 ⇔ 或H1 : π > π 0 或H : π ≠ π 1 0 检验统计量
p值 = 1 − Φ ( z ) ≈ 0.0000
使用连续性修正: 使用连续性修正:
z= x − nπ 0 − 0.5 nπ 0 (1 − π 0 ) ≈ 4.897639
p值 = 1 − Φ ( z ) ≈ 0.0000
大样本结论(置信区间)
总体比例 π 的置信度为(1 − α )的置信区间为:
ˆ (π − zα 2
例2.2(续)
ˆ ˆ π (1 − π ) n
ˆ , π − zα 2
ˆ ˆ π (1 − π ) n
)
大样本近似需要甚么条件?
没法说出充分条件,只有一些必要条件. 较粗率的标准是: π 0 (1 − π 0 ) π 0 (1 − π 0 ) ,π 0 + 3 ) 对于检验 H 0 : π = π 0 ,区间 (π 0 − 3 n n 必须在(0,1)内;
一般的问题
假定总体由N个个体组成,具有某种感兴趣性质的个体数目
π 为未知的k,其在总体中的比例为 = k N.抽取样本量为n的一个 样本,其中感兴趣的个体有x个. 问题:(1) H1 : π < π 0
H 0 : π = π 0 ⇔ 或H1 : π > π 0 或H : π ≠ π 1 0
H1 : π < π 0
H1 : π > π 0
H1 : π ≠ π 0
• 1-phyper(x-1,k0,N-k0,n) P ( X ≥ x) phyper(x-1,k0,NH0
• 2*phyper(xs,k0,N-k0,n) 2 PH ( X ≤ min( x, n − x)) 2*phyper(xs,k0,N0
2.1 小总体情况---超几何分布
例2.1(续)假定该校区有N=400个学生. 问题1: H : π = 0.1 ⇔ H : π < 0.1
0 1
在超几何分布模型中,问题转化为:
H 0 : k = 40 ⇔ H1 : k < 40
问题1的解答
解:在零假设下,总体X为Hyper(1,40,400-40,50).