如何快速识别“二项分布”与“超几何分布”
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在离散型变量综合题型中,如何快速地识别“二项分布”与“超几何分布”
两种分布列的区分应按下述步骤进行快速识别:
(一)从抽样方法来区分。
若在题干中出现明显的“放回抽样”、“不放回抽样”、“一次性抽取几件”、“n次独立重复试验”等字眼时,“放回抽样”、“n次独立重复试验”对应“二项分布”,“不放回抽样”对应“超几何分布”,“一次性抽取几件”可以理解为“不放回地抽取一件,连续抽取几次”,这样就对应“超几何分布”了。
(二)若是没有明显字眼特征,则第二步马上应“从抽取产品的总数N和其中所含次品的件数M是否明确来区分”
注意:题中若出现“用频率估计概率”、“以样本推断总体”等字眼时,应判断为“总体数N不确定”,适用“二项分布”。
这是因为:“用频率估计概率”本身“概率”就是发生的可能性大小,具有不确定性,“以样本推断总体”中的“推断”就是“估计、大概”的意思,具有不确定性。
例:某工厂为检验其所生产的产品的质量,从所生产产品中随机抽取10件进行抽样检验,检测出有两件次品.
(1)从这10件产品中随机抽取3件,其中次品件数为X,求X分布列和期望;
(2)用频率估计概率,若所生产的产品按每箱100件装箱,从一箱产品中随机抽取3件,其中次品件数为Y,求Y分布列和期望;
(3)用频率估计概率,从所生产的产品中随机抽取3件,其中次品件数为Z,求Z分布列和期望.
分析:第(1)问中,抽取产品的总体N=10,所含次品件数M=2,都是明确的,所以该随机变量的分布为超几何分布。
第(2)问是从一箱产品中抽取,产品的总体N=100是明确的,但其中有多少件
次品M是不明确的,有的同学根据样本可认为M=20,但违背了题目中的“用频率估计概率”这一条件,或者说没有理解这句话的含义,本质上就是概率的定义没有理解。
据概率定义,“用频率估计概率”这一条件应理解为:从这100件产品中任意抽取1件产品,该件产品是次品的概率是0.2,同时抽取3件等同于不放回抽1件3次,由于每次的概率都是0.2,因此,可看成独立重复实验,该随机变量的分布为二项分布。
第(3)问是从所生产的全部产品中抽取,而全部产品有多少件题目条件没给出,这时总体N不明确(若总体N明确,就属于第(2)问情况),其中所含次品件数M 自然也是不明确的。
因此,类似的,在“用频率估计概率”这一条件,该随机变量的分布为二项分布。
(三)做完上述两步后,若还不能判断分布类型,则应据“二项分布”与“超几何分布”的区别进行区分:
1、对试验类型进行判断。
若试验符合以下条件:
①在每次试验中只有两种可能的结果,而且是互相对立的;
②每次实验是独立的,与其它各次试验结果无关;
③结果事件发生的概率在整个系列试验中保持不变,则这一系列试验服从二次分布.
2、做完对试验类型的判断后,再根据以下进行判断:
(1)“二项分布”所满足的条件
①每次试验中,事件发生的概率是相同的;是一种放回抽样.②各次试验中的事件是相互独立的;③每次试验只有两种结果,事件要么发生,要么不发生;④随机变量是这n次独立重复试验中事件发生的次数.
(2)“超几何分布”的本质:在每次试验中某一事件发生的概率不相同,是不放
回抽样,“当样本容量很大时∞→n ,超几何分布近似于二项分布;
3、应注意:
(1)“二项分布”和“超几何分布”是两种不同的分布,但其期望是相等的.即:把一个分布看成是“二项分布”或“超几何分布”时,它们的期望是相同的.事实上,
对于“超几何分布”中,若N M p =,则N M n C C C k X E k i n N k n M N N M ⋅=⋅⋅=∑=--1
)(,而“二项分布”中,p n X E ⋅=)(,
“超几何分布”和“二项分布”的这种“巧合”,使得“超几何分布”期望的计算大简化.(注:在超几何分布中,样本容量∞→n 时,频率
→N M 概率p ) 共同点:每次试验只有两种可能的结果:成功或失败。
不同点:1、超几何分布是不放回抽取,二项分布是放回抽取;
(2)超几何分布需要知道总体的容量,二项分布不需要知道总体容量,但要知道“成功率”;
联系:当产品的总数很大时,超几何分布近似于二项分布。
因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的.。