(抽样检验)统计、抽样方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计、抽样方法
一、教学目标
1.随机抽样。
2.用样本估计总体。
3.变量的相关性。
二、知识提要
1.抽样
当总体中的个体较少时,一般可用简单随机抽样;当总体中的个体较多时,一般可用系统抽样;当总体由差异明显的几部分组成时,一般可用分层抽样,而简单随机抽样作为一种最简单的抽样方法,又在其中处于一种非常重要的地位.实施简单随机抽样,主要有两种方法:抽签法和随机数表法.
系统抽样适用于总体中的个体数较多的情况,因为这时采用简单随机抽样就显得不方便,系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均匀分后的每一段进行抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样也属于等概率抽样.
分层抽样在内容上与系统抽样是平行的,在每一层进行抽样时,采用简单随机抽样或系统抽样,分层抽样也是等概率抽样.
2.样本与总体
用样本估计总体是研究统计问题的一种思想方法.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图,当总体中的个体取不同值较多,甚至无限时,其频率分布的研究要用到初中学过的整理样本数据的知识.
用样本估计总体,除在整体上用样本的频率分布去估计总体的分布以外,还可以从特征数上进行估计,即用样本的平均数去估计总体的平均数,用关于样本的方差(标准差)去估计总体的方差(标准差).
3.正态分布
正态分布在实际生产、生活中有着广泛的应用,很多变量,如测量的误差、产品的尺寸等服从或近似服从正态分布,利用正态分布的有关性质可以对产品进行假设检验.
4.线性回归直线
设x 、y 是具有相关关系的两个变量,且相应于n 组观察值的n 个点大致分布在一条直线的附近,我们把整体上这n 个点最接近的一条直线叫线性回归直线.
三、基础训练
1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体入样的概率是( )
A.
310
C 3
B.
8
9103
⨯⨯
C.
10
3 D.
10
1 2.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )
h)
A.0.6 h
B.0.9 h
C.1.0 h
D.1.5 h
3.如果随机变量ξ~N(μ,σ2),且Eξ=3,Dξ=1,则P(-1<ξ≤1)等于( )
A.2Φ(1)-1
B.Φ(4)-Φ(2)
C.Φ(2)-Φ(4)
D.Φ(-4)-Φ(-2)
4..为考虑广告费用x与销售额y之间的关系,抽取了5家餐厅,得到如下数据:
现要使销售额达到6万元,则需广告费用为______.(保留两位有效数字)
四、典型例题
【例1】某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.
【例2】已知测量误差ξ~N(2,100)(cm),必须进行多少次测量,才能使至少有一次测量误差的绝对值不超过8 cm的频率大于0.9?
五、达标检测
1.对总数为N的一批零件抽取一个容量为30的样本,若每个零件被抽取的概率为0.25,则N等于( )
A.150
B.200
C.120
D.100
2.设随机变量ξ~N(μ,σ),且P(ξ≤C)=P(ξ>C),则C等于( )
A.0
B.σ
C.-μ
D.μ
3.(2003年全国,14)某公司生产三种型号的轿车,产量分别为1200辆、6000辆和2000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取______辆、______辆、______辆.
4.某厂生产的零件外直径ξ~N(8.0,1.52)(mm),今从该厂上、下午生产的零件中各随机取出一个,测得其外直径分别为7.9 mm和7.5 mm,则可认为( )
A.上、下午生产情况均为正常
B.上、下午生产情况均为异常
C.上午生产情况正常,下午生产情况异常
D.上午生产情况异常,下午生产情况正常
5.随机变量ξ服从正态分布N(0,1),如果P(ξ<1)=0.8413,求P(-1<ξ<0).
6.公共汽车门的高度是按照确保99%以上的成年男子头部不跟车门顶部碰撞设计的,如果某地成年男子的身高ξ~N(173,72)(cm),问车门应设计多高?
基础训练
1.解析:简单随机抽样中每一个体的入样概率为
N
n . 答案:C
2.解析:一天平均每人的课外阅读时间应为一天的总阅读时间与学生数的比,即 50
5
0.2105.1100.1205.050⨯+⨯+⨯+⨯+⨯=0.9 h.
答案:B
3.解析:对正态分布,μ=E ξ=3,σ2
=D ξ=1,故P (-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2).
答案:B
4.解析:先求出回归方程y
ˆ=bx+a ,令y ˆ=6,得x=1.5万元. 答案:1.5万元
典型例题
【例1】剖析:要说明每个个体被取到的概率相同,只需计算出用三种抽样方法抽取个体时,每个个体被取到的概率.
解:(1)简单随机抽样法:可采取抽签法,将160个零件按1~160编号,相应地制作1~160号的160个签,从中随机抽20个.显然每个个体被抽到的概率为
16020=8
1
. (2)系统抽样法:将160个零件从1至160编上号,按编号顺序分成20组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k 号(1≤k ≤8),则在其余组中分
别抽取第k+8n (n=1,2,3,…,19)号,此时每个个体被抽到的概率为8
1.
(3)分层抽样法:按比例
16020=8
1
,分别在一级品、二级品、三级品、等外品中抽取48×81=6个,64×81=8个,32×81=4个,16×81=2个,每个个体被抽到的概率分别为486,
648,324,162,即都是8
1. 综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是8
1
.
评述:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性.
思考讨论:现有20张奖券,已知只有一张能获奖,甲从中任摸一张,中奖的概率为20
1
,刮开一看没中奖.乙再从余下19张中任摸一张,中奖概率为
19
1
,这样说甲、乙中奖的概率不一样,是否正确?
【例2】解:设η表示n 次测量中绝对误差不超过8 cm 的次数,则η~B (n ,p ).
其中P=P (|ξ|<8)=Φ(
1028-)-Φ(10
2
8--)=Φ(0.6)-1+Φ(1)=0.7258-1+0.8413=0.5671.
由题意,∵P (η≥1)>0.9,n 应满足P (η≥1)=1-P (η=0)=1-(1-p )n
>0.9,