第七讲 随机抽样、样本估计总体及正态分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七节随机抽样、样本估计总体
及正态分布
学习目标:理解随机抽样的必要性和重要性;会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法;了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点;理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题;利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义。
一、例题分析:
例1.1、某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是()
A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法
2、(09广东)某单位200名职工的年龄分布情况如图2,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是。若用分层抽样方法,则40岁以下年龄段应抽取人.
小结:三种抽样方法的联系与区别:
从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是 ( ) (A)简单随机抽样法(B)抽签法 (C)随机数表法 (D)
2、(理科做)(09湖南)一个总体分为A,B两层,其个体数之比为
用分层抽样方法从总体中抽取一个容量为10的样本,已知B
层中甲、乙都被抽到的概率为1/28,则总体中的个数数位。
例2.1、(09山东)某工厂对一批产品进行了抽样检测.右图是
根据抽样检测后的产品净重(单位:克)数据绘制的频率分布
直方图,其中产品净重的范围是[96,106],样本数据分组为
[96,98),[98,100),[100,102),[102,104),[104,106],已知样
本中产品净重小于100克的个数是36,则样本中净重大于或等于98
品的个数是( ) A.90 B.75 C. 60 D.45 2、某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们所有
比赛得分的情况用如图2所示的茎叶图表示, 则甲、乙两名运动
员得分的中位数分别为( ) A .19、13 B .13、19 C .20、18 D .18、20
3、(09江苏)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:则这两组数据的方差中较小的一个为2
s = .小结:1、样本估计总体的方法有两种:①用样本的频率分布估计总体(如频率分布直方图、频率分布折线图、茎叶图)②用样本的数字特征估计总体(如平均数、标准差、方差等); 2、方差和标准差都是刻画数据波动大小的数字特征,一般地,设一组样本数据1x ,2x ,…,
n x ,其平均数为-x =1n
i i X n
=∑,则方差21
2)(1 x x n s n i i -=∑=,标准差
21
)(1-=-=∑x x n s n
i i ;
3、中位数、众数的概念:
4、在频率分布直方图中:①小矩形的面积=组距
组距频率
⨯
=频率;②众数最高矩形的中点的横
坐标;③中位数的左边与右边的直方图的面积相等,可以由此估计中位数的值 拓展变式:1、设矩形的长为a ,宽为b ,其比满足b ∶a =
618.02
1
5≈-,这种矩形给人以美感,称为黄金矩形。黄金矩形常应用于工艺品设计中。下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620 根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( ) A. 甲批次的总体平均数与标准值更接近 B. 乙批次的总体平均数与标准值更接近 C. 两个批次总体平均数与标准值接近程度相同 D. 两个批次总体平均数与标准值接近程度不能确定
2、下图是样本容量为200的频率分布直方图。 根据样本的频率分布直方图估计,样本数据落在【6,10】内的频数为 ,数据落在(2,10)内的概率约为 。
3、随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获
得身高数据的茎叶图如图7。(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173cm 的同学,求身高为176cm 的同学被抽中的概率。
例3.(理科做)(08安徽).设两个正态分布2111()(0)N μσσ>,和2
222()(0)N μσσ>,的密度函数图像如图所示。则有( )
A .1212,μμσσ<<
B .1212,μμσσ<>
C .1212,μμσσ><
D .1212,μμσσ>> 小结:
正态曲线的性质:①曲线位于x 轴上方,与x 轴不相交; ②曲线是单峰的,关于直线x =μ 对称;③曲线在x =μ处达到峰值
π
σ21
;④曲线与x 轴之间的面积为1;⑤当σ一定时,曲线随μ质的变化沿x 轴平
移;⑥当μ一定时,曲线形状由σ确定:σ越大,曲线越“矮胖”,表示总体分布越集中;σ越小,曲线越“高瘦”,表示总体分布越分散。
二、体验高考:
1
则样本数据落在上的频率为
A. 0.13
B. 0.39
C. 0.52
D. 0.64 2、(11湖北理5)已知随机变量ξ服从正态分布(
)2
,2σ
N ,且()8.04=<ξP ,则
()=<<20ξP ( ) A. 6.0 B . 4.0 C. 3.0 D. 2.0
3、一汽车厂生产A,B,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):按类型分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A 类轿车10辆 (1)求z 的值.
(2)用分层抽样的方法在C 类轿车中抽取一个容量为5的样本.将该样本看成一个总体,从中任取2辆,求至少有1辆舒适型轿车的概率;
三、巩固提高:
1、对于样本频率分布直方图与总体密度曲线的关系,下列说法正确的是( ) A 、频率分布直方图与总体密度曲线无关 B 、频率分布直方图就是总体密度曲线
C 、样本容量很大的频率分布直方图就是总体密度曲线
D 、如果样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于总体密度曲线
2、某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1:2:1,用
轿车A 轿车B 轿车C 舒适型 100 150 z 标准型 300 450 600