统计与统计案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计与统计案例
一. 知识回顾: (一)抽样:
1.简单随机抽样
(1)定义:设一个总体含有N 个个体,从中_________抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都________,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法:__________和____________.
2.系统抽样的步骤:假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体进行________;
(2)确定____________,对编号进行________.当N n (n 是样本容量)是整数时,取k =N
n
;
(3)在第1段用________________确定第一个个体编号l (l ≤k);
(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号________,再加k 得到第3个个体编号________,依次进行下去,直到获取整个样本. 3.分层抽样
(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围:当总体是由____________________组成时,往往选用分层抽样. (二)用样本估计总体: 1.常用的统计图表
(1)频率分布直方图①小长方形的高=_____②频率=____③各小长方形的面积之和=_____ (2)茎叶图:在样本数据较少时,用茎叶图表示数据的效果较好. 2.用样本的数字特征估计总体的数字特征:
(1)在一组数据中,出现次数________的数据叫做这组数据的众数. (2)将一组数据按大小依次排列,把处在________位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.
(3)如果有n 个数x 1,x 2,……,x n ,那么x =____________叫做这n 个数的平均数. (4)方差:s 2=_________________________(x n 是样本数据,n 是样本容量,x 是样本平均数). 二.典例分析:
例1.(1)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14
(2)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________. 例2. (1)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,
第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( ) A .6 B .8 C .12 D .18
(2)PM 2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个PM 2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是( ) A .甲 B .乙 C .甲乙相等 D .无法确定
课后作业:
1.某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为( ) A .15 B .16 C .17 D .18
2.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A .200,20
B .100,20
C .200,10
D .100,10
3.某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为___万元.
4.设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( ) A .1+a ,4 B .1+a, 4+a C .1 , 4
D .1, 4+a
5. 某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题: (1)求分数在[50,60]的频率及全班人数;
(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.
甲 乙 2 0.04 1 2 3 6 9 3 0.05 9 6 2 1 0.06 2 9 3 3 1 0.07 9 6 4 0.08 7
7
0.09
2
4
6
例1.(2) 200
课后作业:3. 10
5.解(1)分数在[50,60]的频率为0.008×10=0.08.
由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为
2
0.08=25.
(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]
间的矩形的高为4
25÷10=0.016.