2021届步步高数学大一轮复习讲义(文科)第十章 10.2随机抽样、用样本估计总体

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§10.2随机抽样、用样本估计总体

1.随机抽样

(1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.

(2)系统抽样:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样.(3)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.

2.用样本的频率分布估计总体分布

(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.

(2)频率分布折线图和总体密度曲线

①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;

②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.

(3)茎叶图

茎是指中间的一列数,叶是从茎的旁边生长出来的数.

3.用样本的数字特征估计总体的数字特征

(1)众数:一组数据中出现次数最多的数.

(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.

(3)平均数:x =x 1+x 2+…+x n

n ,反映了一组数据的平均水平.

(4)标准差:是样本数据到平均数的一种平均距离, s =

1

n

[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (5)方差:s 2=1

n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样

本平均数).

概念方法微思考

1.三种抽样方法有什么共同点和联系?

提示 (1)抽样过程中每个个体被抽取的机会均等.

(2)系统抽样中在起始部分抽样时采用简单随机抽样;分层抽样中各层抽样时采用简单随机抽样或系统抽样.

2.平均数、标准差与方差反映了数据的哪些特征?

提示 平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.

题组一 思考辨析

1.判断下列结论是否正确(请在括号中打“√”或“×”)

(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( × ) (2)系统抽样在第1段抽样时采用简单随机抽样.( √ )

(3)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) 题组二 教材改编

2.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( ) A .33,34,33 B .25,56,19 C .20,40,30 D .30,50,20

答案 B

解析 设在不到35岁的员工抽取x 人,则100500=x

125,所以x =25,同理可得这三个年龄段抽

取人数分别为25,56,19.

3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )

A .91.5和91.5

B .91.5和92

C .91和91.5

D .92和92

答案 A

解析 ∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+92

2=91.5,

平均数x =87+89+90+91+92+93+94+96

8

=91.5.

4.如图是100位居民月均用水量的频率分布直方图,则月均用水量在[2,2.5)范围内的居民有______人.

答案 25

解析 0.5×0.5×100=25. 题组三 易错自纠

5.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是() A.5,10,15,20,25 B.3,13,23,33,43

C.1,2,3,4,5 D.2,4,6,16,32

答案 B

解析间隔距离为10,故可能的编号是3,13,23,33,43.

6.若数据x1,x2,x3,…,x n的平均数x=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3x n+1的平均数和方差分别为________.

答案16,18

解析∵x1,x2,x3,…,x n的平均数为5,

∴x1+x2+x3+…+x n

n

=5,

∴3x1+3x2+3x3+…+3x n

n

+1=3×5+1=16,

∵x1,x2,x3,…,x n的方差为2,

∴3x1+1,3x2+1,3x3+1,…,3x n+1的方差是32×2=18.

抽样方法

1.用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( ) A.110,110 B.310,15 C.15,310 D.310,310

答案 A

解析 方法一 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为1

10

.故选A.

方法二 第一次被抽到,显然为1

10;第二次被抽到,首先第一次不能被抽到,第二次抽才被

抽到.可能性为910·19=1

10

.故选A.

2.(2019·全国Ⅰ)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( ) A .8号学生 B .200号学生 C .616号学生 D .815号学生 答案 C

解析 根据题意,系统抽样是等距抽样, 所以抽样间隔为1 000100

=10.

相关文档
最新文档