第43讲 抽样方法、用样本估计总体
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章概率与统计
知识体系【p98】
第43讲抽样方法、用样本估计总体
夯实基础【p98】
【学习目标】
1.了解三种抽样方法:简单随机抽样、分层抽样、系统抽样.
2.掌握“一表三图”:频率分布表、频率分布直方图、折线图、茎叶图.
3.会求“六种数”:众数、中位数、平均数、极差、方差、标准差.
【基础检测】
1.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是() A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法
【解析】显然,调查②为简单随机抽样,而对于调查①,因地区不同产品的销售情况会有差异,因此要采取分层抽样,故选B.
【答案】B
2.某校1 000名学生中,O型血有450人,A型血有200人,B型血有200人,AB型血有150人,为了研究血型与血弱的关系,从中抽取容量为40的样本,按照分层抽样的方法抽取样本,则O型血,A型血,B型血,AB型血的人应分别抽取的人数为() A.16、10、10、4 B.18、8、8、6
C.18、10、10、2 D.15、8、8、9
【解析】分层抽样为按比例抽样,则O型血抽取的人数为40×
450
1 000=18;A型血抽取
的人数为40×
200
1 000=8;B型血抽取的人数为40×
200
1 000=8;AB型血抽取的人数为40×
150
1 000
=6.故本题答案选B.
【答案】B
3.滴滴公司为了调查消费者对滴滴打车出行的真实评价,采用系统抽样方法从2 000人中抽取100人做问卷调查,为此将他们随机编号1,2,…,2 000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的100人中,编号落入区间[1,820]的人做问卷A,编号落入区间[821,1 520]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为()
A.23 B.24 C.25 D.26
【解析】若采用系统抽样方法从2 000人中抽取100人做问卷调查,则需要分为100组,每组20人,若第一组抽到的号码为9,则以后每组应抽取的号码分别为29,49,69,89,109,…,
所以抽到的号码构成以9为首项,20为公差的等差数列,
此等差数列的通项公式为a n=9+20(n-1)=20n-11.
由题意可知,落在区间[1 521,2 000]的有:
1 521≤20n-11≤
2 000,n∈Z,
解得:76.6≤n≤100.55,n∈Z,所以77≤n≤100,n∈Z.
编号落入区间[1 521,2 000]的有24(人),
故选B.
【答案】B
4.为了解某校高二1 000名学生的体能情况,随机抽查部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()
A.该校高二学生1分钟仰卧起坐的次数超过30次的人数约有200人
B.该校高二学生1分钟仰卧起坐的次数少于20次的人数约有20人
C.该校高二学生1分钟仰卧起坐的次数的中位数为25.25次
D.该校高二学生1分钟仰卧起坐的次数的众数为27.5次
【解析】图象的纵坐标是频率比组距,故仰卧起坐的次数超过30次的频率为0.04×5=0.2,故人数有0.2×1 000=200,A是正确的;
同理次数少于20次的频率为0.1,人数为100人,故B 是错误的;
高二学生1分钟仰卧起坐的次数的中位数为25+x ,则0.1+0.3+0.4×x =0.5,x =0.25.故得到中位数为:25.25,故C 是正确的;
众数即出现最多的次数,频率最大的,在25到30之间,取中间值27.5即可,故D 也是正确的.
故选B.
【答案】B
【知识要点】
1.抽样方法
(1)抽样要具有随机性、等可能性,这样才能通过对样本的分析和研究更准确地反映总体的情况,常用的抽样方法有__简单随机抽样__、__分层抽样__、__系统抽样__.
(2)简单随机抽样是指一个总体的个数为N(较小的有限数),通过逐个抽取一个样本,且每次抽取时每个个体被抽取的概率相等.简单随机抽样的两种常用方法为__抽签法和随机数表法__.
(3)分层抽样是总体由差异明显的几部分组成,常将总体按差异分成几个部分,然后__按各部分所占的比值进行抽样__,其中所分成的各部分叫作__层__.
(4)系统抽样是当总体中的个数较多时,将总体均分成几部分,按事先__确定的规则__在各部分抽取.
2.总体分布的估计
(1)作频率分布直方图的步骤:
①求极差(即一组数据中最大值与最小值的差)
②决定组距与组数
③将数据分组
,以每个组距为底,以各频率除以组距的商为高,分别画矩形,共得k 个矩形,这样得到的图形叫作__频率分布直方图__.
频率分布直方图的性质:①第i 个矩形的面积等于样本值落入区间[t i -1,t i )的频率;②由于f 1+f 2+…+f k =1,所以所有小矩形的面积的和为1. (2)连接频率分布直方图中各小长方形上边的中点,就得到频率分布折线图,随着样本容量的增加,折线图会越来越近似于一条光滑曲线,称之为__总体密度曲线__.
(3)统计中还有一种被用来表示数据的图叫茎叶图,茎是__中间的一列数__,叶是从__茎旁边上长出来的数__.
用茎叶图表示数据有两个突出的优点:一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时随时记录,方便记录与表示.
3.平均数和方差的计算
(1)如果有n 个数据x 1,x 2,…,x n ,则x =__1n
(x 1+x 2+…+x n )__叫作这组数据的平均数,s 2=__1n
[(x 1-x)2+(x 2-x)2+…+(x n -x)2] 叫作这组数据的方差,而s 叫作标准差. (2)公式s 2=__1n
[(x 21+x 22+…+x 2n )-nx 2] . (3)当一组数据x 1,x 2,…,x n 中各数较大时,可以将各数据减去一个适当的常数a ,得
到x 1′=x 1-a ,x 2′=x 2-a ,…,x n ′=x n -a ,则s 2=__1n
[(x′21+x′22+…+x′2n )-nx ′2] .