用样本估计总体教案(绝对经典)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§11.2 统计图表、数据的数字特征、用样本估计总体
会这样考 1.考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算.主要以选择题、填空题为主;2.考查以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数).
1.统计数据
(1)众数、中位数、平均数、极差、
众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.(可以没有或者多个). 中位数:将一组数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数).
平均数:样本数据的算术平均数,即x =1
n (x 1+x 2+…+x n ).
(2)方差、标准差 方差(
)()(
)[]
222212
1
x x x x x x n
S n -++-+-=
标准差S =
1
n [(x 1
-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.
标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. 2.统计图表
统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图、频率分布直方图等.
(1)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记
录,给数据的记录和表示都带来方便. (2)在频率分布直方图中:
①纵轴表示频率
组距
,
②每小长方形的面积表示该组数据的频率或比例, ③各小长方形的面积之和等于1.
3.用样本估计总体
(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.
(2)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.
4.利用频率分布直方图估计样本的数字特征
(1)众数:最高那组的组中值.
(2)平均数:每个小长方形的面积与每个组中值的乘积之和. (3)中位数:等分面积那条线的横坐标. [难点正本 疑点清源] 1.作频率分布直方图的步骤
(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图. 频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状.
1.一个容量为20的样本,数据的分组及各组的频数如下:
[10,20),2;[20,30),3;[30,40),x ;[40,50),5;[50,60),4;[60,70),2;则x =________;根据样本的频率分布估计,数据落在[10,50)的概率约为________. 答案 4 0.7
2.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是____.
答案 600
3.如上图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.
(注:方差s 2=1
n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)
答案 6.8
4.某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从上图中可以看出被处罚的汽车大约有的辆数为________. 答案 40
题型一 频率分布直方图的绘制与应用
例1 (1)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段
[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:
(1)求分数在[70,80)内的频率,并补全这个频率分布直方图; (2)据此估计本次考试中的平均分和中位数(保留整数).
思维启迪:利用各小长方形的面积和等于1求分数在[70,80)内的频率,再补齐频率分布直方图. 解 (1)设分数在[70,80)内的频率为x ,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x =1,可得x =0.3,所以频率分布直方图如图所示.
(2)平均分为x =45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).中位数为73 探究提高 频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.
(2)从某小学随机抽取l00名同学,将他们的身高(单位:厘米)数据绘制成频率分布图(如上图).若要从身高在[120,130),[130,140),[l40,150]三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[120,130)的学生中选取的人数应为 .
答案:15
题型二 茎叶图的应用
例2 (1)甲、乙两名同学在5次数学考试中,成绩统计用茎叶图表示如图所示,若甲、乙两人的平均成绩分别用x 甲、x 乙表示,则下列结论正确的是( )
A 、x x <甲乙;乙比甲成绩稳定
B 、x x >甲乙;乙比甲成绩稳定
C 、x x <甲乙;甲比乙成绩稳定
D 、x x >甲乙;甲比乙成绩稳定
答案及解析:D
(2)某学校从高二甲、乙两个班中各选6名同掌参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如上图,其中甲班学生成绩的中位数数是81,乙班学生成绩的平均分为81,则成绩更稳定的班级为______.
答案及解析:乙。
.x=2, y=4.
题型三 用样本的数字特征估计总体的数字特征
例3:从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示:
(1)若某高校A 专业对视力的要求在0.9以上,则该班学生中能报A 专业的人数为________. (2)估计该班50名学生的视力的中位数为________.(保留两位小数)
解析 该班学生视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4,故人数为0.4×50=20.
答案 20
方法与技巧
1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
3.若取值x 1,x 2,…,x n 的频率分别为p 1,p 2,…,p n ,则其平均值为x 1p 1+x 2p 2+…+x n p n ;若x 1,x 2,…,x n 的平均数为x ,方差为s 2,则ax 1+b ,ax 2+b ,…,ax n +b 的平均数为a x +b ,方差为a 2s 2.
A 组 专项基础训练
一、选择题
1.有一个容量为66的样本,数据的分组及各组的频数如下:
[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3
根据样本的频率分布估计,数据落在[31.5,43.5)的频率约是
( )
A.16
B.13
C.12
D.23 答案 B
解析 由条件可知,落在[31.5,43.5)的数据有12+7+3=22(个),故所求概率约为2266=13.
2.在某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 ( ) A .92,2
B .92,2.8
C .93,2
D .93,2.8
答案 B 解析 去掉最高分95和最低分89后,剩余数据的平均数为x =92,方差为s 2=1
5
[(90-92)2
+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=1
5(4+4+1+4+1)=2.8.
3.若样本1+x 1,1+x 2,1+x 3,…1+x n 的平均数是12,方差是5,则对样本2+x 1,2+x 2,2+x 3,…2+x n ,下列结论正确的是 ( )
A . 平均数为14,方差为5
B . 平均数为13,方差为25
C . 平均数为13,方差为5
D . 平均数为14,方差为2 【答案】C
4.现有10个数,其平均数是4,且这10个数的平方和是200,那么这10个数的标准差是( ) A . 1 B . 2 C . 3 D . 4 【答案】B
5.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如图),已知从左到右各长方形高的比为2∶3∶5∶6∶3∶1,则该班学生数学成绩在(80,100)之间的学生人数是
( )
A .32
B .27
C .24
D .33
答案 D
解析 80~100之间两个长方形高占总体的比例为
5+62+3+5+6+3+1=1120
,即为频数之比, ∴x 60=11
20,∴x =33.
6、甲、乙两位运动员在5场比赛的得分情况如茎叶图如上图所示,记甲、乙两人的平均得分分别为x x 甲乙,
,则下列判断正确的是( ) A 、x x <甲乙;乙比甲成绩稳定 B 、x x >甲乙;乙比甲成绩稳定 C 、x x <甲乙;甲比乙成绩稳定
D 、x x >甲乙;甲比乙成绩稳定
答案:.A
二、填空题
1.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温
的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),
[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城
市个数为________.
答案9
解析最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.
2、上图是绵阳市某小区100户居民2017年月平均用水量(单位:t)的频率分布直方图的一部分,则该小区2017年的月平均用水量的中位数的估计值为________.
答案:2.02
3、若样本数据x1,x2,…x5的方差是4,则数据2x1-1,2x2-1,…,2x5-1的标准差为________.
答案:4
三、解答题
1.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分和众数;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求
分数段[50,60)[60,70)[70,80)[80,90)
x∶y 1∶12∶13∶44∶5 解(1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.
(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+
75×0.03×10+85×0.02×10+95×0.005×10=73(分).纵数65
(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为
0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.
由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×5
4=25.
故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.
2、某校有150名学生参加了中学生环保知识竞赛,为了解成绩情况,现从中随机抽取50名学生的成绩进行统计(所有学生成绩均不低于60分).请你根据尚未完成的频率分布表,解答下列问题:
(Ⅰ)写出M 、N 、p 、q (直接写出结果即可),并作出频率分布直方图;
(Ⅱ)若成绩在90分以上的学生获得一等奖,试估计全校所有参赛学生获一等奖的人数; 答案:(Ⅰ)M=13 ,N =2, p=0.30,q=0.04, …………………2分
(Ⅱ)获一等奖的概率为0.04,获一等奖的人数估计为604.0150=⨯(人)……6分
3.某中学高二年级的甲、乙两个班中,需根据某次数学预赛成绩选出某班的5名学生参加数学竞赛决赛,已知这次预赛他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班5名学生成绩的平均分是83, 乙班5名学生成绩的中位数是86.
求出x ,y 的值,且分别求甲、乙两个班中5名学生成绩的方差2
1S 、2
2S ,
70 60 80 90 100
组距
频率
70 60 80 90 100 组距
频率
并根据结果,你认为应该选派哪一个班的学生参加决赛?
答案:.(Ⅰ)x=5,y=6,2127.2S =,2257.2S =,应选甲班参加 ;(Ⅱ) 710
P =
. 解析:(Ⅰ)甲班的平均分为1748284(80)90
8355
x x x +++++=
=⇒=,易知6y =.
2127.2S =;又乙班的平均分为283x =, ∴2
257.2S =;
∵12x x =,2212S S <,说明甲班同学成绩更加稳定,故应选甲班参加.。