2021_2022学年高中数学第1章统计55.1估计总体的分布5.2估计总体的数字特征学案北师大版必
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.1 估计总体的分布 5.2 估计总体的数字特征
学 习 目 标
核 心 素 养
1.理解并会运用样本的频率分布估计总体的分布,通过实例体会分布的意义和作用.(重点)
2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图及频率折线图.(难点)
3.能根据给出的频率分布直方图解决具体问题.(难点)
1.通过运用样本的频率分布估计总体分布,体会分布的意义和作用,提升数学抽象素养.
2.通过列频率分布表,画频率分布直方图及折线图提升数据分析素养.
一、根本概念
1.频率分布表和频率分布直方图 (1)频率分布表编制的方法步骤:
计算极差――→决定组数与组距――→决定分点――→列出
频率分布表
(2)
2.频率分布折线图
(1)在频率分布直方图中,按照分组原那么,在左边和右边各加一个区间,从所加的左边区间的中点开场,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越准确.
(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度那么会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.
二、用样本的平均数、方差与标准差估计总体的数字特征
利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息.
n 个样本数据x 1,x 2,…,x n 的平均数
x =1
n
(x 1+x 2+…+x n ),那么有n x =x 1+x 2+…+x n .
设样本的元素为x 1,x 2,…,x n ,样本的平均数为x ,那么样本的方差s 2=1n
[(x 1-x )
2
+(x 2-x )2+…+(x n -x )2
] .
样本方差的算术平方根即为样本的标准差,即s =
1
n [](x 1
-x )2
+(x 2
-x )2
+…+(x n
-x )2
. 思考:在频率分布直方图中,如何求众数、中位数、平均数? [提示] ①在频率分布直方图中,众数是最高矩形中点的横坐标; ②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
1.当收集到的数据量很大时,比拟适宜的统计图是( ) A .茎叶图 B .频率分布直方图 C .频率折线图
D .频率分布表
B [当收集到的数据量很大时,一般用频率分布直方图.]
2.在抽查产品的尺寸过程中,将其尺寸分成假设干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,那么|a -b |=( )
A .hm B.m
h C.h m
D .h +m B [频率组距=h ,故|a -b |=组距=频率h =m h .]
3.频率分布直方图中,小矩形的面积等于( ) A .组距 B .频率 C .组数
D .频数
B [根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.] 4.某中学举办电脑知识竞赛,总分值为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进展整理后分成5组,绘制成频率分布直方图如下图.
图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,那么参赛的人数是________,成绩优秀的频率是________.
[设参赛的人数为n ,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4, 依题意40
n
=0.4,
∴n =100,优秀的频率是0.10+0.05=0.15.]
画频率分布直方图、折线图
30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率折线图;
(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少. [解] (1)计算极差:30-21=9. 决定组距和组数:取组距为2. ∵92=41
2
,∴共分5组. 决定分点,使分点比数据多一位小数.
并把第1小组的分点减小0.5,即分成如下5组: ),[22.5,24.5),[24.5,26.5), [26.5,28.5),[28.5,30.5]. 列出频率分布表如下:
分组 频数 频率
频率/组距
[20.5,22.5) 2 [22.5,24.5) 3 [24.5,26.5) 8 [26.5,28.5)
4
[28.5,30.5]3
合计20
(2)作出频率分布直方图如下:
取各小长方形上的中点并用线段连接就构成了频率折线图,如上图.
(3)由频率分布表和频率分布直方图观察得:
样本值出现在23~28之间的频率为0.15+0.40+0.2=0.75,所以可以估计总体中出现在23~28之间的数的频率约为0.75.
绘制频率分布直方图的具体步骤
1.求极差
一组数据的最大值与最小值的差称为极差.
2.决定组距与组数
数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过120时,按照数据的多少,常分成5~12组.为方便起见,组距的选择应力求“取整〞.3.将数据分组
通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.
1.为了了解中学生的身高情况,对实验中学同龄的50名男学生的身高进展了测量,结果如下(单位:cm):
175168170176167
181162173171177
171171174173174
175177166163160
166166163169174
165175165170158
174172166172167
172175161173167
170172165157172
173166177179181
列出频率分布表,画出频率分布直方图及频率折线图.
[解] 在这个样本中,最大值为181,最小值为157,它们的极差为24,可以取组距为4,根据题意列出样本的频率分布表如下表:
分组频数频率
3
4
12
12
13
4
2
合计50
由上表画出频率分布直方图及频率折线图如图.
频率分布直方图的应用【例2】为了了解高一学生的体能情况,某校抽取局部学生进展一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如下图,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)假设次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?
[解] (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因
此第二小组的频率为4
2+4+17+15+9+3
=0.08.
又因为第二小组频率=第二小组频数
样本容量,
所以样本容量=第二小组频数第二小组频率=12
0.08=150.
(2)由图可估计该校高一学生的达标率约为 17+15+9+3
2+4+17+15+9+3
×100%=88%.
频率分布直方图的性质
1.因为小矩形的面积=组距×频率÷组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
2.在频率分布直方图中,各小矩形的面积之和等于1. 3.频数÷相应的频率=样本容量.
2.(1)某班50名学生在一次百米跑测试中,成绩全部介于13 s 与19 s 之间,将测试结果按如下方式分成六组:第一组,成绩大于或等于13 s 且小于14 s ;第二组,成绩大于或等于14 s 且小于15 s ;…;第六组,成绩大于或等于18 s 且小于或等于19 s ,如下图是按上述分组方法得到的频率分布直方图.设成绩小于17 s 的学生人数占全班总人数的百分比为x ,成绩大于或等于15 s 且小于17 s 的学生人数为y ,那么从频率分布直方图中分析出x 和y 分别为 ( )
A .0.9,35
B .0.9,45
C .0.1,35
D .0.1,45
(2)某商场在端午节的促销活动中,对某日9时至14时的销售额进展统计,其频率分布直方图如下图.9时至10时的销售额为3万元,那么11时至12时的销售额为________万元.
(1)A (2)12 [由频率分布直方图知x=0.34+0.36+0.18+0.02=0.9,因为y
50
=0.36
+0.34=0.7,所以y=35.应选A.
(2)由频率分布直方图知,9时至10时的销售额的频率为0.1,故销售总额为3
0.1
=30(万元),又11时至12时的销售额的频率为0.4,故销售额为0.4×30=12万元.故填12万元.]
估计总体的数字特征
[探究问题]
1.如何从频率分布直方图中估计中位数?
提示:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,
由此可估计中位数的值.
2.在条形统计图中怎样估计众数?
提示:众数是最高矩形的中点的横坐标.
3.怎样估计平均数?
提示:平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和.
【例3】一组数据:
125,121,123,125,127,129,125,128,130,129,126,124,125,127,126,122,124,125,126, 128.
(1)填写下面的频率分布表:
分组频数频率
[121,123)
[123,125)
[125,127)
[127,129)
[129,131]
合计
(2)作出频率分布直方图;
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. [思路探究] (1)根据频数与频率的概念填写表格; (2)利用作频率分布直方图的步骤作图; (3)根据直方图中求数字特征的方法求解. [解] (1)
分组 频数 频率 [121,123) 2 [123,125) 3 [125,127) 8 [127,129) 4 [129,131] 3 合计
20
1
(2)
(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的准确值为125;(2)图中虚线对应的数据是125+2×5
8=126.25,事实上中位数
为125.5.使用“组中值〞求平均数x =122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,平均数的准确值为x =125.75.
1.平均数、中位数、众数、极差、方差等统计量是将多个数据“加工〞成一个数据,能更清楚地反映这组数据的某些重要特征,要理解这些统计量表达的信息.
2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.
3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进展整理后分成五组,绘制成如下图的频率分布直方图,图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
[解] (1)由图可知众数为65,又因为第一个小矩形的面积为0.3,
所以设中位数为60+x,
那么0.3+x×0.04=0.5,得x=5,
所以中位数为60+5=65.
(2)依题意,x=55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,
所以平均成绩约为67分.
1.利用直方图求数字特征:
(1)众数是最高的矩形的底边的中点.
(2)中位数左右两边直方图的面积应相等.
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.三种图表的区别与联系:
名称区别
频率分布表从数量上比拟准确地反映样本的频率分布规律
频率分布直方图反映样本的频率分布情况
频率折线图直观地反映了数据的变化趋势
这三种图表都是描述样本数据分布情况,估计总体频率分布规律的,其联系如下:
1.思考辨析
(1)频率分布直方图中的纵坐标指的是频率的值.( )
(2)频率分布直方图中各小矩形的面积之和可以不为1. ( )
(3)将数据分组时,一般要求各组的组距相等.( )
(4)在用样本估计总体分布的过程中,样本容量越大,估计越准确.( ) (5)样本平均数一定大于总体平均数.
( ) (6)样本标准差与总体标准差的大小关系无法确定. ( )
[解析] (1)×,纵坐标指的是频率与组距的比值. (2)×,各小矩形的面积之和一定为1.
(3)√,对数据进展分组时,一般要求各组的组距相等. (4)√,样本容量越大,估计越准确.
(5)×,样本平均数与总体平均数的大小关系不确定. (6)√,可能大于也可能小于.
[答案] (1)× (2)× (3)√ (4)√ (5)× (6)√
2.某班的全体学生参加英语测试,成绩的频率分布直方图如下图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].假设低于60分的人数是15,那么该班的学生人数是( )
A .45
B .50
C .55
D .60
B [成绩在[20,40)和[40,60)的频率分别是0.1,0.2,那么低于60分的频率是0.3,设该班学生总数为m ,那么15
m
=0.3,m =50.]
3.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图如下图.由图中数据可知a =________.假设要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,那么从身高在[140,150]内的学生中选取的人数应为________.
图156
0.030 3 [∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1, ∴a =0.030,设身高在[120,130),[130,140),[140,150]三组的分别有x ,y ,z 人.
∴
x
100
=0.030×10,
∴x=30,同理y=20,z=10.
∴从[140,150]中抽取10
30+20+10
×18=3.]
4.公交车的数量太多容易造成资源的浪费,太少又难以满足乘客的需求.为此,公交公司在某站台随机调查了80名乘客,他们的候车时间如下所示(单位:分):17142012102418171221319 285347251828115311211 10161291013191012121622 172316151611931321822 199232815212812111415 3 116218255121520161228 20122815832189
(1)将数据进展适当的分组,并画出相应的频率分布直方图和频率折线图;
(2)候车时间15分钟以上的比例是多少?你能为公交公司提出什么建议?
[解] (1)该数据中最大值为34,最小值为1,两者之差为33,故取组距为5,分为7组.
时间分组(Δx i)频数(n i)频率(f i)
f i Δx i
[0,5)6
[5,10)9
[10,15)22
[15,20)22
[20,25)105 [25,30)8
[30,35]3
频率分布直方图如下列图所示:
频率折线图如下列图所示:
(2)候车时间不低于15分钟的百分比为
0.275+0.125+0.100+0.0375=0.5375=53.75%,公交公司可以适当增加公交车的数量.。