高中数学第一章统计5152估计总体的分布估计总体的数字特征教学案北师大版
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.1 & 5.2 估计总体的分布 估计总体的数字特征
预习课本P32~39,思考并完成以下问题 (1)频率分布直方图纵轴的含义是什么?
(2)频率分布直方图的制作步骤是什么?
(3)如何画频率分布折线图?
[新知初探]
1.频率分布直方图
在频率分布直方图中,每个小矩形的宽度为Δx i (分组的宽度),高为f i
Δx i
,小矩形的面
积恰为相应的频率f i ,图中所有小矩形的面积之和等于1.
2.作频率分布直方图的步骤
(1)求极差.即一组数中最大值和最小值的差.
(2)决定组距与组数.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
(3)将数据分组.
(4)列频率分布表,各小组的频率=小组频数
样本容量.
(5)画频率分布直方图.
[点睛] (1)一般地,样本容量越大,所分组数越多,为方便起见,组距的选择力求“取整”,当样本容量不超过120时,按照数据的多少,通常分成5~12组.
(2)画频率分布直方图时,同一组数据,分组时组距要相等,每个矩形的高与频率成正比,这点应特别注意.
3.频率分布折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越接近于一条光滑曲线.
[小试身手]
1.判断正误.(正确的打“√”,错误的打“×”)
(1)频率分布直方图中每个小矩形的面积等于相应组的频数.( ) (2)频率分布直方图的面积为样本的频数.( )
(3)频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比.( ) (4)从频率分布直方图中可以清楚地看出数据的内容.( ) 答案:(1)× (2)× (3)√ (4)×
2.一个容量为80的样本最大值是140,最小值是51,组距为10,则可以分成( ) A .10组 B .9组 C .8组
D .7组
解析:选B 组数=极差/组距,本题中的极差=140-51=89,所以组数为8.9≈9. 3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则|a -b |=( )
A .hm B.m
h
C.h m
D .h +m
解析:选B
频率组距=h ,故|a -b |=组距=频率h =m
h
. 4.一个容量为n 的样本,分成若干组,已知某组的频数和频率分别为50和0.25,则n =________.
解析:由题意得50
n
=0.25,所以n =200.
答案:200
画频率分布直方图、折线图
[典例] 得到如下数据(单位:cm):
135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 105
123
111
103
105
92
114
108
104
102
12912697100115111106117104109
1118911012180120121104108118
12999909912112310711191100
991011169710210810195107101
1021081179911810611997126108
12311998121101113102103104108
(1)列出频率分布表;
(2)画出频率分布直方图及频率折线图;
(3)估计该片经济林中底部周长小于100 cm的树占多少,底部周长不小于120 cm的树占多少.
[解] (1)这组数据的最大的数为135,最小的数为80,最大的数与最小的数的差为55,可将该组数据分为11组,组距为5.
频率分布表如下:
底部周长分组(Δx i)/cm频数(n i)频率(f i)
f i Δx i
[80,85)10.010.002
[85,90)20.020.004
[90,95)40.040.008
[95,100)140.140.028
[100,105)240.240.048
[105,110)150.150.030
[110,115)120.120.024
[115,120)90.090.018
[120,125)110.110.022
[125,130)60.060.012
[130,135]20.020.004
(2)频率分布直方图和频率折线图如下图所示.
(3)从频率分布表得,样本中底部周长小于100 cm的频率为0.01+0.02+0.04+0.14
=0.21,样本中底部周长不小于120 cm 的频率为0.11+0.06+0.02=0.19.所以估计该片经济林中底部周长小于100 cm 的树占21%,底部周长不小于120 cm 的树占19%.
(1)分点的决定方法:若数据为整数,则减去0.5作为分点数;若数据是小数点后一位的数,则减去0.05作为分点数;依次类推.
(2)画频率分布直方图中小矩形的高的方法:①小矩形的高=频率
组距;②假设频数为1的
小矩形的高为h ,则频数为k 的小矩形的高为kh .
[活学活用]
为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出的频率分布表如下:
组别 频数 频率 145.5~149.5 1 0.02 149.5~153.5 4 0.08 153.5~157.5 20 0.40 157.5~161.5 15 0.30 161.5~165.5 8
0.16
165.5~169.5
m n 合计
M
N
(1)(2)画出频率分布直方图;
(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5 cm 以上的频率.
解:(1)法一:N =1,n =1-(0.02+0.08+0.40+0.30+0.16)=0.04,8m =0.160.04,∴m
=2,M =1+4+20+15+8+2=50.
法二:M =10.02=50,m =50-(1+4+20+15+8)=2,N =1,n =m M =2
50=0.04.
(2)作出直角坐标系,组距为4,纵轴表示f i
Δx i
,横轴表示身高,画出频率分布直方图如
图所示.
(3)由频率分布直方图可知:样本中在153.5~157.5范围内的人数最多,且身高在161.5 cm 以上的频率为0.16+0.04=0.2,由此可估计全体女生中身高在153.5~157.5范围内的人数最多,九年级学生中女生的身高在161.5 cm 以上的频率估计为0.2.
频率分布直方图的应用
[典例] 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少? [解] (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3
=0.08.
又因为第二小组频率=第二小组频数
样本容量,
所以样本容量=第二小组频数第二小组频率=12
0.08=150.
(2)由图可估计该校高一学生的达标率约为 17+15+9+3
2+4+17+15+9+3
×100%=88%.
频率分布直方图中的性质
(1)图中每个小矩形的面积表示相应各组的频率,即小矩形的面积=组距×频率
组距=频率.
(2)在频率分布直方图中,各小矩形的面积的总和等于1.
(3)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. (4)频率分布直方图中,各小矩形的面积之比等于频率之比,各小矩形的高度之比也等于频率之比.
[活学活用]
1.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图,估计样本数据落在区间[10,12)内的频数为( )
A .18
B .36
C .54
D .72
解析:选B 样本数据落在区间[10,12)内的频率为1-(0.02×2+0.05×2+0.15×2+0.19×2)=0.18,所以样本数据落在区间[10,12)内的频数为0.18×200=36.
2.为提高全省高中教师的新课程实施能力,全面推进素质教育,山东省对全省高中教师进行了全员网络远程培训.培训结束后,某市为了解参训教师的成绩情况,从本市参加培训的5 000名教师中随机抽取了100名,对他们的成绩(单位:分)进行统计分析,并画出了成绩的频率分布直方图如下.根据频率分布直方图,完成下面问题:
(1)这100名教师培训成绩的中位数应在哪个小组?请说明理由;
(2)如果成绩在300分以上(含300分)者为优秀学员,估计该市优秀学员的人数. 解:(1)100个数据的中位数是第50和第51两个数据的平均数,前两个小组的频率和为0.002×100×2=0.4,其频数为0.4×100=40<50,故中位数不在前两个小组;前三个小
组的频率之和为(0.002+0.002+0.004)×100=0.8,频数之和为0.8×100=80>50,故中位数应在第三小组.
(2)由频率分布直方图可知,优秀学员的频率为(0.001+0.001)×100=0.2,所以估计该市优秀学员的人数为5 000×0.2=1 000(人).
估计总体的数字特征
[典例] 为了检验产品质量,质量检验员从两台机床的产品中各抽出4件进行测量,结果如下:
机床甲 10 9.8 10 10.2 机床乙
10.1
10
9.9
10
如果你是质量检验员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求?
[解] (1)先计算平均直径:
x 甲=1
4×(10+9.8+10+10.2)=10, x 乙=14
×(10.1+10+9.9+10)=10.
由于x 甲=x 乙,因此仅由平均直径不能反映两台机床生产的零件的质量优劣. (2)再计算方差:
s 2甲=14×[(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02,
s 2乙=14
×[(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2
]=0.005.
s 2甲>s 2乙,这说明乙机床生产出的零件直径波动小,因此从产品质量稳定性的角度考虑,
乙机床生产的零件质量更符合要求.
样本的平均数和方差是两个重要的数字特征.在应用平均数和方差解决实际问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由方差研究其与平均数的偏离程度.
[活学活用]
为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100支日光灯在必须换掉前的使用天数如下表:
天数
151~
181~
211~
241~
271~
301~
331~
361~
180 210 240 270 300 330 360 390 日光
灯数
111182025167 2
(2)若定期更换,可选择多长时间统一更换合适?
解:(1)各组的平均值分别为165.5,195.5,225.5,255.5,285.5,315.5,345.5,375.5,由此可估计这种日光灯的平均使用寿命为165.5×1%+195.5×11%+225.5×18%+255.5×20%+285.5×25%+315.5×16%+345.5×7%+375.5×2%=268.4(天).
(2)s2=
1
100
[1×(165.5-268.4)2+11×(195.5-268.4)2+18×(225.5-268.4)2+
20×(255.5-268.4)2+25×(285.5-268.4)2+16×(315.5-268.4)2+7×(345.5-268.4)2+2×(375.5-268.4)2]=2 128.59,
故标准差s= 2 128.59≈46(天).
由上可知这种日光灯的平均使用寿命为268.4天,标准差约为46天,故可在222天到314天内统一更换较合适.
[层级一学业水平达标]
1.从一堆苹果中任取10个,称得它们的质量如下(单位:克):
125 120 122 105 130 114 116 95 120 134
则样本数据落在[114.5,124.5)内的频率为( )
A.0.2 B.0.3
C.0.4 D.0.5
解析:选C 依题意,样本数据落在[114.5,124.5)内的频数为4,故对应频率为4÷10=0.4.
2.下列说法中错误的是( )
①用样本的频率分布估计总体频率分布时,样本容量越大,所分的组数越多,估计越精确;
②一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n 的值为240;
③频率分布直方图中,小矩形的高等于该组的频率;
④将频率分布直方图中小矩形上面一边的一个端点顺次连接起来,就可以得到频率折线图.
A.①③B.②③④
C.②③④D.①②③④
解析:选C 大样本往往更接近于总体,所以①正确;②中n =40÷0.125=320; ③中频率分布直方图中,小矩形的高等于该小组的频率/组距;
④中应将频率分布直方图中各小矩形上端的中点顺次连接起来得到频率折线图. 3.在样本频率分布直方图中,某个小矩形的面积是其他小矩形面积之和的1
4,已知样本
容量是80,则该组的频数为( )
A .20
B .16
C .30
D .35
解析:选B 设该组的频数为x ,则其他组的频数之和为4x ,由样本容量是80,得x +4x =80,解得x =16,即该组的频数为16.
4.某校为了解高一学生寒假期间的阅读情况,抽查并统计了100名同学的某一周阅读时间,绘制了频率分布直方图(如图所示),那么这100名学生中阅读时间在[4,8)小时内的人数为________.
解析:根据频率分布直方图,可得阅读时间在[4,8)小时内的频率为(0.12+0.15)×2=0.54,所以这100名学生中阅读时间在[4,8)小时内的人数为100×0.54=54.
答案:54
[层级二 应试能力达标]
1.已知样本:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11,那么频率为0.4的范围是( )
A .5.5~7.5
B .7.5~9.5
C .9.5~11.5
D .11.5~13.5
解析:选C 只要列出频率分布表,依次对照就可以找出答案.频率分布表如下:
分组 频数 频率 5.5~7.5 2 0.1 7.5~9.5 6 0.3 9.5~11.5 8 0.4 11.5~13.5 4 0.2 合计
20
1
2.对某种电子元件使用寿命跟踪调查得如图所示的样本频率分布直方图,由图可知一批电子元件中寿命在100~300小时的电子元件的数量与寿命在300~600小时的电子元件的数量比是( )
A.12
B.13
C.14
D.16
解析:选C 因为“频率之比=数量之比”,所以所求为⎝
⎛⎭
⎪
⎫12 000+32 000∶
⎝ ⎛⎭
⎪⎫1400+1250+32 000=1∶4,故选C. 3.样本容量为100的频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为a ,样本数据落在[2,10)内的频率为b ,则a ,b 分别是( )
A .32,0.4
B .8,0.1
C .32,0.1
D .8,0.4
解析:选A 样本数据落在[6,10)内的频率为0.08×4=0.32,则a =100×0.32=32;由于样本数据落在[2,6)内的频率为0.02×4=0.08,则样本数据落在[2,10)内的频率b =0.08+0.32=0.4.
4.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )
A.588 B.480
C.450 D.120
解析:选B 成绩在[40,60)的频率p1=(0.005+0.015)×10=0.2,成绩不少于60分的频率p2=1-0.2=0.8,所以成绩不少于60分的学生人数约为600×0.8=480.
5.《中华人民共和国道路交通安全法》规定;车辆驾驶员血液酒精浓度在20~80 mg/100 mL(不含80)之间,属于酒后驾车;血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车.据《法制晚报》报道,某年2月15日至2月28日,全国查处酒后驾车和醉酒驾车共28 800人,如图是对这28 800人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为________.
解析:(0.01×10+0.005×10)×28 800=4 320.
答案:4 320
6.下图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.
解析:最左边两个小矩形的面积之和为0.10×1+0.12×1=0.22,城市总数为11÷0.22=50,最右边小矩形的面积为0.18×1=0.18,故样本中平均气温不低于25.5 ℃的城市个数为50×0.18=9.
答案:9
7.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
解析:因为频率分布直方图中的各个小矩形的面积之和为1,所以有10×(0.005+0.035+a +0.020+0.010)=1,解得a =0.030.
由频率分布直方图可知在[120,130),[130,140),[140,150]三组内的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为100×10×0.010=10,所以从身高在[140,150]内抽取的学生人数为18
60
×10=3.
答案:3
8.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高? 解:(1)依题意知第三组的频率为 42+3+4+6+4+1=1
5.
又∵第三组频数为12, ∴本次活动的参评作品数为
12
15
=60件. (2)由频率分布直方图,可以看出第四组上交的作品数量最多,共有60×6
2+3+4+6+4+1
=18件.
(3)第四组获奖率是1018=5
9
.
第六组上交的作品数为60×
1
2+3+4+6+4+1
=3件.
∴第六组的获奖率为2
3
,显然第六组的获奖率较高.
9.为增强市民节能环保意识,某市向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:
分组(单位:岁)
频数 频率 [20,25) 5 0.05 [25,30) ① 0.20 [30,35) 35 ② [35,40) 30 0.30 [40,45] 10 0.10 合计
100
1.00
(1)(2)补全频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)的人数.
解:(1)设年龄在[25,30)内的频数为x ,年龄在[30,35)的频率为y , 法一:根据题意可得
x
100=0.20,35
100
=y , 解得x =20,y =0.35.
法二:由题意得5+x +35+30+10=100, 0.05+0.20+y +0.30+0.10=1, 得x =20,y =0.35.
故①②位置应分别填20,0.35.
(2)由频率分布表知年龄在[25,30)内的频率是0.20,组距是5,所以频率组距=0.20
5=0.04.
补全频率分布直方图,如下图所示:
根据频率分布直方图估计这500名志愿者中年龄在[30,35)的人数为500×0.35=175.。