高中数学 第二章 统计 2.2 用样本估计总体 2.2.1 用样本的频率分布估计总体分布教学案 新人教A版必修3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2.1 用样本的频率分布估计总体分布
(1)如何作频率分布表?
(2)绘制频率分布直方图时,应如何确定组距与组数?
(3)频率分布直方图有什么特点?
(4)茎叶图有什么特点?
[新知初探]
1.频率分布直方图的画法
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:
预习课本P65~70,思考并完成以下问题
连接频率分布直方图中各小长方形上端的中点,就得到了频率分布折线图.
(2)总体密度曲线:
随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.
3.四种图表的区别与联系
茎是指中间的一列数,叶就是从茎的旁边生长出来的数.茎叶图可用来分析单组数据,也可以对两组数据进行比较.茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况.
[小试身手]
1.下列关于茎叶图的叙述正确的是( )
A .将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面
B .茎叶图只可以分析单组数据,不能对两组数据进行比较
C .茎叶图更不能表示三位数以上的数据
D .画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可随意同行列出
解析:选A 由茎叶图的概念易知选A.
2.某班学生在一次数学考试中各分数段以及人数的成绩分布为:
[0,80),2人;[80,90),6人;[90,100),4人;[100,110),10人;[110,120),12人;[120,130),5人;[130,140),4人;[140,150],2人.那么分数在[100,130)中的频数以及频率分别为( )
A .27,0.56
B .20,0.56
C .27,0.60
D .13,0.29
解析:选C 由[100,130)中的人数为10+12+5=27,得频数为27,频率为2745
=0.60. 3.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知( )
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
解析:选A 由茎叶图可以看出甲的成绩都集中在30~50分,且高分较多.而乙的成绩只有一个高分52分,其他成绩比较低,故甲运动员的成绩好于乙运动员的成绩.4.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.
解析:60×(0.015+0.025)×10=24.
答案:24
[典例] 抽查100袋洗衣粉,测量它们的净重如下(单位:g)
494 498 493 505 496 492 485 483 508 511
495 494 483 485 511 493 505 488 501 491
493 509 509 512 484 509 510 495 497 498
504 498 483 510 503 497 502 511 497 500
493 509 510 493 491 497 515 503 515 518
510 514 509 499 493 499 509 492 505 489
494 501 509 498 502 500 508 491 509 509
499 495 493 509 496 509 505 499 486 491
492 496 499 508 485 498 496 495 496 505
499 505 496 501 510 496 487 511 501 496
(1)列出样本的频率分布表;
(2)画频率分布直方图及频率分布折线图;
(3)估计净重在494.5~506.5 g 之间的频率.
[解] (1)在样本数据中,最大值是518,最小值是483,所以极差为35,取组距为4,由于354=834
,故要分成9组,使分点比数据多一位小数,且把第1组的起点稍微减小一点,得分组如下:
[482.5,486.5),[486.5,490.5),[490.5,494.5),…,[514.5,518.5].
列出频率分布表如下:
分组
频数 频率 频率/组距 [482.5,486.5)
8 0.08 0.02 [486.5,490.5)
3 0.03 0.007 5 [490.5,494.5)
17 0.17 0.042 5 [494.5,498.5)
21 0.21 0.052 5 [498.5,502.5)
14 0.14 0.035 [502.5,506.5)
9 0.09 0.022 5 [506.5,510.5)
19 0.19 0.047 5 [510.5,514.5)
6 0.06 0.015 [514.5,518.5]
3 0.03 0.007 5 合计
100 1.00
(2)频率分布直方图及频率分布折线图如图:
(3)净重在494.5~506.5 g 之间的频率为0.21+0.14+0.09=0.44.
绘制频率分布直方图应注意的2个问题
(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频率/组距”所占的比例来定高.如我们预先设
定以“”为一个单位长度,代表“0.1”,则若一个组的频率组距为0.2,则该小矩形的高就是“”(占两个单位长度),如此类推.
(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.
[活学活用]
考察某校高二年级男生的身高,随机抽取40名高二男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165
171 169 167 169 151 168 170 160 168 174
165 168 174 159 167 156 157 164 169 180
176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;
(2)画出频率分布直方图和频率分布折线图.
解:(1)最低身高151,最高身高180,它们的极差为180-151=29.
确定组距为3,组数为10,列表如下: 分组
频数 频率 [150.5,153.5)
1 0.025 [153.5,156.5)
1 0.025 [156.5,159.5)
4 0.1 [159.5,162.5)
5 0.125 [162.5,165.5)
8 0.2 [165.5,168.5)
11 0.275 [168.5,171.5)
6 0.15 [171.5,174.5)
2 0.05 [174.5,177.5)
1 0.025 [177.5,180.5]
1 0.025 合计
40 1
(2)频率分布直方图和频率分布折线图如图所示.
频率分布直方图的应用
[典例] 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
[解] (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:
42+4+17+15+9+3
=0.08. 又因为第二小组的频率=第二小组的频数样本容量
, 所以样本容量=第二小组的频数第二小组的频率=120.08
=150. (2)由题意估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3
×100%=88%.
解决与频率分布直方图有关问题的关系式
(1)频率组距
×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率
=样本容量,样本容量×频率=频数.
[活学活用]
(湖北高考)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
解析:(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a =3.
(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.
因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
答案:(1)3 (2)6 000
茎叶图
[典例] 甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示(单位:分),则甲班、乙班的最高成绩分别是________,从图中看,________班的平均成绩较高.
[解析] 由茎叶图知甲班的最高成绩为96分,乙班的最高成绩为92分,再根据茎叶图的分布特点知,乙班的成绩分布集中在下面,故乙班的平均成绩较高.
[答案] 96,92 乙
(1)绘制茎叶图关键是分清茎和叶.一般地说,当数据是两位数时,十位上的数字为“茎”,个位上的数字为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据的特点合理地选择茎和叶.
(2)应用茎叶图对两组数据进行比较时,要从数据分布的对称性、中位数、稳定性等几方面来比较.
(3)茎叶图只适用于样本数据较少的情况.
[活学活用]
如图是2016年青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图(图中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1,a 2,则一定有( )
A .a 1>a 2
B .a 2>a 1
C .a 1=a 2
D .a 1,a 2的大小与m 的值有关
解析:选B 根据茎叶图可知,
去掉一个最高分和一个最低分后,
甲的平均分为a 1=80+5+4+5+5+15
=84, 乙的平均分为a 2=80+4+4+6+4+75
=85, 故a 2>a 1.
[层级一 学业水平达标]
1.已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,11,10,那么频率为0.2的范围是( )
A .5.5~7.5
B .7.5~9.5
C .9.5~11.5
D .11.5~13.5 解析:选D 共20个数据,频率为0.2,在此范围内的数据有4个,只有在11.5~13.5范围内有4个数据:13,12,12,12,故选D.
2.为了解某校教师使用多媒体进行教学的情况,采用简
单随机抽样的方法,从该校400名授课教师中抽取20名,调
查了他们上学期使用多媒体进行教学的次数,结果用茎叶图
表示如图.据此可估计该校上学期400名教师中,使用多媒
体进行教学次数在[16,30)内的人数为( )
A .100
B .160
C .200
D .280
解析:选B 由茎叶图可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学次数在[16,30)内的人数为40020
×8=160. 3.某校100名学生的数学测试成绩频率分布直方图如图所示,分数不低于a (a 为整数)即为优秀,如果优秀的人数为20人,则a 的估计值是________.
解析:由已知可以判断a ∈(130,140),所以[(140-a )×0.015+0.01×10]×100=20.解得a ≈133.
答案:133
4.如图茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中
一个数字被污损,若乙的平均分是89,则污损的数字是________.
解析:设污损的叶对应的成绩是x ,由茎叶图可得89×5=83+83
+87+x +99,所以x =93,故污损的数字是3.
答案:3
[层级二 应试能力达标]
1.为了解某地区高一学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图(如图所示).
可得这100名学生中体重在[56.5,64.5)的学生人数是( )
A .20
B .30
C .40
D .50
解析:选C 由频率分布直方图易得到体重在[56.5,64.5)的学生的频率为(0.03+0.05+0.05+0.07)×2=0.4,那么学生的人数为100×0.4=40,故选C.
2.下列关于茎叶图的叙述正确的是( )
A .茎叶图可以展示未分组的原始数据,它与频率分布表以及频率分布直方图的处理方式不同
B .对于重复的数据,只算一个
C .茎叶图中的叶是“茎”十进制的上一级单位
D .制作茎叶图的程序是:第一步:画出茎;第二步:画出叶;第三步:将“叶子”任意排列
解析:选A 由茎叶图的概念知A 正确,故选A.
3.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间调查了某地10 000位居民,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10 000位居民中再用分层抽样抽出100位居民做进一步调查,则在[2.5,3)(小时)时间段内应抽出的人数是( )
A .25
B .30
C .50
D .75
解析:选A 抽出的100位居民中平均每天看电视的时间在[2.5,3)(小时)时间内的频率为0.5×0.5=0.25,所以这10 000位居民中平均每天看电视的时间在[2.5,3)(小时)时
间内的人数是10 000×0.25=2 500.依题意知抽样比是10010 000=1100
,则在[2.5,3)(小时)时间段内应抽出的人数是2 500×1100
=25. 4.某工厂对一批元件进行抽样检测.经检测,抽出的元件的长度(单位:mm)全部介于93至105之间.将抽出的元件的长度以2为组距分成6组:[93,95),[95,97),[97,99),
[99,101),[101,103),[103,105],得到如图所示的频率分布直方图.若长度在[97,103)内的元件为合格品,根据频率分布直方图,估计这批元件的合格率是( )
A .80%
B .90%
C .20%
D .85.5%
解析:选 A 由频率分布直方图可知元件长度在[97,103)内的频率为1-(0.027 5+0.027 5+0.045 0)×2=0.8,故这批元件的合格率为80%.
5.某地为了了解该地区10 000户家庭的用电情况,采用分层抽样的方法抽取了500
户家庭的月平均用电量,并根据这500户家庭的月平均用电量画出频率分布直方图如图所示,则该地区10 000户家庭中月平均用电度数在[70,80)的家庭有________户.
解析:根据频率分布直方图得该地区10 000户家庭中月平均用电度数在[70,80)的家庭有10 000×0.012×10=1 200(户).
答案:1 200
6.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于
其他7个小长方形的面积和的14
,且样本容量为200,则第8组的频数为________. 解析:设最后一个小长方形的面积为x ,则其他7个小长方形的面积为4x ,从而x +4x =1,所以x =0.2.故第8组的频数为200×0.2=40.
答案:40
7.中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示.从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,则全市高一学生视力在[3.95,4.25)范围内的学生约有________人.
解析:由图知,第五小组的频率为0.5×0.3=0.15,所以第一小组的频率为0.15×56
=0.125,所以全市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60 000×0.125=7 500(人).
答案:7 500
8.某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲得分:95,81,75,89,71,65,76,88,94,110,107;
乙得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
解:甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶
图上可以看出,乙同学的得分情况是大致对称的,大多集中在
80~100之间,中位数是98分.甲同学的得分情况除一个特殊得分外,也大致对称,多集中在70~90之间,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.
9.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?
解:(1)依题意知第三组的频率为42+3+4+6+4+1=15
,又因为第三组的频数为12,∴本次活动的参评作品数为1215
=60(件). (2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有
60×62+3+4+6+4+1
=18(件). (3)第四组的获奖率是1018=59
, 第六组上交的作品数量为60×12+3+4+6+4+1
=3(件). ∴第六组的获奖率为23=69
,显然第六组的获奖率较高.。