第十章-统计及统计案例,算法初步
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节随机抽样
[备考方向要明了]
[归纳·知识整合]
1.简单随机抽样
(1)抽取方式:不放回抽取;
(2)每个个体被抽到的概率相等;
(3)常用方法:抽签法和随机数法.
[探究] 1.简单随机抽样有什么特点?
提示:(1)被抽取样本的总体个数N是有限的;(2)样本是从总体中逐个抽取的;(3)是一种不放回抽样;(4)是等可能的抽取.
2.系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本.
(1)先将总体的N个个体编号;
(2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N
n ;
(3)在第1段用简单随机抽样确定第一个个体编号l (l ≤k );
(4)按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号l +k ,再加k 得到第3个个体编号l +2k ,依次进行下去,直到获取整个样本.
[探究] 2.系统抽样有什么特点?
提示:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.
3.分层抽样
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围:
当总体是由差异明显的几个部分组成时,往往选用分层抽样. [探究] 3.分层抽样有什么特点?
提示:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.
[自测·牛刀小试]
1.在抽样过程中,每次抽取的个体不再放回总体的为不放回抽样,在分层抽样、系统抽样、简单随机抽样三种抽样中,不放回抽样有( )
A .0个
B .1个
C .2个
D .3个
解析:选D 三种抽样都是不放回抽样.
2.(2013·温州模拟)某工厂生产A ,B ,C 三种不同型号的产品,产品数量之比为3∶4∶7,现在用分层抽样的方法抽出容量为n 的样本,样本中A 型号产品有15件,那么样本容量n 为( )
A .50
B .60
C .70
D .80
解析:选C 由分层抽样的方法得3
3+4+7×n =15,
解得n =70.
3.利用简单随机抽样,从n 个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为1
3
,则在整个抽样过程中,每个个体被抽到的概率为( )
A.13
B.514
C.14
D.1027
解析:选B 由题意知9
n -1=1
3
,解得n =28. 故P =1028=514
.
4.某单位青年、中年、老年职员的人数之比为10∶8∶7,从中抽取200名职员作为样本,若每人被抽到的概率为0.2,则该单位青年职员的人数为________.
解析:总人数为200
0.2=1 000,该单位青年职员的人数为
1 000×10
25=400.
答案:400
5.(2012·湖北高考)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有________人.
解析:分层抽样的特点是按照各层占总体的比抽取样本,设抽取的女运动员有x 人,则x 8=42
56
,解得x =6. 答案:6
[例1] 为了支援我国西部教育事业,决定从2011级学生报名的30名志愿者中,选取10人组成志愿小组,请用抽签法和随机数表法设计抽样方案.
[自主解答] 抽签法:
第一步:将30名志愿者编号,编号为1,2,3, (30)
第二步:将30个号码分别写在30张外观完全相同的纸条上,并揉成团,制成号签. 第三步:将30个号签放入一个不透明的盒子中,充分搅匀. 第四步:从盒子中逐个抽取10个号签,并记录上面的编号. 第五步:所得号码对应的志愿者,就是志愿小组的成员.
随机数法:
第一步:将30名志愿者编号,编号为01,02,03,…,30. 第二步:在随机数表中任选一数开始,按某一确定方向读数.
第三步:凡不在01~30中的数或已读过的数,都跳过去不作记录,依次记录下10个得数.
第四步:找出号码与记录的数相同的志愿者组成志愿小组.
把本例中“30名志愿者”改为“1800名志愿者”,仍抽取10人,应如何进行抽样? 解:因为总体数较大,若选用抽签法制签太麻烦,故应选用随机数法.
第一步:先将1 800名志愿者编号,可以编为0001,0002,0003,…,1800. 第二步:在随机数表中任选一个数,例如选出第2行第1列的数9.
第三步:从选定的数开始向右读,依次可得以0736,0751,0732,1355,1410,1256,0503,1557,1210,1421为样本的10个号码,这样我们就得到一个容量为10的样本.
—————
—————————————— 应用简单随机抽样应注意的问题
(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
(2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.
1.今用简单随机抽样从含有6个个体的总体中抽取一个容量为2的样本.问: (1)总体中的某一个体a 在第一次抽取时被抽到的概率是多少? (2)个体a 不是在第一次被抽到,而是在第二次被抽到的概率是多少? (3)在整个抽样过程中,个体a 被抽到的概率是多少?
解:①用简单随机抽样,从含有N 个个体的总体中抽取一个容量为n 的样本,每次抽取一个个体时任一个体被抽到的概率为1N ;在整个抽样过程中各个个体被抽到的概率为n
N ;
②抽签有先后,但概率都是相同的.
故(1)16;(2)16;(3)1
3
.
[例2](2012·山东高考)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为()
A.7B.9
C.10 D.15
[自主解答]第n个抽到的编号为9+(n-1)×30=30n-21,由题意得451≤30n-21≤750,解得
1511
15≤n≤25
7
10.又n∈Z,故满足条件的共有10个.
[答案] C
———————————————————
解决系统抽样应注意的几个问题
(1)适合元素个数较多且均衡的总体;
(2)各个个体被抽到的机会均等;
(3)样本的第一个个体用简单随机抽样.
2.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是() A.13 B.19
C.20 D.51
解析:选C由系统抽样的原理知抽样的间隔为52
4=13,故抽取的样本的编号分别为
7,7+13,7+13×2,7+13×3,从而可知选C.
[例3]某学校共有教职工900人,分成三个批次进行教育培训,在三个批次中男、女教职工人数如下表所示.已知在全体教职工中随机抽取1名,抽到第二批次中女教职工的概率是0.16.
(1)求x 的值;
(2)现用分层抽样的方法在全体教职工中抽取54名做培训效果的调查,问应在第三批次中抽取教职工多少名?
[自主解答] (1)由x
900
=0.16,解得x =144.
(2)第三批次的人数为y +z =900-(196+204+144+156)=200, 设应在第三批次中抽取m 名,则m 200=54
900,解得m =12.
故应在第三批次中抽取
12名教职工. —————
——————————————
分层抽样的步骤
第一步:将总体按一定标准分层;
第二步:计算各层的个体数与总体数的比,按各层个体数占总体数的比确定各层应抽取的样本容量;
第三步:在每一层进行抽样(可用简单随机抽样或系统抽样).
3.(2012·天津高考)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取____________所学校,中学中抽取____________所学校.
解析:从小学中抽取30×150150+75+25=18所学校;从中学中抽取30×75150+75+25=
9所学校.
答案:18 9
1组比较——三种抽样方法的比较
易误警示——抽样方法中的解题误区
[典例](2012·江苏高考)某学校高一、高二、高三年级的学生人数之比是3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.
[解析]由题意得高二年级的学生人数占该学校高中人数的3
10,利用分层抽样的有关知
识得应从高二年级抽取50×3
10=15名学生.
[答案]15
[易误辨析]
1.因不能正确确认抽样的比例从而导致失误.
2.在求解过程中计算失误.
3.解答随机抽样问题时,还有以下几点容易造成失误:
(1)分不清系统抽样中各段入样的个体编号成等差数列;
(2)分层抽样中各层所占的比例不准确;
(3)系统抽样时总体容量不能被样本容量整除时,不知随机从总体中剔除余数;分层抽样时所取各层个体数不是整数时,不会微调个体数目.
[变式训练]
1.从2 006名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2 006人中剔除6人,剩下的2 000人再按照系统抽样的方法进行,则每人入选的概率()
A.不全相等B.均不相等
C.都相等,且为
25
1 003D.都相等,且为
1
40
解析:选C抽样过程中每个个体被抽取的机会均等,概率相等,剔除后的抽取过程与
从2006人中抽取50人,每人入选的概率相同,其概率为
50
2 006=
25
1 003.
2.中央电视台在因特网上就观众对2013年春节晚会这一节目的喜爱程度进行调查,参加调查的总人数为12 000,其中持各种态度的人数如表所示:
其中持“喜爱”态度的观众应抽取________人.
解析:由于样本容量与总体容量的比为
60
12 000=
1
200,
故应抽取“喜爱”态度的观众人数为
4 600×1
200=23(人).
答案:23
一、选择题(本大题共6小题,每小题5分,共30分)
1.下列抽取样本的方式是简单随机抽样的有()
①从无限多个个体中抽取50个个体作为样本;
②箱子里有100支铅笔,今从中选取10支进行检验.在抽样操作时,从中任意拿出一支检测后再放回箱子里;
③从50个个体中一次性抽取5个个体作为样本.
A.0个B.1个
C.2个D.3个
解析:选A①不满足样本的总体数较少的特点;②不满足不放回抽取的特点;③不满足逐个抽取的特点.
2.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是() A.简单随机抽样法B.抽签法
C.随机数表法D.分层抽样法
解析:选D由于总体容量较大,且男、女生健康差异明显,因此采用分层抽样方法抽取样本.
3.(2012·浙江高考改编)某个年级有男生560人,女生420人,用分层抽样的方法从该
年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为( )
A .80
B .120
C .160
D .240
解析:选C 设样本中男、女生分别为x ,y ,且x ∶y =4∶3,所以x =280×4
7=160.
4.800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数k =800
50=16,即每16人抽取一个人.在1~16中随机抽取一个数,如果抽到的
是7,则从33~48这16个数中应取的数是( )
A .40
B .39
C .38
D .37
解析:选B 按系统抽样分组,33~48这16个数属第3组,则这一组应抽到的数是7+2×16=39.
5.某工厂有A ,B ,C 三种不同型号的产品,这三种产品数量之比为2∶3∶5,现用分层抽样从中抽出一个容量为n 的样本,该样本中A 种型号产品有8件,那么这次样本的容量n 是( )
A .12
B .16
C .20
D .40
解析:选D 设三种产品的数量之和为2k +3k +5k =10k ,依题意有n 10k =8
2k ,解得n =
40.
6.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:
①采用随机抽样法,将零件编号为00,01,02,…,99,抽出20个;
②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个; ③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个,则( )
A .不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是1
5
B .①②两种抽样方法,这100个零件中每个被抽到的概率都是1
5,③并非如此
C .①③两种抽样方法,这100个零件中每个被抽到的概率都是1
5,②并非如此
D .采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同
解析:选A 由抽样方法的性质知,抽样过程中每个个体被抽到的概率都相等,这个比
例只与样本容量和总体有关.
二、填空题(本大题共3小题,每小题5分,共15分)
7.某高中共有学生2 000名,已知在全校学生中随机抽取1名,抽到高三年级男生的概率是0.1现用分层抽样的方法在全校抽取若干名学生参加社区服务,相关信息如下表:
则x =________.
解析:由b 2 000=0.1,可得b =200.设在全校抽取n 名学生参加社区服务,则有n
2 000=
10
200+200
.
解得n =50.故x =50-15-10=25. 答案:25
8.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为________.
解析:依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码为3+12(k -1).
令3+12(k -1)≤300得k ≤
1034
, 因此第Ⅰ营区被抽中的人数是25, 令300<3+12(k -1)≤495,得103
4<k ≤42,
因此第Ⅱ营区被抽中的人数是42-25=17. 故第Ⅲ营区被抽中的人数是50-25-17=8. 答案:25,17,8
9.某企业三月中旬生产A 、B 、C 三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:
由于不小心,表格中A 、C 产品的有关数据已被污染看不清楚,统计员记得A 产品的样本容量比C 产品的样本容量多10,根据以上信息,可得C 的产品数量是________.
解析:设C 产品的样本容量为x ,则A 产品的样本容量为10+x ,由B 知抽取的比例为1
10
,故x +10+x +130=300,解得x =80.所以C 产品的数量为800. 答案:800
三、解答题(本大题共3小题,每小题12分,共36分)
10.一次数学模拟考试,共12道选择题,每题5分,共计60分,每道题有四个可供选择的答案,仅有一个是正确的.学生小张只能确定其中10道题的正确答案,其余2道题完全靠猜测回答.
小张所在班级共有40人,此次考试选择题得分情况统计表:
(1)应抽取多少张选择题得60分的试卷?
(2)若小张选择题得60分,求他的试卷被抽到的概率.
解:(1)得60分的人数40×10%=4.设抽取x 张选择题得60分的试卷,则4020=4
x ,
即x =2.故应抽取2张选择题得60分的试卷.
(2)设小张的试卷为a 1,另三名得60分的同学的试卷为a 2,a 3,a 4,所有抽取60分试卷的方法为:(a 1,a 2),(a 1,a 3),(a 1,a 4),(a 2,a 3),(a 2,a 4),(a 3,a 4)共6种,其中小张的试卷被抽到的抽法共有3种,故小张的试卷被抽到的概率为P =36=1
2
.
11.(2012·天津高考)某地区有小学21所,中学14所,大学7所,现采用分层抽样的方法从这些学校中抽取6所学校对学生进行视力调查.
(1)求应从小学、中学、大学中分别抽取的学校数目;
(2)若从抽取的6所学校中随机抽取2所学校做进一步数据分析, ①列出所有可能的抽取结果; ②求抽取的2所学校均为小学的概率.
解:(1)从小学、中学、大学中分别抽取的学校数目为3,2,1.
(2)①在抽取到的6所学校中,3所小学分别记为A 1,A 2,A 3,2所中学分别记为A 4,A 5,大学记为A 6,则抽取2所学校的所有可能结果为{A 1,A 2},{A 1,A 3},{A 1,A 4},{A 1,A 5},{A 1,A 6},{A 2,A 3},{A 2,A 4},{A 2,A 5},{A 2,A 6},{A 3,A 4},{A 3,A 5},{A 3,A 6},{A 4,A 5},{A 4,A 6},{A 5,A 6},共15种.
②从6所学校中抽取的2所学校均为小学(记为事件B )的所有可能结果为{A 1,A 2},{A 1,A 3},{A 2,A 3},共3种,所以P (B )=315=15
.
12.(2012·北京高考)近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾三类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1 000吨生活垃圾,数据统计如下(单位:吨):
(2)试估计生活垃圾投放错误的概率;
(3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为a ,b ,c ,其中a >0,a +b +c =600.当数据a ,b ,c 的方差s 2最大时,写出a ,b ,c 的值(结论不要求证明),并求此时s 2的值.
(注:s 2=1
n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为数据x 1,x 2,…,x n 的平
均数)
解:(1)厨余垃圾投放正确的概率约为
“厨余垃圾”箱里厨余垃圾量厨余垃圾总量=400400+100+100=2
3
.
(2)设“生活垃圾投放错误”为事件A ,则事件A 表示“生活垃圾投放正确”. 事件A 的概率约为“厨余垃圾”箱里厨余垃圾量、“可回收物”箱里可回收物量与“其他垃圾”箱里其他垃圾量的总和除以生活垃圾总量,即P (A )约为400+240+60
1 000=0.7,
所以P (A )约为1-0.7=0.3.
(3)当a =600,b =c =0时,s 2取得最大值. 因为x =1
3
(a +b +c )=200,
所以s 2=1
3
×[(600-200)2+(0-200)2+(0-200)2]=80 000.
1.(2012·福建高考)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是________.
解析:应抽取女运动员的人数为98-5698×28=12.
答案:12
2.某学校在校学生2 000人,学校举行了跑步和登山比赛,每人都参加且每人只参加其中一项比赛,各年级参加比赛的人数情况如下表:
其中a :b :c =2∶5∶3,全校参加登山的人数占总人数的1
4.为了了解学生对本次活动的
满意程度,按分层抽样的方式从中抽取一个200人的样本进行调查,则高三年级参加跑步的学生中应抽取( )
A .15人
B .30人
C .40人
D .45人
解析:选D 由题意,全校参加跑步的人数占总人数的3
4,高三年级参加跑步的总人数
为34×2 000×310=450,由分层抽样的特征,得高三年级参加跑步的学生中应抽取1
10×450=45人.
第二节 用样本估计总体
[备考方向要明了]
[归纳·知识整合]
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.
3.茎叶图的优点
茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示.
4.标准差和方差
(1)标准差是样本数据到平均数的一种平均距离.
(2)标准差:
s =
1n
[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. (3)方差:s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -
)2](x n 是样本数据,n 是样本容量,x
是样本平均数).
5.利用频率分布直方图估计样本的数字特征
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.
(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标. [探究] 1.在频率分布直方图中如何确定中位数?
提示:在频率分布直方图中,中位数左边和右边的直方图的面积是相等的. 2.利用茎叶图求数据的中位数的步骤是什么?
提示:(1)将茎叶图中数据按大小顺序排列;(2)找中间位置的数.
[自测·牛刀小试]
1.(2012·山东高考)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )
A .众数
B .平均数
C .中位数
D .标准差
解析:选D 只有标准差不变,其中众数、平均数和中位数都加2. 2.(2011·安庆模拟)如图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )
A .161
B .162
C .163
D .164
解析:选B 由给定的茎叶图可知,这10位同学身高的中位数为161+163
2=162.
3.某校举行2013年元旦汇演,七位评委为某班的小品打出的分数如下茎叶统计图,去掉一个最高分和一个最低分,所剩数据的方差为________.
15 5 5 7 8 16 1 3 3 5 17
1
2
7 9 8
4
4
6
4
7
解析:由茎叶图知,去掉一个最高分和一个最低分,所剩数据为84,84,86,84,87,所以由公式得方差为1.6.
答案:1.6
4.从一堆苹果中任取10只,称得它们的质量如下(单位:克):
125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为________.
解析:数据落在[114.5,124.5)内的有:120,122,116,120共4个,故所求频率为4
10=0.4.
答案:0.4
5.(2012·大同模拟)将容量为n 的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n =________.
解析:由已知,得2+3+4
2+3+4+6+4+1·n =27,
即920·n =27,解得n =60. 答案:60
[例1] (1)在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的1
4
,且样本容量为160,则中间一组的频数为( )
A .32
B .0.2
C .40
D .0.25
(2)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于
等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有______名.
[自主解答] (1)由频率分布直方图的性质,可设中间一组的频率为x ,则x +4x =1,解
9 3
得x =0.2.故中间一组的频数为160×0.2=32.
(2)由题知,成绩大于等于80分且小于90分的学生所占的频率为1-(0.005×2+0.025+0.045)×10=0.2,所以这200名同学中成绩大于等于80分且小于90分的学生有200×0.2=40名.
[答案] (1)A (2)40 —————
—————————————— 频率分布直方图反映了样本的频率分布
(1)在频率分布直方图中纵坐标表示频率
组距,
频率=组距×频率
组距
.
(2)频率分布表中频率的和为1,故频率分布直方图中各长方形的面积和为1.
1.已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为________,样本数据落在[2,10)内的频率为________.
解析:样本数据落在[6,10)内的样本频数为0.08×4×100=32,样本数据落在[2,10)内的频率为(0.02+0.08)×4=0.4.
答案:32 0.4
[例2] (2012·安徽高考)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A .甲的成绩的平均数小于乙的成绩的平均数
B .甲的成绩的中位数等于乙的成绩的中位数
C .甲的成绩的方差小于乙的成绩的方差
D .甲的成绩的极差小于乙的成绩的极差
[自主解答] 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,1
5×[(5-6)2+(5-6)2+(5-6)2
+(6-6)2+(9-6)2]=12
5
,C 对;甲、乙的成绩的极差均为4,D 错.
[答案] C —————
——————————————
样本数字特征及公式推广
(1)平均数和方差都是重要的数字特征,是对总体一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.
(2)平均数、方差公式的推广
若数据x 1,x 2,…,x n 的平均数为x -
,方差为s 2,则数据mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -
+a ,方差为m 2s 2.
2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )
A .m e =m 0=x
B .m e =m 0<x
C .m e <m 0<x
D .m 0<m e <x
解析:选D 由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数即m e =5.5,5出现次数最多,故m 0=5,x =2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030
≈5.97.于是得m 0<m e <x .
[例3] 某校高三年级进行了一次数学测验,随机从甲、乙两班各抽取6名同学,所得分数的茎叶图如图所示.
(1)
(2)现从甲班这6名同学中随机抽取两名同学,求他们的分数之和大于165分的概率. [自主解答] (1)因为乙班的成绩集中在80分,且没有低分,所以乙班的平均分比较高. (2)设从甲班中任取两名同学,两名同学分数之和超过165分为事件A .从甲班6名同学中任取两名同学,则基本事件空间中包含了15个基本事件,又事件A 中包含4个基本事件,所以,P (A )=415
.
即从甲班中任取两名同学,两名同学分数之和超过165分的概率为4
15.
—————
——————————————
茎叶图的优缺点
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐.
3.(2012·湖南高考)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.
(注:方差s 2=1
n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平
均数)
解析:该运动员五场比赛中的得分为8,9,10,13,15,平均得分x =8+9+10+13+15
5=
11,
方差s 2=1
5[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.
答案:6.8
4.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数
0 8 9 1
3
5。