2021届高考数学11.2统计图表、数据的数字特征、用样本估计整体强化训练 理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§11.2统计图表、数据的数字特点、用样本估量整体
1.统计图表
统计图表是表达和分析数据的重要工具,经常使用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等.
2.数据的数字特点
(1)众数、中位数、平均数
众数:在一组数据中,显现次数最多的数据叫作这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.
平均数:样本数据的算术平均数,即x=1
n(
x1+x2+…+x n).
在频率散布直方图中,中位数左侧和右边的直方图的面积应该相等.(2)样本方差、标准差
标准差s=1
n[
x1-x2+x2-x2+…+x n-x2],
其中x n是样本数据的第n项,n是样本容量,x是平均数.
标准差是反映整体波动大小的特点数,样本方差是标准差的平方.通经常使用样本方差估量整体方差,当样本容量接近整体容量时,样本方差很接近整体方差.
3.用样本估量整体
(1)通常咱们对整体作出的估量一样分成两种,一种是用样本的频率散布估量整体的频率散布,另一种是用
样本的数字特点估量整体的数字特点.
(2)在频率散布直方图中,纵轴表示频率
组距
,数据落在各小组内的频率用各小长方形的面积表示,各小长方形
的面积总和等于1.
(3)在频率散布直方图中,依照分组原那么,再在左侧和右边各加一个区间.从所加的左侧区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就能够够取得一条折线,称之为频率折线图.
(4)当样本数据较少时,用茎叶图表示数据的成效较好,它没有信息的缺失,而且能够随时记录,方便表示
1. 判定下面结论是不是正确(请在括号中打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.
( √ ) (2)一组数据的众数能够是一个或几个,那么中位数也具有相同的结论.
( × )
(3)从频率散布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
( √ )
(4)茎叶图一样左侧的叶按从大到小的顺序写,右边的叶按从小到大的顺序写,相同的数据能够只记一次.
( × )
2. 某教师从礼拜一到礼拜五收到的信件数别离为10,6,8,5,6,那么该组数据的方差s 2=________.
答案 3.2 解析
x =10+6+8+5+65=7,∴s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=16
5
=3.2.
3. 一个容量为20的样本,数据的分组及各组的频数如下:
[10,20),2;[20,30),3;[30,40),x ;[40,50),5;[50,60),4;[60,70),2;那么x =________;依照样本的频率散布估量,数据落在[10,50)的概率约为________. 答案 4 0.7
解析 x =20-(2+3+5+4+2)=4, P =2+3+4+520=0.7或P =1-4+2
20
=0.7.
4. (2021·湖南)如下图是某学校一名篮球运动员在五场竞赛中所得分数的茎
叶图,那么该运动员在这五场竞赛中得分的方差为______. 答案 6.8
解析 依题意知,运动员在5次竞赛中的分数依次为8,9,10,13,15,其平均数为8+9+10+13+15
5=11.
由方差公式得s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=1
5(9+4+1+4+16)=6.8.
5. 某中学为了解学生数学课程的学习情形,在3 000名学生中随机抽取200名,并统计这200名学生的某次
数学考试成绩,取得了样本的频率散布直方图(如图).依照频率散布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.
解析由直方图易患数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,因此所求分数小于60分的学生数为3 000×0.2=600.
题型一频率散布直方图的绘制与应用
例1某校从参加高一年级期中考试的学生中随机抽出60名学
生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,
[90,100]后取得如下图的频率散布直方图,观看图形的信
息,回答以下问题:
(1)求分数在[70,80)内的频率,并补全那个频率散布直方图;
(2)统计方式中,同一组数据经常使用该组区间的中点值作为代表,据此估量本次考试中的平均分.
思维启发利用各小长方形的面积和等于1求分数在[70,80)内的频率,再补齐频率散布直方图.
解(1)设分数在[70,80)内的频率为x,依照频率散布直方图,有(0.010+0.015×2+0.025+0.005)×10+x =1,可得x=0.3,因此频率散布直方图如下图.
(2)平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).
思维升华频率散布直方图直观形象地表示了样本的频率散布,从那个直方图上能够求出样本数据在各个组的频率散布.依照频率散布直方图估量样本(或整体)的平均值时,一样是采取组中值乘以各组的频率的方式.(2021·陕西)对一批产品的长度(单位:mm)进行抽样检测,以下图为检测结果的频率散布直方图.依照标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估量概率,现从该批产品中随机抽取一件,那么其为二等品的概率为( )
A.0.09 B.0.20
C.0.25 D.0.45
答案D
解析设区间[25,30)对应矩形的另一边长为x,那么所有矩形面积之和为1,即(0.02+0.04+0.06+0.03+x)×5=1,解得x=0.05.产品为二等品的概率为0.04×5+0.05×5=0.45.
题型二茎叶图的应用
例2如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出
的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最
高分和一个最低分后,甲、乙两名选手得分的平均数别离为a 1、
a 2,那么必然有
( )
A .a 1>a 2
B .a 2>a 1
C .a 1=a 2
D .a 1,a 2的大小与m 的值有关
思维启发 去掉的最低分和最高分确实是第一行和第三行的数据,剩下的数咱们只要计算其叶上数字之和,即可对问题作出结论. 答案 B
解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故
a 2>a 1.应选B.
思维升华 由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分利用那个图表提供的数据进行相关的计算或是对某些问题作出判定,这种试题往往伴随着对数据组的平均值或是方差的计算等.
(2021·山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为
91.现场作的9个分数的茎叶图后来有1个数据模糊,无法识别,在图中以x 表示: 那么7个剩余分数的方差为
( )
A.1169
B.36
7
C .36
D.
677
答案 B
解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.因此s 2=1
7[(87-91)2+(94-91)2+
(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2] =17(16+9+1+0+1+9+0)=36
7. 题型三 用样本的数字特点估量整体的数字特点
例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情形如图.
(1)别离求出两人得分的平均数与方差;
(2)依照图和上面算得的结果,对两人的训练成绩作出评判.
思维启发 (1)先通过图像统计出甲、乙二人的成绩;
(2)利用公式求出平均数、方差,再分析两人的成绩,作出评判. 解 (1)由题图可得甲、乙两人五次测试的成绩别离为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13,
x 乙=13+14+12+12+145
=13,
s 2甲=1
5
[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s 2乙=
1
5
[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙可知乙的成绩较稳固.
从折线图看,甲的成绩大体呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩那么无明显提高.
思维升华 平均数与方差都是重要的数字特点,是对整体的一种简明的描述,它们所反映的情形有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
(1)(2021·山东)在某次测量中取得的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.假设B
样本数据恰好是A 样本数据每一个都加2后所得数据,那么A ,B 两样本的以下数字特点对应相同的是
( )
A .众数
B .平均数
C .中位数
D .标准差
(2)甲、乙两名射击运动员参加某大型运动会的预选赛,他们别离射击了5次,成绩如下表(单位:环):
甲 10 8 9 9 9 乙
10
10
7
9
9
若是甲、乙两人中只有1. 答案 (1)D (2)甲
解析 (1)对样本中每一个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.
(2)x 甲=x 乙=9环,s 2甲=
15[(10-9)2+(8-9)2+(9-9)2+(9-9)2+(9-9)2]=2
5

s 2乙=
15[(10-9)2+(10-9)2+(7-9)2+(9-9)2+(9-9)2]=6
5
>s 2甲,故甲更稳固,故填甲.
高考中频率散布直方图的应用
典例:(5分)为了研究大学生就业后的收入问题,一个研究机构调查了在2020年已经就业且工作满两年的10 000
人,并依照所得数据画了样本的频率散布直方图(如下图).为了分析其收入与学历、职业、性别等方面的关系,要从这10 000人中再用分层抽样方式抽出200人作进一步伐查,其中月收入低于1 500元的称为低收入者,高于3 000元的称为高收入者,那么应在低收入者和高收入者中别离抽取的人数是
( )
A .1 000,2 000
B .40,80
C .20,40
D .10,20
思维启发 依照频率散布直方图的意义,别离计算出低收入者和高收入者的频率即可,为方
便直接计算,那个频率散布直方图也能够看做是200个样本的频率散布直方图. 解析 低收入者的频率是0.000 2×500=0.1,故从低收入者中抽取200×0.1=20人; 高收入者的频率是(0.000 3+0.000 1)×500=0.2, 故从高收入者中抽取200×0.2=40人.应选C. 答案 C
温馨提示 此题的难点是对频率散布直方图意义的明白得和利用那个图提供的数据对所提问题的计算,频率散布
直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这种问题时要专门注意. 方式与技术
1. 用样本频率散布来估量整体散布的重点是频率散布表和频率散布直方图的绘制及用样本频率散布估量整体散
布;难点是频率散布表和频率散布直方图的明白得及应用.在计数和计算时必然要准确,在绘制小矩形时,宽窄要一致.通过频率散布表和频率散布直方图能够对整体作出估量.
2. 茎叶图、频率散布表和频率散布直方图都是用来描述样本数据的散布情形的.茎叶图由所有样本数据组成,
没有损失任何样本信息,能够随时记录;而频率散布表和频率散布直方图那么损失了样本的一些信息,必需在完成抽样后才能制作.
3. 假设取值x 1,x 2,…,x n 的频率别离为p 1,p 2,…,p n ,那么其平均值为x 1p 1+x 2p 2+…+x n p n ;假设x 1,
x2,…,x n的平均数为x,方差为s2,那么ax1+b,ax2+b,…,ax n+b的平均数为a x+b,方差为a2s2.失误与防范
频率散布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
A组专项基础训练
(时刻:40分钟)
一、选择题
1.(2021·重庆)以下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,那么数据落在区间[22,30)内的概率为( )
B.0.4 C.0.5 D.0.6
答案B
解析10个数据落在区间[22,30)内的数据有22,22,27,29共4个,因此,所求的频率为4
10
=0.4.应选B. 2.(2021·辽宁)某班的全部学生参加英语测试,成绩的频率散布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].假设低于60分的人数是15,那么该班的学生人数是
( )
A.45 B.50 C.55 D.60
答案B
解析由频率散布直方图,知低于60分的频率为(0.01+0.005)×20=0.3.∴该班学生人数n=15
0.3
=50. 3.(2021·陕西)对某商店一个月内天天的顾客人数进行了统计,取得样本的茎
叶图(如下图),那么该样本的中位数、众数、极不同离是( )
A.46,45,56 B.46,45,53
C.47,45,56 D.45,47,53
答案A
解析由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,
50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.
4. 为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图,
假设得分值的中位数为m e ,众数为m o ,平均值为x ,那么 ( )
A .m e =m o =x
B .m e =m o <x
C .m e <m o <x
D .m o <m e <x
答案 D
解析 30个数中第15个数是5,第16个数是6,因其中位数m e =5+6
2=5.5,众数m o =5,平均值x =
3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=179
30
.
5. 假设一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,现在样本容量为9,
平均数为x ,方差为s 2,那么
( )
A.x =5,s 2<2
B.x =5,s 2>2
C.x >5,s 2<2
D.x >5,s 2>2
答案 A
解析 考查样本数据的平均数及方差.
∵18(x 1+x 2+…+x 8)=5,∴1
9(x 1+x 2+…+x 8+5)=5,∴x =5,由方差概念及意义可知加入新数据5后,样本数据取值的稳固性比原先强,∴s 2<2,应选A. 二、填空题
6. (2021·湖北)某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4.
那么:(1)平均命中环数为________; (2)命中环数的标准差为________. 答案 (1)7 (2)2 解析 (1)x =
1
10(7+8+7+9+5+4+9+10+7+4)=70
10=7. (2)s 2=
1
10
[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]
=4,∴命中环数的标准差为2.
7. (2021·山东)如图是依照部份城市某年6月份的平均气温(单位:℃)数据取得的样本频率
散布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,
22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,那么样本中平均气温不低于25.5 ℃的城市个数为______. 答案 9
解析 结合直方图和样本数据的特点求解.
最左侧两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右边矩形面积为0.18×1=0.18,50×0.18=9.
8. 将容量为n 的样本中的数据分成6组,绘制频率散布直方图,假设第一组至第六组数据的频率之比为
2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,那么n =________. 答案 60
解析 ∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,∴前三组频数和为2+3+420·n =27,故n =
60. 三、解答题
9. (2021·安徽)假设某产品的直径长与标准值的差的绝对值不超过1 mm 时,那么视为合格品,不然视为不合
格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发觉有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,取得如下频率散布表:
(1)
(2)估量该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;
(3)现对该厂这种产品的某个批次进行检查,结果发觉有20件不合格品.据此估算这批产品中的合格品的件数.
解 (1)如下表所示频率散布表.
(2)(1,3]内的概率约为0.50+0.20=0.70.
(3)设这批产品中的合格品数为x 件,依题意50
5 000=20
x +20,解得x =5 000×20
50-20=1 980.
因此该批产品的合格品件数大约是1 980件.
10.(2021·广东)某校100名学生期中考试语文成绩的频率散布直方图如下图,其中成绩分组区间是[50,60),
[60,70),[70,80),[80,90),[90,100]. (1)求图中a 的值;
(2)依照频率散布直方图,估量这100名学生语文成绩的平均分;
(3)假设这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.
解 (1)(2)由频率散布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).
(3)由频率散布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为
0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.
由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×5
4=25.
故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10. B 组 专项能力提升 (时刻:30分钟)
1. (2021·四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如下图,以组
距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率散布直方图是
( )
答案 A
解析 由于频率散布直方图的组距为5,排除C 、D ,又[0,5),[5,10)两组各一人,排除B ,应选A. 2. 为了了解某校高三学生的视力情形,随机地抽查了该校100名高三学生的视力情形,取得频率散布直方图,
如下图.由于不慎将部份数据丢失,但明白前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,那么a ,b 的值别离为
( ) A .0.27,78
B .0.27,83
C .2.7,78
D .2.7,83
答案 A
解析 由题意,知4.5到4.6之间的频率为0.09,4.6到4.7之间的频率为0.27,后6组的频数成等差数列,设公差为d ,那么有6×0.27+15d =1-0.01-0.03-0.09,解得d =-0.05,从而求得b =78.
3. 某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发觉有2名同窗的分数记录错了,
甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方不同离是
( )
A .70,75
B .70,50
C .75,1.04
D .62,2.35
答案 B
解析 因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s 2,
那么由题意可得:s 2=
1
48
[(x 1-70)2+(x 2-70)2+…+(80-70)2+(70-70)2+…+(x 48-70)2],
而更正前有75=1
48[(x 1-70)2+(x 2-70)2+…+(50-70)2+(100-70)2+…+(x 48-70)2],
化简整理得s 2=50.
4. 在样本的频率散布直方图中,共有4个小长方形,这4个小长方形的面积由小到大组成等比数列{a n },已知
a 2=2a 1,且样本容量为300,那么小长方形面积最大的一组的频数为______.
答案 160
解析 ∵小长方形的面积由小到大组成等比数列{a n },且a 2=2a 1, ∴样本的频率组成一个等比数列,且公比为2, ∴a 1+2a 1+4a 1+8a 1=15a 1=300,∴a 1=20, ∴小长方形面积最大的一组的频数为8a 1=160.
5. 从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率散布直方图(如图).由图中数据
可知a =____________.假设要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方式选取18人参加一项活动,那么从身高在[140,150]内的学生当选取的人数应为________. 答案 0.030 3
解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a =1-0.700
10=0.030.由题意知,身
高在[120,130),[130,140),[140,150]内的学生别离为30人,20人,10人,∴由分层抽样可知抽样比为
18
60=3
10, ∴在[140,150]当选取的学生应为3人.
6. 某高校在2021年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,取得的频率散布
表如下表所示.
(1)
(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组顶用分层抽样的方式抽取6名学生进入第二轮面试,那么第3、4、5组每组各抽取多少名学生进入第二轮面试?
(3)在(2)的前提下,学校决定在6名学生中随机抽取2名学生同意A 考官进行面试,求:第4组至少有一名学生被考官A 面试的概率.
解 (1)由题意可知,第2组的频数为0.35×100=35, 第3组的频率为30
100=0.300,
频率散布直方图如下图:
(2)因为第3、4、5组共有60名学生,因此利用分层抽样在60名学生中抽取6名学生,每组别离为 第3组:3060×6=3人,第4组:20
60×6=2人,
第5组:10
60
×6=1人.
因此第3、4、5组别离抽取3人、2人、1人. (3)设第3组的3位同窗为A 1,A 2,A 3, 第4组的2位同窗为B 1,B 2, 第5组的1位同窗为C 1,
那么从六位同窗中抽两位同窗有15种可能如下:
(A 1,A 2),(A 1,A 3),(A 1,B 1),(A 1,B 2),(A 1,C 1),(A 2,A 3),(A 2,B 1),(A 2,B 2),(A 2,C 1),(A 3,B 1),(A 3,B 2),(A 3,C 1),(B 1,B 2),(B 1,C 1),(B 2,C 1).
其中第4组的2位同窗至少有一名同窗入选的有(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,
B 2),(B 1,B 2),(B 1,
C 1),(B 2,C 1)9种可能,因此第4组的2位同窗至少有一名同窗入选的概率为
9
15=35
.。

相关文档
最新文档