高中数学必修二 9 2 用样本估计总体(精讲)(含答案)

合集下载

高一数学人教A版(2019)必修第二册: 9 2 3总体集中趋势的估计 学案(含答案)

高一数学人教A版(2019)必修第二册: 9 2 3总体集中趋势的估计 学案(含答案)

第九章 统计9.2 用样本估计总体9.2.3 总体集中趋势的估计学习目标1. 理解样本数据基本数字特征的意义和作用,对样本数据中提取的基本数字特征(如众数、中位数、平均数)作出合理解释;2. 体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;3. 体会样本数字特征的随机性;4. 会用样本估计总体的思想解决实际问题.随堂训练1. 一个样本的容量为60,分成5组,已知第一组、第三组的频数分别是9、10,第二、五组的频率都为15,则该样本的中位数在( ) A .第二组 B .第三组 C .第四组 D .第五组2. 对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图所示,则估计此样本的众数、中位数分别为( )A .2.25,2.5B .2.25,2.02C .2,2.5D .2.5,2.253. 为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A.m e=m0=x B.m e=m0<xC.m e<m0<x D.m0<m e<x4. 已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么数据的众数是________,平均数是________.5. 我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.6. 一次数学知识竞赛中,两组学生成绩如下:经计算,已知两个组的平均分都是80分,请根据所学过的统计知识,进一步判断这次竞赛中哪个组更优秀,并说明理由.答案随堂训练1. 答案:B解析:第二组的频数为60×15=12, ∵9+12=21<30,9+12+10=31>30,∴中位数在第三组.故选B.2. 答案:B解析:众数是指样本中出现频率最高的数,在频率分布直方图中通常取该组区间的中点,所以众数为2+2.52=2.25.中位数是频率为0.5的分界点,由频率分布直方图,可知前4组的频率和为(0.08+0.16+0.30+0.44)×0.5=0.49,因此中位数出现在第5组,设中位数为x ,则(x -2)×0.5=0.01,解得x =2.02.故选B.3. 答案:D解析:由题目所给的统计图可知,30个数据按大小顺序排列好后,中间两个数为5,6,故中位数为m e =5+62=5.5.又众数为m 0=5, 平均值x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930≈5.97, ∴m 0<m e <x .故选D.4.答案:6;5解析:∵中位数为5,∴4+x 2=5,即x =6. ∴该组数据的众数为6,平均数为-1+0+4+6+6+156=5. 5.答案:解:(1)由频率分布直方图,可知月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a ,解得a =0.30.(2)由(1),100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12, 由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)设中位数为x 吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.6.答案:解:(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数这一角度看,甲组成绩好些.(2)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(3)从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成绩在高分段的人数多.同时,乙组满分比甲组多6人,从这一角度看,乙组成绩较好.。

人教A版数学必修第二册第九章《9.2 用样本估计总体》同步讲义

人教A版数学必修第二册第九章《9.2 用样本估计总体》同步讲义

人教A 版数学必修第二册第九章《统计》同步讲义9.2 用样本估计总体一.总体取值规律的估计(一)作频率分布直方图的步骤1.求极差:2.决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.3.将数据分组4.列频率分布表:各小组的频率=5.画频率分布直方图纵轴表示频率组距,频率组距实际上就是频率分布直方图中各小长方形的高度,小长方形的面积= =频率.(二)频率分布直方图的性质1.因为小矩形的面积= = ,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小矩形的面积之和等于1.3.频数相应的频率=样本容量.二.常见统计图表的特点与区别1.扇形图:用于直观描述各类数据占总数的比例,易于显示每组数据相对于总数的大小2.条形图:主要用于直观描述不同类别或分组数据的频数和频率,适用于描述离散型数据。

3.直方图主要用于直观描述不同类别或分组数据的频数和频率,直方图适用于描述连续型数据.4.折线图主要用于描述数据随时间的变化趋势.三.总体百分位数的估计1.百分位数定义:一般地,一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有p %的数据小于或等于这个值,且至少有(100-p )%的数据大于或等于这个值.2.常用的百分位数(1)四分位数:第25百分位数,第50百分位数,第75百分位数.(2)其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.3.计算一组n 个数据的第p百分位数的一般步骤如下:第1步,按从小到大排列原始数据;第2步,计算i =n ×p %;第3步,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.四.总体集中趋势的估计(一)众数、中位数、平均数1.众数:一组数据中出现次数最多的数.2.中位数:如果一组数有奇数个数,且按照从小到大排列后为x 1,x 2,…,x 2n +1,则称x n +1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x 1,x 2,…,x 2n ,则称x n +x n +12为这组数的中位数.3.平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n(x 1+x 2+…+x n )叫做这n 个数的平均数.(二)频率分布直方图中平均数、中位数、众数的求法(1)众数:取最高小长方形底边中点的横坐标作为众数.(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x 轴交点的横坐标称为中位数.(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 五.总体离散程度的估计1.假设一组数据为x 1,x 2,…x n ,则这组数据的平均数= ,方差为标准差2.如果总体中所有个体的变量值分别为Y 1,Y 2,…,Y N ,总体平均数为,则称为总体方差,S =S 2为总体标准差.3.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.4.分层随机抽样的方差设样本中不同层的平均数分别为x 1,x 2,…,x n ,方差分别为s 21,s 2,…,s 2n ,相应的权重分别为w 1,w 2,…,w n,则这个样本的方差为x s =Y n22i i 11S (Y Y)N ==-∑n222ii i i 1S w [S(x x)]==+-∑题型一 总体取值规律的估计【例1-1】(2023·全国·高一专题练习)在2022年某地销售的汽车中随机选取1000台,对销售价格与销售数量进行统计,这1000台车辆的销售价格都不小于5万元,小于30万元,将销售价格分为五组:(单位:万元).统计后制成的频率分布直方图如图所示.在选取的1000台汽车中,销售价格在内的车辆台数为( )A .800B .600C .700D .750【例1-2】(2023天津)从某小区抽取100户居民用户进行月用电调查,发现他们的用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.在被调查的用户中,用电量落在区间内的户数为( )A .45B .46C .54D .70【例1-3】(2023·江苏)党的二十大报告指出:“全面提高人才自主培养质量,着力造就拔尖创新人才,聚天下英才而用之.”某区域教育部门为提高学生的创新能力,组织了200名学生参与研究性学习,每人仅参加1个课题组,参加各课题组的人数占比的扇形统计图如图所示,则参加数学类的人数比参加理化类的人数多()[)[)[)[)[)5,1010,1515,2020,2525,30,,,,[)10,2050350kW h ⋅:[100,200)A .16B .30C .32D .62【例1-4】(2023云南)下图是国家统计局发布的我国最近10年的人口出生率(单位:‰),根据下图,则( )A .这10年的人口出生率逐年下降B .这10年的人口出生率超过12‰的年数所占比例等于45%C .这10年的人口出生率的80%分位数为13.57‰D .这10年的人口出生率的平均数小于12‰题型二 总体百位分数的估计【例2-1】(2023·辽宁)某地有9个快递收件点,在某天接收到的快递个数分别为360,284,290,300,402,188,240,260,288,则这组数据的第72百分位数为( )A .290B .295C .300D .330【例2-2】(2023·全国·高一专题练习)《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是()[40,45),[45,50),[50,55),[55,60),[60,65),[65,70]A .55B .57.25C .58.75D .60题型三 总体集中趋势的估计【例3-1】(2023上海徐汇)军训时,甲、乙两名同学进行射击比赛,共比赛10场,每场比赛各射击四次,且用每场击中环数之和作为该场比赛的成绩.数学老师将甲、乙两名同学的10场比赛成绩绘成如图所示的茎叶图(成绩的十位数为“茎”,个位数为“叶”),并给出下列三个结论:①甲的成绩的极差是29;②乙的成绩的中位数是18;③乙的成绩的众数是22.则三个结论中,正确结论个数为( ).A .3B .2C .1D .0【例3-2】(2023秋·内蒙古包头·高三统考期末)某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数分别为a ,b ,c ,则( )A .B .C .D .【例3-3】(2023春·浙江温州)(多选)《国家学生体质健康标准》是国家学校教育工作的基础性指导文件和教育质a b c <<b a c <<a c b <<b<c<a量基本标准,它适用于全日制普通小学、初中、普通高中、中等职业学校、普通高等学校的学生.某高校组织名大一新生进行体质健康测试,现抽查200名大一新生的体测成绩,得到如图所示的频率分布直方图,其中分组区间为,,,,,.则下列说法正确的是( )A .估计该样本的众数是B .估计该样本的均值是C .估计该样本的中位数是D .若测试成绩达到分方可参加评奖,则有资格参加评奖的大一新生约为人题型四 总体离散程度的估计【例4-1】(2023·高一课时练习)两名运动员在某次测试的6次成绩如图所示,则两人平均数与方差的关系是( )A .甲的平均数大,方差小B .平均数相等,甲方差大C .平均数相等,甲方差小D .平均数和方差都相等【例4-2】(2023 浙江湖州 )(多选)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则()4000[70,75)[75,80)[80,85)[85,90)[90,95)[95,100)87.58086852200A .骑车时间的中位数的估计值是22分钟B .坐公交车时间的40%分位数的估计值是19分钟C .坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值D .坐公交车时间的方差的估计值小于骑车时间的方差的估计值【例4-3】(2023内蒙古赤峰·)甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是( )A .甲同学比乙同学发挥稳定,且平均成绩也比乙同学高B .甲同学比乙同学发挥稳定,但平均成绩比乙同学低C .乙同学比甲同学发挥稳定,且平均成绩也比甲同学高D .乙同学比甲同学发挥稳定,但平均成绩比甲同学低【例4-4】(2023 北京·高一校考期末)经过简单随机抽样获得的样本数据为,且数据的平均数为,方差为,则下列说法正确的是( )A .若数据,方差,则所有的数据都为0B .若数据,的平均数为,则的平均数为6C .若数据,的方差为,则的方差为12D .若数据,的分位数为90,则可以估计总体中有至少有的数据不大于9012,,,n x x x 12,,,n x x x x 2s 12,,,n x x x 20s =()1,2,,i x i n = 12,,,n x x x 3x =()211,2,,i i y x i n =+= 12,,,n x x x 23s =()211,2,,i i y x i n =+= 12,,,n x x x 25%75%答案解析一.总体取值规律的估计(一)作频率分布直方图的步骤1.求极差:极差为一组数据中最大值与最小值的差.2.决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.3.将数据分组4.列频率分布表:各小组的频率=小组频数样本容量.5.画频率分布直方图纵轴表示频率组距,频率组距实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×频率组距=频率.(二)频率分布直方图的性质1.因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小矩形的面积之和等于1.3.频数相应的频率=样本容量.二.常见统计图表的特点与区别1.扇形图:用于直观描述各类数据占总数的比例,易于显示每组数据相对于总数的大小2.条形图:主要用于直观描述不同类别或分组数据的频数和频率,适用于描述离散型数据。

高中数学第九章统计之用样本估计总体(精练)(必修第二册)(教师版含解析)

高中数学第九章统计之用样本估计总体(精练)(必修第二册)(教师版含解析)

9.2 用样本估计总体(精练)【题组一 总体取值规律的估计】1.(2020·江苏苏州市·星海实验中学高一期中)为了解学生课外阅读的情况,随机统计了n 名学生的课外阅读时间,所得数据都在[50,150]中,其频率分布直方图如图所示.已知在[50,75)中的频数为100,则n 的值是( )A .500 B .1000 C .10000 D .25000【答案】B【解析】由图可得在[50,75)中的频率为0.004250.1⨯=,所以10010000.1n ==,故选:B. 2.(2021·北京昌平区·高一期末)某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[90,100],样品数据分组为[90,92),[92,94),[94,96),[96,98),[98,100].已知样本中产品净重小于94克的个数为36,则样本中净重大于或等于92克并且小于98克的产品的个数是( )A .45B .60C .75D .90【答案】D【解析】[90,92),[92,94),[94,96),[96,98)对应的频率分别为:0.1,0.2,0.3,0.25设样本容量为n因为净重小于94克的个数为36,所以()0.10.236n+=,解得120n=则样本中净重大于或等于92克并且小于98克的产品的个数为()0.20.30.2512090++⨯=故选:D3.(2021·北京市第四中学顺义分校高一期末)为了解学生在“弘扬传统文化,品读经典文学”月的阅读情况,现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(阅读时间[]0,50t∈),分组整理数据得到如图所示的频率分布直方图.则图中a的值为( )A.0.028 B.0.030 C.0.280 D.0.300【答案】A【解析】由(0.0060.0400.0200.006)101a++++⨯=得0.028a=.故选:A4.(2020·广东云浮市·高一期末)在容量为50的样本中,某组的频率为0.18,则该组样本的频数为( ).A.9 B.10 C.18 D.20【答案】A【解析】由题意,频数=样本容量×频率500.189=⨯=.故选:A5.(2021·湖南长沙市)“水是生命之源”,但是据科学界统计可用淡水资源仅占地球储水总量的2.8%,全世界近80%人口受到水荒的威胁.某市为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨):一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照00.50.51,...,[[[44.5,),,),)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有60万居民,估计全市居民中月均用水量不低于2.5吨的人数,并说明理由; (3)若该市政府希望使82%的居民每月的用水不按议价收费,估计x 的值,并说明理由. 【答案】(1)0.3;(2)16.2万;(3)2.8吨.【解析】(1)由概率统计相关知识,可知各组频率之和的值为1 即频率分布直方图各小矩形面积之和为1()0.50.080.160.40.520.120.080.0421a ∴⨯+++++++=解得:0.3a =(2)由图可知,不低于2.5吨人数所占百分比为()0.50.30.120.080.0427%⨯+++= ∴全市月均用水量不低于2.5吨的人数为:600.2716.2⨯=(万)(3)由(2)可知,月均用水量小于2.5吨的居民人数所占百分比为:73% 即73%的居民月均用水量小于2.5吨,同理,88%的居民月均用水量小于3吨 故2.53x <<假设月均用水量平均分布,则()82%73%2.5 2.80.3x -=+=(吨)6.(2020·天津河西区·)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30、42、41、36、44、40、37、37、25、45、29、43、31、36、49、34、33、43、38、42、32、34、46、39、36,根据上述数据得到样本的频率分布表如下:分组频数频率[]25,3030.12(]30,3550.20(]35,4080.32(]40,451n1f(]45,502n2f(1)确定样本频率分布表中1n、2n、1f和2f的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(]30,35的概率. 【答案】(1)17n=,22n=,10.28f=,20.08f=;(2)详见解析;(3)0.5904.【解析】(1)由题意知17n=,22n=,170.2825f∴==,220.0825f==;(2)样本频率分布直方图为:(3)根据样本频率分布直方图,每人的日加工零件数落在区间(]30,35的概率0.2, 设所取的4人中,日加工零件数落在区间(]30,35的人数为ξ,则()~4,0.2B ξ,,所以4人中,至少有1人的日加工零件数落在区间(]30,50的概率约为0.5904. 【题组二 总体百分数的估计】1.(2020·全国高一课时练习)一组数据12,34,15,24,39,25,31,48,32,36,36,37,42,50的第25,75百分位数分别是______、________. 【答案】25 39【解析】把数据从小到大排序为12,15,24,25,31,32,34,36,36,37,39,42,48,50共14个数, 14×25%=3.5, 14×75%=10.5, 所以第25,75百分位数分别是第4,11项数据,即是25,39. 故答案为:25,39.2.(2021·安徽宿州市·高一期末)若一组数据为82,81,79,78,95,88,92,84,则该组数据的75%分位数是___________. 【答案】90【解析】由题可得一共有8个数据,则该组数据的75%分位数在第6位和第7位之间,为()8892902+=.故答案为:90.3.(2020·山东东营市·广饶一中高一期末)数据10,9,8,7,6,5,4,3,2,1的25%分位数、80%分位数分别是_______; 【答案】3;8.5【解析】将数据10,9,8,7,6,5,4,3,2,1从小到大排序得:1,2,3,4,5,6,7,8,9,10, 当%25%p =时,10%1025% 2.5i p ==⨯=,25%∴分位数为3. 当%80%p =时,10%1080%8i p ==⨯=,80%∴分位数为89=8.52+.故答案为:3;8.5. 4.(2020·天津市滨海新区大港太平村中学高一期末)树人中学高一1班23名男生身高的样本数据(单位:cm )按从小到大排序,排序结果如下:164,165,165,166,167,168,168,168,170,170,170,172, 172,172,173,173,173,173,174,175,175,175,176. 由数据估计树人中学高一年级男生身高的第50百分位数为________.【答案】172【解析】由2350%11.5⨯=,将样本数据从小到大排列,第12个数字为172,所以可估计树人中学高一年级男生身高的第50百分位数为172.故答案为:172.5.(2020·山东泰安市·高一期末)某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,174,175,若样本数据的第90百分位数是173,则x的值为________.【答案】172【解析】百分位数的意义就在于,我们可以了解的某一个样本在整个样本集合中所处的位置,本题第90百分位数是173,所以1741732x+=,172x=故答案为:1726.(2020·临高县临高中学高一期末)下列数据是30个不同国家中每10000名患某种疾病的男性的死亡人数:1.5 3.2 5.2 5.6 5.6 7.1 8.7 9.2 10.0 11.213.2 13.7 13.8 14.5 15.2 15.7 16.5 18.8 19.2 23.927 27 28.9 28.9 33.1 33.8 34.8 40.6 41.6 50.1这组数据的第70百分位数是_______________.【答案】27.【解析】按从小到大排列此30个数据,指数3070%21i=⨯=,则第70百分位数是2727272+=,故答案为:27.7.(2020·全国高一课时练习)某同学在7天内每天参加体育锻炼的时间(单位:分钟)如下65,65,66,74,73,81,80,则它们的第三四分位数是________ .【答案】80【解析】从小到大排序为65,65,66,73,74,80,81,第三四分位数即75%分位数,7×75%=5.25,所以第三四分位数是第6项数据80.故答案为:808.(2020·江苏高一期中)已知一组数据1,3,2,,4m,且这组数据的平均数为3,则m的值为__________. 【答案】5【解析】由题意132435m++++=,解得5m=故答案为:5【题组三总体集中趋势的估计】1.(2020·全国高一课时练习)10名工人某天生产同一零件,生产的件数是15、17、14、10、15、17、17、16、14、12.设其平均数为a ,中位数为b ,众数为c ,则有( )A .a b c >>B .c b a >>C .c a b >>D .b c a >>【答案】B【解析】将生产的件数由小到大排列为:10、12、14、14、15、15、16、17、17、17,()11517141015171716141214.710a ∴=+++++++++=,中位数为15b =, 众数为17c =.因此,c b a >>.故选:B.2.(2021·安徽宿州市·高一期末)2020年宿州市某中学参加高中数学建模(应用)能力测试,高一年级有60人,高二年级有40人.高一的平均成绩为70分,高二的平均成绩为80分,则参加测试的100名学生的平均成绩为( ) A .72分 B .73分C .74分D .75分【答案】C【解析】由题意可得,参加测试的100名学生的平均成绩为6070408074100⨯+⨯=.故选:C.3.(2021·北京房山区·高一期末)根据气象学上的标准,连续5天的日平均气温低于10C 即为入冬.现有甲、乙、丙、丁四地连续5天的日平均温度的记录数据(记录数据都是正整数): ①甲地:5个数据的中位数为7,众数为6; ②乙地:5个数据的平均数为8,极差为3; ③丙地:5个数据的平均数为5,中位数为4; ④丁地:5个数据的平均数为6,方差小于3. 则肯定进入冬季的地区是( ) A .甲地 B .乙地C .丙地D .丁地【答案】D【解析】①甲地:5个数据的中位数为7,众数为6;则这5个数据可能为6,6,7,10,11;即连续5天的日平均气温不是都低于10C ,所以甲地不一定入冬,故A 错;②乙地:5个数据的平均数为8,极差为3;则这5个数据可能为7,7,8,8,10;即连续5天的日平均气温不是都低于10C ,所以乙地不一定入冬,故B 错;③丙地:5个数据的平均数为5,中位数为4;则这5个数据可能为1,2,4,7,11;即连续5天的日平均气温不是都低于10C ,所以丙地不一定入冬,故C 错;④丁地:5个数据的平均数为6,方差小于3.如有数据大于等于10,则方差必大于等于()210616355-=>,不满足题意,因此丁地这续5天的日平均气温都低于10C ,所以丁地一定入冬,故D 正确; 故选:D.4.(2020·全国高一)某组数据的茎叶图如图所示,其众数为a ,中位数为b ,平均数为c ,则( )A .a b c >> B .a c b >> C .b a c >> D .c a b >>【答案】A【解析】由图中数据可得23a =,202120.52b +== 89131517202123232632332012c +++++++++++==所以a b c >>故选:A5.(2020·全国高一)已知一组数据的频率分布直方图如图所示,则众数、中位数、平均数分别为( )A .63,64,66B .65,65,67C .55,64,66D .64,65,64【答案】B【解析】由频率分布直方图可知,众数为6070652+=; 由100.0350.040.5⨯+⨯=,所以面积相等的分界线为65,即中位数为65; 平均数为550.3650.4750.15850.1950.0567⨯+⨯+⨯+⨯+⨯=.故选:B .6.(2020·广东汕头市·金山中学高一月考)甲、乙两名学生的六次数学测验成绩(百分制)的茎叶图如图所示.①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学的平均分高;③甲同学的平均分比乙同学的平均分低;④甲同学成绩的方差小于乙同学成绩的方差.上面说法正确的是( )A.③④B.①②④C.②④D.①③④【答案】A【解析】由茎叶图知甲同学的成绩为72,76,80,82,86,90;乙同学的成绩为69,78,87,88,92,96.故甲同学成绩的中位数小于乙同学成绩的中位数,①错;计算得甲同学的平均分为81,乙同学的平均分为85,故甲同学的平均分比乙同学的平均分低,因此②错、③对;计算得甲同学成绩的方差小于乙同学成绩的方差,故④对.7.(2020·山东枣庄市·滕州市第一中学新校高一月考)从某食品厂生产的面包中抽取100个,测量这些面包的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数82237285(1)在相应位置上作出这些数据的频率分布直方图;(2)估计这种面包质量指标值的平均数x(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包90%的规定?”【答案】(1)见解析;(2)100;(3)见解析.【解析】(1)画图.(2)质量指标值的样本平均数为800.08900.22x=⨯+⨯1000.371100.28+⨯+⨯1200.05100+⨯=.所以这种面包质量指标值的平均数的估计值为100.(3)质量指标值不低于85的面包所占比例的估计值为0.220.370.280.050.92+++=,由于该估计值大于0.9,故可以认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包90%的规定.”8.(2020·安徽蚌埠市·蚌埠二中高一月考)某学校对男、女学生进行有关“习惯与礼貌”的评分,记录如下:男:54,70,57,46,90,58,63,46,85,73,55,66,38,44,56,75,35,58,94,58;女:77,55,69,58,76,70,77,90,51,53,63,64,69,83,83,65,100,75.(1)分别计算男、女学生得分的平均数;(2)分别计算男、女学生得分的四分位数.【答案】(1)男生平均数为61.05,女生平均数为71;(2)男生得分的四分位数: 50, 58, 71.5;女生得分的四分位数: 63, 69.5, 77.【解析】(1)男学生的平均数为1547057469058634685735566384456753558945820x+++++=++++++++++++++ 61.05=,女学生得分的平均数2775569587670779051536364698383651007518x=+++++++++++++++++71=.(2)男、女学生得分从小到大排列为男:35,38,44,46,46,54,55,56,57,58,58,58 ,63,66,70,73,75,85, 90,94;女:51,53,55,58,63,64,65,69,69,70,75,76,77,77,83,83, 90, 100;男、女学生得分的四分位数如下表25%分位数50%分位数75%分位数男生50 58 71.5女生63 69.5 779.(2021·安徽宿州市·高一期末)某地教育部门对某学校学生的阅读素养进行检测,在该校随机抽取了M 名学生进行检测,实行百分制,现将所得的成绩按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100)分成6组,并根据所得数据作出了如下所示的频数与频率的统计表和频率分布直方图.分组 频数 频率 [40,50)[50,60)25p[60,70) s0.30[70,80)mn[80,90) 100.10[90,100]合计M1(1)求出表中,M p 及图中a 的值;(2)估计该校学生阅读素养的成绩中位数以及平均数.【答案】(1)100,0.25,0.02M p a ===;(2)中位数是2003,平均数是68.5. 【解析】(1)由频率统计表可知:101000.1M ==,250.25100p ∴== 由频率分布直方图可知:(0.0050.0250.030.010.01)101a +++++⨯=,解得0.02a = (2)∵前两组的频率和为0.050.250.30.5+=<,前三组的频率和为0.050.250.30.60.5++=> ∴中位数在[60,70)内,设中位数为x ,则0.050.25(60)0.030.5x ++-⨯=,解得2003x =,即中位数为2003.平均数为450.05550.25650.3750.2850.1950.168.5⨯+⨯+⨯+⨯+⨯+⨯= ∴估计该校学生阅读素养的成绩中位数是2003,平均数是68.5. 10.(2020·全国高一单元测试)某班的全体学生共有50人,参加数学测试(百分制)成绩的频率分布直方图如图,数据的分组依次为:[)20,40,[)40,60,[)60,80,[]80,100. 依此表可以估计这一次测试成绩的中位数为70分.(1)求表中a ,b 的值;(2)请估计该班本次数学测试的平均分. 【答案】(1)0.02a =,0.015b =;(2)68分. 【解析】(1)由中位数为70可得,0.005200.0120100.5a ⨯+⨯+=,解得0.02a =.又()200.0050.010.021b ⨯+++=, 解得0.015b =.(2)由频率分布直方图可知,每组的频率依次为:0.1,0.2,0.4,0.3,则该班本次数学测试的平均分的估计值为:300.1500.2700.4900.368⨯+⨯+⨯+⨯=分.10.(2020·调兵山市第一高级中学高一月考)某城市交通部门为了对该城市共享单车加强监管,随机选取了100人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这100人根据其满意度评分值(百分制)按照[)[)[]50,60,60,70,,90,100⋅⋅⋅分成5组,制成如图所示频率分直方图.(1)求图中x 的值;(2)求这组数据的平均数和中位数;(3)已知满意度评分值在[)50,60内的男生数与女生数的比为3:2,若在满意度评分值为[)50,60的人中随机抽取2人进行座谈,求2人均为男生的概率. 【答案】(1)0.02x =;(2)平均数为77,中位数设为5407;(3)310.【解析】(1)由()0.0050.010.0350.030101x ++++⨯=,解得0.02x =.(2)这组数据的平均数为550.05650.2750.35850.3950.177⨯+⨯+⨯+⨯+⨯=. 中位数设为m ,则()0.050.2700.0350.5m ++-⨯=,解得5407m =. (3)满意度评分值在[)50,60内有1000.005105⨯⨯=人,其中男生3人,女生2人.记为12312,,,,A A A B B , 记“满意度评分值为[)50,60的人中随机抽取2人进行座谈,恰有1名女生”为事件A ,从5人中抽取2人有:12A A ,13A A ,11A B ,12A B ,23A A ,21A B ,22A B ,31A B ,32A B ,12B B 所以总基本事件个数为10个,A 包含的基本事件个数为3个, 所以 ()310P A =. 【题组四 总体离散程度的估计】1.(2020·甘肃白银市·高一期末)已知数据123,,x x x 的中位数为k ,众数为m ,平均数为n ,方差为p ,则下列说法中,错误的是( ) A .数据1232,2,2x x x 的中位数为2kB .数据1232,2,2x x x 的众数为2mC .数据1232,2,2x x x 的平均数为2nD .数据1232,2,2x x x 的方差为2p 【答案】D【解析】若数据123,,x x x 的中位数为k ,众数为m ,平均数为n ,则由性质知数据1232,2,2x x x 的中位数,众数,平均数均变为原来的2倍,故,,A B C 正确;则由方差的性质知数据1232,2,2x x x 的方差为4p ,故D 错误; 故选D .2.(2020·四川省绵阳南山中学高一开学考试)数据1x ,2x ,3x …,n x 分别是某学校教职工()*3,n n n N≥∈个人的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为z ,如果再加上世界首富的年收入数据1n x +,则对这()1n +个数据,下列说法正确的是( ) A .年收入平均数增大,中位数可能不变,方差变大 B .年收入平均数增大,中位数一定变大,方差变大C .年收入平均数增大,中位数可能不变,方差可能不变D .年收入平均数可能不变,中位数可能不变,方差可能不变 【答案】A【解析】因为数据1x ,2x ,3x …,n x 分别是某学校教职工个人的年收入,所以世界首富的收入1n x +会远远大于1x ,2x ,3x …,n x ,故这1n +个数据的平均数会大大增加; 而中位数为数据中间的数或中间两个数的平均数,所以中位数有可能不变;因为世界首富的收入远远大于1x ,2x ,3x …,n x ,所以数据的集中程度受1n x +的影响很大,数据离散程度加大,所以方差变大. 故选:A3(2020·定边县第四中学高一期末)x 是1x ,2x ,…,100x 的平均值,1a 为1x ,2x ,…40x 的平均值,2a 为41x ,42x ,…100x 的平均值,则下列各式正确的是( )A.12235a ax+=B.12325a ax+=C.12x a a=+D.122a ax+=【答案】A【解析】因为1a为1x,2x,...40x的平均值,2a为41x,42x, (100)x的平均值,所以1240140x x x a++⋯+=,4142100260x x x a++⋯+=,则有1121002124060231001005x x x a a a ax++⋯+++===.故选:A.4.(多选)(2021·山东德州市·高一期末)国家为了实现经济“双循环”大战略,对东部和西部地区的多个县市的某一类经济指标进行调查,得出东部,西部两组数据的茎叶图如图所示,则下列结论正确的是( )A.西部的平均数为13.3B.东部的极差小于西部的极差C.东部的30%分位数是11.6D.东部的众数比西部的众数小【答案】ACD【解析】对于A:()11.211.512.412.513.113.113.613.613.713.914.414.915.01313.3++++++++++++÷=即西部的平均数为13.3,故A正确;对于B:东部的最大值为15.1,最小值为10.8,极差为15.110.8 4.3-=;西部的最大值为15.0,最小值为11.2,极差为15.011.2 3.8 4.3-=<;故B错误;对于C:东部共13个数据,1330% 3.9⨯=,即从小到大的第4个数11.6为东部的30%分位数,所以东部的30%分位数是11.6,故C正确;对于D:东部的众数为11.3,西部的众数为13.1和13.6均大于11.3,故D正确;故选:ACD5.(多选)(2020·全国高一单元测试)在某地区某高传染性病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各项中,一定符合上述指标的是( )A.平均数3x≤B.标准差2s≤C.平均数3x≤且极差小于或等于2D.众数等于1且极差小于或等于4【答案】CD【解析】对于A选项,若平均数3x≤,不能保证每天新增病例数不超过5人,不符合题意;对于B选项,标准差反映的是数据的波动大小,例如当每天感染的人数均为10,标准差是0,显然不符合题意;对于C选项,若极差等于0或1,在3x≤的条件下,显然符合指标;若极差等于2,假设最大值为6,最小值为4,则3x>,矛盾,故每天新增感染人数不超过5,符合条件,C正确;对于D选项,若众数等于1且极差小于或等于4,则最大值不超过5,符合指标.故选:CD.6.(多选)(2020·济南市·山东师范大学附中高一月考)甲、乙两支田径队队员的体重(单位:kg)信息如下:甲队体重的平均数为60,方差为200,乙队体重的平均数为68,方差为300,又已知甲、乙两队的队员人数之比为1:3,则关于甲、乙两队全部队员的体重的平均数和方差的说法正确的是( )A.平均数为67 B.平均数为66 C.方差为296 D.方差为287【答案】BD【解析】依题意,甲的平均数160x=,乙的平均数268x=,而甲、乙两队的队员人数之比为1:3,所以甲队队员在所有队员中所占比重为14,乙队队员在所有队员中所占比重为34故甲、乙两队全部队员的体重的平均数为:1360686644x=⨯+⨯=;甲、乙两队全部队员的体重的方差为:()()22213200606630068665922828744s ⎡⎤⎡⎤=⨯+-+⨯+-=+=⎣⎦⎣⎦.故选:BD.7.(多选)(2020·江苏无锡市·高一期末)已知一组数据1x ,2x ,3x ,4x ,5x 的平均数和方差均为2,则下列叙述正确的有( )A .11x +,21x +,31x +,41x +,51x +的平均数为3B .11x +,21x +,31x +,41x +,51x +的方差为3C .12x ,22x ,32x ,42x ,52x 的方差为4D .122x +,222x +,322x +,422x +,522x +的方差为8 【答案】AD【解析】对,A B 选项,将每个数据在原基础上加1,故平均数加1,但是方差保持不变, 故其平均数是3,方差是2;故A 正确;B 错误;对C ,将每个数据乘以2,故其方差变为原来的4倍,即为8,故C 错误; 对D ,将每个数据乘以2再加2,故其方差也变为原来的4倍,即为8,故D 正确. 故选:AD .8.(2020·全国高一课时练习)某城区举行“奥运知识”演讲比赛,中学组根据初赛成绩在高一、高二年级中分别选出10名同学参加决赛,这些选手的决赛成绩如图所示.团体成绩 众数 极差 平均数 方差 高一年级 22 39.6 高二年级85.727.8(1)请把上边的表格填写完整.(2)考虑平均数与方差,你认为哪个年级的团体成绩更好些? 【答案】(1)填表见解析;(2)高二年级的团体成绩更好些.【解析】(1)高一年级的成绩为80,87,89,80,88,99,80,77,91,86; 高二年级的成绩为85,97,85,87,85,88,77,87,78,88. 由此可知高一年级成绩的众数是80,平均数x =85+110(-5+2+4-5+3+14-5-8+6+1)=85.7; 高二年级成绩的众数是85,极差是20. 团体成绩 众数 极差 平均数 方差 高一年级 80 22 85.7 39.6 高二年级 85 2085.727.8(2)因为两个年级的得分的平均数相同,高二年级成绩的方差小,说明高二年级的成绩偏离平均数的程度小,所以高二年级的团体成绩更好些.9.(2020·胶州市教育局高一期末)某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑)(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)【答案】(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为25;(3)3700元. 【解析】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=>所以中位数为x 满足7080x << 由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差1022110(90)610i i x s =-⨯==∑所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为222221100...)801008(90)8x x s +---⨯=(2025==(3)将3座教学楼完全包裹的球的最小直径为:22219280204366444100210++=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;将一座教学楼完全包裹的球的最小直径为2222020604400490070++=<=因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元;将1号教学楼与2号教学楼完全包裹的球的最小直径为:2222080601040012100110++=<=又因为22220806010400490070++=>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元;所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元.11.(2020·河南开封市·高一期末)为庆祝国庆节,某中学团委组织了“歌颂祖国,爱我中华”知识竞赛,从参加考试的学生中抽出60名,将其成绩(成绩均为整数)分成[40,50),[50,60),…,[90,100]六组,并画出如图所示的部分频率分布直方图,观察图形,回答下列问题:(1)求第四组的频率,并补全这个频率分布直方图;(2)请根据频率分布直方图,估计样本的中位数和方差.(每组数据以区间的中点值为代表).【答案】(1)第四组的频率为0.3;作图见解析;(2)2203;194.【解析】因为各组的频率和等于1,所以第四组的频率为1(0.0100.0150.0150.0250.005)1010.70.3 -++++⨯=-=. 补全的频率分布直方图如图所示.(2)前三组的频率之和为:(0.0100.0150.015)100.40.5++⨯=<前四组的频率之和为:0.40.03100.70.5+⨯=>设中位数为x ,则应有(70,80)x ∈又0.4(70)0.030.5x +-⨯=,2203x ∴=即样本的中位数为2203 抽取学生的平均数约为10(450.010550.015650.015750.030850.025950.005)71x =⨯⨯+⨯+⨯+⨯+⨯+⨯=所以,样本的方差为:222210[(4571)0.010(5571)0.015(6571)0.015s =⨯-⨯+-⨯+-⨯222(7571)0.030(8571)0.025(9571)0.005]+-⨯+-⨯+-⨯67.638.4 5.4 4.84928.8194=+++++=.。

9.2.1总体取值规律的估计-【新教材】人教A版高中数学必修第二册课件

9.2.1总体取值规律的估计-【新教材】人教A版高中数学必修第二册课件
突出。某市政府为了勤俭生活用水,计划在本市试行居民生活用 水定额管理,即确定一个居民月用水量标准a,用水量不超过a的 部分按平价收费,超出a的部分按议价收费。如果希望大部分居
民的日常生活不受影响,那么标准a定为多少比较合理呢?
你认为,为了较为合理的确定出这个标准,需要做那些 工作?
9.0 13.6 2.2 8.6 2.1 5.7 2.3 10.0 3.6 7.1 22.2 10.0 5.1 24.5 5.5 6.0 5.3 7.8 7.1 28.0
C.110
D.不确定
[答案] A
[解析] 该组的频率是1500=15.
课本P197-1从某小区抽取100户居民用户进行月用电量 调查,发现他们的用电量都在50~350KW·h之间,进行 适当分组后(每组为左闭右开的区间),画出频率散布直方 图如图所示,
(1).直方图中x的值为 70 ;
(2).在被调查的用户中,用电量落在区间[100,250)内的户
将一批数据按要求分为若干组,各组内的数据的个数,叫做 该组数据的频数,各个小组数据在样本容量中所占的比例的大 小,叫做该组数据的频率。
为了解数据散布的规律,可利用频率散布表和频率散布图 来分析,具体做法如下:
1、求极差(即一组数据中最大值和最小值的差)
例如, 28-1.3=26.7, 这说明这些数据的变化范围大小是26.7t。
4、列频率散布表:
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[[170..22,,1103.第.22)) 几组频率193
第几组频数0.13 样本容量 0.09
[13.2,16.2)
9

高中数学新教材第二册第九章《9.2 用样本估计总体》全部课件

高中数学新教材第二册第九章《9.2 用样本估计总体》全部课件

【思考】 选择恰当的统计图表分析样本数据有何好处? 提示:选择恰当的统计图对数据进行可视化描述,能 通过图形直观地发现样本数据的分布情况,进而估计 总体的分布规律。
4.总体百分位数的估计 一组数据的第p百分位数是这样一个值,它使得这 组数据中至少有 p% 的数据小于或等于这个值,且 至少有(100-p)% 的数据大于或等于这个值。 可以通过下面的步骤计算一组n个数据的第p百分位 数:
【类题·通】 绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值, 当数据很多时,可选一个数当参照。 (2)将一批数据分组,目的是要描述数据分布规律, 要根据数据多少来确定分组数目,一般来说,数据越多 ,分组越多。 (3)将数据分组,决定分点时,一般使分点比数据多 一位小数,并且把第一组的起点稍微减小一点。
类型二 频率分布直方图的应用 【典例】某校从高一年级学生中随机抽取部分学 生,将他们的模块测试成绩(总分为100分)分成 6组加以统计,6组的分数分别是[40,50),[50, 60),[60,70),[70,80),[80,90),[90, 100],得到如图所示的频率分布直方图。已知高 一年级学生中不及格(低于60分)的人数
(1)第二小组的频率是多少?样本量是多少? (2)若次数在110以上(含110次)为达标,则该校全 体高一年级学生的达标率是多少?
【解析】(1)频率分布直方图是以面积的形式反映数
据落在各小组内的频率大小的,
4
因此第二小组的频率为 2 4 17 15 9 3=0.08。
又因为第二小组的频率=
第二小组的频数 样本量

所以样本量= 第二小组的频数= 12 =150。
第二小组的频率 0.08
(2)由频率分布直方图可估计,该校高一年级学生的

高中数学人教版必修第二册:9.2用样本估计总体(第一课时)课件

高中数学人教版必修第二册:9.2用样本估计总体(第一课时)课件

16.0
2.4
9.5
3.7
17.0
3.8
4.1
2.3
5.3
7.8
8.1
4.3
13.3
6.8
1.3
7.0
4.9
1.8
7.1
28.0
10.2
13.8
17.9
10.1
5.5
4.6
3.2
21.3
①频率=
频数
容量
求极差
定组数组距


列散布表
画直方图
②小矩形的面积为该小组的频率

෍ =
=
新课讲授
3.2
21.3
新课讲授
数据的整理:
特征数字法: 平均数、众数、中位数 总体百分位数
例2.为勤俭用水,市政府拟出台用户月均用水量标准,实行阶梯水费,但希望使80%的居民用户生活用水费用
支出不受影响,根据抽样所得数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
分析:由题意,设月均用水量为,则全市用水量中不超过的用户占80%,大于的占20%.
9.0
13.6
14.9
5.9
4.0
7.1
6.4
5.4
19.4
2.0
2.2
8.6
13.8
5.4
10.2
4.9
6.8
14.0
2.0
10.5
2.1
5.7
5.1
16.8
6.0
11.1
1.3
11.2
7.7
4.9
2.3
10.0
16.7
12.0
12.4
7.8

新必修二 9.2用样本估计总体(课件+练习)(含百分位数)

新必修二  9.2用样本估计总体(课件+练习)(含百分位数)

9.2用样本估计总体【要点梳理】要点一、总体取值规律的估计(频率分布直方图)频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.1.步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数: 组距与组数的确定没有具体的标准,一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分为5~12组.(3)将数据分组(4)列频率分布表(5)画频率分布直方图: 其中横轴表示数据,纵轴表示频率与组距的比.2.意义:频率分布直方图中,每个小矩形的面积表示相应组的频率,所有小矩形的面积的总和等于1.3.频率分布的估计:频率分布是指各个小组数据在容量中所占比例的大小,可以用样本的频率分布估计总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.要点诠释:频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有具体数据信息就被抹掉了.3.当频率分布直方图的组数少,组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息,当频率分布直方图的组数多,组距小时,保留了较多的原始数据信息,但由于场小长方形的较多,有时图形会变的非常不规则,不容易从中看出数据分布的特点4.补充:除频率分布直方图外,我们在初中还学习过条形图、扇形图、折线图、频数分布直方图等,不同的统计图在表示数据上有不同的特点,例如扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,折线图主要用于描述数据随时间的变化趋势。

不同的统计图适用的数据类型也不同,例如条形图适用于描述离散型数据,直方图适用描述连续型数据等。

2024春高中数学第9章统计9.2用样本估计总体9.2.2总体百分位数的估计课件新人教A版必修第二册

2024春高中数学第9章统计9.2用样本估计总体9.2.2总体百分位数的估计课件新人教A版必修第二册
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因 为 共 有 12 个 数 据 , 所 以 12×25% = 3 , 12×75% = 9 , 12×95% =
8.0+8.3
8.6+8.9
11.4,则第25百分位数是
=8.15,第75百分位数是

2
2
前七组的频率之和为0.60+0.12=0.72,
前八组的频率之和为0.72+0.09=0.81,
前九组的频率之和为0.81+0.11=0.92.
由前六组的频率之和为0.60,得样本数据的第60百分位数为110,样
本 数 据 的 第 80 百 分 位 数 一 定 在 第 八 组 [115 , 120) 内 , 由 115 +
在[110,120)上为60×0.020×10=12,
在[120,130]上为60×0.010×10=6.
从以上 数 据 可 知 第 50百 分 位 数 一 定 落 在 区 间 [100 , 110)上 , 由 100+
0.5−0.4
10×
≈103.3;
0.7−0.4
0.75−0.7
第75百分位数一定落在区间[110,120)上,由110+10×
8.75,第95百分位数是第12个数据为9.9.
(2)请你找出珍珠质量较小的前15%的珍珠质量.
[解]
因为共有12个数据,所以12×15%=1.8,则第15百分位数是第
2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8 g,
7.9 g.
反思领悟 百分位数是用于衡量数据位置的度量,它提供了有关数
0.80−0.72

高中数学必修二 9 2 2 总体百分位数的估计(含答案)

高中数学必修二  9 2 2 总体百分位数的估计(含答案)

第九章统计9.2.2 总体百分位数的估计一、基础巩固1.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取10位北京市民,他们的幸福感指数为3,4,5,5,6,7,7,8,9,10.则这组数据的75%分位数是()A.7 B.7.5C.8 D.8.5【答案】C【详解】由题意,这10个人的幸福指数已经从小到大排列,⨯=,因为75%107.5所以这10个人的75%分位数是从小到大排列后第8个人的幸福指数,即8.2.高二(1)班7人宿舍中每个同学的身高分别为170,168,172,172,175,176,180,求这7人的第60百分位数为( )A.168 B.175 C.172 D.176【答案】B【详解】将7人的身高从低到高排列:168,170,172,172,175,176,180⨯=760% 4.2∴第5个数据为所求的第60百分位数,即这7人的第60百分位数为1753.以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)78、70、72、86、88、79、80、81、94、84、56、98、83、90、91,则这15人成绩的第80百分位数是()A.90B.91.5C.91D.90.5【答案】D【详解】将这15人成绩由小到大依次排列为56、70、72、78、79、80、81、83、84、86、88、90、91、94、98,1580%12⨯=,因此,这15人成绩的第80百分位数是909190.52+=. 4.已知一组数据为4,5,67,8,8,,第40百分位数是( ) A .8 B .7C .6D .5【答案】C 【详解】 因为有6位数, 所以640 2.4⨯=%,所以第40百分位数是第三个数6.5.为实现国民经济新“三步走”的发展战略目标,国家加大了扶贫攻坚的力度.某地区在2015 年以前的年均脱贫率(脱离贫困的户数占当年贫困户总数的比)为70%.2015年开始,全面实施“精准扶贫”政策后,扶贫效果明显提高,其中2019年度实施的扶贫项目,各项目参加户数占比(参加该项目户数占 2019 年贫困户总数的比)及该项目的脱贫率见下表:那么2019年的年脱贫率是实施“精准扶贫”政策前的年均脱贫率的( ) A .2728倍 B .4735倍 C .4835倍 D .75倍 【答案】B 【详解】设贫困户总数为a ,脱贫率0000000000240952109094a aP a⨯⨯+⨯⨯==, 所以000094477035=. 故2019年的年脱贫率是实施“精准扶贫”政策前的年均脱贫率的4735倍. 6.已知样本那么其25%分位数和70%分位数分别是()A.8.85和11.0B.8.7和11.0C.8.85和11.1D.8.7和11.1【答案】A【详解】所有数据从小到大排列为:6.4,8.0,8.3,8.7,9.0,9.3,9.6,10.0,10.1,10.5,10.6,11.0,11.2,12.4,12.7,13.0总共有16个数据,25%16=4⨯,所以第4个数,第5个数分别为:8.7,9.0所以8.79.08.852+=则25%分位数是8.8570%1611⨯≈.所以第11个数,第12个数分别为:10.6,11.0则10.611.010.82+=,又因为对10.8的近似值也行,故70%分位数是11.0答案为:A7.某学习兴趣小组学生的一次测验成绩如下:130,135,126,123,145,145,150,131,143,144.这个兴趣小组学生的测验成绩的第75百分位数是()A.131 B.143 C.150 D.145 【答案】D【详解】共10个数据,且75%107.5⨯=,∴这个兴趣小组的测验成绩的第75百分位数为第8个数据∴将这10个测验成绩按从小到大排列为123,126,130,131,135,143,144,145,145,150,∴所求的成绩的第75百分位数为145.故选:D8.已知一组数据为7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,20,那么这组数据的第25百分位数是( )A .8B .9C .10D .11【答案】A 【详解】解:数据从小到大排列是:7,7,8,8,8,8,9,9,10,10,10,10,11,11,12,12,13,13,14,20, 共20个数据,2025%5⨯=,所以这组数据的第25百分位数是第5项与第6项数据的平均数,即8, 9.给定一组从小到大排列的数据如下:100,101,102,103,104,105,106,107,108,109. 这组数据的第30百分位数是( ) A .102 B .103C .102.5D .不确定【答案】C 【详解】30%103⨯=,∴这组数据的第30百分位数是102.52102103=+. 10.已知从某中学高一年级随机抽取20名女生,测量她们的身高(单位:cm ),把这20名同学的身高数据从小到大排序:148.0 149.0 150.0 152.0 154.0 154.0 155.0 155.5 157.0 157.0 158.0 159.0 161.0 162.0 163.0 164.0 165.0 170.0 171.0 172.0 则这组数据的第75百分位数是( ) A .163.0 B .164.0C .163.5D .164.5【答案】A 【详解】解:因为这组数据从小到大已排序,所以这组数据的第75百分位数为第200.7515⨯=个数,即为163.011.数据1,2,3,4,5,6的60%分位数为( ) A .3 B .3.5C .3.6D .4【答案】D 【详解】由6⨯60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数, 12.数据12,14,15,17,19,23,27,30的第70百分位数是( ) A .14 B .17C .19D .23【答案】D 【详解】因为8×70%=5.6, 故70%分位数是第6项数据23. 二、拓展提升13.对某电子元件进行寿命追踪调查,情况如下:(1)求下表中的x ,y ;(2)从频率分布直方图估计电子元件寿命的第80百分位数是多少. 【答案】(1)0.15x y ==;(2)475.【详解】 (1)200.1030x=,200.1030y =,0.15x y ∴==. (2)寿命在400以下的频率为0.100.150.400.65++=, 寿命在500以下的频率为0.650.20=0.85+,∴电子元件寿命的第80百分位数一定在[)400,500内.由0.800.654001004750.850.65-+⨯=-,∴估计电子元件寿命的第80百分位数是475.14.某市举行“中学生诗词大赛”,分初赛和复赛两个阶段进行,规定:初赛成绩大于90分的具有复赛资格.某校有800名学生参加了初赛,所有学生的成绩均在区间[]30,150内,其频率分布直方图如图.估计初赛成绩的第80百分位数是多少. 【答案】122 【详解】设初赛成绩在[)90,110的频率组距为a ,则()0.00250.00750.00750.01250.0050201a +++++⨯=. 0.0150a ∴=.初赛成绩在110分以下的频率为()0.00250.00750.00750.0150200.65+++⨯=. 初赛成绩在130分以下的频率为0.650.0125200.90+⨯=.∴初赛成绩的第80百分位数一定在[)110,130内.由0.800.65110201220.900.65-+⨯=-,∴估计初赛成绩的第80百分位数是122.15.某学校为了调查高一年级学生的体育锻炼情况,从甲、乙、丙3个班中,按分层抽样的方法获得了部分学生一周的锻炼时间(单位:h),数据如下,(1)求三个班中学生人数之比;(2)估计这个学校高一年级学生中,一周的锻炼时间超过10h的百分比;(3)估计这个学校高一年级学生一周的平均锻炼时间.【答案】(1)5:7:8(2)25%(3)8.2h【详解】(1)三个班中学生人数之比为5:7:8.(2)样本中一周的锻炼时间超过10h的有5个,因此一周的锻炼时间超过10h的百分比为5100%25% 578⨯=++.估计该校高一年级学生中,一周的锻炼时间超过10h的百分比为25%. (3)样本中甲、乙、丙三个班级的平均锻炼时间分别为7h,9h,8.25h,则样本平均数为577988.258.2578⨯+⨯+⨯=++.估计该校高一年级学生一周的平均锻炼时间为8.2h.。

9.2用样本估计总体-【新教材】人教A版(2019)高中数学必修第二册同步讲义(机构专用)

9.2用样本估计总体-【新教材】人教A版(2019)高中数学必修第二册同步讲义(机构专用)

9.2用样本估计总体知识梳理1、频率分布直方图(1)列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且=极差组距组数;③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图。

(2)频率分布直方图的特点:①==⨯频率小长方形的面积组距频率组距,②个小长方形的面积等于1,③1==频率小长方形的高,所有小长方形的高的和组距组距.(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.2、用样本的平均数估计总体平均数(1)众数:在样本数据中,出现次数最多的那个数据;(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,若样本数据个数为偶数,则取中间两个数据的平均数作为中位数。

(3)平均数:设样本的数据为12n x x x ,,,,则样本的算术平均数为12nx x x x n+++= ;(4)众数、中位数、平均数的异同:①众数、中位数、平均数都是描述一组数据集中趋势的量,平均数是最重要的量;②平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动;③众数考察各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数往往更能反映问题;④中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势;⑤实际问题中求得的平均数、众数和中位数应带上单位。

高中数学必修二 9 用样本估计总体(精练)(含答案)

高中数学必修二   9  用样本估计总体(精练)(含答案)

9.2 用样本估计总体(精练)【考点一 频率分布直方图】1.(2021·广西南宁)北京舞蹈学院为了解大一舞蹈专业新生的体重情况,对报到的1000名舞蹈专业生的数据(单位:kg )进行统计,得到如图所示的体重频率分布直方图,则体重在60kg 以上的人数为( )A .100B .150C .200D .250【答案】D【解析】0.04050.01050.25⨯+⨯=,10000.25250⨯=, 故选:D .2.(2021·江苏南京)为了解学生在课外活动方面的支出情况,抽取了n 个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[]10,50内,其中支出金额在[]30,50内的学生有234人,频率分布直方图如图所示,则n 等于( )A .300B .320C .340D .360【答案】D【解析】解:由频率分布直方图知:234[10.010.025]10n=--⨯,∴360=n . 故选:D.3.(2021·宁夏长庆高级中学 )某家庭记录了50天的日用水量数据(单位:3m ),得到频数分布表如下: 50天的日用水量频数分布表(1)在答题卡上作出50天的日用水量数据的频率分布直方图:(2)估计日用水量小于30.35m 的概率; 【答案】(1)答案见解析;(2)0.48. 【解析】(1)(2)由题可知用水量在[0.3,0.4]的频数为10,所以可估计在[0.3,0.35)的频数为5,故用水量小于30.35m 的频数为1513524+++=,其概率为240.4850P ==. 4.(2021·全国·高一专题练习)已知某市2019年全年空气质量等级如表1所示.表12020年5月和6月的空气质量指数如下:5月240 80 56 53 92 126 45 87 56 60191 62 55 58 56 53 89 90 125 124103 81 89 44 34 53 79 81 62 116 886月63 92 110 122 102 116 81 163 158 7633 102 65 53 38 55 52 76 99 127120 80 108 33 35 73 82 90 146 95选择合适的统计图描述数据,并回答下列问题:(1)分析该市2020年6月的空气质量情况.(2)比较该市2020年5月和6月的空气质量,哪个月的空气质量较好?【答案】(1)答案见解析;(2)从整体上看,5月的空气质量略好于6月,但5月有重度污染,而6月没有.【解析】(1)根据该市2020年6月的空气质量指数和空气质量等级分级标准,可以画出该市这个月的不同空气质量等级的频数与频率分布表(表2).表2从表中可以看出,“优”“良”的天数达19天,占了整月的63.33%,没有出现“重度污染”和“严重污染”.我们还可以用条形图和扇形图对数据作出直观的描述,如图1和图2.从条形图中可以看出,在前三个等级的占绝大多数,空气质量等级为“良”的天数最多,后三个等级的天数很少,从扇形图中可以看出,空气质量为“良”的天数占了总天数的一半,大约有三分之二为“优”“良”,大多数是“良”和“轻度污染”.因此,整体上6月的空气质量不错.图1图2我们也可以用折线图展示空气质量指数随时间的变化情况,如图3.容易发现,6月的空气质量指数在100附近波动.图3(2)根据该市2020年5月的空气质量指数和空气质量分级标准,可以画出该市这个月的不同空气质量等级的频数和频率分布表(表3).表3为了便于比较,我们选用复合条形图,将两组数据同时反映到一个条形图上.通过条形图中柱的高低,可以更直观地进行两个月的空气质量的比较(下图).图4由表3和图4可以发现,5月空气质量为“优”和“良”的总天数比6月多.所以,从整体上看,5月的空气质量略好于6月,但5月有重度污染,而6月没有.【考点二常见统计图表】1.(2021·全国·月考)(多选)在新冠疫情期间,全国人民万众一心,众志成城,在抓防控疫情同时,又能促进复工复产.为了响应政府号召,积极恢复生产,某市相关部门对本市1500个大型企业的复工情况进行了调查,调查结果如图所示,则下列说法正确的是( )A.其他情况的企业比例为37.4%B.从调查的大型企业中任选一个,该企业是暂未全面恢复生产的概率为0.235C.不超过200个企业倾向于部分岗位恢复生产D.部分岗位恢复生产或暂未复工的企业超过604个【答案】AD【解析】对A ,100%23.5%16.8%22.3%37.4%---=,故A 正确;对B ,暂未全面恢复生产包括部分岗位恢复生产和暂未复工以及其他,占比为77.7%,故对应概率为0.777,故B 错误;对C ,倾向于部分岗位恢复生产的企业个数为150016.8%252⨯=(个),故C 错误;对D ,部分岗位恢复生产或暂未复工的企业个数为()150016.8%23.5%605⨯+≈(个),故D 正确. 故选:AD.2.(2021·全国·高一课时练习)(多选)“小康县”的经济评价标准为①年人均收入不低于7000元;②年人均食品支出(单位:元)不高于年人均收入的35%.某县有40万人,年人均收入如表所示,年人均食品支出如图所示,则该县( )A .未达到标准①B .达到标准①C .达到标准②D .不是小康县【答案】BD【解析】由图表可知年人均收入为()2000340005600058000610000712000516000340⨯+⨯+⨯+⨯+⨯+⨯+⨯÷7050=(元),达到了标准①;年人均食品支出为()140032000524001330001036009402695⨯+⨯+⨯+⨯+⨯÷=(元),则年人均食品支出占年人均收入的2695100%38.2%35%7050⨯≈>,未达到标准②,所以该县不是小康县. 故选:BD .3.(2021·全国·高一课时练习)(多选)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2017年1月至2019年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线统计图.根据该折线统计图,下列结论正确的是( )A.年接待游客量逐年增加B.各年的月接待游客量高峰期大致都在8月C.2017年1月至12月月接待游客量逐月增加D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【答案】ABD【解析】对A,接待游客量虽然逐月波动,但总体上逐年增加,故A正确;对B,折线统计图可知,各年的月接待游客量高峰期大致都在8月,故B正确;对C,2017年8月至9月月接待游客量呈下降趋势,故C错误;对D,折线统计图可知,各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳,故D正确.故选:ABD.4.(2021·广东广雅中学 )如图是国家统计周公布的2020年下半年快递运输量情况,请根据图中信息选出正确的选项( )A.2020年下半年,每个月的异地快递量部是同城快递量的6倍以上B.2020年10月份异地快递增长率小于9月份的异地快递增长率(注.增长率指相对前一个月而言)C.2020年下半年,异地快递量与月份呈正相关关系D.2020年下半年,同城和异地快递量最高均出现在11月【答案】BCD【解析】对于A,2020年7月的异地快递量为572812.9万件,同城快递量为105191.1万件,异地快递量不是同城快递量的6倍,故A不正确;对于B,因为679556.6599604.6708642.6679556.6599604.6679556.6-->,9月异地快递增长率明显高于10月异地快递增长率,故B正确;对于C,由图可看出,除2020年12月异地快递量较11月略少,其余都有较明显增加,因此可以判断异地快递量与月份呈正相关关系,故C正确;对于D,由图可看出,同城和异地快递量最高都在11月份,故D正确.故选:BCD5(2021·江苏·高三月考)数据显示,全国城镇非私营单位就业人员平均工资在2011年为40000元,到了2020年,为97379元,比上年增长7.6%.根据下图提供的信息,下面结论中正确的是( )2011-2020年城镇非私营单位就业人员年平均工资及增速A.2011年以来,全国城镇非私营单位就业人员平均工资逐年增长B.工资增速越快,工资的绝对值增加也越大C.与2011年相比,2019年全国城镇非私营单位就业人员平均工资翻了一番多D.2018年全国城镇非私营单位就业人员平均工资首次突破90000元【答案】AC【解析】对选项A:由图可知,2011年以来,全国城镇非私营单位就业人员平均工资逐年增长,只是每年增速有变化,故选项A正确;对选项B:工资增速越快,工资的绝对值增加也越大,这是错误的,工资的绝对值的增加还与上一年的工资水平有关系,故选项B错误;÷≈元,故选项C正对选项C:根据数据2019年全国城镇非私营单位就业人员平均工资为97379 1.07690500确;÷÷≈元,所以对选项D:根据数据2018年全国城镇非私营单位就业人员平均工资为97379 1.076 1.09882423全国城镇非私营单位就业人员平均工资首次突破90000元应为2019年,故选项D错误.故选:AC.【考点三百位分数】1.(2021·湖北省水果湖高级中学高二月考)某校高一年级一名学生一学年以来七次月考物理成绩(满分100分)依次为84,78,82,84,86,89,96,则这名学生七次月考物理成绩的第70百分位数为( ) A.86 B.84 C.96 D.89【答案】A⨯=.所以这名学生七次月考物理成绩的第70百分位数为86.【解析】因为770% 4.9故选:A.2.(2021·安徽·霍邱县第一中学)为了解应届大学毕业生工作之初的薪资情况,随机调查了12名应届大学毕业生,他们的工作之初的基本工资分别为:2850,2950,3050,2880,2755,2710,2890,3130,2940,3325,2920,2880,则样本的第85百分位数是( )A.3050 B.2950 C.3130 D.3325【答案】C【解析】将这组数据从小到大排列为:2710,2755,2850,2880,2880,2890,2920,2940,2950,3050,3130,3325⨯=,可知样本数据的第85百分位数为第11个数,即为3130.由1285%10.2故选:C.3.(2021·江苏如皋·高一月考)为了弘扬体育精神,学校组织秋季运动会,在一项比赛中,学生甲进行了8组投篮,得分分别为10,8,a,8,7,9,6,8,如果学生甲的平均得分为8分,那么这组数据的75百分位数为( )A.8 B.9 C.8.5 D.9.5【答案】C【解析】由题意可得:1088796888a+++++++=,解得:8a=,将这组数据从小到大的顺序排列为6,7,8,8,8,8,9,10,因为875%6⨯=为整数,所以这组数据的75百分位数为898.52+=,故选:C.4.(2021·浙江·)已知100个数据的25百分位数是9.3,则下列说法正确的是( )A.这100个数据中一定有25个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第25个数据C.把这100个数据从小到大排列后,9.3是第25个数据和第26个数据的平均数D.把这100个数据从小到大排列后,9.3是第25个数据和第24个数据的平均数【答案】C【解析】因为100×25%=25为整数,第25个数据和第26个数据的平均数为第25百分位数,所以这100个数据中不一定有25个数小于或等于9.3,故A错误;所以第25个数据和第26个数据的平均数为第25百分位数,是9.3,所以第25个数据不一定是9.3,故B 错误;根据百分位数的定义,可知这100个数据从小到大排列后,9.3是第25个数据和第26个数据的平均数,故C正确,D错误.故选:C.【考点四特征数】1.(2021·广东肇庆)(多选)已知一组数据为-1,1,5,5,0,则该组数据的( )A.众数是5 B.平均数是2C.中位数是5 D.方差是32 5【答案】ABD【解析】数据为-1,1,5,5,0,的众数为5,A正确;数据的平均数为1155025-++++=,B正确;数据的中位数为1,C错误;数据的方差为()()()()()22222 12125252023255--+-+-+-+-=,D正确.故选:ABD.2.(2021·广东·高一月考)(多选)四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的有( ) A .中位数为3,众数为3 B .平均数为3,众数为4 C .平均数为3,中位数为3 D .平均数为2,方差为2.4【答案】BD【解析】对于A ,当掷骰子出现的结果为1,2,3,3,6时, 满足中位数为3,众数为3,所以A 不可以判断;对于B ,若平均数为3,且出现点数为6,则其余4个数的和为9, 而众数为4,故其余4个数的和至少为10,所以B 可以判断; 对于C ,当掷骰子出现的结果为1,1,3,4,6时,满足平均数为3,中位数为3,可以出现点6,所以C 不能判断; 对于D ,若平均数为2,且出现点数6, 则方差221(62) 3.2 2.45S >-=>,所以当平均数为2,方差为2.4时,一定不会出现点数6. 故选:BD.3.(2021·江苏省镇江中学)(多选)甲、乙两位学生的五次数学成绩统计如表所示,则下列判断不正确的是( )A .甲的成绩的平均数等于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差 【答案】BD【解析】选项A :甲的成绩的平均数为4050607080605x ++++==甲,乙的成绩的平均数为5050506090605x ++++==乙,故A 正确,选项B :根据表格可得甲的中位数为60,乙的中位数为50,故B 错误,选项C :甲的成绩的方差为222221(4060)(5060)(7060)(8060)2005s ⎡⎤=-+-+-+-=⎣⎦甲, 乙的成绩的方差为222Z 1(5060)3(9060)2402005s ⎡⎤=-⨯+-=>⎣⎦,故C 正确, 选项D :甲的成绩的极差为804040-=,乙的成绩的极差为905040-=,故D 错误. 故选:BD4.(2021·全国·高三月考)在某文艺比赛中,由6名媒体代表组成的甲组、12名专家组成的乙组和12名观众代表组成的丙组分别给选手打分(100分制,选手得分为所有评委打分的平均分).已知甲组对某选手打分为;46,50,52,48,48,56,乙组、丙组对该选手打分的平均分分别为48和56,标准差分别为3.7和11.8,则( ) A .该选手的得分为51.6 B .甲组打分的中位数为50C .相对于丙组,乙组打分稳定性更高D .相对于丙组,乙组对该选手评价更高 【答案】AC【解析】甲组打分平均分为4650524848566+++++=50,6501248125651.6,61212x ⨯+⨯+⨯∴==++故A 正确;将46,50,52,48,48,56,按照从小到大得顺序排列得46,48,48,50,52,56, 所以甲组打分的中位数为48502+=49,B 错误; 根据标准差知乙组评委打分的波动小,稳定性更高,故C 正确; 根据平均数知丙组对选手评价更高,D 错误. 故选:AC.5.(2021·贵州·贵阳市第二十五中学 )已知123,,,,n x x x x 平均数为a ,标准差是b ,则12332,32,32,,32n x x x x ++++的平均数是________,标准差是________.【答案】32a +【解析】解:由题得12n x x x na +++=,(n x a b n++-=则12332,32,32,,32n x x x x ++++的平均数是123232323232n x x x na na nn+++++++==+,12332,32,32,,32n x x x x ++++的标准差是2221(3232)9[()()]3n n x a x a x a b nn+++---++-==.故答案为:32a +;3b .6.(2021·广西河池·高一月考)已知:1x ,2x ,3x …,n x 的平均数为a .则132x +,232x +,…,32n x +的平均数是__________. 【答案】32a +或23a + 【解析】由题()121n x x x x a n=+++=,所以12n x x x na +++=,则132x +,232x +,…,32n x +的平均数: ()()()121323232n x x x n ++++++⎡⎤⎣⎦()()1211323232n x x x n an n a nn=++++=+=+⎡⎤⎣⎦, 故答案为:32a +7(2021·全国·高一课时练习)已知一组数据1x ,2x ,…,10x 的方差是2,且()()()2221210333380x x x -+-++-=,则这组数据的平均数x =___________.【答案】-3或9【解析】由题意可知,2101010221111()22102010i i i i i i x x x x x x ---===-=⇔-+=∑∑∑,因为101110i i x x -==∑,即10110i i x x -==∑,所以210212010i i x x -==+∑,因为()()()10102122212101333903806i i i i x x x x x ==-+-++-=-+=∑∑,所以220106090380x x --+-+=,解得3x -=-或9. 故答案为:-3或9.8.(2021·江西·新余市第一中学高二月考)已知样本910,11,x y ,,的平均数是10,方差是4,则xy =_____; 【答案】91 【解析】因为样本910,11,x y ,,的平均数是10,方差是4,所以()191011105x y ++++=,()()()()()22222191010101110101045x y ⎡⎤-+-+-+-+-=⎣⎦, 则 ()()2220,101018x y x y +=-+-=, 解得 13,7x y ==或 7,13x y ==, 所以91xy =, 故答案为:91 【考点五 综合运用】1.(2021·广东肇庆)为了迎接新高考,某校举行物理和化学等选科考试,其中,600名学生化学成绩(满分100分)的频率分布直方图如图所示,其中成绩分组区间是:第一组[)45,55,第二组[)55,65,第三组[)65,75,第四组[)75,85,第五组[)85,95.已知图中前三个组的频率依次构成等差数列,第一组和第五组的频率相同.(1)求a ,b 的值;(2)估算高分(大于等于80分)人数;(3)估计这600名学生化学成绩的平均值(同一组中的数据用该组区间的中点值作代表)和中位数(中位数精确到0.1).【答案】(1)0.0200.045a b =⎧⎨=⎩;(2)90;(3)平均值为69.5,中位数为69.4【解析】(1)由题意可知:()0.0050.02520.0050.0250.005101b b a +=⨯⎧⎨++++⨯=⎩,解得0.0200.045a b =⎧⎨=⎩.(2)高分的频率约为:0.0200.005100.005100.1522a ⎛⎫⎛⎫+⨯=+⨯= ⎪⎪⎝⎭⎝⎭. 故高分人数为:6000.1590⨯=.(3)平均值为:500.00510600.02510700.04510800.02010⨯⨯+⨯⨯+⨯⨯+⨯⨯900.0051069.5+⨯⨯=.设中位数为x ,则()0.005100.025100.045650.5x ⨯+⨯+⨯-=,69.4x ≈. 故中位数为69.4.2.(2021·广西·东兰县高级中学 )某企业质管部门,对某条生产线上生产的产品随机抽取100件进行相关数据的对比,并对每个产品进行综合评分(满分100分),下图是这100件产品的综合评分的频率分布直方图.若将综合评分大于等于80分以上的产品视为优等品.(1)求这100件产品中优等品的件数; (2)求这100件产品的综合评分的中位数. 【答案】(1)60;(2)82.5.【解析】(1)由频率和为1得:(0.0050.0100.0250.020)101,0.040a a ++++⨯==. 所以优等品件数为:(0.020.04)1010060+⨯⨯=. (2)设综合评分的中位数为x ,则(0.0050.0100.025)100.040(80)0.5x ++⨯+⨯-=. 解得82.5x =,所以综合评分的中位数为82.5.3.(2021·江西·南城县第二中学 )抚州市为了了解学生的体能情况,从全市所有高一学生中按80:1的比例随机抽取200人进行一分钟跳绳次数测试,将所得数据整理后,分为6组画出频率分布直方图(如图所示),现一,二两组数据丢失,但知道第二组的频率是第一组的3倍.(1)若次数在120以上(含120次)为优秀,试估计全市高一学生的优秀率是多少?全市优秀学生的人数约为多少?(2)求第一组、第二小组的频率是多少?并补齐频率分布直方图; (3)估计该全市高一学生跳绳次数的中位数和平均数?【答案】(1)8640;(2)第一组频率为0.03,第二组频率为0.09.频率分布直方图见解析;(3)中位数为3343,均值为121.9【解析】(1)由频率分布直方图,分数在120分以上的频率为(0.0300.0180.006)100.54++⨯=, 因此优秀学生有0.54200808640⨯⨯=(人); (2)设第一组频率为x ,则第二组频率为3x , 所以30.340.541x x +++=,0.03x =, 第一组频率为0.03,第二组频率为0.09. 频率分布直方图如下:(3)前3组数据的频率和为(0.0030.0090.034)100.46++⨯=,中位数在第四组,设中位数为n,则1100.30.460.5120110n-⨯+=-,3343n=.均值为0.03950.091050.341150.31250.181350.06145121.9⨯+⨯+⨯+⨯+⨯+⨯=.4.(2021·福建·闽江学院附中高一月考)某次数学测试后,数学老师对该班n位同学的成绩进行分折,全班同学的成绩都分布在区间[95,145],制成的频率分布直方图如图所示,已知成绩在区间[125,135)的有12人.(1)求n和该班数学成绩的众数;(2)根据频率分布直方图,估计本次测试该班的数学平均分(同一组数据用该组数据区间的中点值表示).【答案】(1)60n=,众数:120;(2)118.5【解析】1)由频率分布直方图得成绩在区间[125,135)的频率为0.020100.2⨯=,又因为成绩在区间[125,135)的有12人,所以120.2n=,解得60n=.由频率分布直方图得该班数学成绩的众数在[)115,125组内,且为120;(2)由题知[)[)[)[)[]95,105,105,115,115,125,125135,135,145,对于的频率分别为0.15,0.25,0.3,0.2,0.1, 所以本次测试该班的数学平均分为0.151000.251100.31200.21300.1140118.5⨯+⨯+⨯+⨯+⨯=5.(2021·广西·玉林市育才中学)棉花是我国纺织工业重要的原料.新疆作为我国最大的产棉区,对国家棉花产业发展、确保棉粮安全以及促进新疆农民增收、实现乡村振兴战略都具有重要意义.动态、准确掌握棉花质量现状,可以促进棉花产业健康和稳定的发展.在新疆某地收购的一批棉花中随机抽测了100根棉花的纤维长度(单位:mm ),得到样本的频数分布表如下:(1)在图中作出样本的频率分布直方图;(2)根据(1)作出的频率分布直方图求这一棉花样本的众数、中位数与平均数,并对这批棉花的众数、中位数和平均数进行估计.【答案】(1)答案见解析;(2)众数为:275(mm),中位数为:252.5mm ,平均数为:222mm ,购进的这批棉花的众数、中位数和平均数分别约为275mm 、252.5mm 和222mm . 【解析】(1)样本的频率分布直方图如图所示.(2)由样本的频率分布直方图,得众数为:250300275(mm)2+=; 设中位数x 为,(250)0.00850%48%x -⨯=-,则解得252.5x =,即中位数为252.5mm . 设平均数为x ,则250.04750.08x =⨯+⨯+1250.11750.12250.16⨯+⨯+⨯+2750.43250.12222⨯+⨯=,故平均数为222mm .由样本的这些数据,可得购进的这批棉花的众数、中位数和平均数分别约为275mm 、252.5mm 和222mm . 6.(2021·云南省玉溪第一中学 )某市为了了解人们对“中国梦”的伟大构想的认知程度,针对本市不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(95分及以上为认知程度高),结果认知程度高的有20m m人,按年龄分成5组,其中第一组:[)20,25,第二组:[)25,30,第三组:[)30,35,第四组:[)35,40,第五组:[]40,45,得到如图所示的频率分布直方图.(1)根据频率分布直方图,估计这m 人的平均年龄和第80百分位数;(2)现从以上各组中采用分层随机抽样的方法抽取20人,担任本市的宣传使者.若第四组宣传使者的年龄的平均数与方差分别为37和52,第五组宣传使者的年龄的平均数与方差分别为43和1,求这m 人中35~45岁所有人的年龄的方差.【答案】(1)平均年龄32.25岁,第80百分位数为37.5;(2)10. 【解析】解:(1)设这m 人的平均年龄为x ,则22.50.0527.50.3532.50.337.50.242.50.132.25x =⨯+⨯+⨯+⨯+⨯=.设第80百分位数为a ,由50.02(40)0.040.2a ⨯+-⨯=,解得37.5a =. (2)由频率分布直方图得各组人数之比为1:7:6:4:2,故各组中采用分层随机抽样的方法抽取20人,第四组和第五组分别抽取4人和2人, 设第四组、第五组的宣传使者的年龄的平均数分别为4x ,5x ,方差分别为24s ,25s ,则437x =,543x =,2452s =,251s =, 设第四组和第五组所有宣传使者的年龄平均数为z ,方差为2s . 则4542396x x z +==, ()(){}222224545142106s s x z s x z ⎡⎤⎡⎤=⨯+-+⨯+-=⎢⎥⎢⎥⎣⎦⎣⎦, 因此,第四组和第五组所有宣传使者的年龄方差为10,据此,可估计这m 人中年龄在35~45岁的所有人的年龄方差约为10.7.(2021·广西·玉林市第十一中学)为了选拔参加自行车比赛的选手,对自行车运动员甲、乙两人在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s )的数据如下:(1)画出茎叶图;(2)估计甲、乙两运动员的最大速度的均值和方差,并判断谁参加比赛更合适. 【答案】(1)茎叶图见解析;(2)派乙更合适 【解析】(1)茎叶图如下:(2)甲的平均数为:()112730313537386x =+++++=33, 乙的平均数为:216x =(28+29+33+34+36+38)=33, 甲的方差为:()2114736944162563S =+++++=, 乙的方差为:()221382516192563S =++++=, 甲、乙的平均数相等,乙的方差更小,则乙的发挥更稳定,故乙参加比赛更合适.8.(2021·河南·高一期末)我国棉花产量居世界首位,产棉省市区有22个新疆是长绒棉的主产区,新疆棉区日照充足,气候干旱,雨量稀少,属灌溉棉区,所产的新疆长绒棉因质地光亮、有弹性,绒长质优,原棉色泽好,备受消费者的青睐.某科技公司欲进一步改良优质棉品质,对甲乙两块试验田种植的两种棉花新品种的棉绒长度进行测量,分别记录抽查数据如下(单位:mm ):甲:10210199981039899;乙:110115908575115110.试从统计的角度分析说明哪个棉花新品种比较稳定.【答案】甲块试验田种植的棉花新品种的棉绒长度比较稳定 【解析】品种甲的平均数1102101999810398991007x ++++++==, 甲的方差为2222222211(102100)(101100)(99100)(98100)(103100)(98100)(99100)7s ⎡⎤=-+-+-+-+-+-+-⎣⎦247= 乙的平均数21101159085751151101007x ++++++==, 乙的方差为2222222221(110100)(115100)(90100)(85100)(75100)(115100)(110100)7s ⎡⎤=-+-+-+-+-+-+-⎣⎦16007= 因为12x x =,2212s s <,所以甲块试验田种植的棉花新品种的棉绒长度比较稳定.。

人教A版高中数学(配套新教材)必修第二册-第九章 -9-2-3总体集中趋势的估计

人教A版高中数学(配套新教材)必修第二册-第九章 -9-2-3总体集中趋势的估计
易错辨析
1.中位数是一组数据中间的数.( × ) 2.众数是一组数据中出现次数最多的数.( √ ) 3.平均数反映了一组数据的平均水平,任何一个样本数据的改变都会引起平均数的变化.( √ ) 4.一组数据中,有一半的数据不大于中位数,而另一半则不小于中位数,中位数反映了一组数据的中心的情况. 中位数不受极端值的影响.( √ )
高中数学 必修第二册 RJ·A
课堂小结
1.知识清单:中位数、众数、平均数的计算及应用. 2.方法归纳:数据分析统计. 3.常见误区:求中位数时需先把一组数据按从小到大(或从大到小)的顺序排列,再找中间 位置的数或中间两数的平均数.
高中数学 必修第二册 RJ·A
Thank you for watching !
高中数学 必修第二册 RJ·A
新知学习
知识点一 众数、中位数、平均数
1.众数:一组数据中出现次数 最多 的数. 2.中位数:把一组数据按 从小到大(或从大到小) 间两个数的 平均数 )叫做这组数据的中位数.
的顺序排列,处在 中间 位置的数(或中
3.平均数:如果n个数x1,x2,…,xn,那么 x= 1n(x1+x2+…+xn) 叫做这n个数的平均数.
高中数学 必修第二册 RJ·A
知识点三 频率分布直方图中平均数、中位数、众数的求法
1.样本平均数:可以用每个小矩形底边中点的 横坐标 与小矩形 面积 的乘积之和近似代替. 2.在频率分布直方图中,中位数左边和右边的直方图的面积应 相等 . 3.将 最高 小矩形所在的区间 中点 作为众数的估计值.
高中数学 必修第二册 RJ·A
高中数学 必修第二册 RJ·A
跟踪训练
我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查. 通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1), …,[4,4.5]分成9组,制成了如图所示的频率分布直方图.估计居民月均用水量的中位数.

9.2.3总体集中趋势的估计【新教材高中数学人教A版】

9.2.3总体集中趋势的估计【新教材高中数学人教A版】

0.0773 (1.2 4.2) 0.1073 ( 4.2 7.2) 0.0073 ( 25.2 28.2) 8.96
2
2
2
这个结果与根据原始
数据计算的样本平均
数8.79相差不大.
8.96
引入新知 (2)如何估计中位数?
根据中位数的意义,在样本中,有50%的个体小于或等 于中位数,也有50%的个体大于或等于中位数.因此,在 频率分布直方图中,中位数左边和右边的直方图的面积 应该相等.
水量在区间
的居民用户最多.这个信息具有实际意
义。
5.7
引入新知
从频率分布直方图中找众数、中位数、平均数
众数: 最高矩形的中点 优点:反映样本数据的最大集合点 缺点:忽视了其他数据,无法客观的反映总体特征
中位数:中位数左边的直方图面积和右边的直方图面积相等 优点:不受少数几个极端值的影响 缺点:不受少数几个极端值的影响
课堂典例
例4、利用9.2.1节中100户居民用户的月均用水量
的调查数据,计算样本数据的平均数和中位数,并据 此估计全市居民用户月均用水量的平均数和中位数.
假设通过简单随机抽样,获得了100户居民用户的月均用水量数 据(单位:t):
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0 2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 5.7 5.1 61.8 6.0 11.1 1.3 11.2 7.7 4.9 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4 3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0 22.2 10.0 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9 5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7 5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3 5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8 7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6

9.2用样本估计总体-【新教材】人教A版高中数学必修第二册课件(机构适用)

9.2用样本估计总体-【新教材】人教A版高中数学必修第二册课件(机构适用)
A.500 B.1000 C.10000 D.25000
随堂练习
如图是某公司202X年1月到10月的销售额(单位:万元)的折线图,销 售额在35万元以下为亏损,超过35万元为盈利,则下列说法错误的是 (B )
A.这10个月中销售额最低的是1月份 B.从1月到6月销售额逐渐增加 C.这10个月中有3个月是亏损的 D.这10个月销售额的中位数是43万元
为27 32 2 29.5 ,平均数为 1 (17+23+25 26 27 32 34 34 49 53) 32 10
,视察选项可知, 故选:C.
随堂练习
1.为了解学生课外阅读的情况,随机统计n了名 学生的课外阅读时间,所得数据都在[50,150] 中, 其频率散布直方图如图所示.已知在 [50,75) 中的频数为100,则n的值是( B )
经典例题
例2
“共享单车,绿色出行”是近年来火爆的广告词,现对某市10名共享单车用户一个月 内使用共享单车的次数进行统计,得到数据如下所示,下列关于该组数据的说法错误 的是( )
A.极差为36 C.中位数为27
B.众数为24 D.平均数为32
经典例题
解析
【详解】 该组数据的极差为23-17=36,众数为34,中位数
03
s2 1 N n i1
2
yi y
y 为样本方差,s= s2 为样本标准差.
经典例题
例1
某高中为了解学生课外知识的积累情况,随机抽取200名同学参加课外知识测试,测 试共5道题,每答对一题得20分,答错得0分.已知每名同学至少能答对2道题,得分 不少于60分记为及格,不少于80分记为优秀,测试成绩百分比散布图如图所示,则 下列说法正确的是( )
(1)平均数:如果给定的一组数是x1 ,x2,…xn ,则这组数的平均

高一下学期数学人教A版必修第二册9.2.4总体离散程度的估计课件

高一下学期数学人教A版必修第二册9.2.4总体离散程度的估计课件

我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离 平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大 多数的射击成绩离平均成绩会比较远.
因此,我们可以通过这两组射击成绩与它们的平均成绩的“平 均距离”来度量成绩的波动幅度.
平均距离?
思考 如何定义“平均距离”?
1 n
可以得到这组数据x1,
x2,…,
xn到
的 x“
平均距离”为
n
|xi
i 1
x|.
为了避免式中含有绝对值,通常改用平方来代替,即
1 n
n i 1
( xi
x)2
方差
方差刻画了数据的离散程度或波动幅度,方差越大,数据的离散程度 越大;方差越小,数据的离散程度越小.
教材知识梳理
1.假设一组数据为x1,x2,…,xn,则这组数据的平均数x =
x

z
27
)2+
j=1
(yj-
y
27
)2+
j=1
(
y

z
)2]=510{23[s2x+(
x
- z )2]+27[s2y+( y - z )2]}.

由 x =170.6,y =160.6,根据按比例分配分层随机抽样总样本平均数与各
层样本平均数的关系,可得总样本平均数为
z =232+327 x +232+727 y =23×170.6+ 5027×160.6=165.2.
3.(多选)甲、乙两班举行电脑 汉字录入比赛,参赛学生每 分钟录入汉字的个数经统计 计算后填入右表:
班级 参加人数 中位数 方差 平均数

55
149 191 135

人教A版高中数学必修第二册强化练习题-总体取值规律的估计-总体百分位数的估计(含答案)

人教A版高中数学必修第二册强化练习题-总体取值规律的估计-总体百分位数的估计(含答案)

人教A版高中数学必修第二册9.2 用样本估计总体9.2.1 总体取值规律的估计 9.2.2 总体百分位数的估计基础过关练题组一 频数分布表和频率分布直方图1.某射击选手积极备战运动会,在比赛前的一次训练中共射了72次,下表是命中环数的统 D.3203.(河北衡水武强学校开学考试)将样本容量为4组得到的频率分布直方图如图所示(A.样本数据分布在[6,10)内的频率为0.32B.样本数据分布在[10,14)内的频数为40C.样本数据分布在[2,10)内的频数为40D.估计总体数据大约有10%分布在[10,14)内4.(多选题)(2024云南昭通期中)某学校为了调查学生某次研学活动中的消费支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在50元到60元范围内的学生有60人,则( )A.B.D.人)为了了解某工厂生产的产品情况随的样本,测量它们的[92,94),[94,96),[96,98),[98,100),[100,102),其频率分布直方图如图所示.损本在各组的频率代替总体在各组的频率,若每台机器在一个月内生产的产品所获得的利润未达到11 000元,则需要对该工厂设备实施升级改造.试判断是否需要对该工厂设备实施升级改造.题组二 条形图、扇形图、折线图7.(2024四川德阳模拟)某校秋季运动会中,A,B两班的各个项目得分(满分5分,分值高者为优)的雷达图如图所示,则下列说法不正确的是( )A.在200 m项目中,A班的得分比B班高B.在铅球项目中,A班的得分比B班高C.在跳高项目中,B班的得分比A班高D.B班的总分比A班高8.(2024湖南湘楚名校联考)下图为近一年我国商品零售总额和餐饮收入总额同比增速情况折线图,则下列结论正确的是( )(注:同比指当前的数据与上一年同期进行比对;环比指当前数据与上个月的数据进行比对)A.2024年1~2月份,商品零售总额同比增长9.2%B.2023年3~12月份,餐饮收入总额同比都降低C.2023年6~10月份,商品零售总额同比都增加D.2023年12月,餐饮收入总额环比增速为-14.1%9.(2024江西鹰潭模拟)南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了2015年至2022年中国知识付费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法正确的是( )A.2015年至2022年,知识付费用户数量先增加后减少B.2015年至2022年,知识付费用户数量逐年增加量2022年最多C.2015年至2022年,知识付费用户数量的逐年增加量逐年递增D.2022年知识付费用户数量超过2015年知识付费用户数量的10倍10.(2023山西晋中榆次一中开学考试)图1、图2分别是甲、乙两户居民家庭全年各项支出的统计图.根据统计图,下列说法一定正确的是( )A.甲户的各项支出均比乙户的各项支出高B.乙户的教育支出占全年总支出的百分比比甲户的教育支出占全年总支出的百分比大C.甲户的食品支出比乙户的食品支出低D.甲户的其他支出占全年总支出的百分比比乙户的其他支出占全年总支出的百分比小题组三 总体百分位数的估计11.某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不低于103分的人数至少为 ( )A.220B.240C.250D.30012.(2024浙江县域教研联盟学业水平测试)某数学兴趣小组20名成员在规定时间内独立解答6个数学问题,最终结果如下:有1人解出1个问题,有1人解出2个问题,有4人解出3个问题,有4人解出4个问题,有5人解出5个问题,有5人解出6个问题,则解出问题个数的第三四分位数为( )A.3B.4.5C.5D.5.513.(2024山东菏泽第一中学月考)某市在创建文明城区的过程中,中央文明办对某小区居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其得分数据,将得分分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为 .能力提升练题组一 统计图表的综合应用1.(2023天津滨海新区开学考试)随着卡塔尔世界杯的举办,全民对足球的热爱程度有所提高,组委会在某场比赛结束后,随机抽取了若干名球迷对足球“喜爱度”进行调查评分,把喜爱程度较高的按年龄分成5组,其中第一组:[20,25);第二组:[25,30);第三组:[30,35);第四组:[35,40);第五组:[40,45].得到如图所示的频率分布直方图,已知第一组与第二组共有32人,第三组中女性球迷有4人,则第三组中男性球迷人数为( )A.16B.18C.20D.242.(2024四川绵阳三台中学月考)为了积极推进国家乡村振兴战略,某示范村不断自主创新,拓宽村民增收渠道,近年来取得了显著成效.据悉该村2023年经济总收入是2022年的2倍,为了更好地了解该村经济收入的变化情况,统计了该村两年的经济收入构成比例,得到如图所示的两幅统计图,则以下说法错误的是 ( )A.2023年种植收入和2022年种植收入一样多3.(期A.丁险种参保人数超过五成B.41岁以上参保人数超过总参保人数的五成C.18~29周岁人群参保的总费用最少D.人均参保费用不超过5 000元4.(2023北京丰台期末)某商场为了制订合理的停车收费政策,需要了解顾客的停车时长(单位:min).现随机抽取了该商场到访顾客的100辆车进行调查,将数据分成6组:(0,100],(100,200],(200,300],(300,400],(400,500],(500,600],并整理得到如下频率分布直方图:(1)求样本中停车时长在区间(400,500]内的频率;(2)若某天该商场到访顾客的车辆数为1 000,根据频率分布直方图估计该天停车时长在区间(100,400]内的车辆数;(3)为了吸引顾客,该商场准备给停车时长较短的车辆提供免费停车服务.若使该服务能够惠及25%的到访顾客的车辆,请你根据频率分布直方图,给出确定免费停车时长标准的建议.题组二 百分位数及其应用5.(2024福建福州高级中学月考)某校从高一新生中随机抽取了一个容量为10的身高样本,数据(单位:cm)从小到大排列如下:158,165,165,167,168,169,x,172,173,175.若样本数据的第60百分位数是170,则x=( )A.169B.170C.171D.1726.(2024天津第二十中学模拟)按从小到大顺序排列的两组数据,甲组:7,11,14,m,22;乙组:5,10,n,18,20.若这两组数据的第50百分位数、第80百分位数分别对应相等,则m+n=( )A.28B.29C.30D.327.某中学(含初、高中6个年级)为了解学生的身高,采用比例分配的分层随机抽样的方法抽取了40名男生,测量他们的身高,得到如图所示的频率分布直方图.(1)求a的值及样本中男生身高(单位:cm)在[185,195]内的人数;(2)根据频率分布直方图估计该校男生身高的85%分位数.答案与分层梯度式解析9.2 用样本估计总体9.2.1 总体取值规律的估计9.2.2 总体百分位数的估计基础过关练1.C2.C3.ABC4.ABC 7.B 8.C 9.D 10.B11.B 12.D 1.C 根据题意,得a +b =72−22−3,7×3+8a +9b +10×22=9.125×72,化简得a +b =47,8a +9b =416,解得a =7,b =40,故所求频率为40+2272=3136≈0.86,故选C.2.C 由已知得5(a+0.06+0.04+0.02+0.01)=1,所以a=0.07,因为第五组的员工人数为80,所以第二组的员工人数为80×0.070.02=280.故选C.3.ABC 对于A,样本数据分布在[6,10)内的频率为0.08×4=0.32,故A 正确;对于B,样本数据分布在[10,14)内的频数为100×0.1×4=40,故B 正确;对于C,样本数据分布在[2,10)内的频数为100×(0.02+0.08)×4=40,故C 正确;对于D,总体数据分布在[10,14)内的比例约为0.1×4×100%=40%,故D 错误.故选ABC.4.ABC 根据题中频率分布直方图可得样本中消费支出在50元到60元范围内的频率为1-10×(0.01+0.024+0.036)=0.3,A 正确;n=600.3=200,C 正确;样本中消费支出不少于40元的人数为200×(0.036×10+0.3)=132,B 正确;样本中消费支出在20元到30元范围内的频率为0.1,故若该校有2 000名学生参加研学活动,则消费支出在20元到30元范围内的约为2 000×0.1=200(人),D 错误.故选ABC.5.答案 30;0.035解析 由题中频率分布直方图知,年龄在[25,35)内的频率为0.015×10=0.15,所以n=0.15×200=30.由于(0.010+0.015+a+0.030+0.010)×10=1,所以a=0.035.故答案为30;0.035.6.解析 (1)由(0.02+0.04+0.06+0.07+0.09+0.10+x)×2=1,解得x=0.12.(2)估计200件该产品中尺寸在[98,100)内的件数为200×0.09×2=36.(3)由题意可得,这批产品中优等品有3 000×(0.18+0.20)=1 140(件),不合格品有3 000×0.04=120(件),合格品有3 000-1 140-120=1 740(件),所以每台机器在一个月内生产的产品所获得的利润为1 140×5+1 740×3-120×2=10 680(元),因为10 680<11 000,所以需要对该工厂设备实施升级改造.7.B 对于A,在200 m项目中,A班的得分为4分,B班的得分为3分,A班的得分比B班高,A 中的说法正确;对于B,在铅球项目中,A班的得分为3分,B班的得分为4分,A班的得分比B班低,B中的说法错误;对于C,在跳高项目中,B班的得分为4分,A班的得分为3分,B班的得分比A班高,C中的说法正确;对于D,B班的总分为5+3+4+5+3+4=24(分),A班的总分为4+4+3+5+4+3=23(分),B班的总分比A班高,D中的说法正确.故选B.8.C 对于A,2024年1~2月份,商品零售总额同比增长2.9%,故A错误;对于B,2023年8月份,餐饮收入总额同比增加,故B错误;对于C,2023年6~10月份,商品零售总额同比都增加,故C正确;对于D,2023年12月,餐饮收入总额环比增速并未告知,故D错误.故选C.解后反思 读折线统计图时,首先要看清楚横、纵坐标表示的意义,其次要明确图中的数量及其单位.在折线统计图中,从折线的上升、下降可分析统计量的增、减变化情况,从陡峭程度上,可分析统计量增长或下降的幅度.9.D 对于A,2015年至2022年,知识付费用户数量逐年增加,故A错误.对于B、C,知识付费用户数量的逐年增加量(单位:亿人次)分别为:2016年:0.96-0.48=0.48;2017年:1.88-0.96=0.92;2018年:2.95-1.88=1.07;2019年:3.56-2.95=0.61;2020年:4.15-3.56=0.59;2021年:4.77-4.15=0.62;2022年:5.27-4.77=0.5,则知识付费用户数量逐年增加量2018年最多,且不是递增的,故B、C错误.对于D,由5.27>10×0.48,则2022年知识付费用户数量超过2015年知识付费用户数量的10倍,故D正确.故选D.10.B 由题图2无法确定乙户的各项具体支出,故无法比较甲、乙两户的各项支出,故A,C 错误;对于B,乙户的教育支出占全年总支出的百分比为25%,甲户的教育支出占全年总支出的×100%=20%,故B正确;百分比为12001200+2000+1200+1600×100%≈26.7%,对于D,甲户的其他支出占全年总支出的百分比为16001200+2000+1200+1600乙户的其他支出占全年总支出的百分比为20%,故D错误.故选B.11.B 因为1 200×80%=960,所以数学成绩低于103分的学生最多有960人,所以数学成绩不低于103分的学生至少有1 200-960=240(人).故选B.12.D 第三四分位数即75%分位数,把20个数据按从小到大排序为1,2,3,3,3,3,4,4,4,4,5,5,5,5,5,6,6,6,6,6,因为20×75%=15,所以=5.5,故选D.75%分位数为第15和16个数的平均数,即5+6213.答案 84.55解析 由题意得(0.004+a+0.018+2×0.022+0.028)×10=1,解得a=0.006,因为前4组数据的频率之和为(0.004+0.006+0.022+0.028)×10=0.6,前5组数据的频率之和为0.6+0.022×10=0.82,所以70%分位数在[80,90)内,设70%分位数为x,则0.6+(x-80)×0.022=0.7,解得x≈84.55,所以70%分位数约为84.55.能力提升练1.C2.C3.ACD 5.C 6.C1.C 由题意结合题中频率分布直方图可得,第一组与第二组的频率之和为(0.01+0.07)×5=0.4,第三组的频率为0.06×5=0.3.因为第一组与第二组共有32人,所以样本容量为320.4=80,所以第三组的人数为80×0.3=24,故第三组中男性球迷人数为24-4=20.故选C.2.C 设2022年总收入为m,则2023年总收入为2m.对于A,2022年种植收入为0.4m,2023年种植收入为0.2×2m=0.4m,A中说法正确;对于B,2023年养殖收入与第三产业收入之和为0.35×2m+0.2×2m=1.1m,B中说法正确;对于C,2022年外出务工收入为0.15m,2023年外出务工收入为0.05×2m=0.1m,是2022年故,故, 4.(3)因为停车时长在(0,100]内的频率为0.13,停车时长在(0,200]内的频率为0.45,所以免费停车时长标准在(100,200]内,设免费停车时长标准为y min,则0.13+(y-100)×0.003 2=0.25,解得y=137.5.故免费停车时长标准定为137.5 min.5.C 因为10×60%=6,所以第60百分位数为169+x2,由题意知169+x2=170,所以x=171.故选C.6.C 甲组数据的第50百分位数为14,乙组数据的第50百分位数为n,则n=14,由5×80%=4,得甲组数据的第80百分位数为m +222,乙组数据的第80百分位数为18+202=19,因此m +222=19,解得m=16,所以m+n=30.故选C.7.解析 (1)根据题意得(0.005+a+0.020+0.025+0.040)×10=1,解得a=0.010,所以样本中男生身高(单位:cm)在[185,195]内的人数为40×0.010×10=4.(2)因为(0.005+0.020+0.040)×10=0.65<0.85,0.65+0.025×10=0.9>0.85,所以样本数据的85%分位数落在[175,185)内,设其为x,则(x-175)×0.025=0.85-0.65,解得x=183,所以估计该校男生身高的85%分位数为183 cm.。

(教案)9.2用样本估计总体(3)Word版含解析

(教案)9.2用样本估计总体(3)Word版含解析

9.2.2总体百分位数的估计本节《普通高中课程标准数学教科书-必修二(人教A 版)第九章《9.2.2总体百分位数的估计》,本节课通过探究栏目提出“居民生活用水定额管理问题”,在制定水价问题中提出,总体百分位数的估计的概念,让学生尝试运用总体百分位数的估计来解决实际问题,体会总体百分位数的估计的意义和作用,体会用样本估计总体的思想与方法。

从而发展学生的直观想象、逻辑推理、数学建模的核心素养。

课程目标学科素养A. 通过学习和应用百分位数,重点培养数据分析素养、数学运算和数学建模素养.B.掌握求一组数据的百分位的基本步骤: C.感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。

1.数学建模:在具体情境中运用百分位数解决问题;2.逻辑推理:求总体百分位数的基本步骤;3.数学运算:会求总体百分位数4.数据分析:体会百分位数的意义1.教学重点:理解百分位数的概念及其简单应用2.教学难点:掌握求一组数据的百分位的基本步骤:多媒体教学过程教学设计意图 核心素养目标一、温故知新1.如何画频率分布直方图的步骤条形统计图、扇形统计图和折线统计图的区别与联系统计图区别联系条形统计图(1)直观反映数据分布的大致情况(2)清晰地表示各个区间的具体数目(3)会丢失数据的部分信息在同一组数据的不同统计图表中,计算出相应组的频数、频率应扇形统计图(1)清楚地看出数据分布的总体趋势及各部分所占总体的百分比(2)丢失了原来的具体数据折线统计图(1)表示数据的多少和数量增减变化情况(2)制作类似于函数图象的画法,侧重体现数据的变化规律中也经常被使用.163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0 例2.根据下面女生的身高的样本数据,估计树人中学高一年级女生的第25,50,75百分位数.解:把27名女生的样本数据按从小到大排序,可得148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0 158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0 163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0由25%×27=6.75, 50%×27=13.5, 75%×27=20.25,可知样本数据的第25,50,75百分位数为第7, 14,21项数据,分别为155.5,161,164.据此可以估计树人中学高一年级女生的第25,50,75百分位数分别约为155.5,161和164.例3.根据下表或下图,估计月均用水量的样本数据的80%和95%分位数.分析:统计表或统计图,与原始数据相比,它们损失了一些信息,例如由上表中可以知道在[16.2,19.2)内有5个数据,但不知道这5个数据具体是多少.此时,我们通常把它们看成均匀地分布在此区间上. 解:由表可知,月均用水量在13.2t 以下的居民用户所占比例为23%+32%+13%+9%=77%.在16.2t 以下的居民用户所占的比例为77%+9%=86%. 因此,80%分位数一定位于[13.2,16.2)内.由13.2+3× =14.2, 可以估计月均用水量的样本 数据的80%分位数约为14.2.类似地,由22.2+3× =22.95,可以估计月均用水量的样本数据的95%分位数约为22.95. 计算方法和计算中位数是一样的 下表为12名毕业生的起始月薪 毕业生 起始月薪毕业生 起始月薪 1 2 85072 8902 2 950 83 130 33 05092 9400.800.770.860.77--0.95-0.940.98-0.944. 为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?解:由题意知分别落在各区间上的频数为在[80,90)上有60×0.15=9,在[90,100)上有60×0.25=15,在[100,110)上有60×0.3=18,在[110,120)上有60×0.2=12,在[120,130]上有60×0.1=6.从以上数据可知第50百分位数一定落在区间[100,110)上,综上可知,第50百分位数和第75百分位数分别估计为103.3 cm,112.5 cm.5.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(3)根据(2)中求得的数据a =0.001 5,b =0.002 0.计算用电量的75%分位数.[解] (1)当0≤x ≤200时,y =0.5x ;当200<x ≤400时,y =0.5×200+0.8×(x -200)=0.8x -60;当x >400时,y =0.5×200+0.8×200+1.0×(x -400)=x -140.所以y 与x 之间的函数解析式为y =⎩⎪⎨⎪⎧ 0.5x ,0≤x ≤200,0.8x -60,200<x ≤400,x -140,x >400.(2)由(1)可知,当y =260时,x =400,即用电量不超过400千瓦时的占80%,用电量不超过400千瓦时的占80%,所以75%分位数为m 在[300,400)内,所以0.6+(m -300)×0.002=0.75,解得m =375千瓦时,即用电量的75%分位数为375千瓦时.(3)设75%分位数为m ,因为用电量低于30千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,本节课通过探究栏目提出“居民生活用水定额管理问题”,在制定水价问题中提出,总体百分位数的估计的概念,让学生尝试运用总体百分位数的估计来解决实际问题,体会总体百分位数的估计的意义和作用教学中要注重学生的主体地位,调动学生积极性,使数学教学成为数学活动的教学。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

9.2 用样本估计总体(精讲)考法一总体取值规律的估计【例1】(2021·全国高一课时练习)某市2020年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空间质量为良;在101~150之间时,空间质量为轻微污染;在151~200之间时,空间质量为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.【答案】(1)频率分布表见解析;(2)频率分布直方图见解析;(3)该市空气质量有待进一步改善.【解析】(1)频率分布表(2)频率分布直方图(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的1 15;有26天处于良的水平,占当月天数的13 15;处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.【一隅三反】1.(2020·全国高一单元测试)某市为提倡节约用水,准备实行自来水“阶梯计费”方式,用户用水不超出基本用水量的部分享受基本价格,超出基本用水量的部分实行超价收费,为更好地决策,自来水公司随机抽取了部分用户的用水量数据,并绘制了如图不完整的统计图(每组数据包括右端点但不包括左端点),请你根据统计图解答下列问题:用户用水量频数直方图用户用水量扇形统计图(1)此次抽样调查的样本容量是________;(2)补全频数分布直方图,求扇形图中“15吨~20吨”部分的圆心角的度数;(3)如果自来水公司将基本用水量定为每户25吨,那么该地区6万用户中约有多少用户的用水全部享受基本价格.【答案】(1)答案见解析;(2)答案见解析,79.2°;(3)4.08万户.【解析】(1)1010%100÷=;(2)用水15~20吨的户数为100-10-36-24-8=22(户),“15~20吨”部分的圆心角的度数为22 36079.2100︒⨯=︒(3)1022366 4.08100++⨯=(万户)所以该地区6万用户中约有4.08万户的用水全部享受基本价格.2.(2020·全国高一单元测试)对某校高一年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M,p及图中a的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)内的人数. 【答案】(1)M =40,0.075p =,0.125a =;(2)90人. 【解析】(1)由[10,15)内的频数是10,频率是0.25知,100.25M=,所以M =40. 因为频数之和为40,所以10+25+m +2=40,m =3.330.07540p M ===. 因为a 是对应分组[15,20)的频率与组距的商,所以250.125405a ==⨯. (2)因为该校高一学生有360人,分组[10,15)内的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为3600.25⨯=90人.3.(2021·北京丰台区)为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50kW ·h 至350kW ·h 之间,进行适当分组后,画出频率分布直方图如图所示.(I )求a 的值;(Ⅱ)求被调查用户中,用电量大于250kW ·h 的户数;(III )为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW ·h )的建议,并简要说明理由. 【答案】(I )0.006;(Ⅱ)18;(III )245.5 kW ·h.【解析】(1)因为()0.00240.00360.00440.00240.0012501a +++++⨯=,所以0.006a =; (2)根据频率分布直方图可知:“用电量大于250kW ·h ”的频率为()0.00240.0012500.18+⨯=, 所以用电量大于250kW ·h 的户数为:1000.1818⨯=, 故用电量大于250kW ·h 有18户;(3)因为前三组的频率和为:()0.00240.00360.006500.60.8++⨯=<,前四组的频率之和为()0.00240.00360.0060.0044500.820.8+++⨯=>, 所以频率为0.8时对应的数据在第四组, 所以第一档用电标准为:0.80.620050245.50.22-+⨯≈kW ·h.故第一档用电标准为245.5 kW ·h.4.(2021·陕西咸阳市)某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.【答案】(Ⅰ)0.02;(Ⅱ)10800元. 【解析】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为: ()0.040.025309+⨯⨯=(天), 一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.考法二 总体百分数的估计【例2】(2020·天津和平区)已知一组数据为4,5,67,8,8,,第40百分位数是( ) A .8 B .7C .6D .5【答案】C【解析】因为有6位数,所以640 2.4⨯=%,所以第40百分位数是第三个数6.故选:C 【一隅三反】1.(2020·山东菏泽市·高一期末)数据1,2,3,4,5,6的60%分位数为( ) A .3 B .3.5C .3.6D .4【答案】D【解析】由6⨯60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数,故选:D2.(2021·山东高一期末)已知从某中学高一年级随机抽取20名女生,测量她们的身高(单位:cm ),把这20名同学的身高数据从小到大排序:148.0 149.0 150.0 152.0 154.0 154.0 155.0 155.5 157.0 157.0 158.0 159.0 161.0 162.0 163.0 164.0 165.0 170.0 171.0 172.0 则这组数据的第75百分位数是( ) A .163.0 B .164.0C .163.5D .164.5【答案】A【解析】因为这组数据从小到大已排序,所以这组数据的第75百分位数为第200.7515⨯=个数,即为163.0故选:A3.(2020·山东滨州市·高一期末)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[]0,10内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居号,他们的幸福感指数分别为5,6,7,8,9,5,则这组数据的第80百分位数是( ) A .7 B .7.5C .8D .9【答案】C【解析】该组数据从小到大排列为:5,5,6,7,8,9,且680% 4.8⨯=,故选:C.考法三 总体集中趋势的估计【例3】(2021·湖北荆州市)因受新冠疫情的影响,某企业的产品销售面临困难.为了改变现状,该企业欲借助电商和“网红”直播带货扩大销售.受网红效应的影响,产品销售取得了较好的效果.现将该企业一段时间内网上销售的日销售额统计整理后绘制成如下图所示的频率分布直方图:请根据图中所给数据,求: (1)实数a 的值;(2)该企业网上销售日销售额的众数和中位数; (3)该企业在统计时间段内网上销售日销售额的平均数. 【答案】(1)0.012;(2)55万元,57万元;(3)57.4万元. 【解析】(1)由频率分布直方图知:(0.0080.0160.0200.0180.0100.0042)101a ++++++⨯=,解得:0.012a =;(2)用频率分布直方图中最高矩形所在区间的中点值作为众数的近似值,得众数为55万元;因为第一个小矩形的面积为0.08,第二个小矩形的面积为0.12, 第三个小矩形的面积为0.16,0.080.120.160.36++=,设第四个小矩形中底边的一部分长为x ,则0.0200.50.36x ⨯=-,解得7x =, 所以中位数为50757+=万元; (3)依题意,日销售额的平均值为:250.08350.12450.16550.20650.18750.12850.10950.0457.4⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=所以该企业在统计时间段内网上销售日销售额的平均数为57.4万元. 【一隅三反】1.(2020·定边县第四中学高一期末)如图,从参加数学竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图,观察图形,回答下列问题:(Ⅰ)79.5-89.5这一组的频数、频率分别是多少? (Ⅱ)估计这次数学竞赛的平均成绩是多少?(Ⅲ)估计这次数学竞赛的及格率(60分及以上为及格). 【答案】(Ⅰ)15;0.25;(Ⅱ)70.5;(Ⅲ)75%. 【解析】(Ⅰ)79.589.5这一组的频率为0.025100.25⨯=,79.589.5这一组的频数为600.2515⨯=;(Ⅱ)估计这次数学竞赛的平均成绩是:44.50.154.50.1564.50.1574.50.384.50.2594.50.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.故估计这次数学竞赛的平均成绩是70.5.(Ⅲ)估计这次环保知识竞赛的及格率(60分及以上为及格)()10.010.0151075%P =-+⨯=. 2.(2021·河北唐山市·开滦第一中学高一期末)某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[)[)[]40,50,50,60,,90,100⋯后画出如下频率分布直方图.观察图形的信息,回答下列问题:(1)估计这次考试的众数m 与中位数n (结果保留一位小数); (2)估计这次考试的优秀率(80分及以上为及格)和平均分. 【答案】(1)75m =,73.3n =;(2)优秀率30%,平均分71分. 【解析】(1)众数是最高小矩形中点的横坐标,所以众数为75m =(分)前三个小矩形面积为0.01100.015100.015100.4⨯+⨯+⨯=, ∵中位数要平分直方图的面积, ∴0.50.47073.30.03n -=+=.(2)依题意,80及以上的分数所在的第五、六组, 频率和为 ()0.0250.005100.3+⨯=, 所以,抽样学生成绩的合格率是30%, 利用组中值估算抽样学生的平均分:450.1550.15650.15750.3850.25950.0571⨯+⨯+⨯+⨯+⨯+⨯=,估计这次考试的平均分是71分.3.(2021·吉林市)某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x 的值;并估计出月平均用水量的众数. (2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?【答案】(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【解析】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为(0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5,解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯=(3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++, ∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况,其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 考点四 总体离散程度的估计【例4】(2021·山东威海市·高一期末)如图所示的四组数据,标准差最小的是( )A .B .C .D .【答案】A【解析】对A ,()12106206302402516x =⨯+⨯+⨯+⨯=,s == 对B ,()16102202306402516x =⨯+⨯+⨯+⨯=,s == 对C ,()13105205303402516x =⨯+⨯+⨯+⨯=,10s ==, 对D ,()15103203305402516x =⨯+⨯+⨯+⨯=,s == 所以标准差最小的是A.故选:A.【一隅三反】1.(2020·全国高一)已知数据12,,,n x x x 的平均数为x ,方差为2s ,则123x +,223x +,…,23n x +的平均数和方差分别为( )A .x 和2sB .23x +和24sC .23x +和2sD .23x +和24129s s ++ 【答案】B【解析】因为数据12,,,n x x x 的平均数为x ,方差为2s ,所以123x +,223x +,…,23n x +的平均数和方差分别为23x +和24s故选:B2.(2020·安徽蚌埠市·蚌埠二中高一月考)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是( )A .17.2,3.6B .54.8,3.6C .17.2,0.4D .54.8,0.4 【答案】C【解析】设一组数据为i x (1,2,3,,)i n =,平均数为x ,方差为21s ,所得一组新数据为i y (1,2,3,,)i n =,平均数为y ,方差为22s ,则350i i y x =-(1,2,3,,)i n =,12 1.6n y y y y n +++==, 所以123503503501.6n x x x n -+-++-=, 所以350 1.6x -=,所以51.617.23x ==, 由题意得22222121()()() 3.6n s y y y y y y n ⎡⎤=-+-++-=⎣⎦, 所以222121(350 1.6)(350 1.6)(350 1.6) 3.6n x x x n⎡⎤--+--++--=⎣⎦, 所以2221219(17.2)(17.2)(17.2) 3.6n x x x n ⎡⎤⨯-+-++-=⎣⎦ 所以2221219()()() 3.6n x x x x x x n⎡⎤⨯-+-++-=⎣⎦, 所以219 3.6s =,所以210.4s =.故选:C.3.(2020·唐山市第十一中学)已知样本数据由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则a ,b 的值分别为( ).A .10,11B .10.5,9.5C .10.4,10.6D .10.5,10.5 【答案】D【解析】由于样本共有10个值,且中间两个数为a ,b ,依题意,得10.52a b +=,即21b a =-. 因为平均数为23371213.718.320101()0a b +++++++++÷=,所以要使该样本的方差最小,只需()()221010a b -+-最小.又()()()()222221010102110242221a b a a a a -+-=-+--=-+, 所以当4210.522a -=-=⨯时,()()221010a b -+-最小,此时10.5b =. 故选:D4.(2021·合肥市第六中学=)为了测试小班教学的实践效果,刘老师对A 、B 两班的学生进行了阶段测试,并将所得成绩统计如图所示;记本次测试中,A 、B 两班学生的平均成绩分别为A x ,B x ,A 、B 两班学生成绩的方差分别为2A s ,2B s ,则观察茎叶图可知( )A .AB x x <,22A B s s < B .A B x x >,22A B s s <C .A B x x <,22A B s s >D .A B x x >,22A B s s >【答案】B【解析】根据茎叶图中数据的分布可得,A 班学生的分数多集中在[]70,80之间, B 班学生的分数集中在[]50,70 之间,所以A B x x >.相对两个班级的成绩分布来说,A 班学生的分数更加集中,B 班学生的分数更加离散,所以22A B s s <.故选:B。

相关文档
最新文档