高中数学必修二 9 2 用样本估计总体(精讲)(含答案)

合集下载

高一数学人教A版(2019)必修第二册: 9 2 3总体集中趋势的估计 学案(含答案)

高一数学人教A版(2019)必修第二册: 9 2 3总体集中趋势的估计 学案(含答案)

第九章 统计9.2 用样本估计总体9.2.3 总体集中趋势的估计学习目标1. 理解样本数据基本数字特征的意义和作用,对样本数据中提取的基本数字特征(如众数、中位数、平均数)作出合理解释;2. 体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;3. 体会样本数字特征的随机性;4. 会用样本估计总体的思想解决实际问题.随堂训练1. 一个样本的容量为60,分成5组,已知第一组、第三组的频数分别是9、10,第二、五组的频率都为15,则该样本的中位数在( ) A .第二组 B .第三组 C .第四组 D .第五组2. 对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图所示,则估计此样本的众数、中位数分别为( )A .2.25,2.5B .2.25,2.02C .2,2.5D .2.5,2.253. 为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A.m e=m0=x B.m e=m0<xC.m e<m0<x D.m0<m e<x4. 已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么数据的众数是________,平均数是________.5. 我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.6. 一次数学知识竞赛中,两组学生成绩如下:经计算,已知两个组的平均分都是80分,请根据所学过的统计知识,进一步判断这次竞赛中哪个组更优秀,并说明理由.答案随堂训练1. 答案:B解析:第二组的频数为60×15=12, ∵9+12=21<30,9+12+10=31>30,∴中位数在第三组.故选B.2. 答案:B解析:众数是指样本中出现频率最高的数,在频率分布直方图中通常取该组区间的中点,所以众数为2+2.52=2.25.中位数是频率为0.5的分界点,由频率分布直方图,可知前4组的频率和为(0.08+0.16+0.30+0.44)×0.5=0.49,因此中位数出现在第5组,设中位数为x ,则(x -2)×0.5=0.01,解得x =2.02.故选B.3. 答案:D解析:由题目所给的统计图可知,30个数据按大小顺序排列好后,中间两个数为5,6,故中位数为m e =5+62=5.5.又众数为m 0=5, 平均值x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930≈5.97, ∴m 0<m e <x .故选D.4.答案:6;5解析:∵中位数为5,∴4+x 2=5,即x =6. ∴该组数据的众数为6,平均数为-1+0+4+6+6+156=5. 5.答案:解:(1)由频率分布直方图,可知月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a ,解得a =0.30.(2)由(1),100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12, 由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)设中位数为x 吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.6.答案:解:(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数这一角度看,甲组成绩好些.(2)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(3)从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成绩在高分段的人数多.同时,乙组满分比甲组多6人,从这一角度看,乙组成绩较好.。

人教A版数学必修第二册第九章《9.2 用样本估计总体》同步讲义

人教A版数学必修第二册第九章《9.2 用样本估计总体》同步讲义

人教A 版数学必修第二册第九章《统计》同步讲义9.2 用样本估计总体一.总体取值规律的估计(一)作频率分布直方图的步骤1.求极差:2.决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.3.将数据分组4.列频率分布表:各小组的频率=5.画频率分布直方图纵轴表示频率组距,频率组距实际上就是频率分布直方图中各小长方形的高度,小长方形的面积= =频率.(二)频率分布直方图的性质1.因为小矩形的面积= = ,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小矩形的面积之和等于1.3.频数相应的频率=样本容量.二.常见统计图表的特点与区别1.扇形图:用于直观描述各类数据占总数的比例,易于显示每组数据相对于总数的大小2.条形图:主要用于直观描述不同类别或分组数据的频数和频率,适用于描述离散型数据。

3.直方图主要用于直观描述不同类别或分组数据的频数和频率,直方图适用于描述连续型数据.4.折线图主要用于描述数据随时间的变化趋势.三.总体百分位数的估计1.百分位数定义:一般地,一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有p %的数据小于或等于这个值,且至少有(100-p )%的数据大于或等于这个值.2.常用的百分位数(1)四分位数:第25百分位数,第50百分位数,第75百分位数.(2)其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.3.计算一组n 个数据的第p百分位数的一般步骤如下:第1步,按从小到大排列原始数据;第2步,计算i =n ×p %;第3步,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.四.总体集中趋势的估计(一)众数、中位数、平均数1.众数:一组数据中出现次数最多的数.2.中位数:如果一组数有奇数个数,且按照从小到大排列后为x 1,x 2,…,x 2n +1,则称x n +1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x 1,x 2,…,x 2n ,则称x n +x n +12为这组数的中位数.3.平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n(x 1+x 2+…+x n )叫做这n 个数的平均数.(二)频率分布直方图中平均数、中位数、众数的求法(1)众数:取最高小长方形底边中点的横坐标作为众数.(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x 轴交点的横坐标称为中位数.(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 五.总体离散程度的估计1.假设一组数据为x 1,x 2,…x n ,则这组数据的平均数= ,方差为标准差2.如果总体中所有个体的变量值分别为Y 1,Y 2,…,Y N ,总体平均数为,则称为总体方差,S =S 2为总体标准差.3.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.4.分层随机抽样的方差设样本中不同层的平均数分别为x 1,x 2,…,x n ,方差分别为s 21,s 2,…,s 2n ,相应的权重分别为w 1,w 2,…,w n,则这个样本的方差为x s =Y n22i i 11S (Y Y)N ==-∑n222ii i i 1S w [S(x x)]==+-∑题型一 总体取值规律的估计【例1-1】(2023·全国·高一专题练习)在2022年某地销售的汽车中随机选取1000台,对销售价格与销售数量进行统计,这1000台车辆的销售价格都不小于5万元,小于30万元,将销售价格分为五组:(单位:万元).统计后制成的频率分布直方图如图所示.在选取的1000台汽车中,销售价格在内的车辆台数为( )A .800B .600C .700D .750【例1-2】(2023天津)从某小区抽取100户居民用户进行月用电调查,发现他们的用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.在被调查的用户中,用电量落在区间内的户数为( )A .45B .46C .54D .70【例1-3】(2023·江苏)党的二十大报告指出:“全面提高人才自主培养质量,着力造就拔尖创新人才,聚天下英才而用之.”某区域教育部门为提高学生的创新能力,组织了200名学生参与研究性学习,每人仅参加1个课题组,参加各课题组的人数占比的扇形统计图如图所示,则参加数学类的人数比参加理化类的人数多()[)[)[)[)[)5,1010,1515,2020,2525,30,,,,[)10,2050350kW h ⋅:[100,200)A .16B .30C .32D .62【例1-4】(2023云南)下图是国家统计局发布的我国最近10年的人口出生率(单位:‰),根据下图,则( )A .这10年的人口出生率逐年下降B .这10年的人口出生率超过12‰的年数所占比例等于45%C .这10年的人口出生率的80%分位数为13.57‰D .这10年的人口出生率的平均数小于12‰题型二 总体百位分数的估计【例2-1】(2023·辽宁)某地有9个快递收件点,在某天接收到的快递个数分别为360,284,290,300,402,188,240,260,288,则这组数据的第72百分位数为( )A .290B .295C .300D .330【例2-2】(2023·全国·高一专题练习)《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是()[40,45),[45,50),[50,55),[55,60),[60,65),[65,70]A .55B .57.25C .58.75D .60题型三 总体集中趋势的估计【例3-1】(2023上海徐汇)军训时,甲、乙两名同学进行射击比赛,共比赛10场,每场比赛各射击四次,且用每场击中环数之和作为该场比赛的成绩.数学老师将甲、乙两名同学的10场比赛成绩绘成如图所示的茎叶图(成绩的十位数为“茎”,个位数为“叶”),并给出下列三个结论:①甲的成绩的极差是29;②乙的成绩的中位数是18;③乙的成绩的众数是22.则三个结论中,正确结论个数为( ).A .3B .2C .1D .0【例3-2】(2023秋·内蒙古包头·高三统考期末)某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数分别为a ,b ,c ,则( )A .B .C .D .【例3-3】(2023春·浙江温州)(多选)《国家学生体质健康标准》是国家学校教育工作的基础性指导文件和教育质a b c <<b a c <<a c b <<b<c<a量基本标准,它适用于全日制普通小学、初中、普通高中、中等职业学校、普通高等学校的学生.某高校组织名大一新生进行体质健康测试,现抽查200名大一新生的体测成绩,得到如图所示的频率分布直方图,其中分组区间为,,,,,.则下列说法正确的是( )A .估计该样本的众数是B .估计该样本的均值是C .估计该样本的中位数是D .若测试成绩达到分方可参加评奖,则有资格参加评奖的大一新生约为人题型四 总体离散程度的估计【例4-1】(2023·高一课时练习)两名运动员在某次测试的6次成绩如图所示,则两人平均数与方差的关系是( )A .甲的平均数大,方差小B .平均数相等,甲方差大C .平均数相等,甲方差小D .平均数和方差都相等【例4-2】(2023 浙江湖州 )(多选)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则()4000[70,75)[75,80)[80,85)[85,90)[90,95)[95,100)87.58086852200A .骑车时间的中位数的估计值是22分钟B .坐公交车时间的40%分位数的估计值是19分钟C .坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值D .坐公交车时间的方差的估计值小于骑车时间的方差的估计值【例4-3】(2023内蒙古赤峰·)甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是( )A .甲同学比乙同学发挥稳定,且平均成绩也比乙同学高B .甲同学比乙同学发挥稳定,但平均成绩比乙同学低C .乙同学比甲同学发挥稳定,且平均成绩也比甲同学高D .乙同学比甲同学发挥稳定,但平均成绩比甲同学低【例4-4】(2023 北京·高一校考期末)经过简单随机抽样获得的样本数据为,且数据的平均数为,方差为,则下列说法正确的是( )A .若数据,方差,则所有的数据都为0B .若数据,的平均数为,则的平均数为6C .若数据,的方差为,则的方差为12D .若数据,的分位数为90,则可以估计总体中有至少有的数据不大于9012,,,n x x x 12,,,n x x x x 2s 12,,,n x x x 20s =()1,2,,i x i n = 12,,,n x x x 3x =()211,2,,i i y x i n =+= 12,,,n x x x 23s =()211,2,,i i y x i n =+= 12,,,n x x x 25%75%答案解析一.总体取值规律的估计(一)作频率分布直方图的步骤1.求极差:极差为一组数据中最大值与最小值的差.2.决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.3.将数据分组4.列频率分布表:各小组的频率=小组频数样本容量.5.画频率分布直方图纵轴表示频率组距,频率组距实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×频率组距=频率.(二)频率分布直方图的性质1.因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小矩形的面积之和等于1.3.频数相应的频率=样本容量.二.常见统计图表的特点与区别1.扇形图:用于直观描述各类数据占总数的比例,易于显示每组数据相对于总数的大小2.条形图:主要用于直观描述不同类别或分组数据的频数和频率,适用于描述离散型数据。

高中数学第九章统计之用样本估计总体(精练)(必修第二册)(教师版含解析)

高中数学第九章统计之用样本估计总体(精练)(必修第二册)(教师版含解析)

9.2 用样本估计总体(精练)【题组一 总体取值规律的估计】1.(2020·江苏苏州市·星海实验中学高一期中)为了解学生课外阅读的情况,随机统计了n 名学生的课外阅读时间,所得数据都在[50,150]中,其频率分布直方图如图所示.已知在[50,75)中的频数为100,则n 的值是( )A .500 B .1000 C .10000 D .25000【答案】B【解析】由图可得在[50,75)中的频率为0.004250.1⨯=,所以10010000.1n ==,故选:B. 2.(2021·北京昌平区·高一期末)某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[90,100],样品数据分组为[90,92),[92,94),[94,96),[96,98),[98,100].已知样本中产品净重小于94克的个数为36,则样本中净重大于或等于92克并且小于98克的产品的个数是( )A .45B .60C .75D .90【答案】D【解析】[90,92),[92,94),[94,96),[96,98)对应的频率分别为:0.1,0.2,0.3,0.25设样本容量为n因为净重小于94克的个数为36,所以()0.10.236n+=,解得120n=则样本中净重大于或等于92克并且小于98克的产品的个数为()0.20.30.2512090++⨯=故选:D3.(2021·北京市第四中学顺义分校高一期末)为了解学生在“弘扬传统文化,品读经典文学”月的阅读情况,现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(阅读时间[]0,50t∈),分组整理数据得到如图所示的频率分布直方图.则图中a的值为( )A.0.028 B.0.030 C.0.280 D.0.300【答案】A【解析】由(0.0060.0400.0200.006)101a++++⨯=得0.028a=.故选:A4.(2020·广东云浮市·高一期末)在容量为50的样本中,某组的频率为0.18,则该组样本的频数为( ).A.9 B.10 C.18 D.20【答案】A【解析】由题意,频数=样本容量×频率500.189=⨯=.故选:A5.(2021·湖南长沙市)“水是生命之源”,但是据科学界统计可用淡水资源仅占地球储水总量的2.8%,全世界近80%人口受到水荒的威胁.某市为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨):一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照00.50.51,...,[[[44.5,),,),)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有60万居民,估计全市居民中月均用水量不低于2.5吨的人数,并说明理由; (3)若该市政府希望使82%的居民每月的用水不按议价收费,估计x 的值,并说明理由. 【答案】(1)0.3;(2)16.2万;(3)2.8吨.【解析】(1)由概率统计相关知识,可知各组频率之和的值为1 即频率分布直方图各小矩形面积之和为1()0.50.080.160.40.520.120.080.0421a ∴⨯+++++++=解得:0.3a =(2)由图可知,不低于2.5吨人数所占百分比为()0.50.30.120.080.0427%⨯+++= ∴全市月均用水量不低于2.5吨的人数为:600.2716.2⨯=(万)(3)由(2)可知,月均用水量小于2.5吨的居民人数所占百分比为:73% 即73%的居民月均用水量小于2.5吨,同理,88%的居民月均用水量小于3吨 故2.53x <<假设月均用水量平均分布,则()82%73%2.5 2.80.3x -=+=(吨)6.(2020·天津河西区·)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30、42、41、36、44、40、37、37、25、45、29、43、31、36、49、34、33、43、38、42、32、34、46、39、36,根据上述数据得到样本的频率分布表如下:分组频数频率[]25,3030.12(]30,3550.20(]35,4080.32(]40,451n1f(]45,502n2f(1)确定样本频率分布表中1n、2n、1f和2f的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(]30,35的概率. 【答案】(1)17n=,22n=,10.28f=,20.08f=;(2)详见解析;(3)0.5904.【解析】(1)由题意知17n=,22n=,170.2825f∴==,220.0825f==;(2)样本频率分布直方图为:(3)根据样本频率分布直方图,每人的日加工零件数落在区间(]30,35的概率0.2, 设所取的4人中,日加工零件数落在区间(]30,35的人数为ξ,则()~4,0.2B ξ,,所以4人中,至少有1人的日加工零件数落在区间(]30,50的概率约为0.5904. 【题组二 总体百分数的估计】1.(2020·全国高一课时练习)一组数据12,34,15,24,39,25,31,48,32,36,36,37,42,50的第25,75百分位数分别是______、________. 【答案】25 39【解析】把数据从小到大排序为12,15,24,25,31,32,34,36,36,37,39,42,48,50共14个数, 14×25%=3.5, 14×75%=10.5, 所以第25,75百分位数分别是第4,11项数据,即是25,39. 故答案为:25,39.2.(2021·安徽宿州市·高一期末)若一组数据为82,81,79,78,95,88,92,84,则该组数据的75%分位数是___________. 【答案】90【解析】由题可得一共有8个数据,则该组数据的75%分位数在第6位和第7位之间,为()8892902+=.故答案为:90.3.(2020·山东东营市·广饶一中高一期末)数据10,9,8,7,6,5,4,3,2,1的25%分位数、80%分位数分别是_______; 【答案】3;8.5【解析】将数据10,9,8,7,6,5,4,3,2,1从小到大排序得:1,2,3,4,5,6,7,8,9,10, 当%25%p =时,10%1025% 2.5i p ==⨯=,25%∴分位数为3. 当%80%p =时,10%1080%8i p ==⨯=,80%∴分位数为89=8.52+.故答案为:3;8.5. 4.(2020·天津市滨海新区大港太平村中学高一期末)树人中学高一1班23名男生身高的样本数据(单位:cm )按从小到大排序,排序结果如下:164,165,165,166,167,168,168,168,170,170,170,172, 172,172,173,173,173,173,174,175,175,175,176. 由数据估计树人中学高一年级男生身高的第50百分位数为________.【答案】172【解析】由2350%11.5⨯=,将样本数据从小到大排列,第12个数字为172,所以可估计树人中学高一年级男生身高的第50百分位数为172.故答案为:172.5.(2020·山东泰安市·高一期末)某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,174,175,若样本数据的第90百分位数是173,则x的值为________.【答案】172【解析】百分位数的意义就在于,我们可以了解的某一个样本在整个样本集合中所处的位置,本题第90百分位数是173,所以1741732x+=,172x=故答案为:1726.(2020·临高县临高中学高一期末)下列数据是30个不同国家中每10000名患某种疾病的男性的死亡人数:1.5 3.2 5.2 5.6 5.6 7.1 8.7 9.2 10.0 11.213.2 13.7 13.8 14.5 15.2 15.7 16.5 18.8 19.2 23.927 27 28.9 28.9 33.1 33.8 34.8 40.6 41.6 50.1这组数据的第70百分位数是_______________.【答案】27.【解析】按从小到大排列此30个数据,指数3070%21i=⨯=,则第70百分位数是2727272+=,故答案为:27.7.(2020·全国高一课时练习)某同学在7天内每天参加体育锻炼的时间(单位:分钟)如下65,65,66,74,73,81,80,则它们的第三四分位数是________ .【答案】80【解析】从小到大排序为65,65,66,73,74,80,81,第三四分位数即75%分位数,7×75%=5.25,所以第三四分位数是第6项数据80.故答案为:808.(2020·江苏高一期中)已知一组数据1,3,2,,4m,且这组数据的平均数为3,则m的值为__________. 【答案】5【解析】由题意132435m++++=,解得5m=故答案为:5【题组三总体集中趋势的估计】1.(2020·全国高一课时练习)10名工人某天生产同一零件,生产的件数是15、17、14、10、15、17、17、16、14、12.设其平均数为a ,中位数为b ,众数为c ,则有( )A .a b c >>B .c b a >>C .c a b >>D .b c a >>【答案】B【解析】将生产的件数由小到大排列为:10、12、14、14、15、15、16、17、17、17,()11517141015171716141214.710a ∴=+++++++++=,中位数为15b =, 众数为17c =.因此,c b a >>.故选:B.2.(2021·安徽宿州市·高一期末)2020年宿州市某中学参加高中数学建模(应用)能力测试,高一年级有60人,高二年级有40人.高一的平均成绩为70分,高二的平均成绩为80分,则参加测试的100名学生的平均成绩为( ) A .72分 B .73分C .74分D .75分【答案】C【解析】由题意可得,参加测试的100名学生的平均成绩为6070408074100⨯+⨯=.故选:C.3.(2021·北京房山区·高一期末)根据气象学上的标准,连续5天的日平均气温低于10C 即为入冬.现有甲、乙、丙、丁四地连续5天的日平均温度的记录数据(记录数据都是正整数): ①甲地:5个数据的中位数为7,众数为6; ②乙地:5个数据的平均数为8,极差为3; ③丙地:5个数据的平均数为5,中位数为4; ④丁地:5个数据的平均数为6,方差小于3. 则肯定进入冬季的地区是( ) A .甲地 B .乙地C .丙地D .丁地【答案】D【解析】①甲地:5个数据的中位数为7,众数为6;则这5个数据可能为6,6,7,10,11;即连续5天的日平均气温不是都低于10C ,所以甲地不一定入冬,故A 错;②乙地:5个数据的平均数为8,极差为3;则这5个数据可能为7,7,8,8,10;即连续5天的日平均气温不是都低于10C ,所以乙地不一定入冬,故B 错;③丙地:5个数据的平均数为5,中位数为4;则这5个数据可能为1,2,4,7,11;即连续5天的日平均气温不是都低于10C ,所以丙地不一定入冬,故C 错;④丁地:5个数据的平均数为6,方差小于3.如有数据大于等于10,则方差必大于等于()210616355-=>,不满足题意,因此丁地这续5天的日平均气温都低于10C ,所以丁地一定入冬,故D 正确; 故选:D.4.(2020·全国高一)某组数据的茎叶图如图所示,其众数为a ,中位数为b ,平均数为c ,则( )A .a b c >> B .a c b >> C .b a c >> D .c a b >>【答案】A【解析】由图中数据可得23a =,202120.52b +== 89131517202123232632332012c +++++++++++==所以a b c >>故选:A5.(2020·全国高一)已知一组数据的频率分布直方图如图所示,则众数、中位数、平均数分别为( )A .63,64,66B .65,65,67C .55,64,66D .64,65,64【答案】B【解析】由频率分布直方图可知,众数为6070652+=; 由100.0350.040.5⨯+⨯=,所以面积相等的分界线为65,即中位数为65; 平均数为550.3650.4750.15850.1950.0567⨯+⨯+⨯+⨯+⨯=.故选:B .6.(2020·广东汕头市·金山中学高一月考)甲、乙两名学生的六次数学测验成绩(百分制)的茎叶图如图所示.①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学的平均分高;③甲同学的平均分比乙同学的平均分低;④甲同学成绩的方差小于乙同学成绩的方差.上面说法正确的是( )A.③④B.①②④C.②④D.①③④【答案】A【解析】由茎叶图知甲同学的成绩为72,76,80,82,86,90;乙同学的成绩为69,78,87,88,92,96.故甲同学成绩的中位数小于乙同学成绩的中位数,①错;计算得甲同学的平均分为81,乙同学的平均分为85,故甲同学的平均分比乙同学的平均分低,因此②错、③对;计算得甲同学成绩的方差小于乙同学成绩的方差,故④对.7.(2020·山东枣庄市·滕州市第一中学新校高一月考)从某食品厂生产的面包中抽取100个,测量这些面包的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数82237285(1)在相应位置上作出这些数据的频率分布直方图;(2)估计这种面包质量指标值的平均数x(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包90%的规定?”【答案】(1)见解析;(2)100;(3)见解析.【解析】(1)画图.(2)质量指标值的样本平均数为800.08900.22x=⨯+⨯1000.371100.28+⨯+⨯1200.05100+⨯=.所以这种面包质量指标值的平均数的估计值为100.(3)质量指标值不低于85的面包所占比例的估计值为0.220.370.280.050.92+++=,由于该估计值大于0.9,故可以认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包90%的规定.”8.(2020·安徽蚌埠市·蚌埠二中高一月考)某学校对男、女学生进行有关“习惯与礼貌”的评分,记录如下:男:54,70,57,46,90,58,63,46,85,73,55,66,38,44,56,75,35,58,94,58;女:77,55,69,58,76,70,77,90,51,53,63,64,69,83,83,65,100,75.(1)分别计算男、女学生得分的平均数;(2)分别计算男、女学生得分的四分位数.【答案】(1)男生平均数为61.05,女生平均数为71;(2)男生得分的四分位数: 50, 58, 71.5;女生得分的四分位数: 63, 69.5, 77.【解析】(1)男学生的平均数为1547057469058634685735566384456753558945820x+++++=++++++++++++++ 61.05=,女学生得分的平均数2775569587670779051536364698383651007518x=+++++++++++++++++71=.(2)男、女学生得分从小到大排列为男:35,38,44,46,46,54,55,56,57,58,58,58 ,63,66,70,73,75,85, 90,94;女:51,53,55,58,63,64,65,69,69,70,75,76,77,77,83,83, 90, 100;男、女学生得分的四分位数如下表25%分位数50%分位数75%分位数男生50 58 71.5女生63 69.5 779.(2021·安徽宿州市·高一期末)某地教育部门对某学校学生的阅读素养进行检测,在该校随机抽取了M 名学生进行检测,实行百分制,现将所得的成绩按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100)分成6组,并根据所得数据作出了如下所示的频数与频率的统计表和频率分布直方图.分组 频数 频率 [40,50)[50,60)25p[60,70) s0.30[70,80)mn[80,90) 100.10[90,100]合计M1(1)求出表中,M p 及图中a 的值;(2)估计该校学生阅读素养的成绩中位数以及平均数.【答案】(1)100,0.25,0.02M p a ===;(2)中位数是2003,平均数是68.5. 【解析】(1)由频率统计表可知:101000.1M ==,250.25100p ∴== 由频率分布直方图可知:(0.0050.0250.030.010.01)101a +++++⨯=,解得0.02a = (2)∵前两组的频率和为0.050.250.30.5+=<,前三组的频率和为0.050.250.30.60.5++=> ∴中位数在[60,70)内,设中位数为x ,则0.050.25(60)0.030.5x ++-⨯=,解得2003x =,即中位数为2003.平均数为450.05550.25650.3750.2850.1950.168.5⨯+⨯+⨯+⨯+⨯+⨯= ∴估计该校学生阅读素养的成绩中位数是2003,平均数是68.5. 10.(2020·全国高一单元测试)某班的全体学生共有50人,参加数学测试(百分制)成绩的频率分布直方图如图,数据的分组依次为:[)20,40,[)40,60,[)60,80,[]80,100. 依此表可以估计这一次测试成绩的中位数为70分.(1)求表中a ,b 的值;(2)请估计该班本次数学测试的平均分. 【答案】(1)0.02a =,0.015b =;(2)68分. 【解析】(1)由中位数为70可得,0.005200.0120100.5a ⨯+⨯+=,解得0.02a =.又()200.0050.010.021b ⨯+++=, 解得0.015b =.(2)由频率分布直方图可知,每组的频率依次为:0.1,0.2,0.4,0.3,则该班本次数学测试的平均分的估计值为:300.1500.2700.4900.368⨯+⨯+⨯+⨯=分.10.(2020·调兵山市第一高级中学高一月考)某城市交通部门为了对该城市共享单车加强监管,随机选取了100人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这100人根据其满意度评分值(百分制)按照[)[)[]50,60,60,70,,90,100⋅⋅⋅分成5组,制成如图所示频率分直方图.(1)求图中x 的值;(2)求这组数据的平均数和中位数;(3)已知满意度评分值在[)50,60内的男生数与女生数的比为3:2,若在满意度评分值为[)50,60的人中随机抽取2人进行座谈,求2人均为男生的概率. 【答案】(1)0.02x =;(2)平均数为77,中位数设为5407;(3)310.【解析】(1)由()0.0050.010.0350.030101x ++++⨯=,解得0.02x =.(2)这组数据的平均数为550.05650.2750.35850.3950.177⨯+⨯+⨯+⨯+⨯=. 中位数设为m ,则()0.050.2700.0350.5m ++-⨯=,解得5407m =. (3)满意度评分值在[)50,60内有1000.005105⨯⨯=人,其中男生3人,女生2人.记为12312,,,,A A A B B , 记“满意度评分值为[)50,60的人中随机抽取2人进行座谈,恰有1名女生”为事件A ,从5人中抽取2人有:12A A ,13A A ,11A B ,12A B ,23A A ,21A B ,22A B ,31A B ,32A B ,12B B 所以总基本事件个数为10个,A 包含的基本事件个数为3个, 所以 ()310P A =. 【题组四 总体离散程度的估计】1.(2020·甘肃白银市·高一期末)已知数据123,,x x x 的中位数为k ,众数为m ,平均数为n ,方差为p ,则下列说法中,错误的是( ) A .数据1232,2,2x x x 的中位数为2kB .数据1232,2,2x x x 的众数为2mC .数据1232,2,2x x x 的平均数为2nD .数据1232,2,2x x x 的方差为2p 【答案】D【解析】若数据123,,x x x 的中位数为k ,众数为m ,平均数为n ,则由性质知数据1232,2,2x x x 的中位数,众数,平均数均变为原来的2倍,故,,A B C 正确;则由方差的性质知数据1232,2,2x x x 的方差为4p ,故D 错误; 故选D .2.(2020·四川省绵阳南山中学高一开学考试)数据1x ,2x ,3x …,n x 分别是某学校教职工()*3,n n n N≥∈个人的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为z ,如果再加上世界首富的年收入数据1n x +,则对这()1n +个数据,下列说法正确的是( ) A .年收入平均数增大,中位数可能不变,方差变大 B .年收入平均数增大,中位数一定变大,方差变大C .年收入平均数增大,中位数可能不变,方差可能不变D .年收入平均数可能不变,中位数可能不变,方差可能不变 【答案】A【解析】因为数据1x ,2x ,3x …,n x 分别是某学校教职工个人的年收入,所以世界首富的收入1n x +会远远大于1x ,2x ,3x …,n x ,故这1n +个数据的平均数会大大增加; 而中位数为数据中间的数或中间两个数的平均数,所以中位数有可能不变;因为世界首富的收入远远大于1x ,2x ,3x …,n x ,所以数据的集中程度受1n x +的影响很大,数据离散程度加大,所以方差变大. 故选:A3(2020·定边县第四中学高一期末)x 是1x ,2x ,…,100x 的平均值,1a 为1x ,2x ,…40x 的平均值,2a 为41x ,42x ,…100x 的平均值,则下列各式正确的是( )A.12235a ax+=B.12325a ax+=C.12x a a=+D.122a ax+=【答案】A【解析】因为1a为1x,2x,...40x的平均值,2a为41x,42x, (100)x的平均值,所以1240140x x x a++⋯+=,4142100260x x x a++⋯+=,则有1121002124060231001005x x x a a a ax++⋯+++===.故选:A.4.(多选)(2021·山东德州市·高一期末)国家为了实现经济“双循环”大战略,对东部和西部地区的多个县市的某一类经济指标进行调查,得出东部,西部两组数据的茎叶图如图所示,则下列结论正确的是( )A.西部的平均数为13.3B.东部的极差小于西部的极差C.东部的30%分位数是11.6D.东部的众数比西部的众数小【答案】ACD【解析】对于A:()11.211.512.412.513.113.113.613.613.713.914.414.915.01313.3++++++++++++÷=即西部的平均数为13.3,故A正确;对于B:东部的最大值为15.1,最小值为10.8,极差为15.110.8 4.3-=;西部的最大值为15.0,最小值为11.2,极差为15.011.2 3.8 4.3-=<;故B错误;对于C:东部共13个数据,1330% 3.9⨯=,即从小到大的第4个数11.6为东部的30%分位数,所以东部的30%分位数是11.6,故C正确;对于D:东部的众数为11.3,西部的众数为13.1和13.6均大于11.3,故D正确;故选:ACD5.(多选)(2020·全国高一单元测试)在某地区某高传染性病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各项中,一定符合上述指标的是( )A.平均数3x≤B.标准差2s≤C.平均数3x≤且极差小于或等于2D.众数等于1且极差小于或等于4【答案】CD【解析】对于A选项,若平均数3x≤,不能保证每天新增病例数不超过5人,不符合题意;对于B选项,标准差反映的是数据的波动大小,例如当每天感染的人数均为10,标准差是0,显然不符合题意;对于C选项,若极差等于0或1,在3x≤的条件下,显然符合指标;若极差等于2,假设最大值为6,最小值为4,则3x>,矛盾,故每天新增感染人数不超过5,符合条件,C正确;对于D选项,若众数等于1且极差小于或等于4,则最大值不超过5,符合指标.故选:CD.6.(多选)(2020·济南市·山东师范大学附中高一月考)甲、乙两支田径队队员的体重(单位:kg)信息如下:甲队体重的平均数为60,方差为200,乙队体重的平均数为68,方差为300,又已知甲、乙两队的队员人数之比为1:3,则关于甲、乙两队全部队员的体重的平均数和方差的说法正确的是( )A.平均数为67 B.平均数为66 C.方差为296 D.方差为287【答案】BD【解析】依题意,甲的平均数160x=,乙的平均数268x=,而甲、乙两队的队员人数之比为1:3,所以甲队队员在所有队员中所占比重为14,乙队队员在所有队员中所占比重为34故甲、乙两队全部队员的体重的平均数为:1360686644x=⨯+⨯=;甲、乙两队全部队员的体重的方差为:()()22213200606630068665922828744s ⎡⎤⎡⎤=⨯+-+⨯+-=+=⎣⎦⎣⎦.故选:BD.7.(多选)(2020·江苏无锡市·高一期末)已知一组数据1x ,2x ,3x ,4x ,5x 的平均数和方差均为2,则下列叙述正确的有( )A .11x +,21x +,31x +,41x +,51x +的平均数为3B .11x +,21x +,31x +,41x +,51x +的方差为3C .12x ,22x ,32x ,42x ,52x 的方差为4D .122x +,222x +,322x +,422x +,522x +的方差为8 【答案】AD【解析】对,A B 选项,将每个数据在原基础上加1,故平均数加1,但是方差保持不变, 故其平均数是3,方差是2;故A 正确;B 错误;对C ,将每个数据乘以2,故其方差变为原来的4倍,即为8,故C 错误; 对D ,将每个数据乘以2再加2,故其方差也变为原来的4倍,即为8,故D 正确. 故选:AD .8.(2020·全国高一课时练习)某城区举行“奥运知识”演讲比赛,中学组根据初赛成绩在高一、高二年级中分别选出10名同学参加决赛,这些选手的决赛成绩如图所示.团体成绩 众数 极差 平均数 方差 高一年级 22 39.6 高二年级85.727.8(1)请把上边的表格填写完整.(2)考虑平均数与方差,你认为哪个年级的团体成绩更好些? 【答案】(1)填表见解析;(2)高二年级的团体成绩更好些.【解析】(1)高一年级的成绩为80,87,89,80,88,99,80,77,91,86; 高二年级的成绩为85,97,85,87,85,88,77,87,78,88. 由此可知高一年级成绩的众数是80,平均数x =85+110(-5+2+4-5+3+14-5-8+6+1)=85.7; 高二年级成绩的众数是85,极差是20. 团体成绩 众数 极差 平均数 方差 高一年级 80 22 85.7 39.6 高二年级 85 2085.727.8(2)因为两个年级的得分的平均数相同,高二年级成绩的方差小,说明高二年级的成绩偏离平均数的程度小,所以高二年级的团体成绩更好些.9.(2020·胶州市教育局高一期末)某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑)(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)【答案】(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为25;(3)3700元. 【解析】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=>所以中位数为x 满足7080x << 由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差1022110(90)610i i x s =-⨯==∑所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为222221100...)801008(90)8x x s +---⨯=(2025==(3)将3座教学楼完全包裹的球的最小直径为:22219280204366444100210++=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;将一座教学楼完全包裹的球的最小直径为2222020604400490070++=<=因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元;将1号教学楼与2号教学楼完全包裹的球的最小直径为:2222080601040012100110++=<=又因为22220806010400490070++=>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元;所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元.11.(2020·河南开封市·高一期末)为庆祝国庆节,某中学团委组织了“歌颂祖国,爱我中华”知识竞赛,从参加考试的学生中抽出60名,将其成绩(成绩均为整数)分成[40,50),[50,60),…,[90,100]六组,并画出如图所示的部分频率分布直方图,观察图形,回答下列问题:(1)求第四组的频率,并补全这个频率分布直方图;(2)请根据频率分布直方图,估计样本的中位数和方差.(每组数据以区间的中点值为代表).【答案】(1)第四组的频率为0.3;作图见解析;(2)2203;194.【解析】因为各组的频率和等于1,所以第四组的频率为1(0.0100.0150.0150.0250.005)1010.70.3 -++++⨯=-=. 补全的频率分布直方图如图所示.(2)前三组的频率之和为:(0.0100.0150.015)100.40.5++⨯=<前四组的频率之和为:0.40.03100.70.5+⨯=>设中位数为x ,则应有(70,80)x ∈又0.4(70)0.030.5x +-⨯=,2203x ∴=即样本的中位数为2203 抽取学生的平均数约为10(450.010550.015650.015750.030850.025950.005)71x =⨯⨯+⨯+⨯+⨯+⨯+⨯=所以,样本的方差为:222210[(4571)0.010(5571)0.015(6571)0.015s =⨯-⨯+-⨯+-⨯222(7571)0.030(8571)0.025(9571)0.005]+-⨯+-⨯+-⨯67.638.4 5.4 4.84928.8194=+++++=.。

9.2.1总体取值规律的估计-【新教材】人教A版高中数学必修第二册课件

9.2.1总体取值规律的估计-【新教材】人教A版高中数学必修第二册课件
突出。某市政府为了勤俭生活用水,计划在本市试行居民生活用 水定额管理,即确定一个居民月用水量标准a,用水量不超过a的 部分按平价收费,超出a的部分按议价收费。如果希望大部分居
民的日常生活不受影响,那么标准a定为多少比较合理呢?
你认为,为了较为合理的确定出这个标准,需要做那些 工作?
9.0 13.6 2.2 8.6 2.1 5.7 2.3 10.0 3.6 7.1 22.2 10.0 5.1 24.5 5.5 6.0 5.3 7.8 7.1 28.0
C.110
D.不确定
[答案] A
[解析] 该组的频率是1500=15.
课本P197-1从某小区抽取100户居民用户进行月用电量 调查,发现他们的用电量都在50~350KW·h之间,进行 适当分组后(每组为左闭右开的区间),画出频率散布直方 图如图所示,
(1).直方图中x的值为 70 ;
(2).在被调查的用户中,用电量落在区间[100,250)内的户
将一批数据按要求分为若干组,各组内的数据的个数,叫做 该组数据的频数,各个小组数据在样本容量中所占的比例的大 小,叫做该组数据的频率。
为了解数据散布的规律,可利用频率散布表和频率散布图 来分析,具体做法如下:
1、求极差(即一组数据中最大值和最小值的差)
例如, 28-1.3=26.7, 这说明这些数据的变化范围大小是26.7t。
4、列频率散布表:
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[[170..22,,1103.第.22)) 几组频率193
第几组频数0.13 样本容量 0.09
[13.2,16.2)
9

高中数学新教材第二册第九章《9.2 用样本估计总体》全部课件

高中数学新教材第二册第九章《9.2 用样本估计总体》全部课件

【思考】 选择恰当的统计图表分析样本数据有何好处? 提示:选择恰当的统计图对数据进行可视化描述,能 通过图形直观地发现样本数据的分布情况,进而估计 总体的分布规律。
4.总体百分位数的估计 一组数据的第p百分位数是这样一个值,它使得这 组数据中至少有 p% 的数据小于或等于这个值,且 至少有(100-p)% 的数据大于或等于这个值。 可以通过下面的步骤计算一组n个数据的第p百分位 数:
【类题·通】 绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值, 当数据很多时,可选一个数当参照。 (2)将一批数据分组,目的是要描述数据分布规律, 要根据数据多少来确定分组数目,一般来说,数据越多 ,分组越多。 (3)将数据分组,决定分点时,一般使分点比数据多 一位小数,并且把第一组的起点稍微减小一点。
类型二 频率分布直方图的应用 【典例】某校从高一年级学生中随机抽取部分学 生,将他们的模块测试成绩(总分为100分)分成 6组加以统计,6组的分数分别是[40,50),[50, 60),[60,70),[70,80),[80,90),[90, 100],得到如图所示的频率分布直方图。已知高 一年级学生中不及格(低于60分)的人数
(1)第二小组的频率是多少?样本量是多少? (2)若次数在110以上(含110次)为达标,则该校全 体高一年级学生的达标率是多少?
【解析】(1)频率分布直方图是以面积的形式反映数
据落在各小组内的频率大小的,
4
因此第二小组的频率为 2 4 17 15 9 3=0.08。
又因为第二小组的频率=
第二小组的频数 样本量

所以样本量= 第二小组的频数= 12 =150。
第二小组的频率 0.08
(2)由频率分布直方图可估计,该校高一年级学生的

高中数学人教版必修第二册:9.2用样本估计总体(第一课时)课件

高中数学人教版必修第二册:9.2用样本估计总体(第一课时)课件

16.0
2.4
9.5
3.7
17.0
3.8
4.1
2.3
5.3
7.8
8.1
4.3
13.3
6.8
1.3
7.0
4.9
1.8
7.1
28.0
10.2
13.8
17.9
10.1
5.5
4.6
3.2
21.3
①频率=
频数
容量
求极差
定组数组距


列散布表
画直方图
②小矩形的面积为该小组的频率

෍ =
=
新课讲授
3.2
21.3
新课讲授
数据的整理:
特征数字法: 平均数、众数、中位数 总体百分位数
例2.为勤俭用水,市政府拟出台用户月均用水量标准,实行阶梯水费,但希望使80%的居民用户生活用水费用
支出不受影响,根据抽样所得数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
分析:由题意,设月均用水量为,则全市用水量中不超过的用户占80%,大于的占20%.
9.0
13.6
14.9
5.9
4.0
7.1
6.4
5.4
19.4
2.0
2.2
8.6
13.8
5.4
10.2
4.9
6.8
14.0
2.0
10.5
2.1
5.7
5.1
16.8
6.0
11.1
1.3
11.2
7.7
4.9
2.3
10.0
16.7
12.0
12.4
7.8

新必修二 9.2用样本估计总体(课件+练习)(含百分位数)

新必修二  9.2用样本估计总体(课件+练习)(含百分位数)

9.2用样本估计总体【要点梳理】要点一、总体取值规律的估计(频率分布直方图)频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.1.步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数: 组距与组数的确定没有具体的标准,一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分为5~12组.(3)将数据分组(4)列频率分布表(5)画频率分布直方图: 其中横轴表示数据,纵轴表示频率与组距的比.2.意义:频率分布直方图中,每个小矩形的面积表示相应组的频率,所有小矩形的面积的总和等于1.3.频率分布的估计:频率分布是指各个小组数据在容量中所占比例的大小,可以用样本的频率分布估计总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.要点诠释:频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有具体数据信息就被抹掉了.3.当频率分布直方图的组数少,组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息,当频率分布直方图的组数多,组距小时,保留了较多的原始数据信息,但由于场小长方形的较多,有时图形会变的非常不规则,不容易从中看出数据分布的特点4.补充:除频率分布直方图外,我们在初中还学习过条形图、扇形图、折线图、频数分布直方图等,不同的统计图在表示数据上有不同的特点,例如扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,折线图主要用于描述数据随时间的变化趋势。

不同的统计图适用的数据类型也不同,例如条形图适用于描述离散型数据,直方图适用描述连续型数据等。

2024春高中数学第9章统计9.2用样本估计总体9.2.2总体百分位数的估计课件新人教A版必修第二册

2024春高中数学第9章统计9.2用样本估计总体9.2.2总体百分位数的估计课件新人教A版必修第二册
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因 为 共 有 12 个 数 据 , 所 以 12×25% = 3 , 12×75% = 9 , 12×95% =
8.0+8.3
8.6+8.9
11.4,则第25百分位数是
=8.15,第75百分位数是

2
2
前七组的频率之和为0.60+0.12=0.72,
前八组的频率之和为0.72+0.09=0.81,
前九组的频率之和为0.81+0.11=0.92.
由前六组的频率之和为0.60,得样本数据的第60百分位数为110,样
本 数 据 的 第 80 百 分 位 数 一 定 在 第 八 组 [115 , 120) 内 , 由 115 +
在[110,120)上为60×0.020×10=12,
在[120,130]上为60×0.010×10=6.
从以上 数 据 可 知 第 50百 分 位 数 一 定 落 在 区 间 [100 , 110)上 , 由 100+
0.5−0.4
10×
≈103.3;
0.7−0.4
0.75−0.7
第75百分位数一定落在区间[110,120)上,由110+10×
8.75,第95百分位数是第12个数据为9.9.
(2)请你找出珍珠质量较小的前15%的珍珠质量.
[解]
因为共有12个数据,所以12×15%=1.8,则第15百分位数是第
2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8 g,
7.9 g.
反思领悟 百分位数是用于衡量数据位置的度量,它提供了有关数
0.80−0.72
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

9.2 用样本估计总体(精讲)考法一总体取值规律的估计【例1】(2021·全国高一课时练习)某市2020年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空间质量为良;在101~150之间时,空间质量为轻微污染;在151~200之间时,空间质量为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.【答案】(1)频率分布表见解析;(2)频率分布直方图见解析;(3)该市空气质量有待进一步改善.【解析】(1)频率分布表(2)频率分布直方图(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的1 15;有26天处于良的水平,占当月天数的13 15;处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.【一隅三反】1.(2020·全国高一单元测试)某市为提倡节约用水,准备实行自来水“阶梯计费”方式,用户用水不超出基本用水量的部分享受基本价格,超出基本用水量的部分实行超价收费,为更好地决策,自来水公司随机抽取了部分用户的用水量数据,并绘制了如图不完整的统计图(每组数据包括右端点但不包括左端点),请你根据统计图解答下列问题:用户用水量频数直方图用户用水量扇形统计图(1)此次抽样调查的样本容量是________;(2)补全频数分布直方图,求扇形图中“15吨~20吨”部分的圆心角的度数;(3)如果自来水公司将基本用水量定为每户25吨,那么该地区6万用户中约有多少用户的用水全部享受基本价格.【答案】(1)答案见解析;(2)答案见解析,79.2°;(3)4.08万户.【解析】(1)1010%100÷=;(2)用水15~20吨的户数为100-10-36-24-8=22(户),“15~20吨”部分的圆心角的度数为22 36079.2100︒⨯=︒(3)1022366 4.08100++⨯=(万户)所以该地区6万用户中约有4.08万户的用水全部享受基本价格.2.(2020·全国高一单元测试)对某校高一年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M,p及图中a的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)内的人数. 【答案】(1)M =40,0.075p =,0.125a =;(2)90人. 【解析】(1)由[10,15)内的频数是10,频率是0.25知,100.25M=,所以M =40. 因为频数之和为40,所以10+25+m +2=40,m =3.330.07540p M ===. 因为a 是对应分组[15,20)的频率与组距的商,所以250.125405a ==⨯. (2)因为该校高一学生有360人,分组[10,15)内的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为3600.25⨯=90人.3.(2021·北京丰台区)为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50kW ·h 至350kW ·h 之间,进行适当分组后,画出频率分布直方图如图所示.(I )求a 的值;(Ⅱ)求被调查用户中,用电量大于250kW ·h 的户数;(III )为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW ·h )的建议,并简要说明理由. 【答案】(I )0.006;(Ⅱ)18;(III )245.5 kW ·h.【解析】(1)因为()0.00240.00360.00440.00240.0012501a +++++⨯=,所以0.006a =; (2)根据频率分布直方图可知:“用电量大于250kW ·h ”的频率为()0.00240.0012500.18+⨯=, 所以用电量大于250kW ·h 的户数为:1000.1818⨯=, 故用电量大于250kW ·h 有18户;(3)因为前三组的频率和为:()0.00240.00360.006500.60.8++⨯=<,前四组的频率之和为()0.00240.00360.0060.0044500.820.8+++⨯=>, 所以频率为0.8时对应的数据在第四组, 所以第一档用电标准为:0.80.620050245.50.22-+⨯≈kW ·h.故第一档用电标准为245.5 kW ·h.4.(2021·陕西咸阳市)某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.【答案】(Ⅰ)0.02;(Ⅱ)10800元. 【解析】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为: ()0.040.025309+⨯⨯=(天), 一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.考法二 总体百分数的估计【例2】(2020·天津和平区)已知一组数据为4,5,67,8,8,,第40百分位数是( ) A .8 B .7C .6D .5【答案】C【解析】因为有6位数,所以640 2.4⨯=%,所以第40百分位数是第三个数6.故选:C 【一隅三反】1.(2020·山东菏泽市·高一期末)数据1,2,3,4,5,6的60%分位数为( ) A .3 B .3.5C .3.6D .4【答案】D【解析】由6⨯60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数,故选:D2.(2021·山东高一期末)已知从某中学高一年级随机抽取20名女生,测量她们的身高(单位:cm ),把这20名同学的身高数据从小到大排序:148.0 149.0 150.0 152.0 154.0 154.0 155.0 155.5 157.0 157.0 158.0 159.0 161.0 162.0 163.0 164.0 165.0 170.0 171.0 172.0 则这组数据的第75百分位数是( ) A .163.0 B .164.0C .163.5D .164.5【答案】A【解析】因为这组数据从小到大已排序,所以这组数据的第75百分位数为第200.7515⨯=个数,即为163.0故选:A3.(2020·山东滨州市·高一期末)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[]0,10内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居号,他们的幸福感指数分别为5,6,7,8,9,5,则这组数据的第80百分位数是( ) A .7 B .7.5C .8D .9【答案】C【解析】该组数据从小到大排列为:5,5,6,7,8,9,且680% 4.8⨯=,故选:C.考法三 总体集中趋势的估计【例3】(2021·湖北荆州市)因受新冠疫情的影响,某企业的产品销售面临困难.为了改变现状,该企业欲借助电商和“网红”直播带货扩大销售.受网红效应的影响,产品销售取得了较好的效果.现将该企业一段时间内网上销售的日销售额统计整理后绘制成如下图所示的频率分布直方图:请根据图中所给数据,求: (1)实数a 的值;(2)该企业网上销售日销售额的众数和中位数; (3)该企业在统计时间段内网上销售日销售额的平均数. 【答案】(1)0.012;(2)55万元,57万元;(3)57.4万元. 【解析】(1)由频率分布直方图知:(0.0080.0160.0200.0180.0100.0042)101a ++++++⨯=,解得:0.012a =;(2)用频率分布直方图中最高矩形所在区间的中点值作为众数的近似值,得众数为55万元;因为第一个小矩形的面积为0.08,第二个小矩形的面积为0.12, 第三个小矩形的面积为0.16,0.080.120.160.36++=,设第四个小矩形中底边的一部分长为x ,则0.0200.50.36x ⨯=-,解得7x =, 所以中位数为50757+=万元; (3)依题意,日销售额的平均值为:250.08350.12450.16550.20650.18750.12850.10950.0457.4⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=所以该企业在统计时间段内网上销售日销售额的平均数为57.4万元. 【一隅三反】1.(2020·定边县第四中学高一期末)如图,从参加数学竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图,观察图形,回答下列问题:(Ⅰ)79.5-89.5这一组的频数、频率分别是多少? (Ⅱ)估计这次数学竞赛的平均成绩是多少?(Ⅲ)估计这次数学竞赛的及格率(60分及以上为及格). 【答案】(Ⅰ)15;0.25;(Ⅱ)70.5;(Ⅲ)75%. 【解析】(Ⅰ)79.589.5这一组的频率为0.025100.25⨯=,79.589.5这一组的频数为600.2515⨯=;(Ⅱ)估计这次数学竞赛的平均成绩是:44.50.154.50.1564.50.1574.50.384.50.2594.50.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.故估计这次数学竞赛的平均成绩是70.5.(Ⅲ)估计这次环保知识竞赛的及格率(60分及以上为及格)()10.010.0151075%P =-+⨯=. 2.(2021·河北唐山市·开滦第一中学高一期末)某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[)[)[]40,50,50,60,,90,100⋯后画出如下频率分布直方图.观察图形的信息,回答下列问题:(1)估计这次考试的众数m 与中位数n (结果保留一位小数); (2)估计这次考试的优秀率(80分及以上为及格)和平均分. 【答案】(1)75m =,73.3n =;(2)优秀率30%,平均分71分. 【解析】(1)众数是最高小矩形中点的横坐标,所以众数为75m =(分)前三个小矩形面积为0.01100.015100.015100.4⨯+⨯+⨯=, ∵中位数要平分直方图的面积, ∴0.50.47073.30.03n -=+=.(2)依题意,80及以上的分数所在的第五、六组, 频率和为 ()0.0250.005100.3+⨯=, 所以,抽样学生成绩的合格率是30%, 利用组中值估算抽样学生的平均分:450.1550.15650.15750.3850.25950.0571⨯+⨯+⨯+⨯+⨯+⨯=,估计这次考试的平均分是71分.3.(2021·吉林市)某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x 的值;并估计出月平均用水量的众数. (2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?【答案】(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【解析】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为(0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5,解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯=(3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++, ∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况,其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 考点四 总体离散程度的估计【例4】(2021·山东威海市·高一期末)如图所示的四组数据,标准差最小的是( )A .B .C .D .【答案】A【解析】对A ,()12106206302402516x =⨯+⨯+⨯+⨯=,s == 对B ,()16102202306402516x =⨯+⨯+⨯+⨯=,s == 对C ,()13105205303402516x =⨯+⨯+⨯+⨯=,10s ==, 对D ,()15103203305402516x =⨯+⨯+⨯+⨯=,s == 所以标准差最小的是A.故选:A.【一隅三反】1.(2020·全国高一)已知数据12,,,n x x x 的平均数为x ,方差为2s ,则123x +,223x +,…,23n x +的平均数和方差分别为( )A .x 和2sB .23x +和24sC .23x +和2sD .23x +和24129s s ++ 【答案】B【解析】因为数据12,,,n x x x 的平均数为x ,方差为2s ,所以123x +,223x +,…,23n x +的平均数和方差分别为23x +和24s故选:B2.(2020·安徽蚌埠市·蚌埠二中高一月考)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是( )A .17.2,3.6B .54.8,3.6C .17.2,0.4D .54.8,0.4 【答案】C【解析】设一组数据为i x (1,2,3,,)i n =,平均数为x ,方差为21s ,所得一组新数据为i y (1,2,3,,)i n =,平均数为y ,方差为22s ,则350i i y x =-(1,2,3,,)i n =,12 1.6n y y y y n +++==, 所以123503503501.6n x x x n -+-++-=, 所以350 1.6x -=,所以51.617.23x ==, 由题意得22222121()()() 3.6n s y y y y y y n ⎡⎤=-+-++-=⎣⎦, 所以222121(350 1.6)(350 1.6)(350 1.6) 3.6n x x x n⎡⎤--+--++--=⎣⎦, 所以2221219(17.2)(17.2)(17.2) 3.6n x x x n ⎡⎤⨯-+-++-=⎣⎦ 所以2221219()()() 3.6n x x x x x x n⎡⎤⨯-+-++-=⎣⎦, 所以219 3.6s =,所以210.4s =.故选:C.3.(2020·唐山市第十一中学)已知样本数据由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则a ,b 的值分别为( ).A .10,11B .10.5,9.5C .10.4,10.6D .10.5,10.5 【答案】D【解析】由于样本共有10个值,且中间两个数为a ,b ,依题意,得10.52a b +=,即21b a =-. 因为平均数为23371213.718.320101()0a b +++++++++÷=,所以要使该样本的方差最小,只需()()221010a b -+-最小.又()()()()222221010102110242221a b a a a a -+-=-+--=-+, 所以当4210.522a -=-=⨯时,()()221010a b -+-最小,此时10.5b =. 故选:D4.(2021·合肥市第六中学=)为了测试小班教学的实践效果,刘老师对A 、B 两班的学生进行了阶段测试,并将所得成绩统计如图所示;记本次测试中,A 、B 两班学生的平均成绩分别为A x ,B x ,A 、B 两班学生成绩的方差分别为2A s ,2B s ,则观察茎叶图可知( )A .AB x x <,22A B s s < B .A B x x >,22A B s s <C .A B x x <,22A B s s >D .A B x x >,22A B s s >【答案】B【解析】根据茎叶图中数据的分布可得,A 班学生的分数多集中在[]70,80之间, B 班学生的分数集中在[]50,70 之间,所以A B x x >.相对两个班级的成绩分布来说,A 班学生的分数更加集中,B 班学生的分数更加离散,所以22A B s s <.故选:B。

相关文档
最新文档