【高考数学精准解析】多维层次练:第九章+第2节+用样本估计总体
2020版数学习题:第九篇 统计与统计案例(必修3、选修1-2) 第2节 用样本估计总体
第2节用样本估计总体【选题明细表】基础巩固(时间:30分钟)1.(2018·贵阳一模)贵阳地铁1号线12月28日开通运营,某机车某时刻从下麦西站驶往贵阳北站的过程中,10个车站上车的人数统计如下:70,60,60,50,60,40,40,30,30,10,则这组数据的众数、中位数、平均数的和为( D )(A)170 (B)165 (C)160 (D)150解析:数据70,60,60,50,60,40,40,30,30,10的众数是60,中位数是45,平均数是45,故众数、中位数、平均数的和为150,故选D.2.如图是某市今年10月份某天6时至20时温度变化折线图,下列说法错误的是( D )(A)这天温度极差为8 ℃(B)这天温度的中位数在9 ℃附近(C)这天温度无明显变化的是早上6时至早上8时(D)这天温度变化率绝对值最大的是上午11时至中午13时解析:由折线图可得,最高气温为14 ℃,最低气温为6 ℃,所以这天温度极差为8 ℃,故排除A;从6时至20时温度从低到高依次排列,可得这天温度的中位数为9 ℃附近,故排除B;由折线图可得,从6时至8时,温度没有明显变化,故排除C;由折线图可得,从13时至15时,温度变化率绝对值最大,故D是错误的.故选D.3.(2018·开封三模)学校根据某班的期中考试成绩绘制了频率分布直方图(如图所示),根据图中所给的数据可知a+b等于( C )(A)0.024 (B)0.036 (C)0.06 (D)0.6解析:根据频率分布直方图得,(0.01+a+b+0.018+0.012)×10=1,解得a+b=0.06.故选C.4.(2018·江西二模)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则( A )(A)=4,s2<2 (B)=4,s2>2(C)>4,s2<2 (D)>4,s2>2解析:某7个数的平均数为4,方差为2,加入一个新数据4后,这8个数的平均数为=×(7×4+4)=4,方差为s2=×[7×2+(4-4)2]=<2.故选A.5.(2018·南安一中模拟)某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为( C )(A)6万元(B)8万元(C)10万元(D)12万元解析:设11时到12时的销售额为x万元,依题意有=,所以x=10,故选C.6.(2018·龙岩模拟)党的十八大以来,脱贫攻坚取得显著成绩,2013年至2016年4年间,累计脱贫5 564万人,2017年各地根据实际进行创新,精准、高效地完成了脱贫任务.某地区对当地3 000户家庭的2017年所得年收入情况调查统计,年收入的频率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),[60,80),[80,100],则年收入不超过6万的家庭大约为( A )(A)900户(B)600户(C)300户(D)150户解析:由频率分布直方图得:年收入不超过6万的家庭所占频率为(0.005+0.010)×20=0.3,所以年收入不超过6万的家庭大约为0.3×3 000=900.故选A.7.如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70~99分),若甲、乙两组学生的平均成绩一样,则a= ;甲、乙两组学生的成绩相对整齐的是.解析:由题意可知==89,解得a=5.因为=×(142+1+0+92+62)=,=×(132+42+0+92+82)=,所以<,故成绩相对整齐的是甲组.答案:5 甲组能力提升(时间:15分钟)8.(2018·沙市区校级一模)已知四个正数x1,x2,x3,x4的标准差s=0.2,则数据2x1-1,2x2-1,2x3-1,2x4-1的方差为( D )(A)0.2 (B)0.4 (C)0.8 (D)0.16解析:根据题意,设四个正数x 1,x2,x3,x4的平均数为,则有=(x 1+x2+x3+x4),又由其标准差s=0.2,则有其方差)2+(x2-)2+(x3-)2+(x4-)2]=0.04,s2=[(x对于数据2x1-1,2x2-1,2x3-1,2x4-1,其平均数为,则有=(2x 1-1+2x2-1+2x3-1+2x4-1)=2-1,则其方差s′2=[(2x 1-1-2+1)2+(2x2-1-2+1)2+(2x3-1-2+1)2+(2x 4-1-2+1)2]=4s2=0.16,故选D.9.(2018·济宁二模)2017年底,某单位对100名职工进行绩校考核,依考核分数进行评估,考核评估后,得其频率分布直方图如图所示,估计这100名职工评估得分的中位数是.解析:由频率分布直方图得:评估得分在[60,70)的频率为0.015×10=0.15,评估得分在[70,80)的频率为0.040×10=0.4,所以估计这100名职工评估得分的中位数是70+×10=78.75.答案:78.7510.(2018·北京模拟)在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未污损,即9,10,11,1,那么这组数据的方差s2可能的最大值是.解析:设这组数据的最后2个分别是10+x,y,则9+10+11+(10+x)+y=50,得x+y=10,故y=10-x,故s2=[1+0+1+x2+(-x)2]=+x2,显然x最大取9时,s2最大是.答案:11.如图茎叶图是甲、乙两人在5次综合测评中的成绩(为整数),其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是.解析:由图可知,甲的平均分为90.设被污损的数为x,乙的成绩分别是83,83,87,90+x,99,其中被污损的成绩为0到9中的某一个.由甲的平均成绩超过乙的平均成绩,得<90.所以x<8.又x 是0到9的十个整数中的其中一个,所以x<8的概率为=.答案:12.(2018·全国Ⅰ卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解:(1)如图所示.(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为=×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为=×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0 .35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3). 13.(2018·新乡一模)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机各选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均值;(2)轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎,试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好?解:(1)甲厂这批轮胎宽度的平均值为:=(195+194+196+193+194+197+196+195+193+197)=195(cm),乙厂这批轮胎宽度的平均值为:=(195+196+193+192+195+194+195+192+195+193)=194(cm).(2)甲厂这批轮胎宽度在[194,196]内的数据为195,194,196,194,196,195,平均数为=(195+194+196+194+196+195)=195,方差为=[(195-195)2+(194-195)2+(196-195)2+(194-195)2+(196-195)2+ (195-195)2]=,乙厂这批轮胎宽度在[194,196]内的数据为195,196,195,194,195,195.平均数为=(195+196+195+194+195+195)=195,方差为=[(195-195)2+(196-195)2+(195-195)2+(194-195)2+(195-195)2+(195-195)2]=.因为两厂标准轮胎宽度的平均数相等,但乙厂的方差更小.所以乙厂的轮胎相对更好.。
高中数学第九章统计之用样本估计总体(精练)(必修第二册)(教师版含解析)
9.2 用样本估计总体(精练)【题组一 总体取值规律的估计】1.(2020·江苏苏州市·星海实验中学高一期中)为了解学生课外阅读的情况,随机统计了n 名学生的课外阅读时间,所得数据都在[50,150]中,其频率分布直方图如图所示.已知在[50,75)中的频数为100,则n 的值是( )A .500 B .1000 C .10000 D .25000【答案】B【解析】由图可得在[50,75)中的频率为0.004250.1⨯=,所以10010000.1n ==,故选:B. 2.(2021·北京昌平区·高一期末)某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[90,100],样品数据分组为[90,92),[92,94),[94,96),[96,98),[98,100].已知样本中产品净重小于94克的个数为36,则样本中净重大于或等于92克并且小于98克的产品的个数是( )A .45B .60C .75D .90【答案】D【解析】[90,92),[92,94),[94,96),[96,98)对应的频率分别为:0.1,0.2,0.3,0.25设样本容量为n因为净重小于94克的个数为36,所以()0.10.236n+=,解得120n=则样本中净重大于或等于92克并且小于98克的产品的个数为()0.20.30.2512090++⨯=故选:D3.(2021·北京市第四中学顺义分校高一期末)为了解学生在“弘扬传统文化,品读经典文学”月的阅读情况,现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(阅读时间[]0,50t∈),分组整理数据得到如图所示的频率分布直方图.则图中a的值为( )A.0.028 B.0.030 C.0.280 D.0.300【答案】A【解析】由(0.0060.0400.0200.006)101a++++⨯=得0.028a=.故选:A4.(2020·广东云浮市·高一期末)在容量为50的样本中,某组的频率为0.18,则该组样本的频数为( ).A.9 B.10 C.18 D.20【答案】A【解析】由题意,频数=样本容量×频率500.189=⨯=.故选:A5.(2021·湖南长沙市)“水是生命之源”,但是据科学界统计可用淡水资源仅占地球储水总量的2.8%,全世界近80%人口受到水荒的威胁.某市为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨):一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照00.50.51,...,[[[44.5,),,),)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有60万居民,估计全市居民中月均用水量不低于2.5吨的人数,并说明理由; (3)若该市政府希望使82%的居民每月的用水不按议价收费,估计x 的值,并说明理由. 【答案】(1)0.3;(2)16.2万;(3)2.8吨.【解析】(1)由概率统计相关知识,可知各组频率之和的值为1 即频率分布直方图各小矩形面积之和为1()0.50.080.160.40.520.120.080.0421a ∴⨯+++++++=解得:0.3a =(2)由图可知,不低于2.5吨人数所占百分比为()0.50.30.120.080.0427%⨯+++= ∴全市月均用水量不低于2.5吨的人数为:600.2716.2⨯=(万)(3)由(2)可知,月均用水量小于2.5吨的居民人数所占百分比为:73% 即73%的居民月均用水量小于2.5吨,同理,88%的居民月均用水量小于3吨 故2.53x <<假设月均用水量平均分布,则()82%73%2.5 2.80.3x -=+=(吨)6.(2020·天津河西区·)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30、42、41、36、44、40、37、37、25、45、29、43、31、36、49、34、33、43、38、42、32、34、46、39、36,根据上述数据得到样本的频率分布表如下:分组频数频率[]25,3030.12(]30,3550.20(]35,4080.32(]40,451n1f(]45,502n2f(1)确定样本频率分布表中1n、2n、1f和2f的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(]30,35的概率. 【答案】(1)17n=,22n=,10.28f=,20.08f=;(2)详见解析;(3)0.5904.【解析】(1)由题意知17n=,22n=,170.2825f∴==,220.0825f==;(2)样本频率分布直方图为:(3)根据样本频率分布直方图,每人的日加工零件数落在区间(]30,35的概率0.2, 设所取的4人中,日加工零件数落在区间(]30,35的人数为ξ,则()~4,0.2B ξ,,所以4人中,至少有1人的日加工零件数落在区间(]30,50的概率约为0.5904. 【题组二 总体百分数的估计】1.(2020·全国高一课时练习)一组数据12,34,15,24,39,25,31,48,32,36,36,37,42,50的第25,75百分位数分别是______、________. 【答案】25 39【解析】把数据从小到大排序为12,15,24,25,31,32,34,36,36,37,39,42,48,50共14个数, 14×25%=3.5, 14×75%=10.5, 所以第25,75百分位数分别是第4,11项数据,即是25,39. 故答案为:25,39.2.(2021·安徽宿州市·高一期末)若一组数据为82,81,79,78,95,88,92,84,则该组数据的75%分位数是___________. 【答案】90【解析】由题可得一共有8个数据,则该组数据的75%分位数在第6位和第7位之间,为()8892902+=.故答案为:90.3.(2020·山东东营市·广饶一中高一期末)数据10,9,8,7,6,5,4,3,2,1的25%分位数、80%分位数分别是_______; 【答案】3;8.5【解析】将数据10,9,8,7,6,5,4,3,2,1从小到大排序得:1,2,3,4,5,6,7,8,9,10, 当%25%p =时,10%1025% 2.5i p ==⨯=,25%∴分位数为3. 当%80%p =时,10%1080%8i p ==⨯=,80%∴分位数为89=8.52+.故答案为:3;8.5. 4.(2020·天津市滨海新区大港太平村中学高一期末)树人中学高一1班23名男生身高的样本数据(单位:cm )按从小到大排序,排序结果如下:164,165,165,166,167,168,168,168,170,170,170,172, 172,172,173,173,173,173,174,175,175,175,176. 由数据估计树人中学高一年级男生身高的第50百分位数为________.【答案】172【解析】由2350%11.5⨯=,将样本数据从小到大排列,第12个数字为172,所以可估计树人中学高一年级男生身高的第50百分位数为172.故答案为:172.5.(2020·山东泰安市·高一期末)某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,174,175,若样本数据的第90百分位数是173,则x的值为________.【答案】172【解析】百分位数的意义就在于,我们可以了解的某一个样本在整个样本集合中所处的位置,本题第90百分位数是173,所以1741732x+=,172x=故答案为:1726.(2020·临高县临高中学高一期末)下列数据是30个不同国家中每10000名患某种疾病的男性的死亡人数:1.5 3.2 5.2 5.6 5.6 7.1 8.7 9.2 10.0 11.213.2 13.7 13.8 14.5 15.2 15.7 16.5 18.8 19.2 23.927 27 28.9 28.9 33.1 33.8 34.8 40.6 41.6 50.1这组数据的第70百分位数是_______________.【答案】27.【解析】按从小到大排列此30个数据,指数3070%21i=⨯=,则第70百分位数是2727272+=,故答案为:27.7.(2020·全国高一课时练习)某同学在7天内每天参加体育锻炼的时间(单位:分钟)如下65,65,66,74,73,81,80,则它们的第三四分位数是________ .【答案】80【解析】从小到大排序为65,65,66,73,74,80,81,第三四分位数即75%分位数,7×75%=5.25,所以第三四分位数是第6项数据80.故答案为:808.(2020·江苏高一期中)已知一组数据1,3,2,,4m,且这组数据的平均数为3,则m的值为__________. 【答案】5【解析】由题意132435m++++=,解得5m=故答案为:5【题组三总体集中趋势的估计】1.(2020·全国高一课时练习)10名工人某天生产同一零件,生产的件数是15、17、14、10、15、17、17、16、14、12.设其平均数为a ,中位数为b ,众数为c ,则有( )A .a b c >>B .c b a >>C .c a b >>D .b c a >>【答案】B【解析】将生产的件数由小到大排列为:10、12、14、14、15、15、16、17、17、17,()11517141015171716141214.710a ∴=+++++++++=,中位数为15b =, 众数为17c =.因此,c b a >>.故选:B.2.(2021·安徽宿州市·高一期末)2020年宿州市某中学参加高中数学建模(应用)能力测试,高一年级有60人,高二年级有40人.高一的平均成绩为70分,高二的平均成绩为80分,则参加测试的100名学生的平均成绩为( ) A .72分 B .73分C .74分D .75分【答案】C【解析】由题意可得,参加测试的100名学生的平均成绩为6070408074100⨯+⨯=.故选:C.3.(2021·北京房山区·高一期末)根据气象学上的标准,连续5天的日平均气温低于10C 即为入冬.现有甲、乙、丙、丁四地连续5天的日平均温度的记录数据(记录数据都是正整数): ①甲地:5个数据的中位数为7,众数为6; ②乙地:5个数据的平均数为8,极差为3; ③丙地:5个数据的平均数为5,中位数为4; ④丁地:5个数据的平均数为6,方差小于3. 则肯定进入冬季的地区是( ) A .甲地 B .乙地C .丙地D .丁地【答案】D【解析】①甲地:5个数据的中位数为7,众数为6;则这5个数据可能为6,6,7,10,11;即连续5天的日平均气温不是都低于10C ,所以甲地不一定入冬,故A 错;②乙地:5个数据的平均数为8,极差为3;则这5个数据可能为7,7,8,8,10;即连续5天的日平均气温不是都低于10C ,所以乙地不一定入冬,故B 错;③丙地:5个数据的平均数为5,中位数为4;则这5个数据可能为1,2,4,7,11;即连续5天的日平均气温不是都低于10C ,所以丙地不一定入冬,故C 错;④丁地:5个数据的平均数为6,方差小于3.如有数据大于等于10,则方差必大于等于()210616355-=>,不满足题意,因此丁地这续5天的日平均气温都低于10C ,所以丁地一定入冬,故D 正确; 故选:D.4.(2020·全国高一)某组数据的茎叶图如图所示,其众数为a ,中位数为b ,平均数为c ,则( )A .a b c >> B .a c b >> C .b a c >> D .c a b >>【答案】A【解析】由图中数据可得23a =,202120.52b +== 89131517202123232632332012c +++++++++++==所以a b c >>故选:A5.(2020·全国高一)已知一组数据的频率分布直方图如图所示,则众数、中位数、平均数分别为( )A .63,64,66B .65,65,67C .55,64,66D .64,65,64【答案】B【解析】由频率分布直方图可知,众数为6070652+=; 由100.0350.040.5⨯+⨯=,所以面积相等的分界线为65,即中位数为65; 平均数为550.3650.4750.15850.1950.0567⨯+⨯+⨯+⨯+⨯=.故选:B .6.(2020·广东汕头市·金山中学高一月考)甲、乙两名学生的六次数学测验成绩(百分制)的茎叶图如图所示.①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学的平均分高;③甲同学的平均分比乙同学的平均分低;④甲同学成绩的方差小于乙同学成绩的方差.上面说法正确的是( )A.③④B.①②④C.②④D.①③④【答案】A【解析】由茎叶图知甲同学的成绩为72,76,80,82,86,90;乙同学的成绩为69,78,87,88,92,96.故甲同学成绩的中位数小于乙同学成绩的中位数,①错;计算得甲同学的平均分为81,乙同学的平均分为85,故甲同学的平均分比乙同学的平均分低,因此②错、③对;计算得甲同学成绩的方差小于乙同学成绩的方差,故④对.7.(2020·山东枣庄市·滕州市第一中学新校高一月考)从某食品厂生产的面包中抽取100个,测量这些面包的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数82237285(1)在相应位置上作出这些数据的频率分布直方图;(2)估计这种面包质量指标值的平均数x(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包90%的规定?”【答案】(1)见解析;(2)100;(3)见解析.【解析】(1)画图.(2)质量指标值的样本平均数为800.08900.22x=⨯+⨯1000.371100.28+⨯+⨯1200.05100+⨯=.所以这种面包质量指标值的平均数的估计值为100.(3)质量指标值不低于85的面包所占比例的估计值为0.220.370.280.050.92+++=,由于该估计值大于0.9,故可以认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包90%的规定.”8.(2020·安徽蚌埠市·蚌埠二中高一月考)某学校对男、女学生进行有关“习惯与礼貌”的评分,记录如下:男:54,70,57,46,90,58,63,46,85,73,55,66,38,44,56,75,35,58,94,58;女:77,55,69,58,76,70,77,90,51,53,63,64,69,83,83,65,100,75.(1)分别计算男、女学生得分的平均数;(2)分别计算男、女学生得分的四分位数.【答案】(1)男生平均数为61.05,女生平均数为71;(2)男生得分的四分位数: 50, 58, 71.5;女生得分的四分位数: 63, 69.5, 77.【解析】(1)男学生的平均数为1547057469058634685735566384456753558945820x+++++=++++++++++++++ 61.05=,女学生得分的平均数2775569587670779051536364698383651007518x=+++++++++++++++++71=.(2)男、女学生得分从小到大排列为男:35,38,44,46,46,54,55,56,57,58,58,58 ,63,66,70,73,75,85, 90,94;女:51,53,55,58,63,64,65,69,69,70,75,76,77,77,83,83, 90, 100;男、女学生得分的四分位数如下表25%分位数50%分位数75%分位数男生50 58 71.5女生63 69.5 779.(2021·安徽宿州市·高一期末)某地教育部门对某学校学生的阅读素养进行检测,在该校随机抽取了M 名学生进行检测,实行百分制,现将所得的成绩按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100)分成6组,并根据所得数据作出了如下所示的频数与频率的统计表和频率分布直方图.分组 频数 频率 [40,50)[50,60)25p[60,70) s0.30[70,80)mn[80,90) 100.10[90,100]合计M1(1)求出表中,M p 及图中a 的值;(2)估计该校学生阅读素养的成绩中位数以及平均数.【答案】(1)100,0.25,0.02M p a ===;(2)中位数是2003,平均数是68.5. 【解析】(1)由频率统计表可知:101000.1M ==,250.25100p ∴== 由频率分布直方图可知:(0.0050.0250.030.010.01)101a +++++⨯=,解得0.02a = (2)∵前两组的频率和为0.050.250.30.5+=<,前三组的频率和为0.050.250.30.60.5++=> ∴中位数在[60,70)内,设中位数为x ,则0.050.25(60)0.030.5x ++-⨯=,解得2003x =,即中位数为2003.平均数为450.05550.25650.3750.2850.1950.168.5⨯+⨯+⨯+⨯+⨯+⨯= ∴估计该校学生阅读素养的成绩中位数是2003,平均数是68.5. 10.(2020·全国高一单元测试)某班的全体学生共有50人,参加数学测试(百分制)成绩的频率分布直方图如图,数据的分组依次为:[)20,40,[)40,60,[)60,80,[]80,100. 依此表可以估计这一次测试成绩的中位数为70分.(1)求表中a ,b 的值;(2)请估计该班本次数学测试的平均分. 【答案】(1)0.02a =,0.015b =;(2)68分. 【解析】(1)由中位数为70可得,0.005200.0120100.5a ⨯+⨯+=,解得0.02a =.又()200.0050.010.021b ⨯+++=, 解得0.015b =.(2)由频率分布直方图可知,每组的频率依次为:0.1,0.2,0.4,0.3,则该班本次数学测试的平均分的估计值为:300.1500.2700.4900.368⨯+⨯+⨯+⨯=分.10.(2020·调兵山市第一高级中学高一月考)某城市交通部门为了对该城市共享单车加强监管,随机选取了100人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这100人根据其满意度评分值(百分制)按照[)[)[]50,60,60,70,,90,100⋅⋅⋅分成5组,制成如图所示频率分直方图.(1)求图中x 的值;(2)求这组数据的平均数和中位数;(3)已知满意度评分值在[)50,60内的男生数与女生数的比为3:2,若在满意度评分值为[)50,60的人中随机抽取2人进行座谈,求2人均为男生的概率. 【答案】(1)0.02x =;(2)平均数为77,中位数设为5407;(3)310.【解析】(1)由()0.0050.010.0350.030101x ++++⨯=,解得0.02x =.(2)这组数据的平均数为550.05650.2750.35850.3950.177⨯+⨯+⨯+⨯+⨯=. 中位数设为m ,则()0.050.2700.0350.5m ++-⨯=,解得5407m =. (3)满意度评分值在[)50,60内有1000.005105⨯⨯=人,其中男生3人,女生2人.记为12312,,,,A A A B B , 记“满意度评分值为[)50,60的人中随机抽取2人进行座谈,恰有1名女生”为事件A ,从5人中抽取2人有:12A A ,13A A ,11A B ,12A B ,23A A ,21A B ,22A B ,31A B ,32A B ,12B B 所以总基本事件个数为10个,A 包含的基本事件个数为3个, 所以 ()310P A =. 【题组四 总体离散程度的估计】1.(2020·甘肃白银市·高一期末)已知数据123,,x x x 的中位数为k ,众数为m ,平均数为n ,方差为p ,则下列说法中,错误的是( ) A .数据1232,2,2x x x 的中位数为2kB .数据1232,2,2x x x 的众数为2mC .数据1232,2,2x x x 的平均数为2nD .数据1232,2,2x x x 的方差为2p 【答案】D【解析】若数据123,,x x x 的中位数为k ,众数为m ,平均数为n ,则由性质知数据1232,2,2x x x 的中位数,众数,平均数均变为原来的2倍,故,,A B C 正确;则由方差的性质知数据1232,2,2x x x 的方差为4p ,故D 错误; 故选D .2.(2020·四川省绵阳南山中学高一开学考试)数据1x ,2x ,3x …,n x 分别是某学校教职工()*3,n n n N≥∈个人的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为z ,如果再加上世界首富的年收入数据1n x +,则对这()1n +个数据,下列说法正确的是( ) A .年收入平均数增大,中位数可能不变,方差变大 B .年收入平均数增大,中位数一定变大,方差变大C .年收入平均数增大,中位数可能不变,方差可能不变D .年收入平均数可能不变,中位数可能不变,方差可能不变 【答案】A【解析】因为数据1x ,2x ,3x …,n x 分别是某学校教职工个人的年收入,所以世界首富的收入1n x +会远远大于1x ,2x ,3x …,n x ,故这1n +个数据的平均数会大大增加; 而中位数为数据中间的数或中间两个数的平均数,所以中位数有可能不变;因为世界首富的收入远远大于1x ,2x ,3x …,n x ,所以数据的集中程度受1n x +的影响很大,数据离散程度加大,所以方差变大. 故选:A3(2020·定边县第四中学高一期末)x 是1x ,2x ,…,100x 的平均值,1a 为1x ,2x ,…40x 的平均值,2a 为41x ,42x ,…100x 的平均值,则下列各式正确的是( )A.12235a ax+=B.12325a ax+=C.12x a a=+D.122a ax+=【答案】A【解析】因为1a为1x,2x,...40x的平均值,2a为41x,42x, (100)x的平均值,所以1240140x x x a++⋯+=,4142100260x x x a++⋯+=,则有1121002124060231001005x x x a a a ax++⋯+++===.故选:A.4.(多选)(2021·山东德州市·高一期末)国家为了实现经济“双循环”大战略,对东部和西部地区的多个县市的某一类经济指标进行调查,得出东部,西部两组数据的茎叶图如图所示,则下列结论正确的是( )A.西部的平均数为13.3B.东部的极差小于西部的极差C.东部的30%分位数是11.6D.东部的众数比西部的众数小【答案】ACD【解析】对于A:()11.211.512.412.513.113.113.613.613.713.914.414.915.01313.3++++++++++++÷=即西部的平均数为13.3,故A正确;对于B:东部的最大值为15.1,最小值为10.8,极差为15.110.8 4.3-=;西部的最大值为15.0,最小值为11.2,极差为15.011.2 3.8 4.3-=<;故B错误;对于C:东部共13个数据,1330% 3.9⨯=,即从小到大的第4个数11.6为东部的30%分位数,所以东部的30%分位数是11.6,故C正确;对于D:东部的众数为11.3,西部的众数为13.1和13.6均大于11.3,故D正确;故选:ACD5.(多选)(2020·全国高一单元测试)在某地区某高传染性病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各项中,一定符合上述指标的是( )A.平均数3x≤B.标准差2s≤C.平均数3x≤且极差小于或等于2D.众数等于1且极差小于或等于4【答案】CD【解析】对于A选项,若平均数3x≤,不能保证每天新增病例数不超过5人,不符合题意;对于B选项,标准差反映的是数据的波动大小,例如当每天感染的人数均为10,标准差是0,显然不符合题意;对于C选项,若极差等于0或1,在3x≤的条件下,显然符合指标;若极差等于2,假设最大值为6,最小值为4,则3x>,矛盾,故每天新增感染人数不超过5,符合条件,C正确;对于D选项,若众数等于1且极差小于或等于4,则最大值不超过5,符合指标.故选:CD.6.(多选)(2020·济南市·山东师范大学附中高一月考)甲、乙两支田径队队员的体重(单位:kg)信息如下:甲队体重的平均数为60,方差为200,乙队体重的平均数为68,方差为300,又已知甲、乙两队的队员人数之比为1:3,则关于甲、乙两队全部队员的体重的平均数和方差的说法正确的是( )A.平均数为67 B.平均数为66 C.方差为296 D.方差为287【答案】BD【解析】依题意,甲的平均数160x=,乙的平均数268x=,而甲、乙两队的队员人数之比为1:3,所以甲队队员在所有队员中所占比重为14,乙队队员在所有队员中所占比重为34故甲、乙两队全部队员的体重的平均数为:1360686644x=⨯+⨯=;甲、乙两队全部队员的体重的方差为:()()22213200606630068665922828744s ⎡⎤⎡⎤=⨯+-+⨯+-=+=⎣⎦⎣⎦.故选:BD.7.(多选)(2020·江苏无锡市·高一期末)已知一组数据1x ,2x ,3x ,4x ,5x 的平均数和方差均为2,则下列叙述正确的有( )A .11x +,21x +,31x +,41x +,51x +的平均数为3B .11x +,21x +,31x +,41x +,51x +的方差为3C .12x ,22x ,32x ,42x ,52x 的方差为4D .122x +,222x +,322x +,422x +,522x +的方差为8 【答案】AD【解析】对,A B 选项,将每个数据在原基础上加1,故平均数加1,但是方差保持不变, 故其平均数是3,方差是2;故A 正确;B 错误;对C ,将每个数据乘以2,故其方差变为原来的4倍,即为8,故C 错误; 对D ,将每个数据乘以2再加2,故其方差也变为原来的4倍,即为8,故D 正确. 故选:AD .8.(2020·全国高一课时练习)某城区举行“奥运知识”演讲比赛,中学组根据初赛成绩在高一、高二年级中分别选出10名同学参加决赛,这些选手的决赛成绩如图所示.团体成绩 众数 极差 平均数 方差 高一年级 22 39.6 高二年级85.727.8(1)请把上边的表格填写完整.(2)考虑平均数与方差,你认为哪个年级的团体成绩更好些? 【答案】(1)填表见解析;(2)高二年级的团体成绩更好些.【解析】(1)高一年级的成绩为80,87,89,80,88,99,80,77,91,86; 高二年级的成绩为85,97,85,87,85,88,77,87,78,88. 由此可知高一年级成绩的众数是80,平均数x =85+110(-5+2+4-5+3+14-5-8+6+1)=85.7; 高二年级成绩的众数是85,极差是20. 团体成绩 众数 极差 平均数 方差 高一年级 80 22 85.7 39.6 高二年级 85 2085.727.8(2)因为两个年级的得分的平均数相同,高二年级成绩的方差小,说明高二年级的成绩偏离平均数的程度小,所以高二年级的团体成绩更好些.9.(2020·胶州市教育局高一期末)某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑)(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)【答案】(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为25;(3)3700元. 【解析】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=>所以中位数为x 满足7080x << 由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差1022110(90)610i i x s =-⨯==∑所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为222221100...)801008(90)8x x s +---⨯=(2025==(3)将3座教学楼完全包裹的球的最小直径为:22219280204366444100210++=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;将一座教学楼完全包裹的球的最小直径为2222020604400490070++=<=因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元;将1号教学楼与2号教学楼完全包裹的球的最小直径为:2222080601040012100110++=<=又因为22220806010400490070++=>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元;所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元.11.(2020·河南开封市·高一期末)为庆祝国庆节,某中学团委组织了“歌颂祖国,爱我中华”知识竞赛,从参加考试的学生中抽出60名,将其成绩(成绩均为整数)分成[40,50),[50,60),…,[90,100]六组,并画出如图所示的部分频率分布直方图,观察图形,回答下列问题:(1)求第四组的频率,并补全这个频率分布直方图;(2)请根据频率分布直方图,估计样本的中位数和方差.(每组数据以区间的中点值为代表).【答案】(1)第四组的频率为0.3;作图见解析;(2)2203;194.【解析】因为各组的频率和等于1,所以第四组的频率为1(0.0100.0150.0150.0250.005)1010.70.3 -++++⨯=-=. 补全的频率分布直方图如图所示.(2)前三组的频率之和为:(0.0100.0150.015)100.40.5++⨯=<前四组的频率之和为:0.40.03100.70.5+⨯=>设中位数为x ,则应有(70,80)x ∈又0.4(70)0.030.5x +-⨯=,2203x ∴=即样本的中位数为2203 抽取学生的平均数约为10(450.010550.015650.015750.030850.025950.005)71x =⨯⨯+⨯+⨯+⨯+⨯+⨯=所以,样本的方差为:222210[(4571)0.010(5571)0.015(6571)0.015s =⨯-⨯+-⨯+-⨯222(7571)0.030(8571)0.025(9571)0.005]+-⨯+-⨯+-⨯67.638.4 5.4 4.84928.8194=+++++=.。
2021新高考数学新课程一轮复习:第九章 第2讲 用样本估计总体含解析
第2讲用样本估计总体组基础关1.一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,60)内的数据个数为()A.14 B.15 C.16 D.17答案 B=0.3,又因解析由频数分布表可知,样本中数据在[20,40)上的频率为4+530为样本数据在[20,60)上的频率为0.8,所以样本在[40,60)内的频率为0.8-0.3=0.5,数据个数为30×0.5=15.2.甲、乙、丙、丁四人参加国际奥林匹克数学竞赛选拔赛,四人的平均成绩和方差如表:甲乙丙丁平均成绩x-86898985方差s2 2.1 3.5 2.1 5.6从这四人中选择一人参加国际奥林匹克数学竞赛,最佳人选是()A.甲B.乙C.丙D.丁答案 C解析丙平均成绩高,方差s2小(稳定),故最佳人选是丙.3.(2019·全国卷Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5 B.0.6 C.0.7 D.0.8答案 C解析解法一:设调查的100位学生中阅读过《西游记》的学生人数为x,则x+80-60=90,解得x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70=0.7.故选C.100解法二:用Venn图表示调查的100位学生中阅读过《西游记》和《红楼梦》的人数之间的关系如图所示.易知调查的100位学生中阅读过《西游记》的学生人数为70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70=0.7.故选C.1004.(2019·钦州模拟)某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在()A.第三组B.第四组C.第五组D.第六组答案 B解析由图可得,前四组的频率为(0.0375+0.0625+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第四组,所以B 正确.5.如图所示,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB.x -A <x -B ,s A >s BC.x -A >x -B ,s A <s BD.x -A <x -B ,s A <s B 答案 B解析 由图可知A 组的6个数为2.5,10,5,7.5,2.5,10,B 组的6个数为15,10,12.5,10,12.5,10,所以x -A =2.5+10+5+7.5+2.5+106=6.25,x -B =15+10+12.5+10+12.5+106≈11.67.显然x -A <x -B .又由图形可知,B 组的数据分布比A 均匀,变化幅度不大,故B 组数据比较稳定,方差较小,从而标准差较小,所以s A >s B ,故选B.6.(2020·重庆名校联盟调研)在样本频率分布直方图中共有9个小矩形,若其中1个小矩形的面积等于其他8个小矩形面积和的25,且样本容量为210,则该组的频数为( )A .28B .40C .56D .60 答案 D解析 设该小矩形的面积为x,9个小矩形的总面积为1,则其他8个小矩形的面积和为52x ,所以x +52x =1,所以x =27,所以该组的频数为27×210=60.7.已知一组数据x 1,x 2,…,x n 的方差为2,若数据ax 1+b ,ax 2+b ,…,ax n+b (a >0)的方差为8,则a 的值为_______.答案 2解析 根据方差的性质,知a 2×2=8,解得a =2.8.某学校随机抽取了部分学生,对他们每周使用手机的时间进行统计,得到如下的频率分布直方图.若从每周使用时间在[15,20),[20,25),[25,30]三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中应选取的人数为________.答案 3解析 由频率分布直方图,知5×(0.01+0.02+a +0.04+0.04+0.06)=1,解得a =0.03,即使用时间在[15,20),[20,25),[25,30]三组内的学生人数之比为4∶3∶1,则从每周使用时间在[15,20),[20,25),[25,30]三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中应选取的人数为38×8=3.组 能力关1.(2019·葫芦岛一模)一个样本容量为10的样本数据,它们组成一个公差为2的等差数列{a n },若a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是( )A .12,13B .13,13C .13,12D .12,14 答案 B解析 依题意得a 23=a 1a 7,∴(a 1+2×2)2=a 1(a 1+6×2),解得a 1=4,所以此样本的平均数为S 1010=13,中位数为a 5+a 62=13.2.(多选)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图和90后从事互联网行业岗位分布条形图,则下列结论中一定正确的是()注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.90后从事运营岗位的人数比80前从事互联网行业的人数多D.互联网行业中90后从事技术岗位的人数比80后从事技术岗位的人数多答案ABC解析对于A,由饼状图可知互联网行业从业人员中90后占了56%,故A正确.对于B,由条形图可知互联网行业中从事技术岗位的90后占56%×39.6%=22.176%,超过总人数的20%,故B正确.对于C,由两图数据可计算出整个互联网行业从事运营岗位的90后占56%×17%=9.52%,大于互联网行业中的80前总人数,故C正确.对于D,因为80后从事技术岗位的人数所占比例不清楚,所以互联网行业中从事技术岗位的90后人数不一定比80后的人数多,故D错误.故选ABC.3.(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.y的分组企业数[-0.20,0)2[0,0.20)24[0.20,0.40)53[0.40,0.60)14[0.60,0.80) 7(1)业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:74≈8.602.解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y -=1100×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s 2=1100 i =15n i (y i -y -)2=1100×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.0296,s =0.0296=0.02×74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.组 素养关(2019·石家庄市一模)小明在石家庄市某物流公司找到了一份派送员的工作,该公司给出了甲、乙两种日薪薪酬方案,其中甲方案:底薪100元,每派送一单奖励1元;乙方案:底薪140元,每日派送的前55单没有奖励,超过55单的部分每单奖励12元.(1)请分别求出甲、乙两种薪酬方案中日薪y (单位:元)与派送单数n 的函数关系式;(2)根据该公司100天所有派送员的派送记录,发现每名派送员的日平均派送单数与天数满足下表:①设一名派送员的日薪为x (单位:元),根据以上数据,试分别求出甲、乙两种方案中日薪x 的平均数及方差;②结合①中的数据,根据统计的知识,帮助小明分析,他选择哪种薪酬方案比较合适,并说明你的理由.(参考数据:0.62=0.36,1.42=1.96,2.62=6.76,3.42=11.56,3.62=12.96,4.62=21.16,15.62=243.36,20.42=416.16,44.42=1971.36)解 (1)由题意知,甲方案中派送员的日薪y (单位:元)与派送单数n 的函数关系式为y =100+n ,n ∈N ;乙方案中派送员的日薪y (单位:元)与派送单数n 的函数关系式为y =⎩⎨⎧140(n ≤55,n ∈N ),12n -520(n >55,n ∈N ). (2)①由(1)及表格可知,甲方案中,日薪为152元的有20天,日薪为154元的有30天,日薪为156元的有20天,日薪为158元的有20天,日薪为160元的有10天,则x -甲=1100×(152×20+154×30+156×20+158×20+160×10)=155.4, s 2甲=1100×[20×(152-155.4)2+30×(154-155.4)2+20×(156-155.4)2+20×(158-155.4)2+10×(160-155.4)2]=6.44,乙方案中,日薪为140元的有50天,日薪为152元的有20天,日薪为176元的有20天,日薪为200元的有10天,则x -乙=1100×(140×50+152×20+176×20+200×10)=155.6,s 2乙=1100×[50×(140-155.6)2+20×(152-155.6)2+20×(176-155.6)2+10×(200-155.6)2]=404.64.②解法一:由①可知,x-甲<x-乙,但两者相差不大,且s2甲远小于s2乙,即甲方案中日薪的波动相对较小,所以小明选择甲方案比较合适.解法二:由①可知,x-甲<x-乙,即甲方案中日薪的平均数小于乙方案中日薪的平均数,所以小明选择乙方案比较合适.。
第九章第二节用样本估计总体
返回
用C表示“选出的两名同学的植树总棵数为19”这一事件,则C中的结 果有4个,它们是:(A1,B4),(A2,B4),(A3,B2),(A4,B2).故所求 4 1 概率为P(C)=16=4.
返回
[巧练模拟]———————(课堂突破保分题,分分必保!)
解析:由茎叶图知平均值为
2
114+126+128+132 =125, 4
1 ∴s =4[(125-114)2+(125-126)2+(125-128)2+(125-132)2]=45.
答案: C
返回
4.一个容量为20的样本数据,分组后,组别与频数如下:
则样本在(20,50]上的频率为_____方图中,中位数左边和右边的直方图的 面积相等,由此可以估计中位数的值,而平均数的估 计值等于频率分布直方图中每个小矩形的面积乘以小
矩形底边中点的横坐标之和,众数是最高的矩形的中
点的横坐标.
返回
2.对标准差与方差的理解: 标准差、方差描述了一组数据围绕平均数波动的大 小.标准差、方差越大,数据的离散程度越大,标准 差、方差越小,数据的离散程度越小,因为方差与原 始数据的单位不同,且平方后可能夸大了偏差的程度, 所以虽然方差与标准差在刻画样本数据的分散程度上
返回
(1)求第6位同学的成绩x6,及这6位同学成绩的标准差s;
(2)从前5位同学中,随机地选2位同学,求恰有1位同学
成绩在区间(68,75)中的概率.
返回
[自主解答]
∵这6位同学的平均成绩为75分,
1 ∴6(70+76+72+70+72+x6)=75,解得x6=90. 这6位同学成绩的方差 1 s =6×[(70-75)2+(76-75)2+(72-75)2+(70-75)2+
高考数学总复习(一轮)(人教A)教学课件第九章 统计、成对数据的统计分析第2节 用样本估计总体
6
10
9
8
7
则该校学生开展志愿者活动时长的第40百分位数是
8.5
.
解析:(2)40×40%=16,故第40百分位数是第16个数和第17个数的平
均数, 即
+
=8.5.
考点二
总体集中趋势的估计
[例3] (多选题)某学校共有2 000名男生,为了了解这部分学生的身
体发育情况,学校抽查了100名男生的体重情况.根据所得数据绘制
=0.01.
(2)根据频率分布直方图,估计样本数据的15%和85%分位数.
解 :(2)由 图 可 知 ,[20,40)内 的 比 例 为 10%,[40,60)内 的 比 例 为
20%,[60,80)内的比例为40%,[80,100]内的比例为30%.
因此,15%分位数一定位于[40,60),85%分位数一定位于[80,100],
直方图如图所示:
得分 [20,40) [40,60) [60,80) [80,100]
人数
6
a
24
18
(1)求a,b的值;
解:(1)由频率分布直方图可知,
得分在[20,40)的频率为0.005×20=0.1,
故抽取的学生答卷数为6÷0.1=60,由6+a+24+18=60,得a=12.
所以 b=
[针对训练] (2023·全国乙卷)某厂为比较甲乙两种工艺对橡胶产品伸缩率
的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产
品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡
胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为
高考(理)总复习资料:第9章 第2讲 用样本估计总体
• ①甲同学成绩的中位数大于乙同学成绩的中 位数;
• ②甲同学的平均分比乙同学高; • ③甲同学的平均分比乙同学低; • ④甲同学成绩的方差小于乙同学成绩的方
差. • 上解析面:说甲法的中正位确数的81,是乙_的__中_位__数_8_7..5,故①错, x 甲= 81•,答x 案乙=:85③,故④②错,③对,由茎叶图知甲成绩比较稳定,
D. x 甲> x 乙,m甲<m乙
• [审题视点] 仔细观察茎叶图.中位数为一列
数中最中间的那个,当数有偶数个时,中位
数[解为析]中甲间数两据个集中数于的前平半段均,数而.乙数es据集中于后半段,
所以
x
甲<
x
乙;m甲=
18+22 2
=20,m乙=
27+31 2
=29,所以m甲
<m乙,所以选B.
• [答案] B
• [答案] C
32
1.平均数和方差都是重要的数字特征,是对总体一种简 明的阐述.平均数、中位数、众数描述总体的集中趋势,方 差和标准差描述波动大小.
2. 平均数、方差公式的推广 若数据x1,x2,…,xn的平均数为 x ,方差为s2,则数据 mx1+a,mx2+a,…,mxn+a的平均数为m x +a,方差为 m2s2.
33
• [变式探究] [2013·西安质检]某校甲、乙两 个班级各有5名编号为1,2,3,4,5的学生进行投 篮练习,每人投10次,投中的次数如下表:
学生 1号 2号 3号 4号 5号
甲班 6
7
7
8
7
乙班 6
7
6
7
9
34
则以上两组数据的方差中较小的一个为s2,则s2=( )
高考数学一轮复习 第九章 第二节 用样本估计总体课件 理 新人教版
3.方差与原始数据的单位不同,且平方后可能夸大了偏差
的程度,虽然方差与标准差在刻画样本数据的分散程度上 是一样的,但在解决实际问题时,一般多采用标准差.
[互动探究] 在本例条件下估计样本数据的众数.
解析 众数应为最高矩形的中点对应的横坐标,故约为65.
[规律方法] 解决频率分布直方图问题时要抓住 (1)直方图中各小长方形的面积之和为 1. 频率 频率 (2)直方图中纵轴表示 ,故每组样本的频率为组距× ,即 组距 组距 矩形的面积. (3)直方图中每组样本的频数为频率×总体数.
2. (教材习题改编)把样本容量为 20 的数据分组, 分组区间与频数 如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5; [50,60),4;[60,70],2,则在区间[10,50)上的数据的频率 是 ( A.0.05 C.0.5 B.0.25 D.0.7 )
三、样本的数字特征 数字特征 众数 定 义 在一组数据中,出现次数 最多 做这组数据的众数. 的数据叫
将一组数据按大小依次排列,把处在
中位数 最中间 位置的一个数据(或最中间两个数 据的 平均数 )叫做这组数据的中位数. 在频率
分布直方图中,中位数左边和右边的直方图 的面积 相等 .
样本数据的算术平均数.即 平均数 1 x = (x1+x2+…+xn). n 1 s = [(x1- x )2+(x2- x )2+…+(xn- x )2] . n
0.04)×10=1,解得a=0.005. (2) 由频率分布直方图知这 100 名学生语文成绩的平均分为
高考数学 第九章第二节 用样本估计总体课件新人教A版
答案: A
2.(2010· 山东高考)在某项体育比赛中,七位裁判为一选
手打出的分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值 和方差分别为 A.92,2 B.92,2.8 ( )
C.93,2
D.93,2.8
解析:去掉一个最高分 95 与一个最低分 89 后,所得的 5 个数 分别为 90、90、93、94、93, 90+90+93+94+93 460 所以 x = = =92, 5 5
A. x A> x B,sA>sB C. x A> x B,sA<sB
B. x A< x B,sA>sB D. x A< x B,sA<sB
解析:由图可知 A 组的 6 个数为 2.5,10,5,7.5,2.5,10, B 组的 6 个数为 15,10,12.5,10,12.5,10, 2.5+10+5+7.5+2.5+10 37.5 所以 x A= = , 6 6 15+10+12.5+10+12.5+10 70 x B= = .显然 x A< x B, 6 6 又由图形可知,B 组的数据分布比 A 均匀,变化幅度不大,故 B 组数据比较稳定,方差较小,从而标准差较小,所以 sA>sB.
微污染;在151~200之间时,为轻度污染.
请你根据所给数据和上述标准,对该市的空气质量给出一 个简短评价.
[自主解答] (1)频率分布表:
分组 [41,51) [51,61) [61,71) [71,81) [81,91) [91,101) [101,111) 频数 2 1 4 6 10 5 2 频率 2 30 1 30 4 30 6 30 10 30 5 30 2 30
2 2 2 2 × 90 - 92 + 2 × 93 - 92 + 94 - 92 14 2 s= = =2.8. 5 5
高中数学第九章统计9.2用样本估计总体(3)教案新人教A版必修第二册
本节《普通高中课程标准数学教科书-必修二(人教A 版)第九章《9.2.2总体百分位数的估计》,本节课通过探究栏目提出“居民生活用水定额管理问题”,在制定水价问题中提出,总体百分位数的估计的概念,让学生尝试运用总体百分位数的估计来解决实际问题,体会总体百分位数的估计的意义和作用,体会用样本估计总体的思想与方法。
从而发展学生的直观想象、逻辑推理、数学建模的核心素养。
掌握求一组数据的百分位的基本步骤:1.数学建模:在具体情境中运用百分位数解决问题;2.逻辑推理:求总体百分位数的基本步骤;3.数学运算:会求总体百分位数4.数据分析:体会百分位数的意义1.教学重点:理解百分位数的概念及其简单应用2.教学难点:掌握求一组数据的百分位的基本步骤:多媒体三、达标检测1.下列一组数据的第25百分位数是( )解把该组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i2.知100个数据的第75百分位数是9.3,则下列说法正确的是( )解析:因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,选C3.某公司2018年在各个项目中总投资500万元,如图是几类项目的投资占比情况,已知在1万元以上的项目投资中,少于3万元的项目投资占 ,那么不少于3万元的项目投资共有( )4. 为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?解:由题意知分别落在各区间上的频数为在[80,90)上有60×0.15=9,在[90,100)上有60×0.25=15,在[100,110)上有60×0.3=18,在[110,120)上有60×0.2=12,在[120,130]上有60×0.1=6.从以上数据可知第50百分位数一定落在区间[100,110)上,综上可知,第50百分位数和第75百分位数分别估计为103.3cm,112.5 cm.5.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,50,95百分位数;2)请你找出珍珠质量较小的前15%的珍珠质量;3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.解(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,则第25百分位数是错误!=8.15,第50百分位数是错误!=8.5,第95百分位数是第12个数据为9.9.(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.6.某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式.(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b 的值.(3)根据(2)中求得的数据a=0.001 5,b=0.002 0.计算用电量的75%分位数.[解] (1)当0≤x≤200时,yx;当200<x≤400时,y=0.5×200+0.8×(xx-60;当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140. 所以y与x之间的函数解析式为y=本节课通过探究栏目提出“居民生活用水定额管理问题”,在制定水价问题中提出,总体百分位数的估计的概念,让学生尝试运用总体百分位数的估计来解决实际问题,体会总体百分位数的估计的意义和作用教学中要注重学生的主体地位,调动学生积极性,使数学教学成为数学活动的教学。
2020届高考数学一轮复习第九篇统计专题9.2用样本估计总体及统计图表练习(含解析)
专题9.2 用样本估计总体及统计图表【考试要求】1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性;2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义;3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义;4.了解样本估计总体的取值规律;5.能用样本估计百分位数,理解百分位数的统计含义.【知识梳理】1.频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=极差组数; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率. 2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是 s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2], s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].4.百分位数如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.可表示为:一组n 个观测值按数值大小排列.如,处于p %位置的值称第p 百分位数.【微点提醒】1.频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是mx -+a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.3.中位数相当于第50百分位数.【疑误辨析】1.判断下列结论正误(在括号内打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(2)一组数据的方差越大,说明这组数据越集中.( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.( )【答案】 (1)√ (2)× (3)√【解析】 (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.(2)错误.方差越大,这组数据越离散.(3)正确.小矩形的面积=组距×频率组距=频率. 【教材衍化】2.(必修3P1002(1)改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )A.4B.8C.12D.16 【答案】 B【解析】 设频数为n ,则n 32=0.25,∴n =32×14=8. 3.(必修3P70示例改编)若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92【答案】 A【解析】 ∵这组数据为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5, 平均数x -=87+89+90+91+92+93+94+968=91.5. 【真题体验】4.(2018·全国Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】 A【解析】 法一 设新农村建设前经济收入为a ,则新农村建设后经济收入为2a ,则由饼图可得新农村建设前种植收入为0.6a ,其他收入为0.04a ,养殖收入为0.3a .新农村建设后种植收入为0.74a ,其他收入为0.1a ,养殖收入为0.6a ,养殖收入与第三产业收入的总和为1.16a ,所以新农村建设后,种植收入减少是错误的.法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A 是错误的.5.(2019·新余二模)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是( )A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数【答案】 C【解析】 由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为60×60%=36,女性人数为40×60%=24,不相同.故选C.6.(2019·上海黄浦区质检)已知样本容量为200,在样本的频率分布直方图中,共有n 个小矩形,若中间一个小矩形的面积等于其余(n -1)个小矩形面积和的13,则该组的频数为________. 【答案】 50【解析】 设除中间一个小矩形外的(n -1)个小矩形面积的和为p ,则中间一个小矩形面积为13p ,p +13p =1,p =34,则中间一个小矩形的面积等于13p =14,200×14=50,即该组的频数为50.【考点聚焦】考点一 频率分布直方图【例1】 (2019·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x 人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x ;(2)求抽取的x 人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.【答案】见解析【解析】(1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x=0.05,∴x =120. (2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5,∴a =953≈32,则中位数为32. (3)(ⅰ)5个年龄组成绩的平均数为x -1=15×(93+96+97+94+90)=94,方差为s 21=15×[(-1)2+22+32+02+(-4)2]=6.5个职业组成绩的平均数为x -2=15×(93+98+94+95+90)=94,方差为s 22=15×[(-1)2+42+02+12+(-4)2]=6.8.(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).【规律方法】 1.频率分布直方图的性质.(1)小长方形的面积=组距×频率组距=频率; (2)各小长方形的面积之和等于1;(3)小长方形的高=频率组矩,所有小长方形的高的和为1组距. 2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.【训练1】 某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频率分布表. A 地区用户满意度评分的频率分布直方图图①B 地区用户满意度评分的频率分布表(1)在图②中作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B 地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户和满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.【答案】见解析【解析】(1)作出频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.考点二样本的数字特征【例2】 (1)(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x 1,x 2,…,x n 的平均数B.x 1,x 2,…,x n 的标准差C.x 1,x 2,…,x n 的最大值D.x 1,x 2,…,x n 的中位数(2)(2019·聊城模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A.x -=4,s 2<2B.x -=4,s 2>2 C.x ->4,s 2<2 D.x ->4,s 2>2 【答案】 (1)B (2)A【解析】(1)刻画评估这种农作物亩产量稳定程度的指标是标准差.(2)∵某7个数的平均数为4,∴这7个数的和为4×7=28,∵加入一个新数据4,∴x -=28+48=4. 又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+(4-4)28=74<2,故选A. 规律方法 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.【训练2】 抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.【答案】 2【解析】 x -甲=15(87+91+90+89+93)=90,x -乙=15(89+90+91+88+92)=90,s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4, s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.【反思与感悟】1.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.3.频率分布表和频率分布直方图都可直观描述样本数据的分布规律.【易错防范】直方图与条形图不要搞混频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.【核心素养提升】【数据分析】——百分位数的统计含义1.数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养.数据分析过程主要包括:收集数据,整理数据,提取信息,构建模型,进行推断,获得结论.2.数据分析是研究随机现象的重要数学技术,是大数据时代数学应用的主要方法,也是“互联网+”相关领域的主要数学方法,数据分析已经深入到科学、技术、工程和现代社会生活的各个方面.3.数据分析主要表现为:收集和整理数据,理解和处理数据,获得和解释结论,概括和形成知识.4.百分位数是统计学述语,百分位数用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值的分布特征;百分位数还可用于确定非正态分布资料的医学参考值范围.但应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数.【案例】 阶梯电价的设计(此材料见2017版课程标准P130)【情境】为了实现绿色发展,避免浪费能源,某市政府计划对居民用电采用阶梯收费的方法.为此,相关部门在该市随机调查了200户居民六月份的用电量(单位:kW·h),以了解这个城市家庭用电量的情况.数据如下:107 101 78 99 208 127 74 223 31 131214 135 89 66 60 115 189 135 146 127203 97 96 62 65 111 56 151 106 8162 91 67 93 212 159 61 63 178 194194 216 101 98 139 78 110 192 105 9622 50 138 251 120 112 100 201 98 84137 203 260 134 156 61 70 100 72 164174 131 93 100 163 80 76 95 152 18288 247 191 70 130 49 114 110 163 202265 18 94 146 149 147 177 339 57 109107 182 101 148 274 289 82 213 165 224142 61 108 137 90 254 201 83 253 113130 82 170 110 108 63 250 237 120 84154 288 170 123 172 319 62 133 130 127107 71 96 140 77 106 132 106 135 132167 82 258 542 51 107 69 98 72 48109 134 250 42 320 113 180 144 116 530200 174 135 160 462 139 133 304 191 283121 132 118 134 124 178 206 626 120 274141 80 187 88 324 136 498 169 77 57根据以上数据,应当如何确定阶梯电价中的电量临界值,才能使得电价更为合理?【答案】见解析【解析】选取六月份调查,是因为这个城市六月份的部分时间需要使用空调,因此六月份的用电量在一年12个月中处于中等偏上水平.如果阶梯电价临界值的确定依赖于居民月用电量的分布,例如计划实施3阶的阶梯电价,有人给出一个分布如下:75%用户在第一档(最低一档),20%用户在第二档,5%用户在第三档(最高一档).这样,需要通过样本数据估计第一档与第二档、第二档与第三档的两个电量临界值,即75%和95%这两个电量临界值.通过样本估计总体百分位数的要领是对样本数据进行排序,得到有序样本(在统计学中称之为顺序统计量).利用电子表格软件,对上面的样本数据进行排序,可以得到下面的结果:8 18 22 31 42 48 49 50 51 5657 57 60 61 61 61 62 62 63 6365 66 67 69 70 70 71 72 72 7476 77 77 78 78 80 80 82 82 8283 84 84 88 88 89 90 91 93 9394 95 96 96 96 97 98 98 98 99100 100 100 101 101 101 105 106 106 106107 107 107 107 108 108 109 109 110 110110 111 112 113 113 114 115 116 118 120120 120 121 123 124 127 127 127 130 130130 131 131 132 132 132 133 133 134 134134 135 135 135 135 136 137 137 138 139139 140 141 142 144 416 146 147 148 149151 152 154 156 159 160 162 163 163 164165 167 169 170 170 172 174 174 177 178178 180 182 182 187 189 191 191 192 194194 200 201 201 202 203 203 206 208 212213 214 216 223 224 237 247 250 250 251253 254 258 260 265 274 274 283 288 289304 319 320 324 339 462 498 530 542 626样本数据总共有200个,最小值是8,最大值是626,说明200户居民六月份的最小用电量为8 kW·h,最大用电量为626 kW·h,极差为618.初中统计内容中学过的中位数,相当于50%分位数.因为数据量是200,那么这组数据的样本中位数就是有序样本第100个数130和101个数130的平均数,即130,说明这个城市六月份居民用电量的中间水平大约在130 kW·h左右.下面确定75%和95%这两个电量临界值.类似中位数的计算,因为200×75%=150,所以第一个临界值为有序样本中第150个数178和第151个数178的平均数,仍然是178.因为200×95%=190,所以第二个临界值为有序样本中第190个数289和第191个数304的平均数,这个平均数为296.5(因为是对百分位数的估计,估计值可以是289和304之间任何一个数,为了便于操作可以取值为297).依据确定了的电量临界值,阶梯电价可以规定如下:用户每月用电量不超过178 kW·h(或每年用电量不超过2 136 kW·h),按第一档电价标准缴费;每月用电量(单位:kW·h)在区间(178,297]内(或每年用电量在区间(2 136,3 564]内),其中的178 kW·h按第一档电价标准缴费,超过178 kW·h的部分按第二档电价标准缴费;每月用量超过297 kW·h(或每年用电量超过3 564 kW·h),其中的178 kW·h按第一档电价标准缴费,(297-178)=119 kW·h按第二档电价标准缴费,超过297 kW·h的部分按第三档电价标准缴费. 社会上对这种制定阶梯电价的原则和方法存在不同意见,可以讨论制定合理阶梯电价的原则和方法.【评析】分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置.百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息.对于无大量重复的数据,第p百分位数将它分为两个部分.大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大.对第p百分位数,严格的定义如下:第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值.【案例应用1】对于考试成绩的统计,如果您的成绩处在95的百分位数上,则意味着95%的参加考试者得到了和您一样的考分或还要低的考分,而不是您答对了95%的试题.也许您只答对了20%,即使如此,您取得的成绩也与95%的参加考试者一样好,或者比95%的参加考试者更好.【案例应用2】假设想为退休存够钱.可创建一个包括所有不确定变量的模型,如投资年回报率、通货膨胀、退休时的开支等,得到概率分布的结果如下图所示,如果选择平均值,钱不够的概率就会有50%.所以选第90百分位数所对应的投资数,这样钱不够的概率将只有10%.【分层训练】【基础巩固题组】(建议用时:40分钟)一、选择题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45B.50C.55D.60【答案】 B【解析】 由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.∴该班学生人数n =150.3=50.2.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( )A.甲B.乙C.丙D.丁【答案】 C【解析】 由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好.3.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差【答案】 C【解析】 由图可得,x -甲=4+5+6+7+85=6,x -乙=3×5+6+95=6,A 项错误; 甲的成绩的中位数为6,乙的成绩的中位数为5,B 项错误;s 2甲=(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)25=2, s 2乙=3×(5-6)2+(6-6)2+(9-6)25=2.4,C 项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D 项错误.4.(2019·茂名联考)甲组数据为:5,12,16,21,25,37,乙组数据为:1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是( )A.极差B.平均数C.中位数D.都不相同【答案】 B【解析】 由题中数据的分布,可知极差不同,甲的中位数为16+212=18.5,乙的中位数为14+182=16, x -甲=5+16+12+25+21+376=583, x -乙=1+6+14+18+38+396=583, 所以甲、乙的平均数相同.故选B.二、填空题5.某校女子篮球队7名运动员身高(单位:cm)的数据分别为:171,172,17x ,174,175,180,181,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.【答案】 2【解析】 170+17×(1+2+x +4+5+10+11)=175, 17×(33+x )=5,即33+x =35,解得x =2. 6.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.【答案】 (1)0.04 (2)440【解析】 设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h +0.07+0.06+0.02)=1,解得h =0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.7.已知样本数据x 1,x 2,…,x n 的平均数x -=5,则样本数据2x 1+1,2x 2+1,…,2x n +1的平均数为________.【答案】 11【解析】 由x 1,x 2,…,x n 的平均数x -=5,得2x 1+1,2x 2+1,…,2x n +1的平均数为2x -+1=2×5+1=11.三、解答题8.某校2019届高三文(1)班在一次数学测验中,全班N 名学生的数学成绩的频率分布直方图如下,已知分数在110~120的学生有14人.(1)求总人数N 和分数在120~125的人数n ;(2)利用频率分布直方图,估算该班学生数学成绩的众数和中位数各是多少?【答案】见解析【解析】(1)分数在110~120内的学生的频率为p 1=(0.04+0.03)×5=0.35,所以该班总人数N =140.35=40. 分数在120~125内的学生的频率为p 2=1-(0.01+0.04+0.05+0.04+0.03+0.01)×5=0.10,分数在120~125内的人数n =40×0.10=4.(2)由频率分布直方图可知,众数是最高的小矩形底边中点的横坐标,即为105+1102=107.5.设中位数为a ,∵0.01×5+0.04×5+0.05×5=0.50,∴a =110.∴众数和中位数分别是107.5,110.9.(2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】见解析【解析】(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30. 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.【能力提升题组】(建议用时:20分钟)10.(2019·湖北部分重点中学模拟)某商场对某一商品搞活动,已知该商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如图所示,设x (个)为每天商品的销量,y (元)为该商场每天销售这种商品的利润.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率是( )A.19B.110C.15D.18【答案】 B【解析】 由题意知y =⎩⎪⎨⎪⎧5x ,x =18,19,95+(x -19)(4-3),x =20,21,即y =⎩⎪⎨⎪⎧5x ,x =18,19,76+x ,x =20,21. 当日销量不少于20个时,日利润不少于96元.当日销量为20个时,日利润为96元.当日销量为21个时,日利润为97元.日利润为96元的有3天,记为a ,b ,c ,日利润为97元的有2天,记为A ,B ,从中任选2天有(a ,A ),(a ,B ),(a ,b ),(a ,c ),(b ,A ),(b ,B ),(b ,c ),(c ,A ),(c ,B ),(A ,B )共10种情况, 其中选出的这2天日利润都是97元的有(A ,B )1种情况,故所求概率为110. 11.(2019·北京海淀区模拟)已知样本x 1,x 2,…,x n 的平均数为x ;样本y 1,y 2,…,y m 的平均数为y (x ≠y ),若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z =ax +(1-a )y ,其中0<a <12,则n ,m (n ,m ∈N *)的大小关系为( )A.n =mB.n ≥mC.n <mD.n >m 【答案】 C【解析】 由题意得z =1n +m (nx +my )=n n +m x +⎝ ⎛⎭⎪⎫1-n n +m y ,∴a =n n +m, ∵0<a <12,∴0<n n +m <12, 又n ,m ∈N *,∴2n <n +m ,∴n <m .12.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________.【答案】 16【解析】 依题意,x 1,x 2,x 3,…,x 10的方差s 2=64.则数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16.13.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?【答案】见解析【解析】(1)样本数据的频率分布直方图如图所示:(2)质量指标值的样本平均数为x -=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s 2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.。
高考数学(文)一轮复习 9-2用样本估计总体
[必会结论] 频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心”,等于频率分 布直方图中每个小长方形的面积乘以小长方形底边中点的 横坐标之和.
9
板块一
板块二
板块三
板块四
30
板块一
板块二
板块三
板块四
高考一轮总复习 ·数学(文)
考向 数字特征的应用
命题角度 1 样本数字特征与直方图交汇 例 3 [2017·益阳模拟]为了了解某校九年级 1600 名学 生的体能情况,随机抽查了部分学生,测试 1 分钟仰卧起坐 的成绩(次数),将数据整理后绘制成如图所示的频率分布直 方图,根据统计图的数据,下列结论错误的是( )
A.15 名女生成绩的平均分为 78 B.17 名男生成绩的平均分为 77 C.女生成绩和男生成绩的中位数分别为 82,80 D.男生中的高分段和低分段均比女生多,相比较男生 两极分化比较严重
29
板块一
板块二
板块三
板块四
高考一轮总复习 ·数学(文)
解析 15 名女生成绩的平均分为115×(90+93+80+ 80+82+82+83+83+85+70+71+73+75+66+57)= 78,A 正确;17 名男生成绩的平均分为117×(93+93+96+ 80+82+83+86+86+88+71+74+75+62+62+68+53 +57)=77,故 B 正确;观察茎叶图,对男生、女生成绩进 行比较,可知男生两极分化比较严重,D 正确;根据女生 和男生成绩数据分析可得,两组数据的中位数均为 80,C 错误.
板块四
高考一轮总复习 ·数学(文)
202新数学复习第九章统计统计案例9.2用样本估计总体学案含解析
第二节用样本估计总体课标要求考情分析1。
了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.4.会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本1。
本节是用样本估计总体,是统计学的基础,以考查频率分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估计总体的思想的理解.2.本节在高考题中主要是以选择题和填空题为主,属于中低档题目。
方法和样本估计总体的思想解决一些简单的实际问题。
知识点一用样本的频率分布估计总体分布1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.知识点二用样本的数字特征估计总体的数字特征1.众数、中位数、平均数平均数如果有n个数据x1,x2,…,x n,那么这n个数的平均数错误!=错误!平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差:s=错误!。
【高考数学专题复习】专题9.2 用样本估计总体(解析版)
9.2 用样本估计总体运用一 特征数【例1-1】(1)(2019·江西南昌二中高三月考(文))如图是某样本数据的茎叶图,则该样本的中位数、众数、极差分别是( )A .32 34 32B .33 45 35C .34 45 32D .33 36 35(2)(2020·浙江高三专题练习)甲、乙两个数学兴趣小组各有5名同学,在一次数学测试中,成绩统计用茎叶图表示如图,若甲、乙两个小组的平均成绩分别是1x ,2x ,标准差分别是s 1,s 2,则下列说法正确的是( )A .12x x >,12s s <B .12x x >,12s s >C .12x x <,12s s <D .12x x <,12s s >【答案】(1)B (2)A【解析】(1)从茎叶图中知共16个数据,按照从小到大排序后中间的两个数据为32、34, 所以这组数据的中位数为33;45出现的次数最多,所以这组数据的众数为45; 最大值是47,最小值是12,故极差是:35,故选:B . (2)由茎叶图中数据,计算平均数为1x =15×(88+89+90+91+92)=90,2x =15×(85+86+88+88+93)=88,标准差为s 1=(222221[(2)1)0125⎤⨯-+-+++⎦=2, s 2=(222221[(3)2)0055⎤⨯-+-+++⎦=7.2, ∴1x >2x ,s 1<s 2.故选A .【例2-2】24.(2020·辽宁高三月考(文))已知数据1x ,2x ,3x ,4x ,5x 的平均数为3,标准差为4,则数据151x -,251x -,351x -,451x -,551x -的平均数和方差分别为______. 【答案】14;400【解析】由题意知,原数据的平均数()125135x x x x =++⋯+= 方差(2222212513[(3)(3)3)()165S x x x ⎤=-+-+⋯+-==⎦ 另一组数据的平均数()()212512121115151515551555n n x x x x x x x x x x ⎡⎤⎤⎡=-+-+⋯+-=++⋯+-=⨯++⋯+-⎢⎥⎥⎢⎦⎣⎣⎦5115114x =-=-=;方差((22222222212512511[(5114)(5114)5114){25[(3)(3)3)}2540055S x x x x x x S ⎤⎤=--+--+⋯+--=-+-+⋯+-==⎦⎦故答案为:14;400.【例1-3】(2020·全国高三专题练习)某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数.【答案】(1)0.0075x =;(2)众数是230,中位数为224.【解析】(1)由直方图的性质可得(0.0020.00950.0110.01250.0050.0025)201x ++++++⨯=, ∴0.0075x =.(2)月平均用电量的众数是2202402302+=, ∵(0.0020.00950.011)200.450.5++⨯=<, 月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.0020.00950.011)200.0125(220)0.5a ++⨯+⨯-=,可得224a =, ∴月平均用电量的中位数为224 【举一反三】1.(2020·全国高三专题练习)已知数据12,,,n x x x L 的平均数5x =,方差(6,0)±,则数据1237,37,,37n x x x +++L 的平均数和标准差分别为A .15,36B .22,6C .15,6D .22,36【答案】B 【解析】123,,,...,n x x x x Q 的平均数为5,12...5nx x x n+++∴=,()12123...33...37735722n nx x x x x x n n ++++++∴+=+=⨯+=,123,,,...,n x x x x Q 的方差为4,12337,37,37,...,37n x x x x ∴++++的方差是23436⨯=,数据1237,37,,37n x x x +++L 的平均数和标准差分别为22,6,故选B.2.(2020·全国高三专题练习)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为2s ,则( ) A .4x =,22s < B .4x =,22s > C .4x >,22s < D .4x >,22s >【答案】A【解析】某7个数的平均数为4,方差为2, 则这8个数的平均数为1(744)48x =⨯⨯+=,方差为221772(44)284s ⎡⎤=⨯⨯+-=<⎣⎦.故选:A .3.(2020·全国高三专题练习)下列茎叶图中的甲,乙的平均数,方差,极差及中位数,相同的为( )A .极差B .方差C .平均数D .中位数【答案】C【解析】从茎叶图中数据的分布,可知方差不同,极差不同, 甲的中位数为162118.52+=,乙的中位数为1418162+=, 计算平均数:516122521375863x +++++==甲,16141838395863x +++++==乙, 甲、乙的平均数都为583.本题选择C 选项.4.(2019·邢台市第八中学高一月考)某电视台为宣传本省,随机对本省内1565~岁的人群抽取了n 人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示(1)分别求出a b x y 、、、的值;(2)从第234、、组回答正确的人中用分层抽样的方法抽取6人,求第234、、组每组各抽取多少人? (3)指出直方图中,这组数据的中位数是多少(取整数值)?【答案】(1)5a =,27b =,0.9x =,0.2y =;(2)2人,3人,1人;(3)42 【解析】(1)由已知第4组人数为9250.36=,∴251000.02510n ==⨯, 由频率分布直方图得第一组人数为:1000.011010⨯⨯=,100.55a =⨯=, 第二组人数为:1000.021020⨯⨯=,180.920x ==, 第三组人数为:1000.031030⨯⨯=,300.927b =⨯=, 第五组人数为:1000.0151015⨯⨯=,30.215x ==. (2)第2、3、4组回答正确人数分别18、27、9,共54人,设第234、、组分别抽取,,x y z 人, 则65418279x y z===,解得2,3,1x y z ===. (3)第1、2组频率和为0.10.20.3+=,第4、5组频率和为0.250.150.4+=,第3组频率为0.3,设中位数为m ,则350.50.3100.3m --=,241423m =≈. ∴中位数为42.运用二 频率分布直方图【例2】(2020·全国高三专题练习)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36. 根据上述数据得到样本的频率分布表如表所示.(45,50] n 2 f 2(1)确定样本频率分布表中n 1,n 2,f 1和f 2的值;(2)根据上述频率分布表,画出样本频率分布直方图和频率分布折线图. 【答案】(1) n 1=7,n 2=2,f 1=0.28,f 2=0.08 (2)见解析【解析】(1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故1n =7,2n =2,所以f 1=125n =725=0.28,f 2=225n =225=0.08. (2)样本频率分布直方图和频率分布折线图如图所示.【举一反三】1.(2020·全国高三专题练习)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m )和使用了节水龙头50天的日用水量数据,得到频数分布表如下: 未使用节水龙头50天的日用水量频数分布表 日用水量 [)0,0.1 [)0.1,0.2 [)0.2,0.3 [)0.3,0.4 [)0.4,0.5 [)0.5,0.6 [)0.6,0.7频数 13 24 9 26 5使用了节水龙头50天的日用水量频数分布表 日用水量[)0,0.1 [)0.1,0.2 [)0.2,0.3 [)0.3,0.4 [)0.4,0.5 [)0.5,0.6频数151310165(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:0.35m的概率;(2)估计该家庭使用节水龙头后,日用水量小于3(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)47.45m.【答案】(1)直方图见解析;(2)0.48;(3)3【解析】(1)频率分布直方图如下图所示:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于30.35m 的频率为0.20.110.1 2.60.120.050.48⨯+⨯+⨯+⨯=;因此该家庭使用节水龙头后日用水量小于30.35m 的概率的估计值为0.48; (3)该家庭未使用节水龙头50天日用水量的平均数为()110.0510.1530.2520.3540.4590.55260.6550.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为()210.0510.1550.25130.35100.45160.5550.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水()()30.480.3536547.45m -⨯=.1.(2020·福建高三期末(文))某工厂有甲、乙两条流水线同时生产直径为50mm 的零件,各抽取10件进行测量,其结果如下图所示,则以下结论不正确的是( )A.甲流水线生产的零件直径的极差为0.4mmB.乙流水线生产的零件直径的中位数为50.0mmC.乙流水线生产的零件直径比甲流水线生产的零件直径稳定D.甲流水线生产的零件直径的平均值小于乙流水线生产的零件直径的平均值【答案】D-=.故A正确.【解析】对A,甲流水线生产的零件直径的极差为50.249.80.4对B,易得除去3个50.1与3个49.9,剩下的均为50.0.故中位数为50.0mm正确.对C,由图表易得, 乙流水线生产的零件直径比甲流水线生产的零件直径稳定.故C正确.对D,计算可得甲乙流水线生产的零件直径平均值均为50.0mm.故D错误.故选:D2.(2020·江西高二期末(文))高三学生甲和乙近五次月考数学成绩(单位:分)的茎叶图如下图,则下列说法错误的是A.甲的得分的中位数为101B.乙的得分的众数为105C.甲的数学成绩更稳定D.乙得分的极差为21【答案】C【解析】由茎叶图易知,甲的中位数为101,所以A是正确的;乙的众数为105,所以B是正确;乙得分的-=,所以D是正确的,极差为1149321又由甲得分比较分散,乙得分比较集中,故乙的数学成绩更稳定,C 错误,故选C.3.(2020·全国高三专题练习)如图所示的茎叶图表示甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率为( )A .B .C .D .【答案】C【解析】根据题意,由于甲、乙两人在5次综合测评中的成绩,其中一个数字被污损.则甲的平均成绩1x (8889909092)89.85=++++=超过乙的平均成绩1y (838387999)5x =++++,0<x<9,则根据几何概型可知其概率为故答案为C.4.(2020·全国高三专题练习)为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是( )A .35B .48C .60D .75【答案】C【解析】设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.0375+0.0125)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =515250.75++=60.故选:C .5.(2020·全国高三专题练习)设样本数据1210,,,x x x L 的均值和方差分别为1和4,若(i i y x a a =+为非零常数,1,2,,10)i =L ,则1210,,,y y y L 的均值和方差分别为( )A .1,4a +B .1,4a a ++C .1,4D .1,4a +【答案】A【解析】因为样本数据1210,,,x x x L 的平均数是1,所以1210,,...y y y 的平均数是121012101210 (1101010)y y y x a x a x a x x x a a ++++++++++++==+=+;根据i i y x a =+(a 为非零常数,1,2,,10i =L ),以及数据1210,,,x x x L 的方差为4可知数据1210,,,y y y L 的方差为2144⨯=,综上故选A.6.(2020·全国高三专题练习)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为若低于60分的人数是15人,则该班的学生人数是( )A .B .C .D .【答案】B【解析】根据频率分布直方可知成绩低于60分的有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20, 则成绩低于60分的频率P=(0.005+0.010)×20=0.3. 又因为低于60分的人数是15人, 所以该班的学生人数是15÷0.3=50. 本题选择B 选项.7.(2020·全国高三专题练习)一个公司有8名员工,其中6名员工的月工资分别为5200,5300,5500,6100,6500,6600,另两名员工数据不清楚,那么8位员工月工资的中位数不可能是( ) A .5800 B .6000 C .6200 D .6400【答案】D【解析】∵一个公司有8名员工,其中6名员工的月工资分别为5200,5300,5500,6100,6500,6600, ∴当另外两名员工的工资都小于5300时,中位数为(5300+5500)÷2=5400,当另外两名员工的工资都大于5300时,中位数为(6100+6500)÷2=6300,∴8位员工月工资的中位数的取值区间为[5400,6300],∴8位员工月工资的中位数不可能是6400.本题选择D选项.8.(2020·全国高三专题练习)下图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.5,5 B.3,5 C.3,7 D.5,7【答案】B【解析】由茎叶图得:∵甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,∴65=60+y,解得y=5,∵平均值也相等,∴5662657074596167657855x+++++++++=,解得x=3.故选B.9.(2020·全国高三专题练习)甲、乙两名篮球运动员5场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为x甲,x乙,则下列结论正确的是( )A.x甲<x乙;乙比甲得分稳定B.x甲>x乙;甲比乙得分稳定C.x甲>x乙;乙比甲得分稳定D.x甲<x乙;甲比乙得分稳定【答案】A 【解析】因为x 甲=27816225++++=11,x 乙=8121821255++++=16.8,所以x 甲<x 乙,根据茎叶图数据,甲的大量数据集中在10以下,十几,二十几各占一个数据, 乙更多数据集中在十几二十附近,所以乙更稳定. 故选:A10(2020·全国高三专题练习)射击项目选拔赛,四人的平均成绩和方差如下表所示:甲 乙 丙 丁 平均环数x 8.3 8.8 8.8 8.7 方差2s 3.53.62.25.4从这四个人选择一人参加该射击项目比赛,最佳人选是( ) A .甲 B .乙C .丙D .丁【答案】C【解析】由统计的知识可知:平均越大越好,方差越小越好,从数表中提供的数据信息可以看出:这四个人中,平均数较大,方差较小的是丙,应选答案C .11.(2020·全国高三专题练习)为比较甲乙两地某月11时的气温情况,随机选取该月中的5天中11时的气温数据(位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1℃,则甲地该月11时的平均气温的标准差为( )A .2B 2.10 D 10 【答案】B【解析】根据题意可求得m=1,故甲地该月11时的平均气温的标准差为:222221[(2830)(2930)(3030)(3130)(3230)]25s =-+-+-+-+-= 12.(2020·全国高三专题练习)中国诗词大会的播出引发了全民读书热,某学校语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如右图,若规定得分不低于85分的学生得到“诗词达人”的称号,低于85分且不低于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号.根据该次比赛的成绩按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词能手”称号的人数为()A.6 B.5 C.4 D.2【答案】C【解析】由茎叶图可得,低于85分且不低于70分的学生共有16人,所以获得“诗词能手”的称号的概率为:162 405=所以分层抽样抽选10名学生,获得“诗词能手”称号的人数为:2 1045⨯=故选C13.(2020·全国高三专题练习)某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是()A.B.C .D .【答案】A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.14.(2019·尚志市尚志中学高二月考(文))演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差 D .极差【答案】A【解析】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤L .则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤L , 中位数仍为5x ,∴A 正确. ②原始平均数1234891()9x x x x x x x =+++++L ,后来平均数234817x x x x x '=+++L () 平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦L ()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦L 由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确.15(2019·重庆高一期末)甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定【答案】C【解析】乙选手分数的平均数分别为7885848192767780949384,84,55++++++++==所以标准差分别为22222(7884)(8584)(8484)(8184)(9284)22,5-+-+-+-+-=22222(7684)(7784)(8084)(9484)(9384)62,5-+-+-+-+-=因此s 1<s 2,选C.16.(2020·全国高三专题练习)已知样本数据x 1,x 2,…,x n 的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为_____. 【答案】11 【解析】因为样本数据x 1,x 2,…,x n 的均值x =5,所以样本数据2x 1+1,2x 2+1,…,2x n +1的均值为2x +1=2×5+1=11.17.(2020·全国高三专题练习)某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.【答案】2【解析】由题意,可得1170(12451011)1757x+++++++=,即1(33)57x+=,解得2x=.18.(2020·全国高三专题练习)为参加学校的“我爱古诗词”知识竞赛,小王所在班级组织了一次古诗词知识测试,并将全班同学的分数(得分取正整数,满分为100分)进行统计,以下是根据这次测试成绩制作的不完整的频率分布表和频率分布直方图.频率分布表组别分组频数频率1 [50,60) 9 0.182 [60,70) a3 [70,80) 20 0.404 [80,90) 0.085 [90,100] 2 b合计 1请根据以上频率分布表和频率分布直方图,回答下列问题:(1)求出a,b,c,d的值;(2)老师说:“小王的测试成绩是全班同学成绩的中位数”,那么小王的测试成绩在什么范围内.【答案】(1) a=15,b=0.04,c=0.03,d=0.004 (2) 70≤x<80【解析】(1)样本容量为9÷0.18=50,50×0.08=4,所以a=50-9-20-4-2=15,b=2÷50=0.04,c =15÷50÷10=0.03,d =0.04÷10=0.004.(2)因为样本容量为50,则样本的中位数是第25,26个数据的平均数, 而第25,26个数据均位于70≤x <80范围内, 所以小王的测试成绩在70≤x <80范围内.19.(2020·全国高三专题练习)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)50,60,[)60,70,[)70,80,[)80,90,[]90,100. 分数段[)50,60[)60,70[)70,80[)80,90:x y 1∶12∶13∶44∶5(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[)50,90之外的人数.【答案】(1)0.005a =;(2)73(分);(3)10.【解析】(1)由频率分布直方图知(20.020.030.04)101a +++⨯=,解得0.005a =. (2)由频率分布直方图知这100名学生语文成绩的平均分为550.00510650.0410750.0310850.0210950.0051073⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=(分). (3)由频率分布直方图知语文成绩在[)50,60,[)60,70,[)70,80,[)80,90各分数段的人数依次为:0.005101005,0.041010040,0.031010030,0.021010020⨯⨯=⨯⨯=⨯⨯=⨯⨯=由题中给出的比例关系知数学成绩在上述各分数段的人数依次为1455,4020,3040,2025234⨯=⨯=⨯=.故数学成绩在[50,90)之外的人数为100(5204025)10-+++=.20.(2020·全国高三专题练习)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125) 频数 6 26 38 22 8(I)在答题卡上作出这些数据的频率分布直方图:(II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【答案】(1)见解析;(2)平均数100,方差为104;(3)不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【解析】(1)直方图如图,(2)质量指标值的样本平均数为800.06900.261000.381100.221200.08100x =⨯+⨯+⨯+⨯+⨯=.质量指标值的样本方差为22222(20)0.06(10)0.2600.38100.22200.08104s =-⨯+-⨯+⨯+⨯+⨯=.(3)质量指标值不低于95的产品所占比例的估计值为0.380.220.080.68++=,由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.20.(2019·四川成都七中高二期中(文))从某企业生产的某种产品中随机抽取100件,测量这些产品的某项质量指标,由测量结果得到如下频数分布表: 质量指标值分组 [)75,85[)85,95[)95,105[)105,115[)115,125频数 62638228()1在图中作出这些数据的频率分布直方图;()2估计这种产品质量指标值的平均数、中位数(保留2位小数);()3根据以上抽样调査数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【答案】(1)直方图见解析;(2)平均数100,中位数99.74;(3)不能.【解析】()1由已知作出频率分布表为:质量指标值分组[)75,85[)85,95[)95,105[)105,115[)115,125频数 6 26 38 22 8 频率0.060.260.380.220.08由频率分布表作出这些数据的频率分布直方图为:()2质量指标值的样本平均数为:800.06900.261000.381100.221200.08100x =⨯+⨯+⨯+⨯+⨯=&, [)75,95Q 内频率为:0.060.260.32+=,∴中位数位于[)95,105内,设中位数为x ,则0.50.260.06951099.740.38x --=+⨯≈,∴中位数为99.74.()3质量指标值不低于95的产品所占比例的估计值为 0.380.220.080.68++=.由于该估计值小于0.8,故不能认为该企业生产的这种产品“质量指标值不低于95 的产品至少要占全部产品80%的规定. 21.(2019·兰州市第二十七中学高一期末)某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分): 甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.【答案】(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好【解析】(1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84. (2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36,2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2,则s 甲=26.36≈5. 13,s 乙=13.2≈3. 63.(3)由于x x <乙甲,则甲班比乙班平均水平低.由于S S >甲乙,则甲班没有乙班稳定. 所以乙班的总体学习情况比甲班好22.(2019·陕西高二期末(文))我校举行“两城同创”的知识竞赛答题,高一年级共有1200名学生参加了这次竞赛.为了解竞赛成绩情况,从中抽取了100名学生的成绩进行统计.其中成绩分组区间为[50,60),[60,70),[70,80),[80,90),[90,100],其频率分布直方图如图所示,请你解答下列问题:(1)求m 的值;(2)若成绩不低于90分的学生就能获奖,问所有参赛学生中获奖的学生约为多少人; (3)根据频率分布直方图,估计这次平均分(用组中值代替各组数据的平均值). 【答案】(1) 0.03m = (2)60人 (3)76分【解析】(1)由10(0.0050.020.040.005)1m ⨯++++=,解得0.03m = (2)学生成绩在[90,100]之间的频率为0.05,⨯=人故可估计所有参赛学生中能获奖的人数约为12000.0560⨯+⨯+⨯+⨯+⨯=分(3)平均分的估计值为:550.05650.2750.4850.3950.057623.(2020·全国高三专题练习)(本小题满分共12分)为了比较两种治疗失眠症的药(分别成为A药,B 药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h)实验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.41.6 0.5 1.8 0.62.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果来看,哪种药的效果好?(2)完成茎叶图,从茎叶图来看,哪种药疗效更好?【答案】(1)服用A药睡眠时间平均增加2.3;服用B药睡眠时间平均增加1.6;从计算结果来看,服用A药的效果更好;(2)A药B药6 0.8 9 5 6 52 5 8 2 5 1.7 9 234 6 8 1 27 8 2 3 5 6 7 9 3 4 2. 4 6 1 5 72 5 0 1 3. 2从茎叶图来看,A的数据大部分集中在第二、三段,B的数据大部分集中在第一、二段,故A药的药效好. 【解析】(1)设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得:=×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,=×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得>,因此可看出A药的疗效更好.(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.。
2024春高中数学第9章统计9-2用样本估计总体9-2-3总体集中趋势的估计课件新人教A版必修第二册
2
3
4
2.下列关于平均数、中位数、众数的说法中正确的是(
)
A.中位数可以准确地反映出总体的情况
B.平均数可以准确地反映出总体的情况
C.众数可以准确地反映出总体的情况
D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况
√
D
[中位数不受少数极端值的影响,对极端值的不敏感也会成为缺点,
故A错误;平均数可以较好地反映样本数据全体的信息,但是样本数据质
1.(1)已知一组数据x1,x2,x3,x4,x5的平均数是2,那么另一组数
据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为(
√
A.1
A
B.2
C.3
)
D.4
因为一组数据x1,x2,x3,x4,x5的平均数是2,所以另一组数据
2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为2×2-3=1.故
(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极
端值的影响大;中位数是样本数据所占频率的等分线,不受几个极
端值的影响;众数只能体现数据的最大集中点,无法客观反映总体
特征.
(2)当平均数大于中位数时,说明数据中存在许多较大的极端值.
[跟进训练]
3.如表是五年级两个班各11名同学1分钟仰卧起坐的成绩(单位:
10
157
=15.7,中位数为16,众数为18,则b=16,c=18,∴c>b>a.]
10
反思领悟 平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算中位数时,可先将这组数据
按从小到大或从大到小的顺序排列,再根据相关数据的总数是奇数
还是偶数而定;众数是看出现次数最多的数.
高中数学 三维设计 统计 用样本估计总体
9.2 用样本估计总体 9.2.1 总体取值规律的估计 9.2.2 总体百分位数的估计新课程标准新学法解读1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.2.结合实例,掌握用样本估计总体的取值规律.3.理解百分位数的统计含义,能用样本百分位数估计总体百分位数.1.会根据频率分布表估计总体,会利用频率分布直方图估计总体.2.对于频率分布直方图的相关问题需要重点掌握,了解其综合应用问题是本部分内容的难点.3.学会计算样本百分位数,会对总体百分位数做出合理估计.[思考发现]1.某班学生在一次数学考试中各分数段以及人数的成绩分布为:[0,80),2人;[80,90),6人;[90,100),4人;[100,110),10人;[110,120),12人;[120,130),5人;[130,140),4人;[140,150],2人.那么分数在[100,130)中的频数以及频率分别为( )A .27,0.56B .20,0.56C .27,0.60D .13,0.29解析:选C 由[100,130)中的人数为10+12+5=27(人),得频数为27,频率为2745=0.60.2.一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为( )A .10组B .9组C .8组D .7组解析:选A 由题意知,152-6010=9.2,故应分成10组.3.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有( )A .30辆B .40辆C .60辆D .80辆解析:选C由直方图知,时速在[50,60)内的频率为0.03×10=0.3,故此段内汽车有200×0.3=60辆.4.一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为() A.2 B.4C.6 D.8解析:选B频率=频数样本量,则频数=频率×样本量=0.125×32=4.5.某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.则甲得分的第50百分位数为________;乙得分的第75百分位数为_______.解析:把甲的得分由小到大排列为65,71,75,76,81,88,89,94,95,107,110.把乙的得分由小到大排列为79,83,86,88,93,98,98,99,101,103,114.由11×50%=5.5,可知甲得分的第50百分位数为6项数据,据此可得甲得分的第50百分位数为88;由11×75%=8.25,可知乙得分的第75百分位数为第9项数据,据此可得乙得分的第75百分位数为101.答案:88101[系统归纳]1.绘制频率分布直方图的步骤(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.[说明]频数分布直方图的纵坐标是频数,每一组数对应的矩形的高度与频数成正比;频率分布直方图的纵坐标是频率组距,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,所有矩形的面积之和为1.2.条形图、折线图及扇形图(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.3.百分位数(1)一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算一组几个数据第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i 是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.(3)四分位数即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.绘制频率分布直方图[例1]一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.65.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.75.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm 之间的麦穗所占的百分比.[解] (1)计算极差:7.4-4.0=3.4.(2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频率分布表:分组 频数 频率 [3.95,4.25) 1 0.01 [4.25,4.55) 1 0.01 [4.55,4.85) 2 0.02 [4.85,5.15) 5 0.05 [5.15,5.45) 11 0.11 [5.45,5.75) 15 0.15 [5.75,6.05) 28 0.28 [6.05,6.35) 13 0.13 [6.35,6.65) 11 0.11 [6.65,6.95) 10 0.10 [6.95,7.25) 2 0.02 [7.25,7.55] 1 0.01 合计1001.00(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm 之间的麦穗约占41%.绘制频率分布直方图应注意的2个问题(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频率/组距”所占的比例来定高.如我们预先设定以“”为一个单位长度,代表“0.1”,则若一个组的频率组距为0.2,则该小矩形的高就是“”(占两个单位长度),如此类推.(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.[变式训练]某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1)这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图.解:(1)这次测验成绩的最低分是32分,最高分是97分. (2)根据题意,列出样本的频率分布表如下:分组 频数 频率 [30,40) 1 0.02 [40,50) 6 0.12 [50,60) 12 0.24 [60,70) 14 0.28 [70,80) 9 0.18 [80,90) 6 0.12 [90,100] 2 0.04 合计501.00频率分布直方图如图所示.频率分布直方图的应用[例2]从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18]2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.[解](1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9. (2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)同一组中的每个数据用该组区间的中点值代替,则数据的平均数为:1×0.06+3×0.08+5×0.17+7×0.22+9×0.25+11×0.12+13×0.06+15×0.02+17×0.02=7.68(小时)所以样本中的100名学生该周课外阅读时间的平均数在第4组.频率分布直方图的性质(1)每个小矩形的面积表示样本数据落在该组内的频率. (2)所有小矩形的面积和等于1.(3)利用一组的频数和频率,可以求样本量.[变式训练]某电子商务公司对10 000名网络购物者2019年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________人.解析:(1)由0.1×1.5+0.1×2.5+0.1a +0.1×2.0+0.1×0.8+0.1×0.2=1,解得a =3. (2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6. 因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000(人). 答案:(1)3 (2)6 000总体百分位数的估计[例3] (1)为了解毕业生工作情况,某高校对12名应届毕业生起始月薪作了统计如下: 毕业生 起始月薪 毕业生 起始月薪 1 2 32 850 2 9503 0507 8 92 8903 130 2 9404 5 62 8802 7552 7101011123 3252 9202 880则第85百分位数是________.(2)考察某校高二年级男生的身高,随机抽取40名高二男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 160 168 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161请估计该校高二年级男生身高的第25,50,75百分位数.[解析](1)首先对数据排序:2 710 2 755 2 850 2 880 2 880 2 890 2 920 2 940 2 950 3 050 3 130 3 325所以i=12×85%=10.2.即第85百分位数是3 130.[答案] 3 130(2)把这40名男生的身高数据按从小到大排序,可得151 156 157 157 158 159 160 160 161 161 162 163 163 163 163 164 164 165 165 166 166 167 167 167 168 168 168 168 168 168 169 169 169 170 171 171 174 174 176 180由25%×40=10,50%×40=20,57%×40=30,可知样本数据的第25百分位数为161.5,第50百分位数为166,第75百分位数为168.5.据此可估计该校高二男生身高的第25,50,75百分位数分别约为161.5,166和168.5.总体百分位数估计需要注意的两个问题(1)总体百分位估计的基础是样本百分位数的计算,因此计算准确是关键;(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.[变式训练]某良种培育基地正在培育一种小麦新品种A,将其种植了25亩,所得亩产数据(单位:千克)如下:421, 399, 445,359, 415, 443,367,454,368,375, 392, 400, 423,405,412, 427,414, 423, 430, 388,430, 357,434, 445, 451试估计该品种小麦亩产的第80,95百分位数.解:将25个样本数据按从小到大排序,可得357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,4 45,445,451,454由80%×25=20,95%×25=23.75,可知样本数据的第80百分位数为438.5,第95百分位数为第24项数据,为451. 据此估计该品种小麦亩产的第80,95百分位数分别约为438.5和451.A级——学考合格性考试达标练1.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其累计频率为0.4,则这个样本的容量是()A.20B.40C.70 D.80解析:选A由已知不超过70分的人数为8,累计频率为0.4,则这个样本量n=80.4=20.故选A.2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为()A.20 B.30C.40 D.50解析:选B样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.故选B.3.如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.120 B.0.180C.0.012 D.0.018解析:选D由图可知纵坐标表示频率/组距,故x=0.1-0.054-0.010-0.006×3=0.018.故选D.4.某地农村2004年到2019年间人均居住面积的统计图如图所示,则增长最多的5年为( )A .2004年~2009年B .2009年~2014年C .2014年~2019年D .无法从图中看出解析:选C 2004年~2009年的增长量为3.1,2009年~2014年的增长量为3.2,2014年~2019年的增长量为3.8.故选C.5.观察下图所示的统计图,下列结论正确的是( )A .甲校女生比乙校女生多B .乙校男生比甲校男生少C .乙校女生比甲校男生少D .甲、乙两校女生人数无法比较解析:选D 图中数据只是百分比,甲、乙两个学校的学生人数不知道,因此男生、女生的具体人数也无法得知.故选D.6.900,920,920,930,930的20%分位数是________.解析:因为5×20%=1,所以该组数据的20%分位数是900+9202=910.答案:9107.某校高三(1)班共有40名学生,他们每天自主学习的时间全部在180分钟到330分钟之间,按他们学习时间的长短分5个组统计,得到如下频率分布表:第一组 [180,210) 4 0.10 第二组 [210,240) 8 s 第三组 [240,270) 12 0.30 第四组 [270,300) 10 0.25 第五组[300,330]6t则分布表中s ,t 的值分别为________,________. 解析:s =840=0.2,t =1-0.1-s -0.3-0.25=0.15.答案:0.200.158.甲、乙两个城市2019年4月中旬,每天的最高气温统计图如图所示,这9天里,气温比较稳定的城市是________.解析:从折线统计图中可以很清楚的看到乙城市的气温变化较大,而甲城市气温相对来说较稳定,变化基本不大.答案:甲9.某班50名同学参加数学测验,成绩的分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图.解:(1)频率分布表如下:分组频数频率[40,50)20.04[50,60)30.06[60,70)100.20[70,80)150.30[80,90)120.24[90,100]80.16(2)频率分布直方图如下:10.调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171163163166166168168160168165171169167169151168170168160174165168174159167156157164169180176157162161158164163163167161试估计该校高三年级男生的身高数据的30%分位数. 解:按从小到大排列原始数据151 156 157 157 158 159 160 160 161 161 162 163 163 163 163 164 164 165 165 166 166 167 167 167 168 168 168 168 168 168 169 169 169 170 171 171 174 174 176 180 i =40×30%=12为整数.又因第12项与第13项数据都是163,所以他们的平均数也为163. 所以估计该校高三年级男生的身高数据的30%分位数约为163.B 级——面向全国卷高考高分练1.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:组号 1 2 3 4 5 6 7 8 频数101314141513129第3组的频率和累积频率为( ) A .0.14和0.37 B.114和127C .0.03和0.06D.314和637解析:选A 由表可知,第三小组的频率为14100=0.14,累积频率为10+13+14100=0.37.故选A.2.某工厂对一批元件进行抽样检测.经检测,抽出的元件的长度(单位:mm)全部介于93至105之间.将抽出的元件的长度以2为组距分成6组:[93,95),[95,97),[97,99),[99,101),[101,103),[103,105],得到如图所示的频率分布直方图.若长度在[97,103)内的元件为合格品,根据频率分布直方图,估计这批元件的合格率是( )A .80%B .90%C .20%D .85.5%解析:选A 由频率分布直方图可知元件长度在[97,103)内的频率为1-(0.027 5+0.027 5+0.045 0)×2=0.8,故这批元件的合格率为80%.故选A.3.在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的14,已知样本量是80,则该组的频数为( )A .20B .16C .30D .35解析:选B 设该组的频数为x ,则其他组的频数之和为4x ,由样本量是80,得x +4x =80,解得x =16,即该组的频数为16.故选B.4.某厂对一批产品进行抽样检测,如图是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为[76,78),[78,80),…,[84,86].若这批产品有120个,估计其中净重大于或等于78克且小于84克的产品的个数是( )A .12B .18C .25D .90解析:选D 净重大于或等于78克且小于84克的频率为(0.100+0.150+0.125)×2=0.75,所以在该范围内的产品个数为120×0.75=90.故选D.5.如图是根据某中学为地震灾区捐款的情况而制作的统计图.已知该校在校学生3 000人,根据统计图计算该校共捐款________元.解析:根据统计图,得高一人数为3 000×32%=960(人), 捐款960×15=14 400(元);高二人数为3 000×33%=990(人),捐款990×13=12 870(元); 高三人数为3 000×35%=1 050(人),捐款1 050×10=10 500(元). 所以该校学生共捐款14 400+12 870+10 500=37 770(元). 答案:37 7706.5,6,7,8,9,10,11,12,13,14的25%分位数为________,75%分位数为________,90%分位数为________.解析:由于共有10个数字,则10×25%=2.5,10×75%=7.5,10×90%=9.故25%分位数为7,75%分位数为12,90%分位数为13+142=13.5.答案:7 12 13.57.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示).分组频数频率一组0≤t<500二组5≤t<10100.10三组10≤t<1510②四组15≤t<20①0.50五组20≤t≤25300.30合计100 1.00解答下列问题:(1)这次抽样的样本量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图;(3)旅客购票用时的平均数可能落在哪一组?解:(1)样本量是100.(2)第四组的频数①=100-30-10-10=50,第三组的频率②=1.00-0.30-0.50-0.10=0.10.所补频率分布直方图如图中的阴影部分.(3)设旅客平均购票用时为t min,则有0×0+5×10+10×10+15×50+20×30100≤t<5×0+10×10+15×10+20×50+25×30100,即15≤t<20.所以旅客购票用时的平均数可能落在第四组.C级——拓展探索性题目应用练为了了解某片经济林的生长情况,随机测量其中的100棵树的底部周长,得到如下数据(单位:cm):(2)画出频率分布直方图及频率折线图;(3)估计该片经济林中底部周长小于100 cm的树占多少,底部周长不小于120 cm的树占多少.解:(1)这组数据的最大的数为135,最小的数为80,最大的数与最小的数的差为55,可将该组数据分为11组,组距为5.频率分布表如下:(2)频率分布直方图和频率折线图如下图所示.(3)从频率分布表得,样本中底部周长小于100 cm 的频率为0.01+0.02+0.04+0.14=0.21,样本中底部周长不小于120 cm 的频率为0.11+0.06+0.02=0.19.所以估计该片经济林中底部周长小于100 cm 的树占21%,底部周长不小于120 cm 的树占19%.9.2.3 总体集中趋势的估计新课程标准新学法解读结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.阅读教材并通过复习回顾初中学习的众数、中位数、平均数概念,明确它们的统计含义.[思考发现]1.一组数据:85,88,73,88,79,85,其众数是( )A .88B .73C .88,85D .85解析:选C 该组数据85,88,73,88,79,85有两个众数,它们是88,85.故选C. 2.已知数据-3,-2,0,6,6,13,20,35,则它的中位数和众数各是( ) A .6和6 B .3和6 C .6和3D .9.5和6解析:选A ∵从小到大排列的这8个数,排在中间的两个数都是6,∴中位数是6;∵6出现的次数最多,∴众数是6,故选A.3.已知一组数据从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么这组数据的众数为( )A .5B .6C .4D .5.5解析:选B 由题意得12(4+x )=5,得x =6.4.已知一组数据0,2,x,4,5的众数是4,那么这组数据的平均数是________. 解析:∵数据0,2,x,4,5的众数是4,∴x =4,∴这组数据的平均数是15×(0+2+4+4+5)=3.答案:35.一组数据1,10,5,2,x,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的平均数为________.解析:根据题意知,该组数据的众数是2,则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x,5,10,则2+x 2=3,解得x =4,所以这组数据的平均数为x =16×(1+2+2+4+5+10)=4.答案:4[系统归纳]1.众数、中位数、平均数的理解(1)一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.[说明] 如果有几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数.(2)如果一组数有奇数个数,且按照从小到大排列后为x 1,x 2,…,x 2n +1,则称x n +1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x 1,x 2,…,x 2n ,则称x n +x n +12为这组数的中位数. (3)如果给定的一组数是x 1,x 2,…,x n ,则这组数的平均数为x =1n (x 1+x 2+…+x n ).众数、中位数、平均数都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.2.众数、中位数、平均数的比较息平均数代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据全体的信息任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大众数、中位数、平均数的计算[例1]某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群:13,13,14,15,15,15,15,16,17,17;乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?[解](1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+3+4+4+5+6+6+6+6+5610=15(岁),中位数为6岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.[变式训练]如果5个数x1,x2,x3,x4,x5的平均数是7,那么x1+1,x2+1,x3+1,x4+1,x5+1这5个数的平均数是()A.5 B.6C.7 D.8解析:选D 法一(定义法):依题意x 1+x 2+…+x 5=35,所以(x 1+1)+(x 2+1)+…+(x 5+1)=40,故所求平均数为405=8. 法二(性质法):显然新数据(记为y i )与原有数据的关系为y i =x i +1(i =1,2,3,4,5),故新数据的平均数为x +1=8.总体集中趋势的估计[例2] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数、中位数、平均分;(2)估计该校参加高二年级学业水平测试的学生的众数、中位数和平均数. [解] (1)①由题图知众数为70+802=75. ②由题图知,设中位数为x ,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x -70),所以x ≈73.3.③由题图知这次数学成绩的平均分为:40+502 ×0.005×10+50+602 ×0.015×10+60+702 ×0.02×10+70+802 ×0.03×10+80+902×0.025×10+90+1002×0.005×10=72.(2)由于数据是来自高二年级全部参加学业水平测试的学生的简单随机样本,所以可以估计高二年级参加学业水平测试的学生的众数是75,中位数是73.3,平均分是72.用频率分布直方图估计众数、中位数、平均数(1)众数:取最高小长方形底边中点的横坐标作为众数.(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x 轴交点的横坐标称为中位数.(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.[变式训练]为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则:(1)这20名工人中一天生产该产品的数量在[55,75)的人数是________; (2)这20名工人中一天生产该产品的数量的中位数为________; (3)这20名工人中一天生产该产品的数量的平均数为________. 解析:(1)(0.04×10+0.025×10)×20=13.(2)因为0.2+0.4>0.5,所以中位数一定在[55,65]之间,设中位数为x ,则0.2+(x -55)×0.04=0.5,x =62.5.(3)平均数为0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64. 答案:(1)13 (2)62.5 (3)64A 级——学考合格性考试达标练1.下列说法中,不正确的是( ) A .数据2,4,6,8的中位数是4,6 B .数据1,2,2,3,4,4的众数是2,4C .一组数据的平均数、众数、中位数有可能是同一个数据D .8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是8×5+7×311解析:选A 数据2,4,6,8的中位数为4+62=5,显然A 是错误的,B 、C 、D 都是正确的.故选A.2.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均数、众数、中位数分别是( )A .85分,85分,85分B .87分,85分,86分C .87分,85分,85分D .87分,85分,90分解析:选C 由题意知,该学习小组共有10人, 因此众数和中位数都是85(分),平均数为100+95+2×90+4×85+80+7510=87(分).故选C.3.某班50名学生的一次安全知识竞赛成绩分布如表所示:(满分10分)成绩(分) 0 1 2 3 4 5 6 7 8 9 10 人数(人) 0113561915这次安全知识竞赛成绩的众数是( ) A .5分 B .6分 C .9分D .10分解析:选C 根据众数是一组数据中出现次数最多的进行判断,由表中数据可知成绩9分出现了19次,最多,所以众数是9分. 故选C.4.统计学校排球队员的年龄,发现有12、13、14、15等四种年龄,统计结果如下表:年龄(岁) 12 13 14 15 人数(个)2468根据表中信息可以判断该排球队员年龄的平均数、众数、中位数分别为( ) A .13,15,14 B .14,15,14 C .13.5,15,14D .15,15,15 解析:选B 排球队员年龄的平均数 x =12×2+13×4+14×6+15×820=14,故平均数是14,15出现了8次,出现的次数最多,故众数是15.从小到大排列后,排在10、11两个位置的数是14,14,故中位数是14. 故选B.5.某市4月份日平均气温统计图情况如图所示,则在日平均气温这组数据中,众数和中位数分别是( )A .13,13B .13,13.5C .13,14D .16,13解析:选C ∵这组数据中,13出现了10次,出现次数最多,∴众数为13,∵第15个数和第16个数都是14,∴中位数是14.故选C.6.某医院急救中心随机抽取20位病人等待急诊的时间记录如下表: 等待时间[0,5)[5,10)[10,15)[15,20)[20,25](分钟)频数48521用上述分组资料计算出病人平均等待时间的估计值x=________.解析:x=120(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5.答案:9.57.若有一个企业,70%的员工年收入1万元,25%的员工年收入3万元,5%的员工年收入11万元,则该企业员工的年收入的平均数是________万元,中位数是________万元,众数是________万元.解析:年收入的平均数是1×70%+3×25%+11×5%=2(万元).因为70%的员工年收入1万元,其他的只占30%,所以年收入的中位数、众数都为1万元.答案:2118.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________件;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.解析:由分层抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为 1 020×50%+980×20%+1 030×30%=1 015(小时).答案:50 1 0159.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
易知调查的 100 位学生中阅读过《西游记》的学生人数为 70,所 以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为 70 =0.7. 100
答案:C 7.(2018·江苏卷)已知 5 位裁判给某运动员打出的分数的茎叶图如 图所示,那么这 5 位裁判打出的分数的平均数为________.
试验田.这 n 块地的亩产量(单位:kg)分别为 x1,x2,…,xn,下面给
出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn 的平均数 B.x1,x2,…,xn 的标准差
C.x1,x2,…,xn 的最大值 D.x1,x2,…,xn 的中位数 解析:统计问题中,体现数据的稳定程度的指标为数据的方差或
4.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游
服务质量,收集并整理了 2014 年 1 月至 2016 年 12 月期间月接待游客
量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是( )
-2-
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在 7,8 月
该班抽取 20 名学生,根据他们对语文、数学教师教学的满意度评分(百
分制),绘制茎叶图如下图所示.设该班学生对语文、数学教师教学的
满意度评分的中位数分别为 a,b,则( )
A.a<b
B.a>b
C.a=b
D.无法确定
解析:由茎叶图得:a=75+76=75.5,b=75+77=76,所以 a<b.
2
2
答案:A
解析:5 位裁判打出的分数分别是 89,89,90,91,91,则这 5 位裁判打出的分数的平均数为89+89+90+91+91=90.
5 答案:90 8.(2020·济南一中检测)已知样本容量为 200,在样本的频率分布 直方图中,共有 n 个小矩形,若中间一个小矩形的面积等于其余(n-1) 个小矩形面积和的1,则该组的频数为________.
D.各年 1 月至 6 月的月接待游客量相对于 7 月至 12 月,波动性
更小,变化比较平稳
解析:观察 2014 年的折线图,发现从 8 月至 9 月,以及 10 月开 始的三个月接待游客量都是减少的,故 A 选项是错误的.
答案:A 5.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了 n 块地作
×20=0.3.
所以该班学生人数 n=01.53=50.
答案:B
2.(2020·衡水中学检测)某学校为了了解本校学生的上学方式,在
全校范围内随机抽查部分学生,了解到上学方式主要有:A 结伴步行,
B 自行乘车,C 家人接送,D 其他方式,并将收集的数据整理绘制成
如下两幅不完整的统计图.根据图中信息,可知本次抽查的学生中 A
(1)按分层抽样的方法从质量落在[350,400),[400,450)的脐橙中 随机抽取 5 个,再从这 5 个脐橙中随机抽 2 个,求这 2 个脐橙质量至 少有一个不小于 400 克的概率;
(2)以各组数据的中间数值代表这组数据的平均水平,以频率代表 概率,已知该村的脐橙种植地上大约还有 100 000 个脐橙待出售,某电 商提出两种收购方案:
丢失,则依据此图可得:
Байду номын сангаас
(1)[25,30)年龄组对应小矩形的高度为________; (2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人 数为________. 解析:设[25,30)年龄组对应小矩形的高度为 h,则 5×(0.01+h +0.07+0.06+0.02)=1,解得 h=0.04.则志愿者年龄在[25,35)年龄组 的频率为 5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人 数约为 0.55×800=440. 答案:(1)0.04 (2)440 10.某公司为了解用户对其产品的满意度,从 A,B 两地区分别 随机调查了 40 个用户,根据用户对产品的满意度评分,得到 A 地区用 户满意度评分的频率分布直方图和 B 地区用户满意度评分的频数分布 表.
5
-7-
方差为 s2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31- 29)2]=3.6;
标准差为 s 甲= 3.6. 乙地 5 天的气温为 28,29,30,31,32, 其平均数为-x 乙=28+29+30+31+32=30;
5 方差为 s2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32- 30)2]=2; 标准差为 s 乙= 2,所以-x 甲<-x 乙,s 甲>s 乙.因此 AD 正确. 答案:AD 12.(2020·河北示范性高中模拟)某学校对 100 间学生公寓的卫生 情况进行综合评比,依考核分数分为 A,B,C,D 四个等级,其中分 数在[60,70)为 D 等级;分数在[70,80)为 C 等级;分数在[80,90)为 B 等级;分数在[90,100]为 A 等级,考核评估后,得其频率分布折线 图如图所示,估计这 100 间学生公寓评估得分的平均数是________.
A.所有脐橙均以 7 元/千克收购: B.低于 350 克的脐橙以 2 元/个收购,其余的以 3 元/个收购. 请你通过计算为该村选择收益较好的方案. (参考数据:225×0.05+275×0.16+325×0.24+375×0.3+425× 0.2+475×0.05=354.5) 解:(1)由题意得脐橙质量在[350,400)和[400,450)的比为 3∶2, 所以应分别在质量为[350,400)和[400,450)的脐橙中各抽取 3 个 和 2 个. 记抽取质量在[350,400)的脐橙为 A1,A2,A3,质量在[400,450) 的脐橙为 B1,B2. 则从这 5 个脐橙中随机抽取 2 个的情况共有以下 10 种:
具体值,给出结论即可);
B 地区用户满意度评分的频率分布直方图 (2)根据用户满意度评分,将用户和满意度分为三个等级:
满意度评分 低于 70 分 70 分到 89 分 不低于 90 分
满意度等级 不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由. 解:(1)作出频率分布直方图如图所示:
标准差.故选 B.
答案:B 6.(一题多解)(2019·全国卷Ⅲ)《西游记》《三国演义》《水浒传》
和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某
中学为了解本校学生阅读四大名著的情况,随机调查了 100 位学生,
其中阅读过《西游记》或《红楼梦》的学生共有 90 位,阅读过《红楼
梦》的学生共有 80 位,阅读过《西游记》且阅读过《红楼梦》的学生
共有 60 位,则该校阅读过《西游记》的学生人数与该校学生总数比值
的估计值为( )
A.0.5
B.0.6
C.0.7
D.0.8
-3-
解析:法一 设调查的 100 位学生中阅读过《西游记》的学生人 数为 x,则 x+80-60=90,解得 x=70,
所以该校阅读过《西游记》的学生人数与该校学生总数比值的估 计值为17000=0.7.
解析:所求平均分为(65×0.015+75×0.040+85×0.020+95× 0.025)×10=80.5.
答案:80.5 13.(2020·河北衡水调研)十九大提出:坚决打赢脱贫攻坚战,做 到精准扶贫.我省某帮扶单位为帮助定点扶贫村真正脱贫,坚持扶贫
-8-
同扶智相结合,帮助贫困村种植脐橙,并利用互联网电商进行销售, 为了更好销售,现从该村的脐橙树上随机摘下 100 个脐橙进行测重, 其质量分布在区间[200,500](单位:克),根据统计质量的数据作出频 率分布直方图如图所示:
-6-
通过两地区用户满意度评分的频率分布直方图可以看出,B 地区 用户满意度评分的平均值高于 A 地区用户满意度评分的平均值;B 地 区用户满意度评分比较集中,而 A 地区用户满意度评分比较分散.
(2)A 地区用户的满意度等级为不满意的概率大. 记 CA 表示事件:“A 地区用户的满意度等级为不满意”; CB 表示事件:“B 地区用户的满意度等级为不满意”. 由直方图得 P(CA)的估计值为(0.01+0.02+0.03)×10=0.6, P(CB)的估计值为(0.005+0.02)×10=0.25. 所以 A 地区用户的满意度等级为不满意的概率大.
-5-
A 地区用户满意度评分的频率分布直方图
B 地区用户满意度评分的频数分布表
满意度评 [50,60) [60,70) [70,80) [80,90) [90,100]
分分组
频数
2
8
14
10
6
(1)在下图中作出 B 地区用户满意度评分的频率分布直方图,并通
过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出
类人数是( )
A.30
B.40
-1-
C.42
D.48
解析:根据选择 D 方式的有 18 人,占 15%,得总人数为 18 = 15%
120, 故选择 A 方式的人数为 120-42-30-18=30.
答案:A 3.(2020·安徽省示范高中联考)为全面地了解学生对任课教师教学
的满意程度,特在某班开展教学调查.采用简单随机抽样的方法,从
3 解析:设除中间一个小矩形外的(n-1)个小矩形面积的和为 p,
-4-
则中间一个小矩形面积为 1p,p+1p=1,p=3,
3
3
4
则中间一个小矩形的面积等于 13p=14,200×14=50, 即该组的频数为 50.