高中数学:用样本估计总体练习
2021新教材人教版高中数学A版必修第二册模块练习题--总体取值规律的估计、总体百分位数的估计

9.2用样本估计总体9.2.1总体取值规律的估计9.2.2总体百分位数的估计基础过关练题组一频率分布表1.一个容量为80的样本中,数据的最大值是140,最小值是51,组距是10,则应将样本数据分为()A.10组B.9组C.8组D.7组2.一个容量为100的样本,其数据的分组与各组的频数如下:分组[0,10)[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数1213241516137则样本数据落在[10,40)上的频率为()A.0.13B.0.39C.0.52D.0.643.将容量为72的样本中的数据分成5组,已知第一组、第五组的频数,则第三组的频数为()都为8,第二组、第四组的频率都为29A.16B.20C.24D.364.某农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.56.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.65.36.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05.66.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.75.8 5.37.06.0 6.0 5.9 5.4 6.0 5.2 6.06.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表,并估计在这块试验田里长度在[5.75,6.35)之间的麦穗所占的百分比.题组二频率分布直方图5.一个样本量为100的样本的频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在[6,10)内的频数为a,样本数据落在[2,10)内的频率为b,则a,b分别为()A.32,0.4B.8,0.1C.32,0.1D.8,0.46.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=.7.某样本的频率分布直方图中共有8个小长方形,若最后一个小长方,且样本量为200,则第8形的面积等于其他7个小长方形的面积和的14组的频数为.8.某企业在2020年的招聘考试成绩中随机抽取100名应聘者的笔试成绩(单位:分),按成绩分组得到如下频率分布表:组号分组频数频率第1组[160,165)50.05第2组[165,170)①0.35第3组[170,175)30②第4组[175,180)200.20第5组[180,185]100.10合计100 1.00(1)请求出频率分布表中①②处应填写的数据,并完成如图所示的频率分布直方图;(2)为了选拔出最优秀的应聘者,该企业决定在笔试成绩高的第3,4,5组中用比例分配的分层随机抽样方法抽取6名应聘者进入第二轮面试,求第3,4,5组每组各应抽取多少名应聘者进入第二轮面试.题组三条形图、扇形图、折线图9.(多选)下列说法正确的是()A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽必须一样大D.频数分布直方图中每个小矩形的高就是该组的频数10.如图是根据某市3月1日至3月10日的最低气温(单位:℃)情况绘制的折线统计图,试根据折线统计图反映的信息完成下列问题.(1)绘制该市3月1日到3月10日最低气温(单位:℃)的扇形统计图;(2)绘制该市3月1日到3月10日最低气温(单位:℃)的条形统计图;(3)比较以上折线统计图、扇形统计图、条形统计图的特点.11.有一容量为200的样本,数据的分组以及各组的频数如下:分组[-20,-15)[-15,-10)[-10,-5)[-5,0)[0,5)[5,10)[10,15)[15,20]频数711154049412017(1)列出样本的频率分布表;(2)画出频率分布直方图和折线图;(3)求样本数据不足0的频率.题组四总体百分位数的估计12.某地8名新冠肺炎病患者的潜伏期(单位:天)分别为7,8,8,10,12,13,13,16,则它们的50%分位数是()A.10或12B.12C.10D.1113.已知100个数据的第75百分位数是9.3,则下列说法正确的是()A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据按从小到大的顺序排列后,9.3是第75个数据C.把这100个数据按从小到大的顺序排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据按从小到大的顺序排列后,9.3是第74个数据和第75个数据的平均数14.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的第30百分位数是.15.从某珍珠公司生产的珍珠中任意抽取12颗,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,75,95百分位数;(2)请找出珍珠质量较小的前15%的珍珠质量;(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.能力提升练题组一统计图、表的综合应用1.()在抽查某产品尺寸的过程中,将其尺寸分成若干个小组,[a,b)是其中一组,抽查出的个体数在该组内的频率为m,在频率分布直方图中该组的高度为h,则|a-b|=()A.hmB.mℎC.ℎmD.h+m2.(2019山西大同铁一中期末考试,)为了解某校高三学生的身体状况,用分层随机抽样的方法抽取部分男生和女生的体重,将男生体重的数据整理后,画出了如图所示的频率分布直方图,已知图中从左到右前三个小组的频率之比为1∶2∶3,第二小组的频数为12,若全校男、女生比例为3∶2,则全校抽取的学生数为.3.()为了了解学生参加体育活动的情况,某校对学生进行了随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少?”共有4个选项可供选择:A.1.5小时以上;B.1~1.5小时;C.0.5~1小时;D.0.5小时以下.下图是根据调查结果绘制的两幅不完整的统计图,请你根据统计图中提供的信息解答以下问题:(1)本次一共调查了多少名学生?(2)在图(1)中将选项B对应的部分补充完整;(3)若该校有3000名学生,试估计全校学生平均每天参加体育活动的时间在0.5小时以下的人数.题组二总体百分位数的估计4.(2020山东济南历城二中高一下5月学情检测,)已知甲、乙两组按顺序排列的数据:甲组:27,28,37,m,40,50;乙组:24,n,34,43,48,52.若这两组数据的第30百分位数、第50百分位数分别对应相等,则mn等于()A.127B.107C.43D.745.()如图是一样本的频率分布直方图,样本数据共分3组,分别为[5,10),[10,15),[15,20].估计样本数据的第60百分位数是(深度解析)A.14B.15C.16D.176.()从某校高一新生中随机抽取一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170, 170,171,x,174,175.若样本数据的第90百分位数是173,则x的值为()A.171B.172C.173D.1747.(2020福建师大附中高二期末,)从某保险公司的推销员中随机抽取50名,统计这些推销员某月的月销售额(单位:千元),由统计结果得如下频数分布表:月销售额分组[12.25,14.75)[14.75,17.25)[17.25,19.75)[19.75,22.25)[22.25,24.75]频数4102484(1)作出这些数据的频率分布直方图;(2)根据以上抽样调查数据,公司将推销员的月销售指标确定为17.875千元,试判断是否有60%的职工能够完成该销售指标.答案全解全析基础过关练1.B根据列频率分布表的步骤,得极差组距=140−5110=8.9,所以应将样本数据分为9组.2.C样本数据落在[10,40)上的频数为13+24+15=52,故其频率为52100=0.52.3.C由题意得,第二组、第四组的频数都为72×29=16,所以第三组的频数为72-2×8-2×16=24.4.解析(1)计算极差:7.4-4.0=3.4;(2)决定组距与组数:若取组距为0.3,则3.40.3≈11.3,即可以将这些数据分为12组,所以取组距为0.3,组数为12;(3)将数据分组:由于组距为0.3,12个组距的长度超过极差,所以可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值,按如下方式把样本数据以组距0.3分为12组:[3.95,4.25),[4.25,4.55),…,[7.25,7.55];(4)列频率分布表:分组频数频率[3.95,4.25)10.01[4.25,4.55)10.01[4.55,4.85)20.02[4.85,5.15) 5 0.05 [5.15,5.45) 11 0.11 [5.45,5.75) 15 0.15 [5.75,6.05) 28 0.28 [6.05,6.35) 13 0.13 [6.35,6.65) 11 0.11 [6.65,6.95) 10 0.10 [6.95,7.25) 2 0.02 [7.25,7.55] 1 0.01 合计1001.00从表中数据可以看到,样本数据落在[5.75,6.35)之间的频率是0.28+0.13=0.41,所以可以估计在这块试验田里长度在[5.75,6.35)之间的麦穗约占41%. 5.A 由样本的频率分布直方图知:落在[6,10)内的频率是4×0.08=0.32,∴a=100×0.32=32.落在[2,10)内的频率为4×(0.02+0.08)=0.4,∴b=0.4. 6.答案 60解析 设第一组至第六组数据的频率分别为2x,3x,4x,6x,4x,x,则2x+3x+4x+6x+4x+x=1,解得x=0.05,所以前三组数据的频率分别是0.1,0.15,0.2,所以(0.1+0.15+0.2)×n=27,解得n=60. 7.答案 40解析 设最后一个小长方形的面积为x,则其他7个小长方形的面积和为4x,从而x+4x=1,所以x=0.2.故第8组的频数为200×0.2=40. 8.解析 (1)由题意可知,第2组的频数为0.35×100=35,第3组的频率为30100=0.30,故①处应填35,②处应填0.30. 频率分布直方图如图所示.(2)因为第3,4,5组共有60名应聘者,所以利用分层随机抽样的方法在60名应聘者中抽取6名应聘者的抽样比为660=110,故第3组应抽取30×110=3名应聘者,第4组应抽取20×110=2名应聘者,第5组应抽取10×110=1名应聘者,所以第3,4,5组应抽取的应聘者人数分别为3,2,1.9.BD 频率分布直方图中每个小矩形的面积是该组的频率,且各个小矩形的面积之和为1,故A 错,B 正确;数据分组时,可以是等距的,也可以是不等距的,要根据数据的特点而定,所以频率分布直方图中各小矩形的宽不一定都是一样大的,故C 错;根据频数分布直方图的特点可知D 正确.10.解析该城市3月1日至3月10日的最低气温(单位:℃)情况如下表:日期12345678910最低气-3-20-1120-122温(℃)其中最低气温为-3℃的有1天,占10%;最低气温为-2℃的有1天,占10%;最低气温为-1℃的有2天,占20%;最低气温为0℃的有2天,占20%;最低气温为1℃的有1天,占10%;最低气温为2℃的有3天,占30%.(1)绘制的扇形统计图如图所示.(2)绘制的条形统计图如图所示.(3)折线统计图能很好地描述数据随时间的变化趋势;扇形统计图更多用于描述各类数据占总数的比例;从条形统计图中可以更直观地看出事物的不同类型或分组数据的频数和频率.11.解析(1)频率分布表如下:分组频数频率[-20,-15)70.035[-15,-10)110.055[-10,-5)150.075[-5,0)400.200[0,5)490.245[5,10)410.205[10,15)200.100[15,20]170.085合计2001(2)频率分布直方图和折线图如图所示.(3)样本数据不足0的频率为0.035+0.055+0.075+0.200=0.365.12.D50%分位数即中位数,为12×(10+12)=11.13.C因为100×75%=75,为整数,所以第75个数据和第76个数据的平均数为第75百分位数.14.答案8.4解析因为8×30%=2.4,所以30%分位数是第三个数据8.4.15.解析(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为12×25%=3,12×75%=9,12×95%=11.4,所以第25百分位数是8.0+8.32=8.15,第75百分位数是8.6+8.92=8.75,第95百分位数是第12个数据9.9.(2)因为12×15%=1.8,所以第15百分位数是第2个数据7.9,所以产品质量较小的前15%的珍珠有2个,它们的质量分别为7.8,7.9.(3)由(1)可知,样本数据的第25百分位数是8.15g,第50百分位数为8.5g,第95百分位数是9.9g,所以质量小于或等于8.15g的珍珠为次品,质量大于8.15g且小于或等于8.5g的珍珠为合格品,质量大于8.5g且小于或等于9.9g的珍珠为优等品,质量大于9.9g的珍珠为特优品.能力提升练1.B根据频率分布直方图中小矩形的高为频率组距,可知m|a-b|=h,所以|a-b|=mℎ.故选B.2.答案80解析由题图得,第四小组与第五小组的频率和为(0.0375+0.0125)×5=0.25.因为从左到右前三个小组的频率之比为1∶2∶3,第二小组的频数为12,所以前三个小组的频数和为36,所以抽取的男生数为361−0.25=48.因为全校男、女生比例为3∶2,所以全校抽取的学生数为48×53=80.3.解析(1)由题图知,选A的共60名学生,占总学生数的30%,所以总学生数为60÷30%=200,即本次一共调查了200名学生.(2)被调查的学生中,选B的有200-60-30-10=100(名),补充完整的条形图如图所示.(3)3 000×5%=150(名),估计全校有150名学生平均每天参加体育活动的时间在0.5小时以下.4.B 因为30%×6=1.8,50%×6=3,所以甲组数据的第30百分位数为28,乙组数据的第30百分位数为n,甲组数据的第50百分位数为37+m2,乙组数据的第50百分位数为34+432=772. 所以{28=n,37+m2=772,解得{n =28,m =40.所以m n =4028=107.5.A 第1组[5,10)的频率为0.04×(10-5)=0.20, 第2组[10,15)的频率为0.10×(15-10)=0.50, 所以第60百分位数是10+5×0.60−0.200.70−0.20=14.方法技巧本题还可以利用方程思想,通过列方程求解.设第60百分位数是x,则0.04×5+(x-10)×0.10=60%,解得x=14. 6.B 因为20×90%=18,所以第90百分位数是第18项和第19项数据的平均数,即12×(x+174)=173,所以x=172.7.解析 (1)根据题意作出频率分布表.月销售 额分组 [12.25, 14.75) [14.75, 17.25) [17.25, 19.75) [19.75, 22.25) [22.25, 24.75] 频数 4 10 24 8 4 频率 0.08 0.20 0.48 0.16 0.08作出频率分布直方图如图所示:(2)由(1)得,月销售额小于17.875千元的频率为0.08+0.2+17.875−17.2519.75−17.25×0.48=0.4.所以有60%的职工能够完成该销售指标.。
高中数学必修二 9 2 用样本估计总体(精讲)(含答案)

9.2 用样本估计总体(精讲)考法一总体取值规律的估计【例1】(2021·全国高一课时练习)某市2020年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空间质量为良;在101~150之间时,空间质量为轻微污染;在151~200之间时,空间质量为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.【答案】(1)频率分布表见解析;(2)频率分布直方图见解析;(3)该市空气质量有待进一步改善.【解析】(1)频率分布表(2)频率分布直方图(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的1 15;有26天处于良的水平,占当月天数的13 15;处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.【一隅三反】1.(2020·全国高一单元测试)某市为提倡节约用水,准备实行自来水“阶梯计费”方式,用户用水不超出基本用水量的部分享受基本价格,超出基本用水量的部分实行超价收费,为更好地决策,自来水公司随机抽取了部分用户的用水量数据,并绘制了如图不完整的统计图(每组数据包括右端点但不包括左端点),请你根据统计图解答下列问题:用户用水量频数直方图用户用水量扇形统计图(1)此次抽样调查的样本容量是________;(2)补全频数分布直方图,求扇形图中“15吨~20吨”部分的圆心角的度数;(3)如果自来水公司将基本用水量定为每户25吨,那么该地区6万用户中约有多少用户的用水全部享受基本价格.【答案】(1)答案见解析;(2)答案见解析,79.2°;(3)4.08万户.【解析】(1)1010%100÷=;(2)用水15~20吨的户数为100-10-36-24-8=22(户),“15~20吨”部分的圆心角的度数为22 36079.2100︒⨯=︒(3)1022366 4.08100++⨯=(万户)所以该地区6万用户中约有4.08万户的用水全部享受基本价格.2.(2020·全国高一单元测试)对某校高一年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M,p及图中a的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)内的人数. 【答案】(1)M =40,0.075p =,0.125a =;(2)90人. 【解析】(1)由[10,15)内的频数是10,频率是0.25知,100.25M=,所以M =40. 因为频数之和为40,所以10+25+m +2=40,m =3.330.07540p M ===. 因为a 是对应分组[15,20)的频率与组距的商,所以250.125405a ==⨯. (2)因为该校高一学生有360人,分组[10,15)内的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为3600.25⨯=90人.3.(2021·北京丰台区)为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50kW ·h 至350kW ·h 之间,进行适当分组后,画出频率分布直方图如图所示.(I )求a 的值;(Ⅱ)求被调查用户中,用电量大于250kW ·h 的户数;(III )为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW ·h )的建议,并简要说明理由. 【答案】(I )0.006;(Ⅱ)18;(III )245.5 kW ·h.【解析】(1)因为()0.00240.00360.00440.00240.0012501a +++++⨯=,所以0.006a =; (2)根据频率分布直方图可知:“用电量大于250kW ·h ”的频率为()0.00240.0012500.18+⨯=, 所以用电量大于250kW ·h 的户数为:1000.1818⨯=, 故用电量大于250kW ·h 有18户;(3)因为前三组的频率和为:()0.00240.00360.006500.60.8++⨯=<,前四组的频率之和为()0.00240.00360.0060.0044500.820.8+++⨯=>, 所以频率为0.8时对应的数据在第四组, 所以第一档用电标准为:0.80.620050245.50.22-+⨯≈kW ·h.故第一档用电标准为245.5 kW ·h.4.(2021·陕西咸阳市)某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.【答案】(Ⅰ)0.02;(Ⅱ)10800元. 【解析】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为: ()0.040.025309+⨯⨯=(天), 一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.考法二 总体百分数的估计【例2】(2020·天津和平区)已知一组数据为4,5,67,8,8,,第40百分位数是( ) A .8 B .7C .6D .5【答案】C【解析】因为有6位数,所以640 2.4⨯=%,所以第40百分位数是第三个数6.故选:C 【一隅三反】1.(2020·山东菏泽市·高一期末)数据1,2,3,4,5,6的60%分位数为( ) A .3 B .3.5C .3.6D .4【答案】D【解析】由6⨯60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数,故选:D2.(2021·山东高一期末)已知从某中学高一年级随机抽取20名女生,测量她们的身高(单位:cm ),把这20名同学的身高数据从小到大排序:148.0 149.0 150.0 152.0 154.0 154.0 155.0 155.5 157.0 157.0 158.0 159.0 161.0 162.0 163.0 164.0 165.0 170.0 171.0 172.0 则这组数据的第75百分位数是( ) A .163.0 B .164.0C .163.5D .164.5【答案】A【解析】因为这组数据从小到大已排序,所以这组数据的第75百分位数为第200.7515⨯=个数,即为163.0故选:A3.(2020·山东滨州市·高一期末)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[]0,10内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居号,他们的幸福感指数分别为5,6,7,8,9,5,则这组数据的第80百分位数是( ) A .7 B .7.5C .8D .9【答案】C【解析】该组数据从小到大排列为:5,5,6,7,8,9,且680% 4.8⨯=,故选:C.考法三 总体集中趋势的估计【例3】(2021·湖北荆州市)因受新冠疫情的影响,某企业的产品销售面临困难.为了改变现状,该企业欲借助电商和“网红”直播带货扩大销售.受网红效应的影响,产品销售取得了较好的效果.现将该企业一段时间内网上销售的日销售额统计整理后绘制成如下图所示的频率分布直方图:请根据图中所给数据,求: (1)实数a 的值;(2)该企业网上销售日销售额的众数和中位数; (3)该企业在统计时间段内网上销售日销售额的平均数. 【答案】(1)0.012;(2)55万元,57万元;(3)57.4万元. 【解析】(1)由频率分布直方图知:(0.0080.0160.0200.0180.0100.0042)101a ++++++⨯=,解得:0.012a =;(2)用频率分布直方图中最高矩形所在区间的中点值作为众数的近似值,得众数为55万元;因为第一个小矩形的面积为0.08,第二个小矩形的面积为0.12, 第三个小矩形的面积为0.16,0.080.120.160.36++=,设第四个小矩形中底边的一部分长为x ,则0.0200.50.36x ⨯=-,解得7x =, 所以中位数为50757+=万元; (3)依题意,日销售额的平均值为:250.08350.12450.16550.20650.18750.12850.10950.0457.4⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=所以该企业在统计时间段内网上销售日销售额的平均数为57.4万元. 【一隅三反】1.(2020·定边县第四中学高一期末)如图,从参加数学竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图,观察图形,回答下列问题:(Ⅰ)79.5-89.5这一组的频数、频率分别是多少? (Ⅱ)估计这次数学竞赛的平均成绩是多少?(Ⅲ)估计这次数学竞赛的及格率(60分及以上为及格). 【答案】(Ⅰ)15;0.25;(Ⅱ)70.5;(Ⅲ)75%. 【解析】(Ⅰ)79.589.5这一组的频率为0.025100.25⨯=,79.589.5这一组的频数为600.2515⨯=;(Ⅱ)估计这次数学竞赛的平均成绩是:44.50.154.50.1564.50.1574.50.384.50.2594.50.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.故估计这次数学竞赛的平均成绩是70.5.(Ⅲ)估计这次环保知识竞赛的及格率(60分及以上为及格)()10.010.0151075%P =-+⨯=. 2.(2021·河北唐山市·开滦第一中学高一期末)某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[)[)[]40,50,50,60,,90,100⋯后画出如下频率分布直方图.观察图形的信息,回答下列问题:(1)估计这次考试的众数m 与中位数n (结果保留一位小数); (2)估计这次考试的优秀率(80分及以上为及格)和平均分. 【答案】(1)75m =,73.3n =;(2)优秀率30%,平均分71分. 【解析】(1)众数是最高小矩形中点的横坐标,所以众数为75m =(分)前三个小矩形面积为0.01100.015100.015100.4⨯+⨯+⨯=, ∵中位数要平分直方图的面积, ∴0.50.47073.30.03n -=+=.(2)依题意,80及以上的分数所在的第五、六组, 频率和为 ()0.0250.005100.3+⨯=, 所以,抽样学生成绩的合格率是30%, 利用组中值估算抽样学生的平均分:450.1550.15650.15750.3850.25950.0571⨯+⨯+⨯+⨯+⨯+⨯=,估计这次考试的平均分是71分.3.(2021·吉林市)某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x 的值;并估计出月平均用水量的众数. (2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?【答案】(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【解析】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为(0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5,解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯=(3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++, ∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况,其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 考点四 总体离散程度的估计【例4】(2021·山东威海市·高一期末)如图所示的四组数据,标准差最小的是( )A .B .C .D .【答案】A【解析】对A ,()12106206302402516x =⨯+⨯+⨯+⨯=,s == 对B ,()16102202306402516x =⨯+⨯+⨯+⨯=,s == 对C ,()13105205303402516x =⨯+⨯+⨯+⨯=,10s ==, 对D ,()15103203305402516x =⨯+⨯+⨯+⨯=,s == 所以标准差最小的是A.故选:A.【一隅三反】1.(2020·全国高一)已知数据12,,,n x x x 的平均数为x ,方差为2s ,则123x +,223x +,…,23n x +的平均数和方差分别为( )A .x 和2sB .23x +和24sC .23x +和2sD .23x +和24129s s ++ 【答案】B【解析】因为数据12,,,n x x x 的平均数为x ,方差为2s ,所以123x +,223x +,…,23n x +的平均数和方差分别为23x +和24s故选:B2.(2020·安徽蚌埠市·蚌埠二中高一月考)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是( )A .17.2,3.6B .54.8,3.6C .17.2,0.4D .54.8,0.4 【答案】C【解析】设一组数据为i x (1,2,3,,)i n =,平均数为x ,方差为21s ,所得一组新数据为i y (1,2,3,,)i n =,平均数为y ,方差为22s ,则350i i y x =-(1,2,3,,)i n =,12 1.6n y y y y n +++==, 所以123503503501.6n x x x n -+-++-=, 所以350 1.6x -=,所以51.617.23x ==, 由题意得22222121()()() 3.6n s y y y y y y n ⎡⎤=-+-++-=⎣⎦, 所以222121(350 1.6)(350 1.6)(350 1.6) 3.6n x x x n⎡⎤--+--++--=⎣⎦, 所以2221219(17.2)(17.2)(17.2) 3.6n x x x n ⎡⎤⨯-+-++-=⎣⎦ 所以2221219()()() 3.6n x x x x x x n⎡⎤⨯-+-++-=⎣⎦, 所以219 3.6s =,所以210.4s =.故选:C.3.(2020·唐山市第十一中学)已知样本数据由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则a ,b 的值分别为( ).A .10,11B .10.5,9.5C .10.4,10.6D .10.5,10.5 【答案】D【解析】由于样本共有10个值,且中间两个数为a ,b ,依题意,得10.52a b +=,即21b a =-. 因为平均数为23371213.718.320101()0a b +++++++++÷=,所以要使该样本的方差最小,只需()()221010a b -+-最小.又()()()()222221010102110242221a b a a a a -+-=-+--=-+, 所以当4210.522a -=-=⨯时,()()221010a b -+-最小,此时10.5b =. 故选:D4.(2021·合肥市第六中学=)为了测试小班教学的实践效果,刘老师对A 、B 两班的学生进行了阶段测试,并将所得成绩统计如图所示;记本次测试中,A 、B 两班学生的平均成绩分别为A x ,B x ,A 、B 两班学生成绩的方差分别为2A s ,2B s ,则观察茎叶图可知( )A .AB x x <,22A B s s < B .A B x x >,22A B s s <C .A B x x <,22A B s s >D .A B x x >,22A B s s >【答案】B【解析】根据茎叶图中数据的分布可得,A 班学生的分数多集中在[]70,80之间, B 班学生的分数集中在[]50,70 之间,所以A B x x >.相对两个班级的成绩分布来说,A 班学生的分数更加集中,B 班学生的分数更加离散,所以22A B s s <.故选:B。
高中数学必修第二册用样本估计总体练习题(平均数、方差、众数、百分位数等)

用样本估计总体(平均数、众数、方差、百分位数等)一、单选题1.甲、乙、丙三人投掷飞镖,他们的成绩(环数)如下面的频数条形统计图所示.则甲、乙、丙三人训练成绩方差S甲2,S乙2,S丙2的大小关系是()A. S丙2<S乙2<S甲2B. S丙2<S甲2<S乙2C. S乙2<S丙2<S甲2D. S乙2<S甲2<S丙22.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花的纤维长度(棉花的纤维长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示.估计棉花的纤维长度的样本数据的80%分位数是()A. 28mmB. 28.5mmC. 29mmD. 29.5mm3.某校为了解高三年级学生在线学习情况,统计了2020年4月18日∼27日(共10天)学生在线学习人数及其增长比例数据,并制成如图所示的条形图与折线图的组合图.根据组合图判断,下列结论正确的是()A. 这10天学生在线学习人数的增长比例在逐日减小B. 前5天在线学习人数的方差大于后5天在线学习人数的方差C. 这10天学生在线学习人数在逐日增加D. 前5天在线学习人数增长比例的极差大于后5天在线学习人数增长比例的极差4.下列说法中,正确的是()A. 数据5,4,4,3,5,2的众数是4B. 一组数据的标准差的平方是这组数据的方差C. 数据2,3,4,5的方差是数据4,6,8,10的方差的一半D. 频率分布直方图中各小矩形的面积等于相应各组的频数5.为促进精准扶贫,某县计划引进一批果树树苗免费提供给贫困户种植.为了解果树树苗的生长情况,现从甲、乙两个品种中各随机抽取了100株,进行高度测量,并将高度数据制作成了如图所示的频率分布直方图.由频率分布直方图求得甲、乙两个品种高度的平均值都是66.5,用样本估计总体,则下列描述正确的是()A. 甲品种的平均高度高于乙品种,且乙品种比甲品种长的整齐B. 乙品种的平均高度高于甲品种,且甲品种比乙品种长的整齐C. 甲、乙品种的平均高度差不多,且甲品种比乙品种长的整齐D. 甲、乙品种的平均高度差不多,且乙品种比甲品种长的整齐6.从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位数分别为()A. 92,85B. 92,88C. 95,88D. 96,857.已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是13,那么另一组数3x1−2,3x2−2,3x3−2,3x4−2,3x5−2的平均数,方差分别是()A. 2,13B. 2,1 C. 4,3 D. 4,238.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数x8.68.98.98.2方差s2 3.5 3.5 2.1 5.6从这四人中选择一人参加奥运会射击项目比赛,最佳人选是()A. 甲B. 乙C. 丙D. 丁9.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B,则()A. x A>x B,s A>s BB. x A<x B,s A<s BC. x A>x B,s A<s BD. x A<x B,s A>s B10.某工厂的机器上有一种易损元件,这种元件发生损坏时,需要及时维修.现有甲、乙两名工人同时从事这项工作,下表记录了某月1日到10日甲、乙两名工人分别维修这种元件的件数.日期1日2日3日4日5日6日7日8日9日10日甲3546463784乙4745545547由于甲、乙的任务量大,拟增加工人,为使增加工人后平均每人每天维修的元件不超过3件,请利用上表数据估计最少需要增加工人的人数为()A. 2B. 3C. 4D. 5二、多选题(本大题共2小题,共10.0分)11.某赛季甲乙两名篮球运动员各6场比赛得分情况如表:场次123456甲得分31162434189乙得分232132113510则下列说法正确的是()A. 甲运动员得分的极差小于乙运动员得分的极差B. 甲运动员得分的中位数小于乙运动员得分的中位数C. 甲运动员得分的平均值大于乙运动员得分的平均值D. 甲运动员的成绩比乙运动员的成绩稳定12.一组样本数据的频率分布直方图如图所示,每组数据取中间值为代表,则下列说法正确的是()A. 此样本数据的中位数估计值为12B. 此样本数据的众数估计值为12C. 此样本数据的均值估计值为11.52D. 若将样本数据中每个数扩大1倍,则数据的方差也扩大1倍第II卷(非选择题)三、单空题13.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值分别为.14.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第百分位数.15.为了解中学生课外阅读情况,现从某中学随机抽取200名学生,收集了他们一年内的课外阅读量(单位:本)等数据,图是根据数据绘制的统计图表的一部分.下面有四个推断:①这200名学生阅读量的平均数可能是26本;②这200名学生阅读量的75%分位数在区间[30,40)内;③这200名学生中的初中生阅读量的中位数一定在区间[20,30)内;④这200名学生中的初中生阅读量的25%分位数可能在区间[20,30)内.所有合理推断的序号是.四、多空题16.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)年龄组[25,30)对应小长方形的高度为;(2)由频率分布直方图估计这800名志愿者年龄的85%分位数为岁.(精确到0.01)五、解答题17.某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率分布直方图,已知第一组有5人.(1)求x;(2)求抽取的x人的年龄的50%分位数(结果保留整数);(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“一带一路”的认知程度,并谈谈你的感想.18.某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式.(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值.(3)根据(2)中求得的数据计算用电量的75%分位数.19.某校研究性学习课题小组为了了解某市工薪阶层的工资水平,从该市工薪阶层中随机调查了50位市民,调查结果如下表.(1)完成下图的月收入频率分布直方图(注意填写纵坐标);(2)估计该市市民月收入的第25和70百分位数.20.起源于汉代的“踢键子”运动,虽有两千多年历史,但由于简便易行,至今仍很流行.某校为丰富课外活动、增强学生体质,在高一年级进行了“踢键子”比赛,以学生每分钟踢毯子的个数记录分值,一个记一分.参赛学生踢键子的分值均在40∼100分之间,从中随机抽取了100个样本学生踢键子的成绩进行统计分析,绘制了如图所示的频率分布直方图,并称得分在80∼90之间为“踢毽健将”,90分以上为“踢建达人”.(1)求样本的平均值x(同一组数据用该区间的中点值代替);(2)求下列数据的四分位数.13,15,12,27,22,24,28,30,31,18,19,20.(3)求上述数据的40百分位数。
高考数学一轮复习第十章概率、随机变量及其分布课时规范练51随机抽样、用样本估计总体

课时规范练51随机抽样、用样本估计总体基础巩固组1.(2020天津耀华中学高一期末)已知一组数据为4,5,6,7,8,8,40%分位数是()A.8B.7C.6D.52.(多选)(2020江苏泗洪质检)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有()A.应该采用分层随机抽样法B.高一、高二年级应分别抽取100人和135人C.乙被抽到的可能性比甲大D.该问题中的总体是高一、高二年级的全体学生的视力3.(多选)(2020江苏启东高一期末)某人射箭9次,射中的环数依次为7,8,9,7,6,9,8,10,8,关于这组数据,下列说法正确的是()A.这组数据的众数是8B.这组数据的平均数是8C.这组数据的中位数是6D.这组数据的方差是434.将甲、乙两个篮球队10场比赛的得分数据整理成如图所示的茎叶图,由图可知()A.甲队得分的众数是3B.甲、乙两队得分在[30,39)内的频率相等C.甲、乙两队得分的极差相等D.乙队得分的中位数是38.55.(2020陕西榆林高三四模)港珠澳大桥位于中国广东省珠江口伶仃洋海域内,是中国境内一项连接香港、珠海和澳门的桥隧工程,因其超大的建筑规模、空前的施工难度和顶尖的建造技术而闻名世界.2018年10月24日上午9时开通运营后香港到澳门之间4个小时的陆路车程极大缩短.为了解实际通行所需时间,随机抽取了n台车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在[35,50]内,按通行时间分为[35,38),[38,41),[41,44),[44,47),[47,50]五组,其中通行时间在[38,47)内的车辆有182台,频率分布直方图如图所示,则n=()A.280B.260C.250D.2006.(2020天津一中高三月考)某社区组织“学习强国”的知识竞赛,从参加竞赛的市民中抽出40人,将其成绩分成以下6组:第1组[40,50),第2组[50,60),第3组[60,70),第4组[70,80),第5组[80,90),第6组[90,100],得到如图所示的频率分布直方图.现采用分层随机抽样的方法,从第2,3,4组中抽取8人,则第2,3,4组抽取的人数依次为()A.1,3,4B.2,3,3C.2,2,4D.1,1,67.(2020山东泰安高一期末)某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x ,174,175,若样本数据的90%分位数是173,则x 的值为.8.(2020北京密云高三质检)某校高一年级三个班共有学生120名,这三个班的男生、女生人数如下表所示,已知在全年级中随机抽取1名学生,抽到二班女生的概率是0.2,则x=.现用分层随机抽样的方法在全年级抽取30名学生,则应在三班抽取的学生人数为.班级一班二班三班女生人数20x y 男生人数2020z 综合提升组9.(多选)(2020山东淄博高三质检)某学校为了调查学生一周内在生活方面的支出情况,抽出了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60)内的学生有60人,则下列说法正确的是()A.样本中支出在[50,60)内的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2000名学生,则定有600人支出在[50,60)内10.在《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?则下列说法错误的是()A.甲应付5141109钱B.乙应付3224109钱C.丙应付1656109钱D.三者中甲付的钱最多,丙付的钱最少11.(多选)(2020山东嘉祥一中高三月考)在某次高中学科知识竞赛中,对4000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],60分以下视为不及格,若同一组中数据用该组区间中点值作代表,则下列说法中正确的是()A.成绩在[70,80)内的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分12.(2020江西九江高三模拟)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是()A.17.2,3.6B.54.8,3.6C.17.2,0.4D.54.8,0.413.(2020福建福州高二期中)为让学生适应新高考的赋分模式,某校在一次校考中使用赋分制给高二年级学生的生物成绩进行赋分,具体方案如下:A等级,排名等级占比7%,分数区间是83—100;B等级,排名等级占比33%,分数区间是71—82;C等级,排名等级占比40%,分数区间是59—70;D等级,排名等级占比15%,分数区间是41—58;E等级,排名等级占比5%,分数区间是30—40.现从全年段的生物成绩中随机抽取100名学生的原始成绩(未赋分)进行分析,其频率分布直方图如图所示:(1)求图中a的值;(2)以样本估计总体的办法,估计该校本次生物成绩原始分不少于多少分才能达到赋分后的C等级及以上(含C等级);(3)若采用分层抽样的方法,从原始成绩在[40,50)和[50,60)内的学生中共抽取5人,查看他们的答题情况来分析知识点上的缺漏,再从中选取2人进行调查分析,求这2人中至少一人原始成绩在[40,50)内的概率.创新应用组14.(多选)(2020重庆巴蜀中学高三月考)气象意义上从春季进入夏季的标志为:“连续5天每天日平均温度不低于22℃”.现有甲、乙、丙三地连续5天日平均温度的记录数据(数据都是正整数,单位:℃)满足以下条件:甲地:5个数据的中位数是24,众数是22;乙地:5个数据的中位数是27,平均数是24;丙地:5个数据有1个是32,平均数是26,方差是10.2,则下列说法正确的是()A.进入夏季的地区至少有2个B.丙地区肯定进入了夏季C.不能肯定乙地区进入夏季D.不能肯定甲地区进入夏季15.如图是某城市100户居民的月平均用电量(单位:度)的频率分布直方图.(1)求频率分布求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?参考答案课时规范练51随机抽样、用样本估计总体1.C因为有6位数,所以6×40%=2.4,所以40%分位数是第三个数6.2.ABD由于各年级的年龄段不一样,因此应采用分层随机抽样法.由于比例为23520×50+30×45=110,因此高一年级1000人中应抽取100人,高二年级1350人中应抽取135人,甲、乙被抽到的可能性都是110,因此只有C不正确,故选ABD.3.ABD数据从小到大排列为6,7,7,8,8,8,9,9,10,所以众数为8,故A正确;中位数为8,故C错误;平均数为6+7+7+8+8+8+9+9+109=8,故B正确;方差为19×[(6-8)2+(7-8)2×2+(8-8)2×3+(9-8)2×2+(10-8)2]=43,故D正确.4.D甲队得分的众数是33和35,故A错误;甲、乙两队得分在[30,39)内的频率分别为25和310,所以甲、乙两队得分在[30,39)内的频率不相等,故B错误;甲队得分的极差为51-24=27,乙队得分的极差为52-22=30,所以甲、乙两队得分的极差不相等,故C错误;乙队得分的中位数是34+432=38.5,故D正确.故选D.5.D由题意可知,通行时间在[38,47)内的频率为1-(0.01+0.02)×3=0.91,所以182=0.91,所以n=200.6.C由图可知第2,3,4组的频率之比为0.15∶0.15∶0.3,所以频数之比为1∶1∶2,现采用分层随机抽样的方法,从第2,3,4组中抽取8人,所以第2,3,4组抽取的人数依次为2,2,4.7.17290%分位数是173,所以r1742=173,x=172.8.249由题意可得120=0.2,解得x=24.三班总人数为120-20-20-24-20=36,用分层随机抽样的方法在全年级抽取30名学生,每个学生被抽到的概率为30120=14,故应从三班抽取的人数为36×14=9.9.BC样本中支出在[50,60)内的频率为1-(0.01+0.024+0.036)×10=0.3,故A错误;样本中支出不少于40元的人数为0.0360.03×60+60=132,故B正确;n=600.3=200,故n的值为200,故C正确;若该校有2000名学生,则可能有0.3×2000=600(人)支出在[50,60)内,故D错误.10.B依题意由分层随机抽样可知,100÷(560+350+180)=10109,则甲应付10109×560=5141109(钱);乙应付10109×350=3212109(钱);丙应付10109×180=1656109(钱).11.ABC由频率分布直方图可得,成绩在[70,80)内的频率最高,因此考生人数最多,故A正确;成绩在[40,60)内的频率为0.01×10+0.015×10=0.25,因此,不及格的人数为4000×0.25=1000,故B 正确;考生竞赛成绩的平均分约为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;因为成绩在[40,70)内的频率为0.45,在[70,80)内的频率为0.3,所以考生竞赛成绩的中位数为70+10×0.050.3≈71.67(分),故D错误.12.C设一组数据为x i(i=1,2,3,…,n),平均数为,方差为12,所得一组新数据为y i(i=1,2,3,…,n),平均数为,方差为22,则y i=3x i-50(i=1,2,3,…,n),=1+2+…+=1.6,即31-50+32-50+…+3-50=1.6,所以3-50=1.6,所以=51.63=17.2.22=1[(y1-)2+(y2-)2+…+(y n-)2]=1[(3x1-50-1.6)2+(3x2-50-1.6)2+…+(3x n-50-1.6)2]=1×9[(x1-17.2)2+(x2-17.2)2+…+(x n-17.2)2]=1×9[(x1-)2+(x2-)2+…+(x n-)2]=3.6,所以912=3.6,所以12=0.4.故选C.13.解(1)由题意(0.010+0.015+0.015+a+0.025+0.005)×10=1,所以a=0.030.(2)由已知等级达到C及以上所占排名等级占比为7%+33%+40%=80%,假设原始分不少于x分可以达到赋分后的C等级及以上,则有(0.005+0.025+0.030+0.015)×10+(60-x)×0.015=0.8,所以x≈57.估计原始分不少于57分才能达到赋分后的C等级及以上.(3)由题知评分在[40,50)和[50,60)内的频率分别为0.1和0.15,则抽取的5人中,评分在[40,50)内的有2人,评分在[50,60)内的有3人,记评分在[50,60)内的3位学生为a,b,c,评分在[40,50)内的2位学生为D,E,则从5人中任选2人的所有可能结果为:(a,b),(a,c),(a,D),(a,E),(b,c),(b,D),(b,E),(c,D),(c,E),(D,E),共10种,其中,这2人中至少一人评分在[40,50)内的可能结果为(a,D),(a,E),(b,D),(b,E),(c,D),(c,E),(D,E),共7种.所以这2人中至少一人评分在[40,50)内的概率为710.14.ABC甲地:5个数据由小到大排,则22,22,24,a,b,其中24<a<b,满足进入夏季的标志;乙地:将5个数据由小到大排,则a,b,27,c,d,其中a≤b≤27≤c≤d,则27+c+d≥81,而a+b+27+c+d=120,故a+b≤39,其中必有一个小于22,故不满足进入夏季的标志;丙地:设5个数据为a,b,c,d,32,且a,b,c,d∈N*,由方差公式可知:(a-26)2+(b-26)2+(c-26)2+(d-26)2+(32-26)2=10.2×5=51,则(a-26)2+(b-26)2+(c-26)2+(d-26)2=15=9+4+1+1,不妨设|a-26|=3,|b-26|=2,|c-26|=|d-26|=1,则a,b,c,d均大于22,满足进入夏季标准.综上,ABC正确.15.解(1)由频率分布直方图得20×(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)=1,解得x=0.0075.(2)由频率分布直方图知众数为230,用电量在[160,220)的频率是20×(0.002+0.0095+0.011)=0.45,用电量在[220,240)的频率为0.0125×20=0.25,设中位数为m,则-22020=0.5-0.450.25,解得m=224,即中位数是224.(3)由频率分布直方图知月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户的频率依次为0.25,0.15,0.1,0.05,则月平均用电量在[220,240)的用户中应抽取户数为0.250.25+0.15+0.1+0.05×11=5,应抽取5户.。
05-第四节 用样本估计总体的数字特征-课时1 样本的数字特征高中数学必修一北师大版

等待时间
[0,5)
[5,10)
[10,15)
[15,20)
[20,25]
频数
4
8
5
2
1
9.5
则估计该医院急救中心病人的平均等待时间为____,病人等待时间的方差
28.5
为_____.
【解析】 记20位病人的平均等待时间为,等待时间的方差为 2 ,则
若在这组数据中插入一个自然数使得这组新数据满足中位数是7且平均数
4(答案不唯一)
大于7,则的值可以是_________________(写出符合条件的一个值即可).
【解析】 要使得中位数是7,必须插在7的前面,即 ≤ 7,平均数为
2+3+6++7+8+10+11+13
9
> 7,解得 > 3,又是自然数,所以 = 4,5,6,7.
[70,75), [75,80),[80,85), [85,90),[90,95),[95,100],则下列说法正确
的是( ACD )
A.估计该样本的众数是87.5
B.估计该样本的平均数是80
C.估计该样本的中位数是86
D.若测试成绩达到85分方可参加评奖,
则有资格参加评奖的大一新生约为
2 200人
【解析】 由题意,将这组数据按照从小到大的顺序排列,得1,2,2,,5,10,易
2+
2+
2
得这组数据的众数为2,中位数为 .又2 =
× ,所以
2
2
3
1
据的平均数为 × 1 + 2 + 2 + 4 + 5 + 10 = 4.
2025版高考数学总复习第9章统计成对数据的统计分析第1讲随机抽样用样本估计总体提能训练

第1讲 随机抽样 用样本估计总体A 组基础巩固一、单选题1.(2024·陕西汉中模拟)某射击运动员连续射击5次,命环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为( B )A .7.6B .7.8C .8D .8.2[解析] 由题意可知该组数据为6,7,8,9,9,∴平均数x =6+7+8+9+95=7.8.故选B.2.(2023·陕西西安联考)某社区有1 500名老年居民、2 100名中青年居民和1 800名儿童居民.为了解该社区居民对社区工作的满意度,现采用分层抽样的方法从这些居民中抽取一个容量为n 的样本,若中青年居民比老年居民多抽取20人,则n =( C )A .120B .150C .180D .210[解析] 由题可知⎝ ⎛⎭⎪⎫2 1001 500+2 100+1 800- 1 5001 500+2 100+1 800×n =20,解得n =180.故选C.3.(2023·湖南部分学校联考)已知某班共有学生46人,该班语文老师为了了解学生每天阅读课外书籍的时长情况,决定利用随机数表法从全班学生中抽取10人进行调查.将46名学生按01,02,…,46进行编号.现提供随机数表的第7行至第9行:84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 56 57 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 32 21 12 34 29 78 64 56 07 82 82 42 07 44 38 15 51 00 13 42 99 66 02 79 54 若从表中第7行第41列开始向右依次读取2个数据,每行结束后,下一行依然向右读数,则得到的第8个样本编号是( D )A .07B .12C .39D .44 [解析] 依次抽取的样本编号为12,06,01,16,19,10,12,07,44,39,38.剔除重复号码12,故选D.4.(2024·江苏南京六校联合调研)已知样本数据3x 1+1,3x 2+1,3x 3+1,3x 4+1,3x 5+1,3x 6+1的平均数为16,方差为9,则另一组数据x 1,x 2,x 3,x 4,x 5,x 6,12的方差为( C )A.467B .477C .487D .7[解析] 设数据x 1,x 2,x 3,x 4,x 5,x 6的平均数为x ,方差为s 2,由3x +1=16,9s2=9,得x =16∑i =16x i =5,s 2=16∑i =16 (x i -5)2=1,则x 1,x 2,x 3,x 4,x 5,x 6,12的平均数为5×6+127=6,方差为∑i =16x i -62+12-627=∑i =16x i -5-12+367=∑i =16x i -52-2∑i =16x i -5+1×6+367=∑i =16x i -52-2∑i =16x i +1027=6s 2-2×6x +1027=487.故选C.5.(2022·全国高考甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识,为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( B )A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差[解析] 讲座前中位数为70%+75%2>70%,所以A 错;讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B 对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C 错;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D 错.故选B.6.(2024·四川南充高级中学月考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( D )A.100,10 B.100,20C.200,10 D.200,20[解析]依题意可得样本容量为(3 500+2 000+4 500)×2%=200,其中高中生抽取2 000×2%=40人,因为样本中高中生的近视率为50%,所以抽取的高中生近视人数为40×50%=20人;故选D.7.(2024·江苏基地校大联考改编)如图为甲、乙两人在同一星期内每日步数的折线统计图,则下列结论错误的是( C )A.这一星期内甲的日步数的中位数为11 600B.这一星期内甲的日步数的极差大于乙的日步数的极差C.这一星期内乙的日步数的方差大于甲的日步数的方差D.这一星期内乙的日步数的下四分位数是7 030[解析]甲的步数从小到大排列为:2 435,7 965,9 500,11 600,12 700,16 000,16 800,中位数是11 600.故A正确;这一星期内甲的日步数的极差16 800-2 435=14 365,这一星期内乙的日步数的极差14 200-5 340=8 860,这一星期内甲的日步数的极差大于乙的日步数的极差,故B正确;由图知甲的波动程度大,故方差大故C错误;乙的步数从小到大排列为:5 340,7 030,10 060,11 600,12 300,12 970,14 200,7×25%=1.75,故这一星期内乙的日步数为25%分位数是7 030,故D正确.故选C.8.(2023·江西赣州模拟)某校随机抽取了100名学生测量体重,经统计,这些学生的体重数据(单位:kg)全部介于45至70之间,将数据整理得到如图所示的频率分布直方图,则下列结论错误的是( D )A .频率分布直方图中a 的值为0.07B .这100名学生中体重低于60 kg 的人数为70C .据此可以估计该校学生体重的第78百分位数约为62D .据此可以估计该校学生体重的平均数约为56.25[解析] 因为5×(0.01+0.02+0.04+0.06+a )=1,解得a =0.07,所以A 正确;体重低于60 kg 的频率为5×(0.01+0.06+0.07)=0.7,所以人数为0.7×100=70,所以B 正确;因为5×(0.01+0.06+0.07)=0.7,5×(0.01+0.06+0.07+0.04)=0.9,所以体重的第78百分位数位于[60,65)之间,设体重的第78百分位数为x ,则(0.01+0.07+0.06)×5+(x -60)×0.04=0.78,解得x =62,所以C 正确;体重的平均数约为0.01×5×47.5+0.07×5×52.5+0.06×5×57.5+0.04×5×62.5+0.02×5×67.5=57.25,所以D 错误.故选D.二、多选题9.(2024·安徽安庆、池州、铜陵部分学校联考)甲乙两名射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4 乙9578768677则A .甲乙两人射击成绩的平均数相同 B .甲乙两人射击成绩的中位数相同 C .甲命中环数的极差大于乙命中环数的极差 D .甲比乙射击成绩更稳定[解析] 可求甲乙平均数为x 1=x 2=7,中位数均为7,故A ,B 正确;甲的极差为6,乙的极差为4,故C 正确;甲的方差为:17×(1+4+4+9+4+9+9)=407,乙的方差为:17×(4+4+1+1+1+1)=127,故D 错误.10.(2024·湖北宜荆荆恩联考、广东深圳宝安区调研)下列说法正确的有( AC )A .从40个个体中随机抽取一个容量为10的样本,则每个个体被抽到的概率都是0.25B .已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是5C .数据26,11,14,31,15,17,19,23的50%分位数是18D .若样本数据x 1,x 2,…,x n 的标准差为4,则数据2x 1+1,2x 2+1,…,2x n +1的标准差为16[解析] 从40个个体中随机抽取一个容量为10的样本,则每个个体被抽到的概率都是1040=0.25,故A 正确;已知一组数据1,2,m,6,7的平均数为4,则m =4×5-(1+2+6+7)=4,这组数据的方差为15×[(1-4)2+(2-4)2+(4-4)2+(6-4)2+(7-4)2]=265,故B 错误;这组数据从小到大排列为:11,14,15,17,19,23,26,31,共8个,故其50%分位数为第4个数17和第5个数19的平均数,为18,故C 正确;若样本数据x 1,x 2,…,x n 的标准差为4,则方差为16,故数据2x 1+1,2x 2+1,…,2x n +1的方差为16×22=64,标准差为8,故D 错误.故选AC.11.(2024·江西南昌摸底)“未来之星”少儿才艺大赛,选手通过自我介绍和才艺表演,展示仪表形象、表达能力、风度气质等自身的整体形象,评委现场打分.若九位评委对某选手打分分别是x 1,x 2,…,x 9,记这组数据的平均分、中位数、标准差、极差分别为x ,z ,s ,j ,去掉这组数据的一个最高分和一个最低分后,其平均分、中位数、标准差、极差分别为x ′,z ′,s ′,j ′,则下列判断中一定正确的是( BCD )A.x =x ′ B .z =z ′ C .s ≥s ′D .j ≥j ′[解析] 根据平均数的性质可知x =x ′不一定成立,例如九个数一个90,其他都是80,显然该等式不成立,因此A 不正确;根据中位数的定义可知这九个数据从小到大排列,中间的一个数据是中位数,去掉最高和最低不影响中间的数据,所以B 正确;根据标准差的意义可知去掉最高和最低分,数据有可能会更集中,所以选项C 正确;因为去掉最高和最低分,极差有可能减小,所以选项D 正确,故选BCD.12.(2024·江西新余一中开学考)下列命题是真命题的有( BD )A .分层抽样调查后的样本中甲、乙、丙三种个体的比例为3∶1∶2,如果抽取的甲个体数为9,则样本容量为30B .某一组样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在区间[114.5,124.5]内的频率为0.4C .甲、乙两队队员体重的平均数分别为60,68,人数之比为1∶3,则甲、乙两队全部队员体重的平均数为67D .一组数6,5,4,3,3,3,2,2,2,1的85%分位数为5[解析] 根据样本的抽样比等于各层的抽样比,样本容量为9÷33+1+2=18,故选项A 错误;样本数据落在区间[114.5,124.5]内的有120,122,116,120共4个,所以样本数据落在区间[114.5,124.5]内的频率为410=0.4,故选项B 正确;甲、乙两队的人数之比为1∶3,则甲队队员在所有队员中所占权重为11+3=14,乙队队员在所有队员中所占权重为31+3=34,则甲、乙两队全部队员体重的平均数为x =14×60+34×68=66,故选项C 错误;将该组数据从小到大排列为:1,2,2,2,3,3,3,4,5,6,由10×85%=8.5,则该组数据的85%分位数是第9个数,该数为5,故选项D 正确.13.(2024·陕西西安、河北保定部分学校联考)某公司统计了2023年1月至6月的月销售额(单位:万元),并与2022年比较,得到同比增长率数据,绘制了如图所示的统计图,则下列说法正确的是( ACD )注:同比增长率=(今年月销售额-去年同期月销售额)÷去年同期月销售额×100%. A .2023年1月至6月的月销售额的极差为8B .2023年1月至6月的月销售额的第60百分位数为8C .2023年1月至6月的月销售额的中位数为9.5D .2022年5月的月销售额为10万元[解析] 2023年1月至6月的月销售额的极差为8,故A 正确;因为6×60%=3.6,所以2023年1月至6月的月销售额的第60百分位数为11,故B 错误;2023年1月至6月的月销售额的中位数为9.5,故C 正确;设2022年5月的月销售额为x 万元,则11-xx×100%=10%,解得x =10,故D 正确.故选ACD.三、填空题14.(2023·辽宁沈阳东北育才学校模拟)已知一组样本数据x 1,x 2,x 3…x 10,且x 21+x 22+x 23+…+x 210=185,平均数x =4,则该组数据的方差s 2= 2.5 .[解析] 由题意知x 1+x 2+x 3…+x 10=4×10=40,又s 2=x 1-42+x 2-42+x 3-42+…+x 10-4210=x 21+x 22+x 23+…+x 210-8x 1+x 2+x 3…+x 10+16×1010=185-8×40+16×1010=18.5-32+16=2.5.15.(2024·浙江名校联盟高考研究卷改编)从树人小学二年级学生中随机抽取100名学生,将他们的身高(单位:cm)数据绘制成频率分布直方图如图,则下列结论正确的是 ①② (填上所有正确结论的序号)①a =0.030②估计树人小学这100名二年级学生的平均身高为124.5 cm ③估计树人小学这100名二年级学生身高的中位数为122.5 cm ④估计树人小学这100名二年级学生身高的众数为120 cm[解析] a =0.1-(0.005+0.01+0.02+0.035)=0.03.①正确.平均身高:105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm),②正确.由(x -120)×0.03=0.1得x ≈123.3(cm),③错.身高的众数为115 cm.④错.故填①②.B 组能力提升1.(2024·山西大同质检)一组数据按从小到大的顺序排列为1,3,5,6,m,10,12,13,若该组数据的中位数是极差的58,则该组数据的第60百分位数是( C )A .7.5B .8C .9D .9.5[解析] 由题意得6+m 2=58×(13-1),∴m =9.故选C.2.(多选题)(2024·安徽皖东智校协作联盟联考)某学校共有学生2 000人,其中高一800人,高二高三各600人,学校为了了解学生在寒假期间每天的读书时间,按照分层随机抽样的方法从全校学生中抽取100人,其中高一学生,高二学生,高三学生每天读书时间的平均数分别为x 1=2.7,x 2=3.1,x 3=3.3,每天读书时间的方差分别为s 21=1,s 22=2,s 23=3,则下列正确的是( ACD )A.从高二年级抽取30人B.被抽取的学生中,高二年级每天的总读书时间比高一年级多15小时C.被抽取的学生每天的读书时间的平均数为3小时D.估计全体学生每天的读书时间的方差为s2=1.966[解析]根据分层抽样,分别从高一学生,高二学生,高三学生中抽取40人,30人,30人,故A正确;抽取的高二年级每天的总读书时间为x2×30=93,抽取的高一年级每天的总读书时间为x1×40=108,高二年级每天的总读书时间比高一年级少15小时,故B错误;被抽取的学生每天的读书时间的平均数为40100×2.7+30100×3.1+30100×3.3=3(小时),故C正确;被抽取的学生每天的读书时间的方差为40100×[1+(2.7-3)2]+30100×[2+(3.1-3)2]+30100×[3+(3.3-3)2]=1.966,∴估计全体学生每天的读书时间的方差为s2=1.966,故D正确.故选ACD.3.(多选题)(2023高考新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( BD )A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差[解析]x2,x3,x4,x5的平均数不一定等于x1,x2,…,x6的平均数,A错误;x2,x3,x4,x5的中位数等于x3+x42,x1,x2,…,x6的中位数等于x3+x42,B正确;设样本数据x1,x2,…,x6为0,1,2,8,9,10,可知x1,x2,…,x6的平均数是5,x2,x3,x4,x5的平均数是5,x1,x2,…,x6的方差s21=16×[(0-5)2+(1-5)2+(2-5)2+(8-5)2+(9-5)2+(10-5)2]=503,x2,x3,x4,x5的方差s22=14×[(1-5)2+(2-5)2+(8-5)2+(9-5)2]=252,s21>s22,∴s1>s2,C错误;x6>x5,x2>x1,∴x6-x1>x5-x2,D正确.故选BD.4.(2023·陕西渭南模拟)2022年2月28日,国家统计局发布了我国2021年国民经济和社会发展统计公报,在以习近平同志为核心的党中央坚强领导下,实现了“十四五”良好开局.2021年,全国居民人均可支配收入和消费支出均较上一年有所增长,结合如下统计图表,下列说法中正确的是( B )A .2017~2021年全国居民人均可支配收入逐年递减B .2021年全国居民人均消费支出24 100元C .2020年全国居民人均可支配收入较前一年下降D .2021年全国居民人均消费支出构成中食品烟酒和居住占比超过60%[解析] 根据条形图可知,2017~2021年全国居民人均可支配收入逐年递增,A 错误.根据扇形图可知,2021年全国居民人均消费支出为:5 641+1 419+7 178+569+2 115+2 599+3 156+1 423=24 100元,B 正确.根据条形图可知,2020年全国居民人均可支配收入较前一年上升,C 错误.2021年全国居民人均消费支出构成中食品烟酒和居住占比:7 178+5 64124 100×100%≈53.2%<60%,D 错误.故选B.5.(2023·全国乙卷)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为x i ,y i (i =1,2,…,10).试验结果如下: 试验序号i 1 2 3 4 5 6 7 8 9 10 伸缩率x i 545 533 551 522 575 544 541 568 596 548 伸缩率y i536527543530560533522550576536记z i =x i -y i (i =1,2,…,10),记z 1,z 2,…,z 10的样本平均数为z ,样本方差为s2.(1)求z,s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.(如果z≥2s210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高) [解析](1)x=545+533+551+522+575+544+541+568+596+54810=552.3,y=536+527+543+530+560+533+522+550+576+53610=541.3,z=x-y=552.3-541.3=11,z i=x i-y i的值分别为:9,6,8,-8,15,11,19,18,20,12,∴s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知:z=11,2s210=2 6.1=24.4,故有z≥2s210,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.。
高三数学《概率统计(文科)》练习

文科数学《统计与概率》核心知识点与参考练习题一、统计(核心思想:用样本估计总体)1.抽样(每个个体被抽到的概率相等)(1)简单随机抽样:抽签法与随机数表法(2)系统抽样(等距抽样)(3)分层抽样2.用样本估计总体:(1)样本数字特征估计总体:众数、中位数、平均数、方差与标准差(2)样本频率分布估计总体:频率分布直方图与茎叶图3.变量间的相关关系:散点图、正相关、负相关、回归直线方程(最小二乘法)4.独立性检验二、概率(随机事件发生的可能性大小)1.基本概念(1)随机事件A的概率()()1,0∈AP(2)用随机模拟法求概率(用频率来估计概率)(3)互斥事件(对立事件)2.概率模型(1)古典概型(有限等可能)(2)几何概型(无限等可能)三、参考练习题1.某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______ .2.某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则该从高二年级抽取_____名学生.3.某校老年、中年和青年教师的人数见右表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为_______ .4.已知一组数据5.5,4.5,1.5,8.4,7.4,则该组数据的方差是_____.5.若1,2,3,4,m这五个数的平均数为3,则这五个数的标准差为____.6.重庆市2013年各月的平均气温(℃)数据的茎叶图如右图:则这组数据的中位数是________.7.某高校调查了200名学生每周的晚自习时间(单位:小时),制成了如图所示的频率分布直方图,其中晚自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1408.(2016四川文)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查. 通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照 [0,0.5),[0.5,1),…,[4,4.5] 分成9组,制成了如图的频率分布直方图. (Ⅰ)求直方图中a的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(Ⅲ)估计居民月均用水量的中位数.类别人数老年教师900中年教师1800青年教师1600合计43009.(2015全国Ⅱ文)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表. A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表 满意度评分分组[50,60) [60,70) [70,80) [80,90) [90,100]频 数2814106(Ⅰ)作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B 地区用户满意度评分的频率分布直方图(Ⅱ)根据用户满意度评分,将用户的满意度分为三个等级:试估计哪个地区用户的满意度等级为不满意的概率大?说明理由.10.(2014安徽文)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时). (Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:()()()()()d b c a d c b a bc d a n K ++++-=22满意度评分 低于70分 70分到89分不低于90分 满意度等级不满意满意非常满意()02k K P ≥ 0.10 0.05 0.01 0.005 0k 2.706 3.841 6.635 7.87911.(2014全国Ⅰ文)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125] 频数 6 26 38 22 8(Ⅰ)在下表中作出这些数据的频率分布直方图:(Ⅱ)估计这种产品质量指标值的平均数和方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?12.(2014广东文)某车间20名工人年龄数据如下表:(Ⅰ)求这20名工人年龄的众数与极差;(Ⅱ)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(Ⅲ)求这20名工人年龄的方差.13.(2016江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是_______ .14.从甲、乙等5名学生中随机选出2人,则甲被选中的概率为_______ .15.(2016全国乙卷文)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是______ .16.(2016全国丙卷文)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M、I、N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是________ .17.(2016天津文)甲、乙两人下棋,两人下成和棋的概率为21,甲获胜的概率是31,则甲不输的概率为_________ .18.已知5件产品中有2件次品,其余为合格品.现从这5件产品中任选2件,恰有一件次品的概率为_________ .19.某单位N 名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分区间 [25,30) [30,35) [35,40) [40,45) [45,50]人数 25 a b(Ⅰ)求正整数a ,b ,N 的值;(Ⅱ)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率.20.(2016全国Ⅰ文)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )A.31B.21C.32D.4321.(2016全国Ⅱ文)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为( ) A.107 B.85 C.83 D.103 22.在区间[-2,3]上随机选取一个数x ,则1≤x 的概率为_____ .23.若将一个质点随机投入如图所示的长方形ABCD 中,其中AB=2,BC=1,则质点落在以AB 为直径的半圆内的概率是_______ .24.如图,在边长为1的正方形中随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴影部分的面积为_________ .25.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为( )A .1ˆ-=x yB .1ˆ+=x yC .x y 2188ˆ+= D .176ˆ=y26.某产品的广告费用x 与销售额y 的统计数据如下:根据上表可得回归方程a x b yˆˆˆ+=中的b ˆ为9.4,据此模型预报广告费用为6万元时销售额为 A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元27.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年 份 2011 2012 2013 2014 2015 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(Ⅰ)求y 关于t 的回归方程a t b yˆˆˆ+=; (Ⅱ)利用(Ⅰ)中的回归方程,分析2011年至2015年该地区城乡居民储蓄存款的变化情父亲身高x (cm ) 174 176 176 176 178 儿子身高y (cm )175175176177177广告费用x (万元) 4 2 3 5 销售额y (万元)49263954况,并预测该地区2016年(t =6)的人民币储蓄存款.附:回归方程a t b yˆˆˆ+=中,t b y atn tyt n y t b ni ini ii ˆˆ,ˆ1221-=--=∑∑==.28.甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样的方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下: 甲校:乙校:(1)计算y x ,的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率; (3)由以上统计数据填写下面2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.参考数据与公式:由列联表中数据计算()()()()()d b c a d c b a bc ad n K ++++-=22;临界值表:29.一次考试中,5名学生的数学、物理成绩如下表所示:(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90分的概率;(2)根据上表数据作散点图,求y 与x 的线性回归方程(系数精确到0.01).附:回归直线的方程是:a x b y ˆˆˆ+=,其中()()()x b y ax x y y x x b ni ini iiˆˆ,ˆ121-=---=∑∑==; 90,93==y x ,()()()30,4051251=--=-∑∑==y y x x x x ii ii i .30.为调查市民对汽车品牌的认可度,在秋季车展上,从有意购车的500名市民中,随机抽取100名市民,按年龄情况进行统计得到下面的频率分布表和频率分布直方图.(1)求频率分布表中a 、b 的值,并补全频率分布直方图,再根据频率分布直方图估计有意购车的这500名市民的平均年龄;31.(2016新课标Ⅱ)某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:上年度出险次数0 1 2 3 4 ≥5保费0.85aa1.25a1.5a1.75a2a设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数0 1 2 3 4 ≥5概率0.300.150.200.200.100.05(Ⅰ)求一续保人本年度的保费高于基本保费的概率;32.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机分组(岁) 频数 频数[20,25) 5 0.050 [25,30) 200.200 [30,35) a0.350[35,40) 30 b[40,45] 10 0.100 合计1001.000摸出2只球,则这2只球颜色不同的概率为____________ .33.现有6道题,其中4道甲类题,2道乙类题,某同学从中任取2道题解答.试求:(1)所取的2道题都是甲类题的概率;(2)所取的2道题不是同一类题的概率.A,两地区分别随机调查了20个用户,得到用34.某公司为了解用户对其产品的满意度,从B户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);。
高中数学第二章统计221用样本的频率分布估计总体分布练习含解析新人教A版必修

2.2.1 用样本的频率分布估计总体分布A级基础巩固一、选择题1.没有信息的损失,所有的原始数据都可以从图中得到的统计图是( )A.总体密度曲线B.茎叶图C.频率分布折线图D.频率分布直方图答案:B2.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )B.C.D.解析:数据总个数n=10,又落在区间[22,30)内的数据个数为4,故所求的频率为410=0.4.答案:B3.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.下图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为( )A.30辆B.40辆C.60辆D.80辆解析:车速大于或等于70 km/h的汽车数为×10×300=60(辆).答案:C4.一个社会调查机构就某地区居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图),为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(单位:元)月收入段应抽出的人数为( )A.5 B.25 C.50 D.2 500解析:组距=500,在[2 500,3 000)的频率=0.000 5×500=,样本数为100,则在[2 500,3 000)内应抽100×=25(人).答案:B5.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,仅知道后5组的频数和为62.设视力在到之间的学生数为a,最大频率为,则a的值为( )A.27 B.48 C.54 D.64解析:由已知,视力在到之间的学生数为100×=32,又视力在到之间的频率为1-+0.5)×-62100=,所以视力在到之间的学生数为100×=22,所以视力在到之间的学生数a =32+22=54.答案:C二、填空题6.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:分组/分频数频率[80,90)①②[90,100)[100,110)[110,120)36[120,130)[130,140)12③[140,150]合计④根据上面的频率分布表,可以①处的数值为________,②处的数值为________. 解析:由位于[110,120)的频数为36,频率=36n=,得样本容量n =120,所以[130,140)的频率=12120=,②处的数值=1------=; ①处的数值为×120=3. 答案:37.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[140,150]内的学生中抽取的人数应为________.解析:所有小矩形的面积和等于10×++0.020+a +0.035)=1,解得a =;100名同学中,身高在[120,130)内的学生数是10××100=30,身高在[130,140)内的学生数是10××100=20,身高在[140,150]内的学生数是10××100=10,则三组内的总学生数是30+20+10=60,抽样比是1860=310,所以身高在[140,150]内的学生中选取的人数应为10×310=3.答案: 38.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如下:据此可估计该校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为________.答案:60三、解答题9.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00-10:00间各自的点击量,得到如图所示的茎叶图.(1)甲网站点击量在[10,40]间的频率是多少? (2)甲、乙两个网站哪个更受欢迎?请说明理由.解:(1)甲网站点击量在[10,40]内的有17,20,38,32,共有4天,则频率为414=27. (2)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? 解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由题意估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.B 级 能力提升1.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图所示是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18解析:志愿者的总人数为20(+)×1=50,所以第三组的人数为50×=18,有疗效的人数为18-6=12.答案:C2.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,则运动员人数为4.答案:43.从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分): [40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[70,80)分的学生所占总体的百分比.解:(1)频率分布表如下:成绩分组频数频率[40,50)2[50,60)3[60,70)10[70,80)15[80,90)12[90,100]8合计50(2)由题意知组距为10,取小矩形的高根据表格画出如下的频率分布直方图:(3)由频率分布直方图,可估计成绩在[70,80)分的学生所占总体的百分比是×10==30%.。
高中数学第6章统计4用样本估计总体数字特征4-1样本的数字特征4-2分层随机抽样的均值与方差4-

1
2
2 = [(x1-90)2+…+(x48-90)2+(115-90)2+(65-90)2],
50
1
1
2
2
2
2 2 2
得2 − 1 = ×(25 +25 -5 -5 )= ×1 200=24,
50
50
所以22 = 12 +24=52+24=49,
所以s2=7,即该50名学生实际成绩的平均分为90分,标准差为7分.
的测试成绩分别为70,76,77,74,78,75,则这10名体育生的平均分与方差分别
为
77
、
385
72
.
1 2 3 4 5 6 7 8 9 10 11 12 13 14
解析 由题意知1 =
2 =
82+81+79+78
=80,
4
1
×(70+76+77+74+78+75)=75,
6
∴这 10 名体育生的平均成绩为 =
得分的平均数为
=21,小张得分的平均数为
6
22+20+31+10+34+9
=21,故
6
C 错误;小明和小张平均分相等,但小明分数相对集
中,更稳定,故 D 正确.
1 2 3 4 5 6 7 8 9 10 11 12 13 14
6.数据18,26,27,28,30,32,34,40的75%分位数为
33
成绩的方差是( B )
A.0.127
解析 ∵ =
∴s
B.0.016
C.0.08
高中数学第六章统计3用样本估计总体分布频率分布直方图课后习题北师大版必修第一册

§3 用样本估计总体分布3.1 从频数到频率 3.2 频率分布直方图A 级必备知识基础练1.一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在区间[20,60)上的频率为0.8,则估计样本在区间[40,50),[50,60)内的数据个数共为( )A.15B.16C.17D.192.(多选题)为弘扬中华民族传统文化,某中学学生会对本校高一年级1 000名学生课余时间参加传统文化活动的情况,随机抽取50名学生进行调查,将数据分组整理后,列表如下参加场数01234567参加人数占调查人数的百分比8%10%20%26%18%12%4%2%估计该校高一学生参加传统文化活动情况不正确的是( )A.参加活动次数是3场的学生约为360人B.参加活动次数是2场或4场的学生约为480人C.参加活动次数不高于2场的学生约为280人D.参加活动次数不低于4场的学生约为360人3.去年,相关部门对某城市“五朵金花”之一的某景区在“十一”黄金周中每天的游客人数作了统计,其频率分布如下表所示:时间10月1日10月2日10月3日10月4日10月5日10月6日10月7日频率0.050.080.090.130.300.150.20已知10月1日这天该景区的营业额约为8万元,假定这七天每天游客人均消费相同,则这个黄金周该景区游客人数最多的那一天的营业额约为 万元.4.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示).由图中数据可知a= .若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为.5.为了解某校高一1 000名学生的物理成绩,随机抽查了部分学生的期中考试成绩,将数据整理后绘制成如图所示的频率分布直方图.(1)估计该校高一学生物理成绩不低于80分的人数;(2)若在本次考试规定物理成绩在m分以上(包括m分)的为优秀,该校学生物理成绩的优秀率大约为18%,求m的值.B级关键能力提升练6.为了丰富教职工业余生活,某校计划在假期组织全体老师外出旅游,并给出了两个方案(方案一和方案二),每位老师均选择且只选择一种方案,其中有50%的男老师选择方案一,有75%的女老师选择方案二,且选择方案一的老师中女老师占40%,那么该校全体老师中女老师的比例为( )A.1 2B.47C.58D.347.(多选题)某市教体局对全市高三年级的学生身高进行抽样调查,随机抽取了100名学生,他们的身高都处在A,B,C,D,E五个层次内,根据抽样结果得到统计图表如图,则下面叙述正确的是( )女生身高情况直方图男生身高情况扇形图A.样本中女生人数多于男生人数B.样本中B层人数最多C.样本中E层男生人数为6人D.样本中D层男生人数多于女生人数8.某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80), [80,100].(1)图中的x= ;(2)若上学所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有 名学生可以申请住宿.9.某样本频率分布直方图如图所示,且在区间[15,18)内频数为8.求:(1)求样本容量;(2)若在区间[12,15)内的小矩形面积为0.06,求在区间[12,15)内的频数和样本在区间[18,33)内的频率.C级学科素养创新练10.为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50 kW·h至350 kW·h之间,进行适当分组后,画出频率分布直方图如图所示.(1)求a的值;(2)求被调查用户中,用电量大于250 kW·h的户数;(3)为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW·h)的建议.3.1 从频数到频率3.2 频率分布直方图=0.5.故样本在区间[40,50),1.A 由题易得在区间[40,50),[50,60)内的频率为0.8-4+530[50,60)内的数据个数共为30×0.5=15.故选A.2.ABC 参加活动场数为3场的学生约有1000×26%=260(人),A错误;参加活动场数为2场或4场的学生约有1000×(20%+18%)=380(人),B错误;参加活动场数不高于2场的学生约有1000×(8%+10%+20%)=380(人),C错误;参加活动场数不低于4场的学生约有1000×(18% +12%+4%+2%)=360(人),D正确.故选ABC.3.48 根据表格可知,10月1日这天的频率为0.05,营业额为8万;频率最高的为10月5日,频率为0.30.设这个黄金周10月5日的营业额约为x万元,由8 0.05=x0.30,得x=48,则游客人数最多的那一天的营业额约为48万元.4.0.030 3 因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由图可知身高在[120,150]内的学生人数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内的学生中选取的人数为1860×10=3.5.解(1)由频率分布直方图得,该校高一学生物理成绩不低于80分的频率为(0.03+0.024)×10=0.54,∴该校高一学生物理成绩不低于80分的人数为1000×0.54=540.(2)∵0.24>0.18,∴90<m<100,∴0.24-0.180.24=m-9010,解得m=92.5.6.B 设该校男老师的人数为x,女老师的人数为y,则可得如下表格:性别方案一方案二男老师0.5x0.5x女老师0.25y0.75y由题意,0.25y0.5x+0.25y =0.4,可得yx=43,所以yx+y =4 7.故选B.7.ABC 样本中女生人数为9+24+15+9+3=60,男生人数为100-60=40,A正确;样本中A层人数为9+40×10%=13,B层人数为24+40×30%=36,C层人数为15+40×25%=25,D层人数为9+40×20%=17,E层人数为3+40×15%=9,故B正确;样本中E层男生人数为40×15%=6,C正确;样本中D层男生人数为40×20%=8,女生人数为9,D错误.故选ABC.8.(1)0.0125 (2)72 (1)由频率分布直方图知20x=1-20×(0.025+0.0065+0.003+0.003),解得x=0.0125.(2)上学时间不少于1小时的学生的频率为0.003×2×20=0.12,因此估计有0.12×600=72(人)可以申请住宿.9.解(1)由频率分布直方图可知区间[15,18)对应y轴的数字为475,且组距为3,所以区间[15,18)对应频率为475×3=425,又已知在区间[15,18)内频数为8,所以样本容量为n=8425=50.(2)因为[12,15)内的小矩形面积为0.06,所以在区间[12,15)内频率为0.06,且样本容量为50,所以在区间[12,15)内的频数为50×0.06=3,又因为在区间[15,18)内的频数为8,所以在区间[18,33)内的频数为50-3-8=39.所以在区间[18,33)内的频率为3950=0.78.10.解(1)因为(0.0024+0.0036+a+0.0044+0.0024+0.0012)×50=1,所以a=0.0060.(2)根据频率分布直方图可知,“用电量大于250kW·h”的频率为(0.0024+0.0012)×50=0.18,所以用电量大于250kW·h的户数为100×0.18=18.(3)因为前三组的频率之和为(0.0024+0.0036+0.0060)×50=0.6<0.8,前四组的频率之和为(0.0024+0.0036+0.0060+0.0044)×50=0.82>0.8,所以频率为0.8时对应的数据在第四组,所以第一档用电标准为200+0.8-0.60.22×50≈245.5(kW·h).故第一档用电标准为245.5kW·h.。
高中数学人教A版必修三习题第二章-用样本的数字特征估计总体的数字特征含答案

;x =
5
乙
5
=30,
2.所以-x 甲<-x 乙,s 甲>s 乙.
答案:B 二、填空题 6.甲、乙两位同学某学科连续五次的考试成绩用茎叶图表示如图所示,则平均分数较 高的是________,成绩较为稳定的是________.
解析:-x
甲=70,-x 乙
=68,s甲2
=1 5
×(22+12+12+22)=2,s乙2
11
= =6. 11
答案:A
2.甲、乙两同学在高考前各做了 5 次立定跳远测试,测得甲的成绩如下(单位:米):
2.20, 2.30, 2.30, 2.40, 2.30, 若 甲 、 乙 两 人 的 平 均 成 绩 相 同 , 乙 的 成 绩 的 方 差 是
0.005,那么甲、乙两人成绩较稳定的是________. 解析:求得甲的平均成绩为 2.30米,甲的成绩的方差是 0.004.由已知得甲、乙平均成
而 2(k1-3),2(k2-3),…,2(k6-3)的平均数为 2(k -3),则所求方差为
16[4(k1--k )2+4(k2--k )2+…+4(k6-
- k )2]=4×3=12.
答案:12
8.若有一个企业,70%的员工年收入 1 万元,25%的员工年收入 3 万元,5%的员工年收
入 11万元,则该企业员工的年收入的平均数是________万元,中位数是________万元,众
乙品种的样本平均数也为 10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2)+(9.8-10)2]÷5=0.24.
因为 0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.
2020届高三数学(文理)复习《 统计图表、用样本估计总体》

2020届高三复习《统计图表、用样本估计总体》专题练专题1 扇形图1.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________、________.2.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半专题2 折线图1.甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为x-甲,x-乙,标准差分别为σ甲,σ乙,则()A.x-甲<x-乙,σ甲<σ乙B.x-甲<x-乙,σ甲>σ乙C.x-甲>x-乙,σ甲<σ乙D.x-甲>x-乙,σ甲>σ乙2.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳3.空气质量指数(简称:AQI)是定量描述空气质量状况的无量纲指数,空气质量按照AQI大小分为六级:[0,50)为优,[50,100)为良,[100,150)为轻度污染,[150,200)为中度污染,[200,250)为重度污染,[250,300)为严重污染.下面记录了北京市22天的空气质量指数,根据图表,下列结论错误的是()A.在北京这22天的空气质量中,按平均数来考察最后4天的空气质量优于最前面4天的空气质量B.在北京这22天的空气质量中,有3天达到污染程度C.在北京这22天的空气质量中,12月29日空气质量最差D.在北京这22天的空气质量中,达到空气质量优的天数有7天专题3 茎叶图1.某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为175 cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x,那么x的值为_______.2.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图所示.据此可估计该校上学期400名教师中,使用多媒体进行教学次数在[16,30)内的人数为3.空气质量指数(Air Qu a li ty Inde x,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为________.(该年为365天)6.据了解,大学英语四级改革的一项重要内容就是总分改为710分,每个考生会有一个成绩,不再颁发“合格证”,这也意味着,不再有“及格”一说.大学英语四级考试成绩在425分及以上的考生可以报考大学英语六级考试,英语四级成绩在550分及以上的考生可以报考口语考试.如图是从某大学数学专业40人的英语四级成绩中随机抽取8人的成绩的茎叶图.(1)通过这8人的英语四级成绩估计该大学数学专业英语四级考试成绩的平均数和中位数;(2)在这8人中,从可以报考大学英语六级考试的学生中任取2人,求这2人都可以报考口语考试的概率.专题4 频率分布直方图1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为2.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有____人.3.从某企业的某种产品中抽取1 000件,测量该种产品的一项质量指标值,由测量结果得到如图所示的频率分布直方图,假设这项指标在[185,215]内,则这项指标合格,估计该企业这种产品在这项指标上的合格率为__________.4.某学校组织学生参加数学测试,成绩(单位:分)的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.5.某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.6.某校高二(16)班共有50人,如图是该班在四校联考中数学成绩的频率分布直方图,则成绩在[100,120]内的学生人数为7.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.8.近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图所示,其中年龄在区间[30,40)内的有2 500人,在区间[20,30)内的有1200人,则m的值为9.为了解学生在课外活动方面的支出情况,抽取了n个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[10,50]内,其中支出金额在[30,50]内的学生有117人,频率分布直方图如图所示,则n等于10.为了了解一批产品的长度(单位:毫米)情况,现抽取容量为400的样本进行检测,如图是检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则样本中三等品的件数为________.11.某学校为了调查学生在学科教辅书方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出的钱数在[30,40)的同学比支出的钱数在[10,20)的同学多26人,则n的值为________.12.为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kP a)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.13.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为14.在样本频率分布直方图中,共有9个小长方形.若中间一个小长方形的面积等于其他8个小长方形面积之和的25,且样本容量为140,则中间一组的频数为15.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为________.16.某市民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w =3时,估计该市居民该月的人均水费.17.某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分布直方图,估计这100名学生语文成绩的平均分;18.全世界越来越关注环境保护问题,某监测站点于2018年1月某日起连续n天监测空气质量指数(AQI),数据统计如下表:优20(1)根据所给统计表和频率分布直方图中的信息求出n,m的值,并完成频率分布直方图;(2)由频率分布直方图,求该组数据的平均数与中位数.19.某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值.(2)求月平均用电量的众数和中位数.(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240]的用户中应抽取多少户?20.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:(1)求a,b,c的值;(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P(注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.21.某大学生在开学季准备销售一种文具盒进行试创业,在一个开学季内,每售出1盒该产品获得的利润为30元,未售出的产品,每盒亏损10元.该大学生通过查询资料得到开学季市场需求量的频率分布直方图,如图所示.该大学生为这个开学季购进了160盒该产品,以x(单位:盒,100≤x≤200)表示这个开学季内的市场需求量,y(单位:元)表示这个开学季内经销该产品的利润.(1)根据直方图估计这个开学季内市场需求量x的众数和平均数;(2)将y表示为x的函数;(3)根据直方图估计利润y不少于4 000元的概率.专题5 样本的数字特征的计算与应用1.数据1,3,4,8的平均数与方差分别是2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()甲乙A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差3.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为4.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为 5.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A.x -=4,s 2=2B.x -=4,s 2>2C.x -=4,s 2<2D.x ->4,s 2<26.已知样本数据x 1,x 2,…,x n 的平均数x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的平均数为________.7.若数据x 1,x 2,x 3,…,x n 的平均数x =5,方差s 2=2,则数据3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数和方差分别为 、8.已知正数x 1,x 2,x 3的方差s 2=13(x 21+x 22+x 23-12),则数据x 1+1,x 2+1,x 3+1的平均数为__9.在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1■,那么这组数据的方差s 2可能的最大值是________.10.某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.5.1 与频率分布直方图交汇1.200辆汽车通过某一段公路时的速度的频率分布直方图如图所示,则速度的众数、中位数的估计值分别为2.一组样本数据的频率分布直方图如图所示,试估计此样本数据的中位数为3.如图是一容量为100的样本重量的频率分布直方图,则由图可估计样本重量的平均数与中位数分别为、5.2 与茎叶图交汇1.已知某班级部分同学一次测验的成绩统计如图所示,则其中位数和众数分别为、2.某班学生A,B在高三8次月考的化学成绩用茎叶图表示如图,其中学生A的平均成绩与学生B 的成绩的众数相等,则m=________.3.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为_____.4.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为、5.一次数学考试后,某老师从甲、乙两个班级中各抽取5人,记录他们的考试成绩,得到如图所示的茎叶图,已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x-y的值为6.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为7.五四青年节活动中,高三(1)、(2)班都进行了3场知识辩论赛,比赛得分情况的茎叶图如图所示(单位:分),其中高三(2)班得分有一个数字被污损,无法确认,假设这个数字x具有随机性(x∈N),那么高三(2)班的平均得分大于高三(1)班的平均得分的概率为8.如图是某位篮球运动员8场比赛得分的茎叶图,其中一个数据染上污渍用x代替,那么这位运动员这8场比赛的得分平均数不小于得分中位数的概率为________.5.3 与优化决策问题交汇命题1.在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图.若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.2.甲、乙两人在相同条件下各射击10次,每次中靶环数情况如图所示:(1)请填写下表(写出计算过程):(2)①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);③从折线图上两人射击命中环数的走势看(分析谁更有潜力).。
高中数学必修二 9 2 用样本估计总体-同步培优专练

专题9.2 用样本估计总体知识储备1.数据的最值、平均数、中位数、百分位数、众数4.频数(率)分布直方图5.用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等.所以,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.6.分层抽样的均值与方差以分两层抽样的情况为例.假设第一层有m个数,分别为x1,x2,…,x m,平均数为x,方差为s2;第二层有n个数,分别为y1,y2,…,y n,平均数为y,方差为t2.则x=m 11i m =∑x i ,s 2=11m i m =∑(x i -x )2,y =11nii y n=∑,t 2=211()nii y y n=-∑.如果记样本均值为a ,样本方差为b 2,则可以算出a=1m n +(1m i =∑x i +1ni =∑y i )=mx ny m n ++, b 2=2222[()][()]m s x a n t y a m n +-++-+=1m n+222()()mn ms nt x y m n ⎡⎤++-⎢⎥+⎣⎦. 7.常用结论1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k 的整数倍.3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.4.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 5.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.能力检测注意事项:本试卷满分100分,考试时间45分钟,试题共16题.答卷前,考生务必用0.5毫米黑色签字笔将自己的姓名、班级等信息填写在试卷规定的位置. 一、单选题1.(2020·河北高二学业考试)为了解全年级1180名学生的数学成绩分布情况,在一次数学调研测试后,某教师随机抽取了80份试卷并对试卷得分(满分:150分)进行了整理,得到如下频率分布表:若同一组数据用该区间的中点值作代表,则此次数学测试全年级平均分的估计值是( ). A .110 B .108. 5C .105D .102. 5【答案】B【解析】由题意可得,此次数学测试全年级平均分的估计值是650.025750.050850.100950.1251050.2501150.200⨯+⨯+⨯+⨯+⨯+⨯ 1250.1001350.0751450.075108. 5+⨯+⨯+⨯=.故选:B.2.(2020·广东广州市·高三月考)某学校鼓励学生参加社区服务,学生甲2019年每月参加社区服务的时长(单位:小时)分别为1x ,2x ,…,12x ,其均值和方差分别为x 和2s ,若2020年甲每月参加社区服务的时长增加1小时,则2020年甲参加社区服务时长的均值和方差分别为( ) A .x ,2s B .1x +,21s +C .x ,21s +D .1x +,2s【答案】D【解析】由题意可知12121()12x x x x =++⋅⋅⋅+,222121221[()()()]12s x x x x x x =-+-+⋅⋅⋅+-, 设2020年甲参加社区服务时长的均值和方差分别为'x ,'2s ,则'1212121211[(1)(1)(1)][()12]11212x x x x x x x x =++++⋅⋅⋅++=++⋅⋅⋅++=+, '222212121[(11)(11)(11)]12x x x x x x s =+--++--+⋅⋅⋅++--22212121[()()()]12x x x x x x =-+-+⋅⋅⋅+-2s =故选:D 3.(2020·湖北十堰市·高二期中)如图所示茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为17.6,则,x y 的值分别A .58、B .57、C .78、D .7、7【答案】D 【解析】组数据的中位数为17,7x ∴=,乙组数据的平均数为17.4,()191616102917.45y ∴+++++=, 得8087y +=,则7y =,故选:D .4.(2020·湖北高三学业考试)棉花的纤维长度是棉花质量的重要指标.在一批棉花中随机抽测了50根棉花的纤维长度(单位:mm),其频率分布直方图如图所示.根据频率分布直方图,估计事件“棉花的纤维长度大于275mm”的概率为( )A .0.30B .0.48C .0.52D .0.70【答案】C 【解析】“棉花的纤维长度大于275mm”的概率为500.0040500.0064⨯+⨯0.52=.故选:C5.(2020·湖北高三学业考试)为做好精准扶贫工作,需关注贫困户的年收入情况.经统计,某贫困户近5年的年收分别为1a ,2a ,3a ,4a ,5a .下面给出的指标可以用来评估该贫困户年收入的稳定A .1a ,2a ,3a ,4a ,5a 的平均数B .1a ,2a ,3a ,4a ,5a 的标准差C .1a ,2a ,3a ,4a ,5a 的最大值D .1a ,2a ,3a ,4a ,5a 的中位数【答案】B【解析】标准差反映了各数据对平均数的偏离, 反映了一组数据的离散程度,在本题中即稳定程度, 而其他的统计量则不能反映稳定程度,故选:B6.(2020·全国高三专题练习)中国传统文化是中华民族智慧的结晶,是中华民族的历史遗产在现实生活中的展现.为弘扬中华民族传统文化,某校学生会为了解本校高一1000名学生的课余时间参加传统文化活动的情况,随机抽取50名学生进行调查.将数据分组整理后,列表如下:以下四个结论中正确的是( ). A .表中m 的数值为10B .估计该校高一学生参加传统文化活动次数不高于2场的学生约为180人C .估计该校高一学生参加传统文化活动次数不低于4场的学生约为360人D .若采用系统抽样方法进行调查,从该校高一1000名学生中抽取容量为50的样本,则分段间隔为25 【答案】C【解析】A 选项,由题意可得,8%10%20%26%18%%4%2%1m +++++++=, 则12m =;故A 错;B 选项,由题意可得,样本中该校高一学生参加传统文化活动次数不高于2场的学生占比为8%12%20%+=,则该校高一学生参加传统文化活动次数不高于2场的学生约为100020%200⨯=人;故B 错; C 选项,由题意,样本中该校高一学生参加传统文化活动次数不低于4场的学生占比为18%12%4%2%36%,则该校高一学生参加传统文化活动次数不低于4场的学生约为360人;故C 正确;D 选项,从若采用系统抽样方法进行调查,从该校高一1000名学生中抽取容量为50的样本,则分段间隔为10002050=;故D 错.故选:C. 7.(2020·山东临沂市·高一期末)某工厂12名工人的保底月薪如下表所示,第80百分位是( )A .3050B .2950C .3130D .3325【答案】A【解析】把这组数据从小到大排序:2710,2755,2850,2860,2880,2890,2920,2940,2950,3050,3130,3325, 所以%1280%9.6i n p =⨯=⨯=,所以第80百分位是3050,故选:A.8.(2020·黑龙江大庆市·大庆实验中学高二月考(文))在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( ) A .甲地:总体平均值为3,中位数为4B .乙地:总体平均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为2 【答案】D【解析】不妨通过构造特殊值法进行判断,对于甲地:0,0,0,0,4,4,4,4,4,10符合条件,但其第10天新增疑似病例超过7人,故不符合题意;对于乙地:0,0,0,0,0,0,0,0,10符合条件,但其第10天新增疑似病例超过7人,故不符合题意;对于丙地,0,0,1,1,2 ,2,3,3,3,10符合条件,但其第10天新增疑似病例超过7人,故不符合题意;对于丁地,当总体平均数是2时,若有一个数据超过7,则方差就超过了2,符合题意,因此,一定没有发生大规模群体感染的是丁地.故选:D.二、多选题9.(2020·河北沧州市·高二期中)甲、乙两名射击运动员在某次测试中各射击20次,两人测试成绩的条形图如图所示,则()A.甲运动员测试成绩的中位数等于乙运动员测试成绩的中位数B.甲运动员测试成绩的众数大于乙运动员测试成绩的众数C.甲运动员测试成绩的平均数大于乙运动员测试成绩的平均数D.甲运动员测试成绩的方差小于乙运动员测试成绩的方差【答案】AD【解析】由图可得甲运动员测试成绩中3次7环,8次8环,5次9环,4次10环,所以甲运动员测试成绩的中位数为8,众数为8,平均数为3788594108.520⨯+⨯+⨯+⨯=,方差2222(78.5)3(88.5)8(98.5)5(108.5)4192020 -⨯+-⨯+-⨯+-⨯=;乙运动员测试成绩中4次7环,7次8环,4次9环,5次10环,所以乙运动员测试成绩的中位数为8,众数为8,平均数为4778495108.520⨯+⨯+⨯+⨯=,方差2222(78.5)4(88.5)7(98.5)4(108.5)5232020 -⨯+-⨯+-⨯+-⨯=,故选项A正确,B不正确,C不正确,D正确,故选:AD10.(2020·河北巨鹿中学高二月考)2020年3月6日,在新加坡举行的世界大学生辩论赛中,中国选手以总分230.51分获得冠军.辩论赛有7位评委进行评分,首先这7位评委给出某对选手的原始分数,评定该队选手的成绩时从7个原始成绩中去掉一个最高分、一个最低分,得到5个有效评分,则5个有效评分与7个原始评分相比,可能变化的数字特征是( ) A .中位数 B .平均数C .方差D .极差【答案】BCD【解析】因为5个有效评分是7个原始评分中去掉一个最高分、一个最低分, 所以中位数不变,平均数、方差、极差可能发生变化, 所以可能变化的数字特征是平均数、方差、极差.故选:BCD.11.(2020·湖南省汨罗市第二中学高三开学考试)气象意义上从春季入夏季的标志为:“连续5天的日平均温度均不低于22℃”.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数):①甲地:5个数据的中位数为24,众数为22; ②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8. 则肯定进入夏季的地区有( ) A .①②③ B .②C .③D .①【答案】CD【解析】由统计知识,①甲地:5个数据的中位数为24,众数为22,5个数据中2个是22,有2个大于24,一个是24,可知①符合题意;而②乙地:5个数据的中位数为27,总体均值为24,有可能某一天的气温低于22℃,所以不符合题意;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8.若有某一天的气温低于22℃,则总体方差就大于10.8,所以满足题意,故选:CD. 12.(2020·南京航空航天大学附属高级中学高二开学考试)已知一组数据1x ,2x ,3x ,4x ,5x 的平均数和方差均为2,则下列叙述正确的有( ) A .11x +,21x +,31x +,41x +,51x +的平均数为3 B .11x +,21x +,31x +,41x +,51x +的方差为3 C .12x ,22x ,32x ,42x ,52x 的方差为4D .122x +,222x +,322x +,422x +,522x +的方差为8 【答案】AD【解析】对,A B 选项,将每个数据在原基础上加1,故平均数加1,但是方差保持不变,故其平均数是3,方差是2;故A 正确;B 错误;对C ,将每个数据乘以2,故其方差变为原来的4倍,即为8,故C 错误; 对D ,将每个数据乘以2再加2,故其方差也变为原来的4倍,即为8,故D 正确. 故选:AD . 三、填空题13.(2020·贵溪市实验中学高三月考)甲乙两名链球运动员在比赛中各投掷5次,成绩如表(单位:米)22S S 甲乙、分别表示甲、乙两人比赛成绩的方差,则22S S 甲乙、的大小关系是_____________.(用<、=、>连接)【答案】22S S <甲乙【解析】7880778184805x 甲,()()()()()22222217880808077808180848065S 甲⎡⎤=-+-+-+-+-=⎣⎦,7680858277805x 乙,()()()()()22222217680808085808280778010.85S 乙⎡⎤=-+-+-+-+-=⎣⎦,则22S S <甲乙,故答案为:22S S <甲乙.14.(2020·西城区·北京铁路二中高三期中)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,给出下列四个结论:①第3天至第11天复工复产指数均超过80%;②这11天期间,复产指数增量大于复工指数的增量;③第9天至第11天复产指数增量大于复工指数的增量;④第1天至第3天复工指数的方差大于第2天至第4天复工指数的方差.其中所有正确结论的序号是____________________.【答案】①①【解析】由图像可得,第3天至第11天复工复产指数均超过80%,故①正确;由图像可得,第1天复产指数与复工指数的差大于第11天复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故②错误;由图像可得,第9天至第11天复产指数增量大于复工指数的增量;故③正确;由图像可得,第1天至第3天复工指数波动较小,第2天至第4天复工指数波动较大,所以第1天至第3天复工指数的方差小于第2天至第4天复工指数的方差,故④错误.故答案为:①①15.(2020·北京高一期末)某班数学兴趣小组组织了线上“统计”全章知识的学习心得交流:甲同学说:“在频率分布直方图中,各小长方形的面积的总和小于1”;乙同学说:“简单随机抽样因为抽样的随机性,可能会岀现比较‘极端’的样本,相对而言,分层随机抽样的样本平均数波动幅度更均匀”;丙同学说:“扇形图主要用于直观描述各类数据占总数的比例”;丁同学说:“标准差越大,数据的离散程度越小”.以上四人中,观点正确的同学是______.【答案】乙丙【解析】在频率分布直方图中,各小长方形的面积的总和等于1,故甲的观点错误;“简单随机抽样因为抽样的随机性,可能会岀现比较‘极端’的样本,相对而言,分层随机抽样的样本平均数波动幅度更均匀”,故乙的观点正确,“扇形图主要用于直观描述各类数据占总数的比例”,故丙的观点正确;“标准差越大,数据的离散程度越大”,故丁的观点错误.故答案为:乙丙.四、双空题16.(2020·滁州市第二中学高二月考)某高校在2013年的自主招生考试成绩中随机抽取50名学生的笔试成绩,绘制成频率分布直方图如图所示,由图中数据可知a=________;若要从成绩(单位:分)在[85,90),[90,95),[95,100]三组内的学生中,用分层抽样的方法选取12人参加面试,则成绩(单位:分)在[95,100]内的学生中,学生甲被选取的概率为________.【答案】0.04 0.4【解析】由频率分布直方图知,(0.0160.0640.060.02)51a++++⨯=,所以0.04a=.第3组的人数为0.06055015⨯⨯=,第4组的人数为0.04055010⨯⨯=,第5组的人数为0.0205505⨯⨯=,因为第3、4、5组共抽30名学生,所以利用分层抽样在30名学生中抽取12名学生.每组抽取的人数分别为:第3组:15126 30⨯=,第4组:10124 30⨯=第5组:512230⨯=,所以第3、4、5组分别抽取6人、4人、2人.则成绩在[95,100]内的5个学生中抽2个,学生甲被选取的概率为0.4故答案为:0.04;0.4。
随机抽样与用样本估计总体 小题专练—2023届高考数学重难点二轮专题训练(含解析)

专题36随机抽样与用样本估计总体小题专练一、单选题1. 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是,,,,,则高一参赛学生的成绩的众数、中位数、平均成绩分别为( )A. B. C. D.2. 某省普通高中学业水平考试成绩由高分到低分按人数所占比例依次分为,,,,五个等级,等级,等级,等级,,等级共其中等级为不合格,原则上比例不超过该省某校高二年级学生都参加学业水平考试,先从中随机抽取了部分学生的考试成绩进行统计,统计结果如图所示.若该校高二年级共有名学生,则估计该年级拿到等级及以上级别的学生人数为()A. B. C. D.3. 下面规定一个学生数学成绩优秀的标志为连续次数学考试成绩满分分均不低于分现有甲、乙、丙三位学生连续次数学考试成绩的记录数据记录数据都是正整数情况:甲学生:个数据的中位数为,众数为乙学生:个数据的中位数为,总体均值为丙学生:个数据中有一个数据是,总体均值为,总体方差为.则可以断定数学成绩优秀的学生为( )A. 甲、丙B. 乙、丙C. 甲、乙D. 甲、乙、丙4. 从,,,,,,,中随机取两个数,这两个数一个比大,一个比小的概率为,已知为上述数据中的分位数,则的取值可能为( )A. B. C. D.5. 中国居民膳食指南数据显示,岁至岁儿童青少年超重肥胖率高达为了解某地中学生的体重情况,某机构从该地中学生中随机抽取名学生,测量他们的体重单位:千克,根据测量数据,按,,,,,分成六组,得到的频率分布直方图如图所示根据调查的数据,估计该地中学生体重的中位数是( )A. B. C. D.6. 某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:党史学习时间小时党员人数则该单位党员一周学习党史时间的众数及第百分位数分别是( )A. ,B. ,C. ,D. ,7. 某赛季甲、乙两名篮球运动员各场比赛得分情况用茎叶图表示如下:根据下图,对这两名运动员的成绩进行比较,下列四个结论中,不正确的是( )A. 甲运动员得分的极差大于乙运动员得分的极差B. 甲运动员得分的的中位数大于乙运动员得分的的中位数C. 甲运动员的得分平均值大于乙运动员的得分平均值D. 甲运动员的成绩比乙运动员的成绩稳定二、多选题8. 已知样本数据,,,的平均数为,方差为,由这组数据得到新样本数据,,,,其中,则得到的新样本数据的平均数和方差分别是( )A. 新样本数据的样本平均数为B. 新样本数据的样本平均数为C. 新样本数据的样本方差为D. 新样本数据的样本方差为9. 某中学为了解高三男生的体能情况,通过随机抽样,获得了名男生的米体能测试成绩单位:秒,将数据按照,,,分成组,制成了如图所示的频率分布直方图.由直方图推断,下列选项正确的是( )A. 直方图中的值为B. 由直方图估计本校高三男生米体能测试成绩的众数为秒C. 由直方图估计本校高三男生米体能测试成绩不大于秒的人数为D. 由直方图估计本校高三男生米体能测试成绩的中位数为秒10. 图为年月日通报的天内省区市疫情趋势,则下列说法正确的是()A. 无症状感染者的极差大于B. 确诊病例的方差大于无症状感染者的方差C. 实际新增感染者的平均数小于D. 实际新增感染者的第百分位数为11. 若甲组样本数据,,,数据各不相同的平均数为,方差为,乙组样本数据,,,的平均数为,则下列说法正确的是( ) A. 的值为 B. 乙组样本数据的方差为C. 两组样本数据的样本中位数一定相同D. 两组样本数据的样本极差不同三、填空题12. 工厂年前加紧手套生产,设该工厂连续天生产的手套数依次为,,,,单位:万只,若这组数据,,,,的方差为,且,,,,的平均数为,则该工厂这天平均每天生产手套万只.13. 在我市今年高三年级期中联合考试中,某校数学单科前名的学生成绩依次是:,,,,,,,,,,这名同学数学成绩的分位数是.14. 定义一个同学数学成绩优秀的标准为“连续次数学考试成绩均不低于分满分分”现有甲乙丙三位同学连续次数学考试成绩的数据数据都是正整数的描述:甲同学的个数据的中位数为,总体均值为;乙同学的个数据的中位数为,众数为;丙同学的个数据的众数为,极差为,总体均值为.则数学成绩一定优秀的同学是.15. 若,,,这个数据的样本平均数为,方差为,则,,,,这个数据的方差为.16. 某同学次测评成绩的数据从小到大排列如下:,,,,,,,,,已知成绩的中位数为,若要使标准差最小,则的值是.答案和解析1.【答案】解:由频率分布直方图得:高一参赛学生的成绩的众数为:,的频率为:,的频率为,中位数为:,平均数为:.故选:.2.【答案】解:由题中两图可知等级所占比例为,所以等级及以上级别所占比例为,所以估计等级及以上级别的学生人数为.故选:.3.【答案】解:对于第十三届全国人大女代表所占比重为,第十一届为,提高个百分点,A正确;对于第十三届全国政协女委员所占比重为,第四届为,提高个百分点,B正确;对于从第一到第十三届全国政协女委员所占比重的平均值为,高于,C错误;对于第十三届全国人大代表的人数约为人,不高于人,D正确.故选:.4.【答案】解:在中,甲同学:个数据的中位数为,众数为,所以前三个数为,,,则后两个数肯定大于,故甲同学数学成绩优秀,故成立;在中,个数据的中位数为,总体均值为,可以找到很多反例,如:,,,,,故乙同学数学成绩不优秀,故不成立;在中,个数据的中位数为,总体均值为,总体方差为,假设有一个数据小于,设为,则此时方差大于,且数据越小,整体方差越大,故所有数据均不低于.数学成绩优秀有甲和丙个同学.故选A.5.【答案】解:从,,,,,,,中随机取两个数有种,一个数比大,一个数比小的不同结果有,于是得,整理得:,解得或,当时,数据中的分位数是第个数,则,解得,所有选项都不满足;当时,数据中的分位数是第个数,则,解得,选项A,,不满足,满足.故选:.6.【答案】解:因为,,所以该地中学生的体重的中位数在内,设该中位数为,则,解得.7.【答案】解:党员人数一共有,学习党史事件为小时的人数最多,故学习党史时间的众数为,由,则第百分位数是第和个数的平均数,第,个数分别为,,所以第百分位数是.故选:.8.【答案】解:首先将茎叶图的数据还原:甲运动员得分:乙运动员得分:对于,极差是数据中最大值与最小值的差,由图中的数据可得甲运动员得分的极差为,乙运动员得分的极差为,得甲运动员得分的极差大于乙运动员得分的极差,因此A正确;对于,甲数据从小到大排列:处于中间的数是,所以甲运动员得分的中位数是,同理求得乙数据的中位数是,因此甲运动员得分的中位数大于乙运动员得分的中位数,故B正确;对于,不难得出甲运动员的得分平均值约为,乙运动员的得分平均值为,因此甲运动员的得分平均值大于乙运动员的得分平均值,故C正确;对于,分别计算甲、乙两个运动员得分的方差,方差小的成绩更稳定.可以算出甲的方差为:,同理,得出乙的方差为:,因为乙的方差小于甲的方差,所以乙运动员的成绩比甲运动员的成绩稳定,故D不正确.故选:.9.【答案】解:设样本数据,,,的方差为,新样本数据的方差为,因为,所以新样本数据的平均数,新样本数据的方差为.故选AD.10.【答案】解:由概率统计相关知识可知,各组频率之和为,所以,解得,故A错误;测试成绩的众数是直方图中频率最高组的中点,即故B正确;由图可知,成绩不大于秒的人数为故C正确;设中位数是,则,解得:,故D错误.故选:.11.【答案】解:对于,,且日与日确诊病例的差值不超过,所以无症状感染者的极差必然大于,故A正确;对于,相比较而言,确诊病例数比无症状感染者数波动性小,所以确诊病例的方差小于无症状感染者的方差,故B错误;对于,实际新增感染者的平均数,所以C错误;对于,因为天内省区市的实际新增感染者数从小到大分别为:,,,,,,,,,,,,,,又,不是整数,所以实际新增感染者的第百分位数为为第位,即为,所以D正确.故选AD.12.【答案】解:对于选项A由两组数据的平均数可知,,,故选项A正确,对于选项B,,,,,故选项B正确,对于选项C因为随着的增大而增大,所以若为甲组数据的中位数,则为乙组数据的中位数,故选项C错误,对于选项D因为随着的增大而增大,所以甲组数据的极差为,乙组数据的极差为,故选项D正确,故选:.13.【答案】解:依题意得,设,,,,的平均数为,根据方差的计算公式有,,即,又,.故答案为.14.【答案】解:将学生成绩从低到高排列为,,,,,,,,,,,分位数为第个数据与第个数据的平均数即15.【答案】乙解:在中,甲同学的个数据的中位数为,总体均值为,如,,,,,故甲同学的数学成绩不一定优秀;在中,乙同学的个数据的中位数为,众数为,所以前三个数为,,,则后两个数肯定大于,故乙同学的数学成绩一定优秀;在中,丙同学的个数据的众数为,极差为,总体均值为,最大值与最小值的差为,若最大值为,则最小值为即,,,,,故丙同学的数学成绩不一定优秀.综上,数学成绩一定优秀的同学只有乙.故答案为:乙.16.【答案】解:,,,这个数据的样本平均数为,方差为,,,,,,,这个数据的方差:.故答案为:.17.【答案】解:因为,,,,,,,,,的中位数为,则,所以,因为成绩的平均数为,要使标准差最小,即方差最小,因为,则有,当且仅当,即时,等号成立,此时标准差取得最小值,且符合题意,所以,故答案为.。
03-第二节 用样本估计总体-课时1 总体取值规律的估计高中数学必修第二册人教版

√
7.(多选)[2024河南开封联考]汽车的燃油效率是指汽车每消耗 汽油最多行驶的路程,如图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况,下列叙述中正确的是( )
【解析】 写出一条满足题意的评价即可,比如:①该市一个月中有2天空气质量为优,占当月天数的;有26天空气质量为良,占当月天数的 .空气质量为优或良的天数共有28天,占当月天数的 ,说明该市空气质量基本良好.②该市一个月中轻度污染有2天,占当月天数的 .空气质量指数在 内(接近轻度污染)的天数有15天,加上轻度污染的天数,共有17天,占当月天数的,超过 ,说明该市空气质量有待进一步改善.
【解析】 第一组和第二组的频率之和为 ,又第一组与第二组共有20人,故选取志愿者的总人数为 ,故第三组人数为,其中有疗效的人数为 .
2.随机抽查了某校100名高三学生的视力情况,得到的频率分布直方图如图所示.由于不慎将部分数据丢失,但知道后5组的频数之和为64.设这100名学生中视力在4.6到4.8之间的学
D
A.20 B.10 C.60 D.40
【解析】 由频率分布直方图可得 ,,所以 .
2.[2024河南焦作期末]某样本的频率分布直方图如图,若在,,, 内的数据的频率之比为,则 ( )
D
A. B. C. D.
【解析】 因为在,,, 内的数据的频率之比为 ,所以可设这四组的频率分别为,,, ,则
8.某市为提倡节约用水,准备实行自来水“阶梯计费”方式,用户用水不超出基本用水量的部分享受基本价格,超出基本用水量的部分实行超价收费.为更好地决策,自来水公司随机抽取了部分用户的用水量数据(单位: ),并绘制了如图不完整的条形图(每组数据包括右端点但不包括左端点)和扇形图.
河南省镇平县第一高级中学高中数学人教A版必修三同步

高一数学《用样本估计总体》练习题1.如右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )A .161 cmB .162 cmC .163 cmD .164 cm2.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .603.一组数据中的每一个数据都乘以2,再都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )A .40.6,1.1B .48.8,4.4C .81.2,44.4D .78.8,75.6 4.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差5.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x -,则( )A .m e =m 0=x -B .m e =m 0<x -C .m e <m 0<x -D .m 0<m e <x -6.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为( )A.65B.65C. 2 D.27.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的概率分布直方图是( )8.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画出了如图所示的频率分布直方图,现要从这10 000人中再用分层抽样的方法抽出100人作进一步调查,则月收入在[2 500,3 000)(元)内应抽出________人.9.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.10. 为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:(1)表中m,n,M,(2)画出频率分布直方图.(3)全体女生中身高在哪组范围内的人数最多?11.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图.(2)这两个班参赛的学生人数是多少?(3)这两个班参赛学生的成绩的中位数应落在第几小组内?12、下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)(1)(2)(3)13、为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。
高中数学必修三同步练习题库:用样本估计总体(填空题:较易)

用样本估计总体(填空题:较易)1、在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1,那么这组数据的方差可能的最大值是__________.2、从某高校的高一学生中采用系统抽样法选出30人测量其身高,数据的茎叶图如图所示(单位:cm),若高一年级共有600人,估算身高在1.70m以上的有_______人.3、如图是甲,乙两名同学次综合测评成绩的茎叶图,则乙的成绩的中位数是,甲乙两人中成绩较为稳定的是 .4、为了普及环保知识,增强环保意识,某高中随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为,众数为,平均值为,则这三个数的大小关系为_______________.5、甲,乙两人在相同条件下练习射击,每人打发子弹,命中环数如下则两人射击成绩的稳定程度是6、下图是甲、乙两市领导干部年龄的茎叶图,对于这两市领导干部的平均年龄给出的以下说法正确的是________.①甲市领导干部的年龄的分布主要集中在40~60之间;②乙市领导干部的年龄分布大致对称;③甲市领导干部的平均年龄比乙市领导干部的平均年龄大;④平均年龄都是50.7、从某高校的高一学生中采用系统抽样法选出30人测量其身高,数据的茎叶图如图所示(单位:cm),若高一年级共有600人,估算身高在1.70m以上的有_______人.8、某市为了了解居民家庭网购消费情况,调查了10000户家庭的月消费金额(单位:元),所有数据均有区间上,其频率分布直方图如图所示,则被调查的10000户家庭中,月消费金额在1000元以下的有__________户.9、一所中学共有4 000名学生,为了引导学生树立正确的消费观,需抽样调查学生每天使用零花钱的数量(取整数元)情况,分层抽取容量为300的样本,作出频率分布直方图如图所示,请估计在全校所有学生中,一天使用零花钱在6元~14元的学生大约有________人.10、某人连续五周内收到的包裹数分别为3,2,5,1,4,则这5个数据的标准差为________.11、下列四个命题①样本方差反映的是所有样本数据与样本平均值的偏离程度;②从含有2008个个体的总体中抽取一个容量为100的样本,现采用系统抽样方法应先剔除8人,则每个个体被抽到的概率均为;③从总体中抽取的样本数据共有m个a,n个b,p个c,则总体的平均数的估计值为;④某中学采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做牙齿健康检查,现将800名学生从001到800进行编号,已知从497--512这16个数中取得的学生编号是503,则初始在第1小组00l~016中随机抽到的学生编号是007.其中真命题的个数是_____个12、某校在市统测后,从高三年级的1000名学生中随机抽出100名学生的数学成绩作为样本进行分析,得到样本频率分布直方图,如图所示,则估计该校高三学生中数学成绩在之间的人数为__________.13、某植树小组测量了一批新采购的树苗的高度,所得数据如茎叶图所示(单位:),则这批树苗高度的中位数为__________.14、某人5次上班途中所花的时间(单位:分钟)分别为.已知这组数据的平均数为10,方差为2,则的值为___.15、若1,2,3,4,这五个数的平均数为3,则这五个数的方差为__________.16、某学院的三个专业共有1200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的专业有380名学生,专业有420名学生,则在该学院的专业应抽取____________名学生.17、在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示,则该35名运动员成绩的中位数为__________.18、为了解学生答卷情况,某市教育部门在高三某次测试后抽取了名同学的试卷进行调查,并根据所得数据画出了样本的频率分布直方图(如图),该样本的中位数是__________.19、已知一组数据,,,,,则该组数据的方差是____.20、气象意义上从春季进入夏季的标志为:“连续5天的日平均温度均不低于22℃.”现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位:℃):①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.2.则肯定进入夏季的地区有____个.21、交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为,其中甲社区有驾驶员人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为,,,,则这四个社区驾驶员的总人数为.22、已知一组数据的方差是S,那么另一组数据的方差是。
高中数学人教版A版必修三课时作业习题及答案:第二章2-2 用样本估计总体

第二章统计2.2 用样本估计总体2.2.1用样本的频率分布估计总体分布课时目标 1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图,频率分布折线图,茎叶图.3.能够利用图形解决实际问题.1,用样本估计总体的两种情况(1)用样本的____________估计总体的分布.(2)用样本的____________估计总体的数字特征.2,数据分析的基本方法(1)借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中____________,二是利用图形________信息.(2)借助于表格分析数据的另一方法是用紧凑的________改变数据的排列方式,此法是通过改变数据的____________,为我们提供解释数据的新方式.3,频率分布直方图在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.4,频率分布折线图和总体密度曲线(1)频率分布折线图连接频率分布直方图中各小长方形__________,就得到了频率分布折线图.(2)总体密度曲线随着样本容量的增加,作图时所分的____增加,组距减小,相应的频率分布折线图就会越来越接近于一条________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.5,茎叶图(1)适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.(2)优点:它不但可以____________,而且可以__________,给数据的记录和表示都带来方便.(3)缺点:当样本数据______时,枝叶就会很长,茎叶图就显得不太方便.一、选择题1,下列说法不正确的是()A,频率分布直方图中每个小矩形的高就是该组的频率B,频率分布直方图中各个小矩形的面积之和等于1C,频率分布直方图中各个小矩形的宽一样大D,频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的2,一个容量为100的样本,其数据的分组与各组的频数如下:组别(0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数12 13 24 15 16 13 7 则样本数据落在(10,40]上的频率为()A,0.13 B.0.39 C.0.52 D.0.643,100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有()A.30辆B.40辆C,60辆D.80辆4,如图是总体密度曲线,下列说法正确的是()A,组距越大,频率分布折线图越接近于它B,样本容量越小,频率分布折线图越接近于它C,阴影部分的面积代表总体在(a,b)内取值的百分比D,阴影部分的平均高度代表总体在(a,b)内取值的百分比5,一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()A,20% B.69%C,31% D.27%6,某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A,90 B.75 C.60 D.45题号 1 2 3 4 5 6答案二、填空题7,将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 8,在如图所示的茎叶图中,甲,乙两组数据的中位数分别是________.9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题10,抽查100袋洗衣粉,测得它们的重量如下(单位:g):494498493505496492485483508 511495494483485511493505488 501491493509509512484509510 495497498504498483510503497 502511497500493509510493491 497515503515518510514509499 493499509492505489494501509 498502500508491509509499495 493509496509505499486491492 496499508485498496495496505 499505496501510496487511501496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升11,在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?12,某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.答案: 2.2.1 用样本的频率分布估计总体分布 知识梳理1,(1)频率分布 (2)数字特征 2.(1)提取信息 传递 (2)表格 构成形式 3.频率/组距 小长方形的面积 1 4.(1)上端的中点 (2)组数 光滑曲线5,(2)保留所有信息 随时记录 (3)较多作业设计1,A 2,C [样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52100=0.52.] 3,B [时速在[60,70)的汽车的频率为:0,04×(70-60)=0.4,又因汽车的总辆数为100, 所以时速在[60,70)的汽车大约有0.4×100=40(辆).]4,C5,C [由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.]6,A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36, ∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.] 7,60解析 ∵n·2+3+42+3+4+6+4+1=27, ∴n =60.8,45,46解析 由茎叶图及中位数的概念可知x 甲中=45,x 乙中=46. 9.m h解析频率组距=h ,故|a -b|=组距=频率h =m h . 10,解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:分组 个数累计 频数 频率 累积频率 [482.5,486.5) 正 8 0.08 0.08 [486.5,490.5) 3 0.03 0.11[490.5,494.5) 正正正 17 0.17 0.28 [494.5,498.5) 正正正正- 21 0.21 0.49 [498.5,502.5) 正正 14 0.14 0.63 [502.5,506.5) 正 9 0.09 0.72[506.5,510.5) 正正正 19 0.19 0.91 [510.5,514.5) 正- 6 0.06 0.97[514.5,518.5] 3 0.03 1.00合计 100 1.00(2)频率分布直方图与频率分布折线图如图.(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44.设重量不足500 g 的频率为b ,根据频率分布表,b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55. 11,解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.12,解 (1)(2)(3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.2.2.2用样本的数字特征估计总体的数字特征课时目标 1.会求样本的众数,中位数,平均数,标准差,方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.1,众数,中位数,平均数(1)众数的定义:一组数据中重复出现次数________的数称为这组数的众数.(2)中位数的定义及求法把一组数据按从小到大的顺序排列,把处于最______位置的那个数称为这组数据的中位数.①当数据个数为奇数时,中位数是按从小到大顺序排列的__________那个数.②当数据个数为偶数时,中位数为排列的最中间的两个数的________.(3)平均数①平均数的定义:如果有n个数x1,x2,…,x n,那么x=____________,叫做这n个数的平均数.②平均数的分类:总体平均数:________所有个体的平均数叫总体平均数.样本平均数:________所有个体的平均数叫样本平均数.2,标准差,方差(1)标准差的求法:标准差是样本数据到平均数的一种平均距离,一般用s表示.s=________________________________________________________________________.(2)方差的求法:标准差的平方s2叫做方差.s2=________________________________________________________________________.一、选择题1,下列说法正确的是()A,在两组数据中,平均值较大的一组方差较大B,平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C,方差的求法是求出各个数据与平均值的差的平方后再求和D,在记录两个人射击环数的两组数据中,方差大的表示射击水平高2,已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有()A,a>b>c B.a>c>bC,c>a>b D.c>b>a3,甲,乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲,乙两同学在这次篮球比赛活动中,发挥得更稳定的是()A,甲B.乙C,甲,乙相同D.不能确定4,一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是()A.13s2B.s2C,3s2D.9s25,如图是2010年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为()A,84,4.84 B.84,1.6C,85,1.6 D.85,0.46,如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B则()A.x A>x B,s A>s BB.x A<x B,s A>s BC.x A>x B,s A<s BD.x A<x B,s A<s B题号 1 2 3 4 5 6答案二、填空题7,已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.8,甲,乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲10 8 9 9 9乙10 10 7 9 9如果甲,乙两人只能有1人入选,则入选的应为________.9,若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a2,…,a20,x这21个数据的方差为________.三、解答题10,甲,乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:(1)请填写表:平均数方差中位数命中9环及9环以上的次数甲乙(2)请从下列四个不同的角度对这次测试结果进行分析:①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和中位数相结合看(分析谁的成绩好些);③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);④从折线图上两人射击命中环数的走势看(分析谁更有潜力).能力提升11,下面是一家快餐店所有工作人员(共7人)一周的工资表:总经理大厨二厨采购员杂工服务员会计3 000元450元350元400元320元320元410元(1)计算所有人员一周的平均工资;(2)计算出的平均工资能反映一般工作人员一周的收入水平吗?(3)去掉总经理的工资后,再计算剩余人员的平均工资,这能代表一般工作人员一周的收入水平吗?12,1,平均数、众数、中位数都是描述数据的集中趋势的,其中平均数是最重要的量.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法客观地反映总体特征;中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也成为缺点,因为这些极端值有时是不能忽视的.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.2,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.3,极差、方差、标准差是描述数据的离散程度的,即各数据与其平均数的离散程度.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.答案:2,2.2用样本的数字特征估计总体的数字特征知识梳理1,(1)最多 (2)中间 ①中间位置的 ②平均数 (3)①x 1+x 2+…+x n n ②总体中 样本中2,(1)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] (2)1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2] 作业设计1,B [A 中平均值和方差是数据的两个特征,不存在这种关系;C 中求和后还需取平均数;D 中方差越大,射击越不平稳,水平越低.]2,D [由题意a =110(16+18+15+11+16+18+18+17+15+13)=15710=15.7,中位数为16,众数为18,即b =16,c =18,∴c>b>a.]3,B [方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.∵5.09>3.72,故选B .]4,D [s 20=1n [9x 21+9x 22+…+9x 2n -n(3x )2]=9·1n(x 21+x 22+…+x 2n -n x 2)=9·s 2(s 20为新数据的方差).]5,C [由题意x =15(84+84+86+84+87)=85.s 2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=15(1+1+1+1+4)=85=1.6.]6,B [样本A 数据均小于或等于10,样本B 数据均大于或等于10,故x A <x B , 又样本B 波动范围较小,故s A >s B .] 7,91解析 由题意得8,甲解析 x 甲=9,2S 甲=0.4,x 乙=9,2S 乙=1.2,故甲的成绩较稳定,选甲.9,0.19 解析 这21个数的平均数仍为20,从而方差为121×[20×0.2+(20-20)2]≈0.19. 10,解 由折线图,知甲射击10次中靶环数分别为:9,5,7,8,7,6,8,6,7,7.将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数分别为: 2,4,6,8,7,7,8,9,9,10.也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.(1)x 甲=110×(5+6×2+7×4+8×2+9)=7010=7(环), x 乙=110×(2+4+6+7×2+8×2+9×2+10)=7010=7(环),s 2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,s 2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2] =110×(25+9+1+0+2+8+9)=5.4. 根据以上的分析与计算填表如下:平均数 方差 中位数 命中9环及9环以上的次数甲 7 1.2 7 1乙 7 5.4 7.5 3 (2)①∵平均数相同,2S 甲<2S 乙,∴甲成绩比乙稳定. ②∵平均数相同,甲的中位数<乙的中位数,∴乙的成绩比甲好些.③∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.④甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.11,解 (1)平均工资即为该组数据的平均数 x =17×(3 000+450+350+400+320+320+410)=17×5 250=750(元).(2)由于总经理的工资明显偏高,所以该值为极端值,因此由(1)所得的平均工资不能反映一般工作人员一周的收入水平.(3)除去总经理的工资后,其他工作人员的平均工资为:x ′=16×(450+350+400+320+320+410)=16×2 250=375(元).这个平均工资能代表一般工作人员一周的收入水平.12,解 设第一组20名学生的成绩为x i (i =1,2,…,20),第二组20名学生的成绩为y i (i =1,2,…,20), 依题意有:x =120(x 1+x 2+…+x 20)=90,y =120(y 1+y 2+…+y 20)=80,故全班平均成绩为:140(x 1+x 2+…+x 20+y 1+y 2+…+y 20)=140(90×20+80×20)=85;又设第一组学生成绩的标准差为s 1,第二组学生成绩的标准差为s 2,则s 21=120(x 21+x 22+…+x 220-20x 2),s 22=120(y 21+y 22+…+y 220-20y 2) (此处,x =90,y =80),又设全班40名学生的标准差为s ,平均成绩为z (z =85),故有s 2=140(x 21+x 22+…+x 220+y 21+y 22+…+y 220-40z 2) =140(20s 21+20x 2+20s 22+20y 2-40z 2) =12(62+42+902+802-2×852)=51. s =51.所以全班同学的平均成绩为85分,标准差为51.。
06-第二节 用样本估计总体-课时4 总体离散程度的估计高中数学必修第二册人教版

1 2
+ [2
2
+ (12 − 13)2 ],解得22 = 16.
知识点2 利用统计量进行决策
6.在某次运动会选拔赛上,甲、乙、丙、丁四人参加10米气步枪项目的角
逐.如果四人成绩的平均数和方差如下表所示:
甲
乙
丙
丁
平均数
8.6
8.9
8.9
8.2
方差2
3.5
3.5
2.1
5.6
那么从这四个人中选择一人参加运动会10米气步枪项目比赛,最佳人选是
2 + ,⋯ , + 的平均数为 + ,方差为2 2 .
4.[2024河南安阳调研]从某企业生产
的某种产品中抽取500件,测量这些
产品的一项质量指标值,由测量结果
得到如下频率分布直方图,则估计该
企业这种产品的质量指标值的方差为
110
_____(同一组中的数据用该组区间的中点值作代表).
− 69)2 × 13 + (69.4 − 69)2 × 1] = 0.033 6,
2
2
所以乙
< 甲
.乙工厂生产的足球的周长的方差略小于甲工厂生产的足球
的周长的方差,所以乙工厂的生产水平更稳定一些,D错误.
4.四名同学各掷骰子7次,分别记录每次骰子出现的点数,得到如下统计
结果,则可以判断出一定没有出现点数6的是( C )
1
(5
6
1
+ 6 + 7 + 5 + 7 + 6) = 6,方差为 (1 + 0 +
6
2 2
2
8
样本数据1 ,2 ,3 ,⋯ ,6 的方差为( ) × = .
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中数学:用样本估计总体练习1.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个小长方形的面积和的25,且样本容量为140,则中间一组的频数为(B)A.28 B.40C.56 D.60解析:设中间一组的频数为x,因为中间一个小长方形的面积等于其他8个小长方形的面积和的25,所以其他8组的频数和为52x,由x+52x=140,解得x=40.2.(广东广雅中学联考)某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m+n的值是(C)A.10 B.11C.12 D.13解析:∵甲组学生成绩的平均数是88,∴由茎叶图可知78+86+84+88+95+90+m+92=88×7,∴m=3,∵乙组学生成绩的中位数是89,∴n=9,∴m+n=12.3.(山东济南一模)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为s2,则(A)A.x =4,s 2<2 B .x =4,s 2>2 C.x >4,s 2<2D .x >4,s 2>2解析:∵某7个数的平均数为4,∴这7个数的和为4×7=28,∵加入一个新数据4,∴x -=28+48=4,又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+(4-4)28=74<2,故选A.4.(广东茂名五大联盟学校联考)甲、乙两组数的数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数相同的是( C )A.极差 B .方差 C .平均数D .中位数解析:由题中茎叶图中数据的分布,可知方差不同,极差不同, 甲的中位数为16+212=18.5,乙的中位数为14+182=16, x 甲=5+16+12+25+21+376=583,x 乙=1+6+14+18+38+396=583,所以甲、乙的平均数相同.故选C.5.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( D )A.56 B.60C.120 D.140解析:由频率分布直方图知200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.6.(北京东城质检)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:假设每名同学最近一周平均每天的锻炼时间是互相独立的.①男生每天锻炼的时间差别小,女生每天锻炼的时间差别大;②从平均值分析,男生每天锻炼的时间比女生多;③男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;④从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大.其中符合茎叶图所给数据的结论是(C)A.①②③B.②③④C.①②④D.①③④解析:由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确.男生平均每天锻炼时间超过65分钟的概率P 1=510=12,女生平均每天锻炼时间超过65分钟的概率P 2=410=25,P 1>P 2,因此④正确. 设男生、女生两组数据的平均数分别为x 甲,x 乙,标准差分别为s 甲,s 乙. 易求x 甲=65.2,x 乙=61.8,知x 甲>x 乙,②正确.又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散,∴s 甲<s 乙,③错误, 因此符合茎叶图所给数据的结论是①②④.7.(石家庄质检)设样本数据x 1,x 2,…,x 2 018的方差是4,若y i =2x i -1(i =1,2,…,2 018),则y 1,y 2,…,y 2 018的方差为 16 .解析:设样本数据的平均数为x ,则y i =2x i -1的平均数为2x -1,则y 1,y 2,…,y 2 018的方差为12 018[(2x 1-1-2x +1)2+(2x 2-1-2x +1)2+…+(2x 2 018-1-2x +1)2]=4×12 018[(x 1-x )2+(x 2-x )2+…+(x 2 018-x )2]=4×4=16.8.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有 24 株树木的底部周长小于100 cm.解析:底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24.9.一组数据1,10,5,2,x,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的方差为 9 .解析:根据题意知,该组数据的众数是2,则中位数是2÷23=3, 把这组数据从小到大排列为1,2,2,x,5,10, 则2+x2=3,解得x =4,所以这组数据的平均数为x =16×(1+2+2+4+5+10)=4,方差为s 2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.10.(江西新余一模)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x 人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45),得到如图所示的频率分布直方图,已知第一组有6人.(1)求x ;(2)求抽取的x 人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户,五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.解:(1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x =0.05, ∴x =120.(2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5, ∴a =953≈32,则中位数为32.(3)(ⅰ)5个年龄组成绩的平均数为x 1=15×(93+96+97+94+90)=94,方差为s 21=15×[(-1)2+22+32+02+(-4)2]=6.5个职业组成绩的平均数为x 2=15×(93+98+94+95+90)=94,方差为s 22=15×[(-1)2+42+02+12+(-4)2]=6.8.(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定.感想合理即可.11.在一个文艺比赛中,12名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分,如图是两个评判组对同一选手打分的茎叶图:(1)求A 组数的众数和B 组数的中位数;(2)对每一组计算用于衡量相似性的数值,回答:小组A 与小组B 哪一个更像是由专业人士组成的?并说明理由.解:(1)由茎叶图可得:A 组数据的众数为47,B 组数据的中位数为55+582=56.5.(2)小组A ,B 数据的平均数分别为x A =112(42+42+44+45+46+47+47+47+49+50+50+55)=56412=47, x B =112(36+42+46+47+49+55+58+62+66+68+70+73)=67212=56, 小组A ,B 数据的方差分别为s2A=112[(42-47)2+(42-47)2+…+(55-47)2]=112(25+25+9+4+1+0+0+0+4+9+9+64)=12.5,s2B=112[(36-56)2+(42-56)2+…+(73-56)2]=112(400+196+100+81+49+1+4+36+100+144+196+289)=133.因为s2A<s2B,所以A组成员的相似程度高,由于专业裁判给分更符合专业规则,相似程度应该高,因此A组更像是由专业人士组成的.12.(河北石家庄教学质量检测)某学校A、B两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.①A班兴趣小组的平均成绩高于B班兴趣小组的平均成绩;②B班兴趣小组的平均成绩高于A班兴趣小组的平均成绩;③A班兴趣小组成绩的标准差大于B班兴趣小组成绩的标准差;④B班兴趣小组成绩的标准差大于A班兴趣小组成绩的标准差.其中正确结论的编号为(A)A.①④B.②③C.②④D.①③解析:A班兴趣小组的平均成绩为53+62+64+…+92+9515=78,其方差为115×[(53-78)2+(62-78)2+…+(95-78)2]=121.6,则其标准差为121.6≈11.03;B班兴趣小组的平均成绩为45+48+51+…+9115=66,其方差为115×[(45-66)2+(48-66)2+…+(91-66)2]=175.2,则其标准差为175.2≈13.24.故选A.13.某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=3;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 6 000.解析:(1)由频率分布直方图可知:0.1×(0.2+0.8+1.5+2.0+2.5+a)=1,解得a=3.(2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1×(3.0+2.0+0.8+0.2)=0.6,所以所求购物者的人数为0.6×10 000=6 000.14.全世界越来越关注环境保护问题,某监测站点于2016年8月某日起连续n天监测空气质量指数(AQI),数据统计如下表:空气质量指数(μg/m3)[0,50](50,100](100,150](150,200](200,250] 空气质量等级优良轻度污染中度污染重度污染天数2040m 10 5(2)由频率分布直方图,求该组数据的平均数与中位数;(3)在空气质量指数分别为(50,100]和(150,200]的监测数据中,用分层抽样的方法抽取5天,从中任意选取2天,求事件A“两天空气质量等级都为良”的概率.解:(1)∵0.004×50=20 n,∴n=100,∵20+40+m+10+5=100, ∴m=25.40 100×50=0.008;25100×50=0.005;10 100×50=0.002;5100×50=0.001.由此完成频率分布直方图,如图:(2)由频率分布直方图得该组数据的平均数为25×0.004×50+75×0.008×50+125×0.005×50+175×0.002×50+225×0.001×50=95,∵[0,50]的频率为0.004×50=0.2,(50,100]的频率为0.008×50=0.4,∴中位数为50+0.5-0.20.4×50=87.5.(3)由题意知在空气质量指数为(50,100]和(150,200]的监测天数中分别抽取4天和1天,在所抽取的5天中,将空气质量指数为(50,100]的4天分别记为a,b,c,d;将空气质量指数为(150,200]的1天记为e,从中任取2天的基本事件为(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,e),共10个, 其中事件A“两天空气质量等级都为良”包含的基本事件为(a,b),(a,c),(a,d),(b,c),(b,d),(c,d),共6个,所以P(A)=610=35.。