随机抽样、用样本估计总体习题及答案解析
高一数学用样本估计总体试题答案及解析
高一数学用样本估计总体试题答案及解析1.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取20人参加一项活动,则从身高在[120,130内的学生中选取的人数应为.【答案】10【解析】由频率分布直方图可得:;则[120,130),[130,140),[140,150]三组人数所占的比例为,则在[120,130内选取的人数应为.【考点】频率分布直方图.2.设的平均数是,标准差是,则另一组数的平均数和标准差分别是_________.【答案】,.【解析】另一组数的平均数为:,标准差为:,所以则另一组数的平均数和标准差分别是,.【考点】统计中的期望与方差.3.200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70)的汽车大约( )A.30辆B.40辆C.60辆D.80辆【答案】D【解析】时速在[60,70)的频率为,故汽车大约有辆.【考点】频率分布直方图的应用.4.某校五四演讲比赛中,七位评委为一选手打出的分数如下:90 86 90 97 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.B.C.D.【答案】B【解析】由题意知,去掉一个最高分和一个最低分后,所剩数据的平均数为;方差为故选B.【考点】样本平均数和方差的计算.5.统计某校800名学生的数学期末成绩,得到频率分布直方图如图所示,若考试采用100分制,并规定不低于60分为及格,则及格率为.【答案】0.8【解析】由图形可知及格率为,答案为0.8.【考点】频率分布直方图6.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( ).A.甲B.乙C.丙D.丁【答案】C.【解析】分析表格可知,乙与丙的平均环数最多,又丙的方差比乙小说明丙成绩发挥的较为稳定,所以最佳人选为丙.【考点】数据的平均数与方差的意义.7.一次选拔运动中,测得7名选手的身高(单位:cm)分布茎叶图如图,记录的平均身高为177cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为( )A.5B.6C.7D.8【答案】D【解析】由图可知7名同学的身高分别为180、181、170、173、,178、179而7名同学的平均身高为177,所以有得=178,所以【考点】茎叶图8.由正整数组成的一组数据,其平均数和中位数都是,且标准差等于,则这组数据为 .(从小到大排列)【答案】【解析】由已知不妨假设,则,又因为标准差等于,所以,且都是正整数,观察分析可知这组数据只可为:1,1,3,3.【考点】1.平均数与中位数;2.标准差;3.方程组思想.9.某路段属于限速路段,规定通过该路段的汽车时速不得超过70km/h,否则视为违规扣分,某天有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图,如下图所示,则违规扣分的汽车大约为辆.【答案】120.【解析】易求得70-80这组的频率为1-0.05-0.18-0.38-0.27=0.12,则违规扣分的汽车大约为辆.【考点】频率分布直方图中每组对应的长方形面积为,总面积为1,频数=频率样本容量.10.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.【答案】0.04;440【解析】由频率分布直方图得:,解得;志愿者年龄在[25,35)的人数为.【考点】概率与统计.11.将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均分为91,现场做的7个得分的茎叶图(如图)后来有一个数据模糊,无法辨认,在图中用表示,则x的值为( )A.0B.4C.5D.7【答案】A【解析】如果是最高得分的话,,所以是最大值,那么,解得,故选A.【考点】茎叶图12.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差______.【答案】3.2【解析】由平均数及方差的定义可得;.【考点】样本数据的数字特征:平均值与方差.13.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数是多少;(3)这两个班参赛学生的成绩的中位数应落在第几小组内.【答案】(1)第二小组的频率为,补全的频率分布直方图详见解析;(2)100人;(3)九年级两个班参赛学生的成绩的中位数应落在第二小组内.【解析】(1)先从所给的直方图中得出第一、三、四、五小组的频率,然后用1减去第一、三、四、五小组的频率和得到第二小组的频率,接着由确定第二小组的小长方形的高,从而可补全频率分布直方图;(2)用第二小组的频数除以该组的频率,即可计算出九年两个班参赛学生的总人数;(3)要确定中位数所在的小组,只需先确定各小组的频数,从第一小组开始累加,当和达到总人数的一半时的组就是中位数所在的小组.试题解析:(1)∵各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05∴第二小组的频率为:∴落在59.5~69.5的第二小组的小长方形的高,则补全的频率分布直方图如图所示(2)设九年级两个班参赛的学生人数为人∵第二小组的频数为40人,频率为0.40∴,解得所以这两个班参赛的学生人数为100人(3)因为0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5所以九年级两个班参赛学生的成绩的中位数应落在第二小组内【考点】1.频率分布直方图;2.转化与运算能力.14.在样本的频率分布直方图中, 共有9个小长方形, 若第一个长方形的面积为0.02, 前五个与后五个长方形的面积分别成等差数列且公差互为相反数,若样本容量为160, 则中间一组(即第五组)的频数为()A.12B.24C.36D.48【答案】C【解析】设公差为d,那么9个小长方形的面积分别为0.02,0.02+d,0.02+2d,0.02+3d,0.02+4d,0.02+3d,0.02+2d,0.02+d,0.02,而9个小长方形的面积和为 1,可得0.18+16d=1 可以求得d=∴中间一组的频数为:160×(0.02+4d)=36.故答案为:36.故选C。
高中数学必修二 9 2 用样本估计总体(精讲)(含答案)
9.2 用样本估计总体(精讲)考法一总体取值规律的估计【例1】(2021·全国高一课时练习)某市2020年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空间质量为良;在101~150之间时,空间质量为轻微污染;在151~200之间时,空间质量为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.【答案】(1)频率分布表见解析;(2)频率分布直方图见解析;(3)该市空气质量有待进一步改善.【解析】(1)频率分布表(2)频率分布直方图(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的1 15;有26天处于良的水平,占当月天数的13 15;处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.【一隅三反】1.(2020·全国高一单元测试)某市为提倡节约用水,准备实行自来水“阶梯计费”方式,用户用水不超出基本用水量的部分享受基本价格,超出基本用水量的部分实行超价收费,为更好地决策,自来水公司随机抽取了部分用户的用水量数据,并绘制了如图不完整的统计图(每组数据包括右端点但不包括左端点),请你根据统计图解答下列问题:用户用水量频数直方图用户用水量扇形统计图(1)此次抽样调查的样本容量是________;(2)补全频数分布直方图,求扇形图中“15吨~20吨”部分的圆心角的度数;(3)如果自来水公司将基本用水量定为每户25吨,那么该地区6万用户中约有多少用户的用水全部享受基本价格.【答案】(1)答案见解析;(2)答案见解析,79.2°;(3)4.08万户.【解析】(1)1010%100÷=;(2)用水15~20吨的户数为100-10-36-24-8=22(户),“15~20吨”部分的圆心角的度数为22 36079.2100︒⨯=︒(3)1022366 4.08100++⨯=(万户)所以该地区6万用户中约有4.08万户的用水全部享受基本价格.2.(2020·全国高一单元测试)对某校高一年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M,p及图中a的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)内的人数. 【答案】(1)M =40,0.075p =,0.125a =;(2)90人. 【解析】(1)由[10,15)内的频数是10,频率是0.25知,100.25M=,所以M =40. 因为频数之和为40,所以10+25+m +2=40,m =3.330.07540p M ===. 因为a 是对应分组[15,20)的频率与组距的商,所以250.125405a ==⨯. (2)因为该校高一学生有360人,分组[10,15)内的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为3600.25⨯=90人.3.(2021·北京丰台区)为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50kW ·h 至350kW ·h 之间,进行适当分组后,画出频率分布直方图如图所示.(I )求a 的值;(Ⅱ)求被调查用户中,用电量大于250kW ·h 的户数;(III )为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW ·h )的建议,并简要说明理由. 【答案】(I )0.006;(Ⅱ)18;(III )245.5 kW ·h.【解析】(1)因为()0.00240.00360.00440.00240.0012501a +++++⨯=,所以0.006a =; (2)根据频率分布直方图可知:“用电量大于250kW ·h ”的频率为()0.00240.0012500.18+⨯=, 所以用电量大于250kW ·h 的户数为:1000.1818⨯=, 故用电量大于250kW ·h 有18户;(3)因为前三组的频率和为:()0.00240.00360.006500.60.8++⨯=<,前四组的频率之和为()0.00240.00360.0060.0044500.820.8+++⨯=>, 所以频率为0.8时对应的数据在第四组, 所以第一档用电标准为:0.80.620050245.50.22-+⨯≈kW ·h.故第一档用电标准为245.5 kW ·h.4.(2021·陕西咸阳市)某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.【答案】(Ⅰ)0.02;(Ⅱ)10800元. 【解析】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为: ()0.040.025309+⨯⨯=(天), 一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.考法二 总体百分数的估计【例2】(2020·天津和平区)已知一组数据为4,5,67,8,8,,第40百分位数是( ) A .8 B .7C .6D .5【答案】C【解析】因为有6位数,所以640 2.4⨯=%,所以第40百分位数是第三个数6.故选:C 【一隅三反】1.(2020·山东菏泽市·高一期末)数据1,2,3,4,5,6的60%分位数为( ) A .3 B .3.5C .3.6D .4【答案】D【解析】由6⨯60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数,故选:D2.(2021·山东高一期末)已知从某中学高一年级随机抽取20名女生,测量她们的身高(单位:cm ),把这20名同学的身高数据从小到大排序:148.0 149.0 150.0 152.0 154.0 154.0 155.0 155.5 157.0 157.0 158.0 159.0 161.0 162.0 163.0 164.0 165.0 170.0 171.0 172.0 则这组数据的第75百分位数是( ) A .163.0 B .164.0C .163.5D .164.5【答案】A【解析】因为这组数据从小到大已排序,所以这组数据的第75百分位数为第200.7515⨯=个数,即为163.0故选:A3.(2020·山东滨州市·高一期末)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[]0,10内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居号,他们的幸福感指数分别为5,6,7,8,9,5,则这组数据的第80百分位数是( ) A .7 B .7.5C .8D .9【答案】C【解析】该组数据从小到大排列为:5,5,6,7,8,9,且680% 4.8⨯=,故选:C.考法三 总体集中趋势的估计【例3】(2021·湖北荆州市)因受新冠疫情的影响,某企业的产品销售面临困难.为了改变现状,该企业欲借助电商和“网红”直播带货扩大销售.受网红效应的影响,产品销售取得了较好的效果.现将该企业一段时间内网上销售的日销售额统计整理后绘制成如下图所示的频率分布直方图:请根据图中所给数据,求: (1)实数a 的值;(2)该企业网上销售日销售额的众数和中位数; (3)该企业在统计时间段内网上销售日销售额的平均数. 【答案】(1)0.012;(2)55万元,57万元;(3)57.4万元. 【解析】(1)由频率分布直方图知:(0.0080.0160.0200.0180.0100.0042)101a ++++++⨯=,解得:0.012a =;(2)用频率分布直方图中最高矩形所在区间的中点值作为众数的近似值,得众数为55万元;因为第一个小矩形的面积为0.08,第二个小矩形的面积为0.12, 第三个小矩形的面积为0.16,0.080.120.160.36++=,设第四个小矩形中底边的一部分长为x ,则0.0200.50.36x ⨯=-,解得7x =, 所以中位数为50757+=万元; (3)依题意,日销售额的平均值为:250.08350.12450.16550.20650.18750.12850.10950.0457.4⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=所以该企业在统计时间段内网上销售日销售额的平均数为57.4万元. 【一隅三反】1.(2020·定边县第四中学高一期末)如图,从参加数学竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图,观察图形,回答下列问题:(Ⅰ)79.5-89.5这一组的频数、频率分别是多少? (Ⅱ)估计这次数学竞赛的平均成绩是多少?(Ⅲ)估计这次数学竞赛的及格率(60分及以上为及格). 【答案】(Ⅰ)15;0.25;(Ⅱ)70.5;(Ⅲ)75%. 【解析】(Ⅰ)79.589.5这一组的频率为0.025100.25⨯=,79.589.5这一组的频数为600.2515⨯=;(Ⅱ)估计这次数学竞赛的平均成绩是:44.50.154.50.1564.50.1574.50.384.50.2594.50.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.故估计这次数学竞赛的平均成绩是70.5.(Ⅲ)估计这次环保知识竞赛的及格率(60分及以上为及格)()10.010.0151075%P =-+⨯=. 2.(2021·河北唐山市·开滦第一中学高一期末)某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[)[)[]40,50,50,60,,90,100⋯后画出如下频率分布直方图.观察图形的信息,回答下列问题:(1)估计这次考试的众数m 与中位数n (结果保留一位小数); (2)估计这次考试的优秀率(80分及以上为及格)和平均分. 【答案】(1)75m =,73.3n =;(2)优秀率30%,平均分71分. 【解析】(1)众数是最高小矩形中点的横坐标,所以众数为75m =(分)前三个小矩形面积为0.01100.015100.015100.4⨯+⨯+⨯=, ∵中位数要平分直方图的面积, ∴0.50.47073.30.03n -=+=.(2)依题意,80及以上的分数所在的第五、六组, 频率和为 ()0.0250.005100.3+⨯=, 所以,抽样学生成绩的合格率是30%, 利用组中值估算抽样学生的平均分:450.1550.15650.15750.3850.25950.0571⨯+⨯+⨯+⨯+⨯+⨯=,估计这次考试的平均分是71分.3.(2021·吉林市)某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x 的值;并估计出月平均用水量的众数. (2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?【答案】(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【解析】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为(0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5,解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯=(3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++, ∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况,其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 考点四 总体离散程度的估计【例4】(2021·山东威海市·高一期末)如图所示的四组数据,标准差最小的是( )A .B .C .D .【答案】A【解析】对A ,()12106206302402516x =⨯+⨯+⨯+⨯=,s == 对B ,()16102202306402516x =⨯+⨯+⨯+⨯=,s == 对C ,()13105205303402516x =⨯+⨯+⨯+⨯=,10s ==, 对D ,()15103203305402516x =⨯+⨯+⨯+⨯=,s == 所以标准差最小的是A.故选:A.【一隅三反】1.(2020·全国高一)已知数据12,,,n x x x 的平均数为x ,方差为2s ,则123x +,223x +,…,23n x +的平均数和方差分别为( )A .x 和2sB .23x +和24sC .23x +和2sD .23x +和24129s s ++ 【答案】B【解析】因为数据12,,,n x x x 的平均数为x ,方差为2s ,所以123x +,223x +,…,23n x +的平均数和方差分别为23x +和24s故选:B2.(2020·安徽蚌埠市·蚌埠二中高一月考)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是( )A .17.2,3.6B .54.8,3.6C .17.2,0.4D .54.8,0.4 【答案】C【解析】设一组数据为i x (1,2,3,,)i n =,平均数为x ,方差为21s ,所得一组新数据为i y (1,2,3,,)i n =,平均数为y ,方差为22s ,则350i i y x =-(1,2,3,,)i n =,12 1.6n y y y y n +++==, 所以123503503501.6n x x x n -+-++-=, 所以350 1.6x -=,所以51.617.23x ==, 由题意得22222121()()() 3.6n s y y y y y y n ⎡⎤=-+-++-=⎣⎦, 所以222121(350 1.6)(350 1.6)(350 1.6) 3.6n x x x n⎡⎤--+--++--=⎣⎦, 所以2221219(17.2)(17.2)(17.2) 3.6n x x x n ⎡⎤⨯-+-++-=⎣⎦ 所以2221219()()() 3.6n x x x x x x n⎡⎤⨯-+-++-=⎣⎦, 所以219 3.6s =,所以210.4s =.故选:C.3.(2020·唐山市第十一中学)已知样本数据由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则a ,b 的值分别为( ).A .10,11B .10.5,9.5C .10.4,10.6D .10.5,10.5 【答案】D【解析】由于样本共有10个值,且中间两个数为a ,b ,依题意,得10.52a b +=,即21b a =-. 因为平均数为23371213.718.320101()0a b +++++++++÷=,所以要使该样本的方差最小,只需()()221010a b -+-最小.又()()()()222221010102110242221a b a a a a -+-=-+--=-+, 所以当4210.522a -=-=⨯时,()()221010a b -+-最小,此时10.5b =. 故选:D4.(2021·合肥市第六中学=)为了测试小班教学的实践效果,刘老师对A 、B 两班的学生进行了阶段测试,并将所得成绩统计如图所示;记本次测试中,A 、B 两班学生的平均成绩分别为A x ,B x ,A 、B 两班学生成绩的方差分别为2A s ,2B s ,则观察茎叶图可知( )A .AB x x <,22A B s s < B .A B x x >,22A B s s <C .A B x x <,22A B s s >D .A B x x >,22A B s s >【答案】B【解析】根据茎叶图中数据的分布可得,A 班学生的分数多集中在[]70,80之间, B 班学生的分数集中在[]50,70 之间,所以A B x x >.相对两个班级的成绩分布来说,A 班学生的分数更加集中,B 班学生的分数更加离散,所以22A B s s <.故选:B。
高考数学真题分类题库2020解析版 考点43 随机抽样、用样本估计总体
考点43随机抽样、用样本估计总体一、选择题1.(2020·全国卷Ⅲ理科·T3)在一组样本数据中,1,2,3,4出现的频率分别为p 1,p 2,p 3,p 4,且∑J14p i =1,则下面四种情形中,对应样本的标准差最大的一组是()A.p 1=p 4=0.1,p 2=p 3=0.4B.p 1=p 4=0.4,p 2=p 3=0.1C.p 1=p 4=0.2,p 2=p 3=0.3D.p 1=p 4=0.3,p 2=p 3=0.2【命题意图】本题考查标准差的大小比较,考查方差公式的应用及标准差与方差的关系,考查学生的计算能力.【解析】选B .选项A:E (X )=1×0.1+2×0.4+3×0.4+4×0.1=2.5.所以D (X )=(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×0.1=0.65.同理选项B:E (X )=2.5,D (X )=1.85;选项C:E (X )=2.5,D (X )=1.05;选项D:E (X )=2.5,D (X )=1.45.2.(2020·全国卷Ⅲ文科·T3)设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为()A.0.01 B.0.1C.1 D.10【命题意图】本题考查方差,考查基本分析求解运算能力.【解析】选C .因为数据ax i +b (i =1,2,…,n )的方差是数据x i (i =1,2,…,n )的方差的a 2倍,所以所求数据方差为102×0.01=1.二、填空题3.(2020·江苏高考·T3)已知一组数据4,2a ,3-a ,5,6的平均数为4,则a 的值是.【命题意图】本题主要考查数据特征中的平均数的计算.【解析】由4+2r (3-)+5+65=4可知a =2.答案:2。
用样本估计总体 第2节 华东师大版九年级数学下册同步练习(含答案)
28.2.2. 简单随机抽样调查可靠吗课堂练习一、单选题1.某学校需要了解全校学生眼睛近视的情况,下面抽取样本的方式比较合适的是()A.从全校每个班级中随机抽取10名学生作调查B.从九年级随机抽取一个班级的学生作调查C.从全校的女同学中随机抽取50名学生作调查D.在学校篮球场上随机抽取10名学生作调查2.在一次数学测试中,将某班50名学生的成绩分为5组,第一组到第四组的频率之和为0.8,则第5组的频数是()A.10B.9C.8D.73.在“We like maths.”这个句子的所有字母中,字母“e”出现的频数是()A.2B.3C.4D.54.在2008年的世界无烟日(5月31日),小华学习小组为了解本地区大约有多少成年人吸烟,随机调查了1000个成年人,结果其中有150个成年人吸烟.对于这个关于数据收集与处理的问题,下列说法正确的是()A.调查的方式是普查B.本地区约有15%的成年人吸烟C.样本是150个吸烟的成年人D.本地区只有850个成年人不吸烟5.如图是某班45名同学爱心捐款额的频数分布直方图(每组含前一个边界值,不含后一个边界值),则捐款人数最多的一组是()A.5~10元B.10~15元C.15~20元D.20~25元6.下列说法:①两点之间,线段最短;②正数和负数统称为有理数;③多项式3x2-5x2y2-6y4-2是四次四项式;④一个容量为80的样本最大值是123,最小值是50,取组距为10,则可以分成7组;⑤一个锐角的补角与这个角的余角的差是直角,其中正确的有()A.2个B.3个C.4个D.5个7.下列调查中,适宜采用全面调查(普查)方式的是()A.了解“中国达人秀第六季”节目的收视率B.调查我校七年级某班学生喜欢上数学课的情况C.调查我国民众对“香港近期暴力”行为的看法D.调查我国目前“垃圾分类”推广情况8.要调查城区九年级8000名学生了解禁毒知识的情况,下列调查方式最合适的是()A.在某校九年级选取50名女生B.在某校九年级选取50名男生C.在某校九年级选取50名学生D.在城区8000名九年级学生中随机选取50名学生二、填空题9.在一样本容量为80的样本中,已知某组数据的频率为0.7,频数为. 10.在整数20200408中,数字“0”出现的频率是.11.某校为了解七年级同学的体能情况,随机选取部分学生测试一分钟仰卧起坐的次数,并绘制了如图所示的直方图,学校七年级共有600人,则计该校一分钟仰卧起坐的次数不少于25次的有人.12.对1850个数据进行整理.在频数的统计表中,各组的频率之和等于. 13.如图是九(1)班45名同学每周课外阅读时间的频数分布直方图(每组含前一个边界值。
2022年高考分类题库考点43 随机抽样、用样本估计总体
考点43随机抽样、用样本估计总体1.(2022·全国甲卷文科)(同2022·全国甲卷理科T2)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图:则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差【命题意图】本题考查散点图、中位数、平均数、标准差、极差等基础知识,考查运算求解能力.【解析】选B.讲座前中位数为70%+75%2>70%,所以A错;讲座后问卷答题的正确率只有一个是80%,4个是85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D错.2.(2022·新高考Ⅱ卷)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).【命题意图】本题考查频率分布直方图求平均数、频率,考查条件概率计算公式.【解析】(1)平均年龄=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)×10=47.9(岁).(2)设A={一人患这种疾病的年龄在区间[20,70)},所以P(A)=1-P( )=1-(0.001+0.002+0.006+0.002)×10=1-0.11=0.89;(3)设B={任选一人年龄位于区间[40,50)},C={任选一人患这种疾病},则由条件概率公式可得P(C|B)= ( ) ( )=0.1%×0.023×100.16=0.0014375≈0.0014.16%=0.001×0.23。
2021年高考数学总复习第63讲:随机抽样与用样本估计总体练习题及答案解析
2021年高考数学总复习第63讲:随机抽样与用样本估计总体1.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差A[中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.] 2.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.200,20B.100,20C.200,10D.100,10A[该地区中小学生总人数为3 500+2 000+4 500=10 000人,则样本容量为10 000×2%=200人,其中抽取的高中生近视人数为2 000×2%×50%=20.]3.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有引起大规模群体感染的标志“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3D[根据信息可知,连续10天内,每天新增的疑似病例不超过7人,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,如果方差太大,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存在,那么方差不可能为3.故选D.]4.(2019·全国卷Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.8C[法一:设调查的100位学生中阅读过《西游记》的学生人数为x,则x+80-60=90,解得x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.法二:用Venn图表示调查的100位学生中阅读过《西游记》和《红楼梦》的人数之间的关系如图:易知调查的100位学生中阅读过《西游记》的学生人数为70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.]5.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是__________.140[由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.]6.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1人,则在采用系统抽样时,需要在总体中先剔除1个个体,则n=________.6[总体容量为6+12+18=36. 当样本容量为n时,由题意知,系统抽样的间隔为36 n,。
人教版2019必修二统计之随机抽样与样本估计总体
人教版2019必修二统计之随机抽样与样本估计总体一、单选题(共8题;共16分)1.(2分)某企业有职工150人,其中高级职称有15人,中级职称有45人,一般职员有90人,现抽取30人,进行分层抽样,则各职称人数分别为()A.5,10,15B.3,9,18C.3,10,17D.5,9,162.(2分)现有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样确定所抽取的编号为()A.5,10,15,20,25B.5,15,20,35,40C.5,11,17,23,29D.10,20,30,40,503.(2分)一高铁列车共有节车厢,铁路部门为了给旅客提供优质服务,在列车上做了一项民意调查在该高铁内选取每一节车厢号座位的乘客填写调查信息.这里运用的抽样方法是()A.抽签法B.随机数法C.系统抽样D.分层抽样4.(2分)数据12,12,12,14,15的平均数与众数的差为()A .2B.1C .-1D .-25.(2分)某校要调查该校1200名学生的身体健康情况,中男生700名,女生500名,现按性别用分层抽样的方法从中抽取120名学生的体检报告,下列说法错误的是()A.总体容量是1200B.样本容量是120C .男生应抽取70名D.女生应抽取40名6.(2分)一位高三学生在半年时间里经历了七次大考,他把这七次考试的历史成绩统计为如图所示的茎叶图,则该学生成绩的平均数和中位数分别为()A.84,83B.84,84C.85,84D.85,857.(2分)随机抽取骑行共享单车的市民进行问卷调查,得到样本的频率分布直方图如图所示.再从这些市民中用分层抽样的方法抽取一个样本进行调查,若第二次抽取的样本中年龄段的人数为14,则第二次抽取的样本中年龄段的人数为()A.2B.3C.5D.68.(2分)一年内,某单位组织员工进行了六次业务知识考试.一员工将其六次成绩绘成如图所示的茎叶统计图,其中第五次考试成绩以表示.若该员工成绩的中位数是93,则该员工六次业务知识考试成绩的方差是()A .B .C.D.二、多选题(共4题;共12分)9.(3分)下列命题是真命题的有()A.有甲、乙、丙三种个体按的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为30 B.数据1,2,3,3,4,5的平均数、众数、中位数相同C.若甲组数据的方差为5,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是乙D.一组数6,5,4,3,3,3,2,2,2,1的85%分位数为510.(3分)某特长班有男生和女生各10人,统计他们的身高,其数据(单位:cm)如下面的茎叶图所示,则下列结论正确的是()A.女生身高的极差为12B.男生身高的均值较大C.女生身高的中位数为165D.男生身高的方差较小11.(3分)已知一组数据,,,,的平均数和方差均为2,则下列叙述正确的有()A.,,,,的平均数为3B.,,,,的方差为3C.,,,,的方差为4D.,,,,的方差为812.(3分)下图是某市6月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择6月1日至6月13日中的某一天到达该市,并停留2天.下列说法正确的有()A.该市14天空气质量指数的平均值大于100B.此人到达当日空气质量优良的概率为C.此人在该市停留期间只有1天空气重度污染的概率为D.每连续3天计算一次空气质量指数的方差,其中第5天到第7天的方差最大三、填空题(共4题;共6分)13.(1分)有下列结论:①某年级有男生560人,女生420人,用分层抽样的方法从该年级学生中抽取一个容量为280的样本,则此样本中男生人数为160;②一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则列频率分布表时应将样本数据分为9组;③若关于的线性回归方程为,其中的取值依次为2,8,6,14,20,则;④用一组样本数据8,,10,11,9估计总体的标准差,若样本的平均数为10,则估计总体的标准差为.其中正确的有.(填写所有正确结论的序号)14.(1分)水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是.15.(1分)下表是关于某校高一年级男女生选科意向的调查数据,人数如表所示:选修物理选修历史男生16040女生80120现要在所有参与调查的人中用分层抽样的方法抽取n个人做进一步的调查,若在“选修物理的男生”中抽取了8人,则n的值为.16.(3分)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图,如图,估计这次测试中数学成绩的平均分约为、众数约为、中位数约为.(结果不能整除的精确到0.1)四、解答题(共4题;共40分)17.(10分)某教练统计了甲、乙两名三级跳远运动员连续5次的跳远成绩(单位:米),统计数据如图所示.(1)(5分)分别求甲、乙跳远成绩的平均数;(2)(5分)通过平均数和方差分析甲、乙两名运动员的平均水平和发挥的稳定性.18.(5分)某饭店共有36名厨师,其中特级厨师6名,一级厨师12名,二级厨师18名.该饭店用分层抽样的方法从这36名厨师中选派人参加饮食行业的比武大会.但是,即将参加比武大会时,被选出的厨师中恰有一名因病退出,如果再采用系统抽样(等距)方法选派,则选派的人数减少1,且需要从这36名厨师中剔除2人,求的值.19.(10分)某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人),现用分层抽样方法(按A类,B类分二层)从该工厂的工人中共抽取100名工人,调查他们的生产能力(生产能力指一天加工的零件数).(1)(5分)A类工人和B类工人各抽取多少人?(2)(5分)将A类工人和B类工人的抽查结果分别绘制成频率分布直方图(如图1和图2).①就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).20.(15分)某校高一(1)班全体男生的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如图所示,据此解答如下问题:(1)(5分)求该班全体男生的人数;(2)(5分)求分数在之间的男生人数,并计算频率公布直方图中之间的矩形的高;(3)(5分)根据频率分布直方图,估计该班全体男生的数学平均成绩(同一组中的数据用该组区间的中点值代表).答案解析部分1.【答案】B【解析】【解答】,即应按照的比例来抽取,高级职称应抽取(人);中级职称应抽取(人);一般职员应抽取(人).故答案为:B.【分析】由分层抽样的定义计算出结果即可。
冀教版九年级上册《23.4用样本估计总体》练习题含答案解析
23.4 用样本估计总体习题课1、随机抽样的三种方法是、、2、在简单随机抽样中,常用的两种办法是、3、画频率分布直方图的步骤是:4、茎叶图的两个优点是:(1)(2)课内探究一:用样本的平均数估计总体的平均数【例1】从一种棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352计算这25根棉花的纤维的平均长度,并估计这种棉花的纤维的平均长度?问题一:计算数据的平均数有没有较为简便的方法?跟踪训练:上图是CBA篮球联赛中,甲乙两名运动员某赛季一些场次得分的茎叶图,则平均得分高的运动员是________.课内探究二:用样本的标准差估计总体的标准差【例2】在一次跳远选拔比赛中,甲、乙两名运动员各进行了10次测试,成绩如下:甲运动员﹕5.85 5.93 6.07 5.91 5.99 6.13 5.89 6.05 6.00 6.19;乙运动员﹕6.11 6.08 5.83 5.92 5.84 5.81 6.18 6.17 5.85 6.21;观察上述样本数据,如果你是教练,选哪位选手去参加正式比赛?为什么?跟踪训练:1、甲、乙两台机床同时加工直径为100mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):甲:99,100,98,100,100,103乙:99,100,102,99,100,100(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.2、某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91.复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是________.第2页共2页。
高考数学《随机抽样与用样本估计总体》真题含答案
高考数学《随机抽样与用样本估计总体》真题含答案一、选择题1.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36,36,37,37,40,43,43,44,44,若用样本估计总体,年龄在(x -s ,x +s)内的人数占公司人数的百分比是(其中x 是平均数,s 为标准差,结果精确到1%)( )A .14%B .25%C .56%D .67% 答案:C解析:因为x -=36+36+37+37+40+43+43+44+449=40,s 2=19 (16+16+9+9+0+9+9+16+16)=1009 ,即s =103 ,年龄在(x - -s ,x -+s)即⎝⎛⎭⎫1103,1303 内的人数为5,所以所求百分比为59≈0.56=56%,故选C . 2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140 答案:D解析:由频率分布直方图知,200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.3.[2024·九省联考]样本数据16,24,14,10,20,30,12,14,40的中位数为( ) A .14 B .16 C .18 D .20 答案:B解析:将这些数据从小到大排列可得:10,12,14,14,16,20,24,30,40,则其中位数为16.故选B.4.[2024·新课标Ⅱ卷]某农业研究部门在面积相等的100块稻田上种植一种新型水稻,根据表中数据,下列结论中正确的是()A.100块稻田亩产量的中位数小于1 050 kgB.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200 kg至300 kg之间D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间答案:C解析:A选项,因为6+12+18=36<50,36+30=66>50,所以100块稻田亩产量的中位数不小于1 050 kg, A错误;B选项,因为100块稻田中亩产量低于1 100 kg的稻田有66块,所占比例为66%<80%,所以B错误;C选项,100块稻田亩产量的极差的最大值小于1 200-900=300,最小值大于1 150-950=200,所以极差介于200 kg至300 kg之间,C正确;D选项,同一组中的数据都用左端点值来估计,则这100块稻田亩产量的平均值的最小值为1100×(6×900+12×950+18×1 000+30×1 050+24×1 100+10×1 150)=1 042>1 000,所以平均值不介于900 kg至1 000 kg之间,D错误.故选C.5.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案:A解析:设建设前经济收入为a ,则建设后经济收入为2a ,由题图可得下表:根据上表可知B 、C 、D 均正确,A 不正确,故选A .6.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( )A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差 答案:B解析:由统计图可知,讲座前这10位社区居民问卷答题的正确率分别为65%,60%,70%,60%,65%,75%,90%,85%,80%,95%.对于A 项,将这10个数据从小到大排列为60%,60%,65%,65%,70%,75%,80%,85%,90%,95%,因此这10个数据的中位数是第5个与第6个数的平均数,为70%+75%2 =72.5%>70%,A 错误.对于B 项,由统计图可知,讲座后这10位社区居民问卷答题的正确率分别为90%,85%,80%,90%,85%,85%,95%,100%,85%,100%,所以讲座后这10位社区居民问卷答题的正确率的平均数为110×(90%+85%+80%+90%+85%+85%+95%+100%+85%+100%)=89.5%>85%,B 正确.对于C 项,讲座后这10位社区居民问卷答题的正确率的方差s 2后 =110 ×[(90%-89.5%)2+(85%-89.5%)2+…+(85%-89.5%)2+(100%-89.5%)2]=42.2510 000 ,所以标准差s 后=6.5%.讲座前这10位社区居民问卷答题的正确率的平均数为110 ×(60%+60%+65%+65%+70%+75%+80%+85%+90%+95%)=74.5%,所以讲座前这10位社区居民问卷答题的正确率的方差为s 2前 =110×[(60%-74.5%)2+(60%-74.5%)2+…+(90%-74.5%)2+(95%-74.5%)2]=142.2510 000 ,所以标准差s 前≈11.93%.所以s 前>s 后,C 错误.对于D 项,讲座前问卷答题的正确率的极差为95%-60%=35%,讲座后问卷答题的正确率的极差为100%-80%=20%,D 错误.故选B .7.(多选)有一组样本数据x 1,x 2,…,x n ,由这组数据得到新样本数据y 1,y 2,…,y n ,其中y i =x i +c(i =1,2,…,n),c 为非零常数,则( )A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同 答案:CD解析:A :E(y)=E(x +c)=E(x)+c 且c ≠0,故平均数不相同,错误;B :若第一组中位数为x i ,则第二组的中位数为y i =x i +c ,显然不相同,错误;C :D(y)=D(x)+D(c)=D(x),故方差相同,正确.D :由极差的定义知:若第一组的极差为x max -x min ,则第二组的极差为y max -y min =(x max+c)-(x min +c)=x max -x min ,故极差相同,正确.故选CD .8.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差 答案:C解析:甲的平均数是4+5+6+7+85 =6,中位数是6,极差是4,方差是(-2)2+(-1)2+02+12+225=2;乙的平均数是5+5+5+6+95=6,中位数是5,极差是4,方差是(-1)2+(-1)2+(-1)2+02+325 =125,比较可得选项C 正确.9根据上表可得经验回归方程为y ^ =6.3x +a ^,下列说法正确的是( ) A .回归直线y ^ =6.3x +a ^必经过样本点(2,19),(6,44)B .这组数据的样本点中心(x - ,y - )未必在回归直线y ^ =6.3x +a ^上 C .回归系数6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元 D .据此模型预报广告费用为7万元时销售额约为50.9万元 答案:D解析:由表格中的数据可得x - =2+3+4+5+65 =4,y - =19+25+34+38+445=32,将点(x - ,y - )的坐标代入经验回归方程得6.3×4+a ^=32, 解得a ^=6.8,所以回归方程为y ^=6.3x +6.8.对于A 选项,当x =2时,y ^=6.3×2+6.8=19.4,A 选项错误;对于B 选项,这组数据的样本点中心(x - ,y - )必在回归直线y ^ =6.3x +a ^上,B 选项错误;对于C 选项,回归系数6.3的含义是广告费用每增加1万元,销售额约增加6.3万元,C 选项错误;对于D 选项,当x =7时,y ^=6.3×7+6.8=50.9,所以据此模型预报广告费用为7万元时销售额约为50.9万元,D 选项正确.故选D .二、填空题10.已知一组数据4,2a ,3-a ,5,6的平均数为4,则a 的值是________. 答案:2解析:由平均数公式可得4+2a +(3-a )+5+65=4,解得a =2.11.某电子商务公司对10 000名网络购物者2021年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 答案:(1)3 (2)6 000解析:(1)0.1×(0.2+0.8+1.5+2.0+2.5+a)=1,解得a =3.(2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1×(3.0+2.0+0.8+0.2)=0.6,所以所求购物者的人数为0.6×10 000=6 000.12.在一容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1■,■,那么这组数据的方差s 2可能的最大值是________.答案:32.8解析:设这组数据的最后两个数据为10+x ,y(x ∈N ,x ≤9) ∵9+10+11+10+x +y =10×5=50, ∴x +y =10,∴y =10-x .∴s 2=15 [1+0+1+x 2+(y -10)2]=15 (2+2x 2).∵x ≤9,∴当x =9时,s 2取得最大值32.8.[能力提升]13.[2024·重庆南开中学月考]今年入夏以来,我市天气反复,降雨频繁.如图统计了上个月前15天的气温,以及相对去年同期的气温差(今年气温-去年气温,单位:摄氏度),以下判断错误的是( )A.今年每天气温都比去年同期的气温高B.今年的气温的平均值比去年同期的气温的平均值低C.去年8~11号气温持续上升D.今年8号气温最低答案:A解析:由图可知,1号温差为负值,所以今年1号气温低于去年同期的气温,故选项A 不正确;除6,7号,今年气温略高于去年同期的气温外,其他日子,今年气温都低于去年同期的气温,所以今年的气温的平均值比去年同期的气温的平均值低,选项B正确;今年8~11号气温上升,但是气温差逐渐下降,说明去年8~11号气温持续上升,选项C正确;由图可知,今年8号气温最低,选项D正确.故选A.14.(多选)[2023·新课标Ⅰ卷]有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差答案:BD解析:取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为223=663,故A,C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.综上,选BD.15.已知一组正数x 1,x 2,x 3的方差s 2=13 (x 21 +x 22 +x 23 -12),则数据x 1+1,x 2+1,x 3+1的平均数为________. 答案:3解析:∵s 2=13 [(x 1-x - )2+(x 2-x - )2+(x 3-x -)2]=13 ⎣⎡⎦⎤x 21 +x 22 +x 23 -2x -(x 1+x 2+x 3)+3x -2 =13 ⎣⎡⎦⎤x 21 +x 22 +x 23 -3x -2 , 又s 2=13 (x 21 +x 22 +x 23 -12), ∴3x - 2=12,∴x -=2.∴x 1+1,x 2+1,x 3+1的平均数为x 1+x 2+x 3+33=3.16.已知样本容量为200,在样本的频率分布直方图中,共有n 个小矩形,若中间一个小矩形的面积等于其余(n -1)个小矩形面积和的13,则该组的频数为________.答案:50解析:设除中间一个小矩形外的(n -1)个小矩形面积的和为P ,则中间一个小矩形面积为13 P ,P +13 P =1,P =34 ,则中间一个小矩形的面积等于13 P =14 ,200×14 =50,即该组的频数为50.。
抽样推断练习题答案
抽样推断练习题答案抽样推断是统计学中的一个重要概念,它涉及到从总体中抽取一部分样本,然后根据这些样本来推断总体的特征。
以下是一些抽样推断练习题的答案:1. 题目一:某公司有1000名员工,为了了解员工的平均工资水平,公司随机抽取了100名员工的工资进行调查。
调查结果显示这100名员工的平均工资为5000元。
如果总体平均工资的方差为1000元^2,那么95%置信水平下,总体平均工资的置信区间是多少?答案:根据抽样分布的中心极限定理,样本均值的分布近似正态分布。
首先计算样本均值的标准误差(SE):\[ SE =\sqrt{\frac{\sigma^2}{n}} = \sqrt{\frac{1000}{100}} = 10 \]。
然后使用95%置信水平下的z值,该值为1.96。
置信区间为:\[ CI = \bar{x} \pm z \times SE = 5000 \pm 1.96 \times 10 = (4969.4, 5030.6) \]。
2. 题目二:一个研究者想要估计一个城市中所有家庭的平均年收入。
他随机抽取了50个家庭,并计算出他们的平均年收入为50000元,标准差为10000元。
如果研究者想要以90%的置信水平估计总体平均年收入,置信区间应该是多少?答案:同样使用样本均值的分布近似正态分布。
计算标准误差:\[ SE = \frac{s}{\sqrt{n}} = \frac{10000}{\sqrt{50}} =1414.21 \]。
90%置信水平下的z值为1.645。
置信区间为:\[ CI = 50000 \pm 1.645 \times 1414.21 = (47142.79, 52857.21) \]。
3. 题目三:一个班级有200名学生,随机抽取了25名学生进行数学测试,平均分为80分,标准差为10分。
如果以99%的置信水平估计班级所有学生的数学平均分,置信区间是多少?答案:计算标准误差:\[ SE = \frac{s}{\sqrt{n}} =\frac{10}{\sqrt{25}} = 2 \]。
随机抽样与用样本估计总体 小题专练—2023届高考数学重难点二轮专题训练(含解析)
专题36随机抽样与用样本估计总体小题专练一、单选题1. 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是,,,,,则高一参赛学生的成绩的众数、中位数、平均成绩分别为( )A. B. C. D.2. 某省普通高中学业水平考试成绩由高分到低分按人数所占比例依次分为,,,,五个等级,等级,等级,等级,,等级共其中等级为不合格,原则上比例不超过该省某校高二年级学生都参加学业水平考试,先从中随机抽取了部分学生的考试成绩进行统计,统计结果如图所示.若该校高二年级共有名学生,则估计该年级拿到等级及以上级别的学生人数为()A. B. C. D.3. 下面规定一个学生数学成绩优秀的标志为连续次数学考试成绩满分分均不低于分现有甲、乙、丙三位学生连续次数学考试成绩的记录数据记录数据都是正整数情况:甲学生:个数据的中位数为,众数为乙学生:个数据的中位数为,总体均值为丙学生:个数据中有一个数据是,总体均值为,总体方差为.则可以断定数学成绩优秀的学生为( )A. 甲、丙B. 乙、丙C. 甲、乙D. 甲、乙、丙4. 从,,,,,,,中随机取两个数,这两个数一个比大,一个比小的概率为,已知为上述数据中的分位数,则的取值可能为( )A. B. C. D.5. 中国居民膳食指南数据显示,岁至岁儿童青少年超重肥胖率高达为了解某地中学生的体重情况,某机构从该地中学生中随机抽取名学生,测量他们的体重单位:千克,根据测量数据,按,,,,,分成六组,得到的频率分布直方图如图所示根据调查的数据,估计该地中学生体重的中位数是( )A. B. C. D.6. 某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:党史学习时间小时党员人数则该单位党员一周学习党史时间的众数及第百分位数分别是( )A. ,B. ,C. ,D. ,7. 某赛季甲、乙两名篮球运动员各场比赛得分情况用茎叶图表示如下:根据下图,对这两名运动员的成绩进行比较,下列四个结论中,不正确的是( )A. 甲运动员得分的极差大于乙运动员得分的极差B. 甲运动员得分的的中位数大于乙运动员得分的的中位数C. 甲运动员的得分平均值大于乙运动员的得分平均值D. 甲运动员的成绩比乙运动员的成绩稳定二、多选题8. 已知样本数据,,,的平均数为,方差为,由这组数据得到新样本数据,,,,其中,则得到的新样本数据的平均数和方差分别是( )A. 新样本数据的样本平均数为B. 新样本数据的样本平均数为C. 新样本数据的样本方差为D. 新样本数据的样本方差为9. 某中学为了解高三男生的体能情况,通过随机抽样,获得了名男生的米体能测试成绩单位:秒,将数据按照,,,分成组,制成了如图所示的频率分布直方图.由直方图推断,下列选项正确的是( )A. 直方图中的值为B. 由直方图估计本校高三男生米体能测试成绩的众数为秒C. 由直方图估计本校高三男生米体能测试成绩不大于秒的人数为D. 由直方图估计本校高三男生米体能测试成绩的中位数为秒10. 图为年月日通报的天内省区市疫情趋势,则下列说法正确的是()A. 无症状感染者的极差大于B. 确诊病例的方差大于无症状感染者的方差C. 实际新增感染者的平均数小于D. 实际新增感染者的第百分位数为11. 若甲组样本数据,,,数据各不相同的平均数为,方差为,乙组样本数据,,,的平均数为,则下列说法正确的是( ) A. 的值为 B. 乙组样本数据的方差为C. 两组样本数据的样本中位数一定相同D. 两组样本数据的样本极差不同三、填空题12. 工厂年前加紧手套生产,设该工厂连续天生产的手套数依次为,,,,单位:万只,若这组数据,,,,的方差为,且,,,,的平均数为,则该工厂这天平均每天生产手套万只.13. 在我市今年高三年级期中联合考试中,某校数学单科前名的学生成绩依次是:,,,,,,,,,,这名同学数学成绩的分位数是.14. 定义一个同学数学成绩优秀的标准为“连续次数学考试成绩均不低于分满分分”现有甲乙丙三位同学连续次数学考试成绩的数据数据都是正整数的描述:甲同学的个数据的中位数为,总体均值为;乙同学的个数据的中位数为,众数为;丙同学的个数据的众数为,极差为,总体均值为.则数学成绩一定优秀的同学是.15. 若,,,这个数据的样本平均数为,方差为,则,,,,这个数据的方差为.16. 某同学次测评成绩的数据从小到大排列如下:,,,,,,,,,已知成绩的中位数为,若要使标准差最小,则的值是.答案和解析1.【答案】解:由频率分布直方图得:高一参赛学生的成绩的众数为:,的频率为:,的频率为,中位数为:,平均数为:.故选:.2.【答案】解:由题中两图可知等级所占比例为,所以等级及以上级别所占比例为,所以估计等级及以上级别的学生人数为.故选:.3.【答案】解:对于第十三届全国人大女代表所占比重为,第十一届为,提高个百分点,A正确;对于第十三届全国政协女委员所占比重为,第四届为,提高个百分点,B正确;对于从第一到第十三届全国政协女委员所占比重的平均值为,高于,C错误;对于第十三届全国人大代表的人数约为人,不高于人,D正确.故选:.4.【答案】解:在中,甲同学:个数据的中位数为,众数为,所以前三个数为,,,则后两个数肯定大于,故甲同学数学成绩优秀,故成立;在中,个数据的中位数为,总体均值为,可以找到很多反例,如:,,,,,故乙同学数学成绩不优秀,故不成立;在中,个数据的中位数为,总体均值为,总体方差为,假设有一个数据小于,设为,则此时方差大于,且数据越小,整体方差越大,故所有数据均不低于.数学成绩优秀有甲和丙个同学.故选A.5.【答案】解:从,,,,,,,中随机取两个数有种,一个数比大,一个数比小的不同结果有,于是得,整理得:,解得或,当时,数据中的分位数是第个数,则,解得,所有选项都不满足;当时,数据中的分位数是第个数,则,解得,选项A,,不满足,满足.故选:.6.【答案】解:因为,,所以该地中学生的体重的中位数在内,设该中位数为,则,解得.7.【答案】解:党员人数一共有,学习党史事件为小时的人数最多,故学习党史时间的众数为,由,则第百分位数是第和个数的平均数,第,个数分别为,,所以第百分位数是.故选:.8.【答案】解:首先将茎叶图的数据还原:甲运动员得分:乙运动员得分:对于,极差是数据中最大值与最小值的差,由图中的数据可得甲运动员得分的极差为,乙运动员得分的极差为,得甲运动员得分的极差大于乙运动员得分的极差,因此A正确;对于,甲数据从小到大排列:处于中间的数是,所以甲运动员得分的中位数是,同理求得乙数据的中位数是,因此甲运动员得分的中位数大于乙运动员得分的中位数,故B正确;对于,不难得出甲运动员的得分平均值约为,乙运动员的得分平均值为,因此甲运动员的得分平均值大于乙运动员的得分平均值,故C正确;对于,分别计算甲、乙两个运动员得分的方差,方差小的成绩更稳定.可以算出甲的方差为:,同理,得出乙的方差为:,因为乙的方差小于甲的方差,所以乙运动员的成绩比甲运动员的成绩稳定,故D不正确.故选:.9.【答案】解:设样本数据,,,的方差为,新样本数据的方差为,因为,所以新样本数据的平均数,新样本数据的方差为.故选AD.10.【答案】解:由概率统计相关知识可知,各组频率之和为,所以,解得,故A错误;测试成绩的众数是直方图中频率最高组的中点,即故B正确;由图可知,成绩不大于秒的人数为故C正确;设中位数是,则,解得:,故D错误.故选:.11.【答案】解:对于,,且日与日确诊病例的差值不超过,所以无症状感染者的极差必然大于,故A正确;对于,相比较而言,确诊病例数比无症状感染者数波动性小,所以确诊病例的方差小于无症状感染者的方差,故B错误;对于,实际新增感染者的平均数,所以C错误;对于,因为天内省区市的实际新增感染者数从小到大分别为:,,,,,,,,,,,,,,又,不是整数,所以实际新增感染者的第百分位数为为第位,即为,所以D正确.故选AD.12.【答案】解:对于选项A由两组数据的平均数可知,,,故选项A正确,对于选项B,,,,,故选项B正确,对于选项C因为随着的增大而增大,所以若为甲组数据的中位数,则为乙组数据的中位数,故选项C错误,对于选项D因为随着的增大而增大,所以甲组数据的极差为,乙组数据的极差为,故选项D正确,故选:.13.【答案】解:依题意得,设,,,,的平均数为,根据方差的计算公式有,,即,又,.故答案为.14.【答案】解:将学生成绩从低到高排列为,,,,,,,,,,,分位数为第个数据与第个数据的平均数即15.【答案】乙解:在中,甲同学的个数据的中位数为,总体均值为,如,,,,,故甲同学的数学成绩不一定优秀;在中,乙同学的个数据的中位数为,众数为,所以前三个数为,,,则后两个数肯定大于,故乙同学的数学成绩一定优秀;在中,丙同学的个数据的众数为,极差为,总体均值为,最大值与最小值的差为,若最大值为,则最小值为即,,,,,故丙同学的数学成绩不一定优秀.综上,数学成绩一定优秀的同学只有乙.故答案为:乙.16.【答案】解:,,,这个数据的样本平均数为,方差为,,,,,,,这个数据的方差:.故答案为:.17.【答案】解:因为,,,,,,,,,的中位数为,则,所以,因为成绩的平均数为,要使标准差最小,即方差最小,因为,则有,当且仅当,即时,等号成立,此时标准差取得最小值,且符合题意,所以,故答案为.。
高三总复习数学检测题 随机抽样与用样本估计总体
随机抽样与用样本估计总体一、点全面广强基训练1.某市交通局为了解机动车驾驶员对交通法规的知晓情况,对甲、乙、丙、丁四个社区做分层随机抽样调查,其中甲社区有驾驶员96人,若从甲、乙、丙、丁四个社区中抽取驾驶员的人数分别为12,21,25,43,则乙、丙、丁三个社区驾驶员总人数是( )A .101B .808C .712D .89解析:选C 根据题意知抽样比为12÷96=18,则乙、丙、丁三个社区驾驶员总人数为(21+25+43)÷18=712.2.某校8位学生的本次月考成绩恰好都比上一次的月考成绩高出50分,以该8位学生这两次的月考成绩各自组成样本,则这两个样本不变的数字特征是( )A .方差B .中位数C .众数D .平均数解析:选A 由题意知,本次和上次的月考成绩的平均数、中位数、众数都相差50,根据方差公式知方差不变.3.(2021·天津高考)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是( )A .20B .40C .64D .80解析:选D 由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.05×4=80.4.(2021·新高考Ⅱ卷)(多选)下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是( )A .样本x 1,x 2,…,x n 的标准差B .样本x 1,x 2,…,x n 的中位数C .样本x 1,x 2,…,x n 的极差D .样本x 1,x 2,…,x n 的平均数解析:选AC 标准差、极差能反映一组数据偏离平均数的离散程度.故选A 、C. 5.(多选)机器人是一种能够半自主或全自主工作的智能机器.它可以辅助甚至替代人类完成某些工作,提高工作效率,服务人类生活,扩大或延伸人的活动及能力范畴.某公司为了研究某机器人的销售情况,统计了2021年2月至7月M ,N 两店每月该机器人的营业额(单位:万元),得到如图所示的折线图,则下列说法中正确的是( )A .N 店营业额的平均值是29B .M 店营业额的平均值在[34,35]内C .N 店营业额总体呈上升趋势D .M 店营业额的极差比N 店营业额的极差大解析:选ABC 对于A ,N 店营业额的平均值是16×(2+8+16+35+50+63)=29,A正确;对于B ,M 店营业额的平均值是16×(14+20+26+45+64+36)=2056∈[34,35],B 正确;由图象知C 正确;对于D ,M 店营业额的极差为64-14=50,N 店营业额的极差为63-2=61,50<61,D 错误.6.已知30个数据的60%分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是________.解析:由30×60%=18,设第19个数据为x ,则7.8+x2=8.2,解得x =8.6,即第19个数据是8.6.答案:8.67.将6个数据1,2,3,4,5,a 去掉最大的一个,剩下的5个数据的平均数为1.8,则a =________.解析:若a 是最大的数,则1+2+3+4+55=3,不符合题意.故5是最大的数,则1+2+3+4+a5=1.8,解得a =-1.答案:-18.某校高一年级开设了丰富多彩的校本课程,现从甲、乙两个班随机抽取了5名学生校本课程的学分,统计如表:用s 21,s 22s 22=________,并由此可判断成绩更稳定的班级是________班.解析:甲班学生学分的平均数x 1=15×(8+11+14+15+22)=14,所以甲班学生学分的方差s 21=15×[(8-14)2+(11-14)2+(14-14)2+(15-14)2+(22-14)2]=22.乙班学生学分的平均数x 2=15×(6+7+10+23+24)=14,所以乙班学生学分的方差s 22=15×[(6-14)2+(7-14)2+(10-14)2+(23-14)2+(24-14)2]=62,所以s 22=62.由此可判断成绩更稳定的班级是甲班.答案:62 甲9.为了迎接新高考,某校举行物理和化学等选科考试,其中,600名学生化学成绩(满分100分)的频率分布直方图如图所示,其中成绩分组区间是:第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95].已知图中前三个组的频率依次构成等差数列,第一组和第五组的频率相同.(1)求a ,b 的值;(2)估算高分(大于等于80分)人数;(3)估计这600名学生化学成绩的平均值(同一组中的数据用该组区间的中点值作代表)和中位数(中位数精确到0.1).解:(1)由题意可知,0.005+b =2×0.025,(0.005+0.025+b +a +0.005)×10=1,解得a =0.020,b =0.045.(2)因为高分的频率约为⎝⎛⎭⎫a 2+0.005×10=⎝⎛⎭⎫0.0202+0.005×10=0.15,所以估算高分(大于等于80分)人数为600×0.15=90.(3)估计这600名学生化学成绩的平均值等于50×0.005×10+60×0.025×10+70×0.045×10+80×0.02×10+90×0.005×10=69.5;设中位数为x 0,则0.005×10+0.025×10+0.045×(x 0-65)=0.5,解得x 0≈69.4,故估计这600名学生化学成绩的中位数为69.4.10.(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s21和s22.(1)求x,y,s21,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s21+s2210,那么认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解:(1)∵x=110×(9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.7)=10,y=110×(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5)=10.3,∴s21=110×(0.22+0.32+02+0.22+0.12+0.22+02+0.12+0.22+0.32)=0.036,s22=110×(0.22+0.12+0.22+0.32+0.22+02+0.32+0.22+0.12+0.22)=0.04.(2)∵y-x=10.3-10=0.3,2s21+s2210=20.036+0.0410=2 0.007 6,∴y-x=0.3=2×0.15=2×0.152=2×0.022 5>2×0.007 6,满足y-x≥2s21+s2210,∴新设备生产产品的该项指标的均值较旧设备有显著提高.二、重点难点培优训练1.(多选)对300名考生的数学竞赛成绩进行统计,得到如图所示的频率分布直方图.则下列说法正确的是() A.a=0.01B .成绩落在[80,90)的考生人数最多C .成绩的中位数大于80D .成绩的平均分落在[70,80)解析:选AD 由频率分布直方图的性质得,(a +0.02+0.035+0.025+a )×10=1,解得a =0.01,故A 正确;由频率分布直方图得成绩落在[70,80)的考生人数最多,故B 错误;由频率分布直方图得,[50,70)的频率为(0.01+0.02)×10=0.3,[70,80)的频率为0.035×10=0.35,∴成绩的中位数位于[70,80)内,故C 错误;成绩的平均分为x =55×0.01×10+65×0.02×10+75×0.035×10+85×0.025×10+95×0.01×10=75.5,∴成绩的平均分落在[70,80)内,故D 正确.2.(多选)在对某中学高一年级学生身高(单位:cm)的调查中,随机抽取了男生23人、女生27人,23名男生身高的平均数和方差分别为170和10.84,27名女生身高的平均数和方差分别为160和28.84,则( )A .总样本中女生的身高数据比男生的离散程度小B .总样本的平均数大于164C .总样本的方差大于45D .总样本的标准差大于7解析:选BC 因为方差越小,数据的离散程度越小,所以样本中女生的身高数据比男生的离散程度大,所以A 错误;由已知可得样本的平均数为23×170+27×16050=164.6,所以B 正确;设23名男生的身高分别为a 1,a 2,…,a 23,27名女生的身高分别为b 1,b 2,…,b 27,则a 1+a 2+…+a 23=23×170,123[(170-a 1)2+(170-a 2)2+…+(170-a 23)2]=10.84,b 1+b 2+…+b 27=27×160,127[(160-b 1)2+(160-b 2)2+…+(160-b 27)2]=28.84,所以23×1702-2×170×23×170+(a 21+a 22+…+a 223)=23×10.84,27×1602-2×160×27×160+(b 21+b 22+…+b 227)=27×28.84,所以a 21+a 22+…+a 223=23×10.84+23×1702,b 21+b 22+…+b 227=27×28.84+27×1602,所以总样本的方差为150[(164.6-a 1)2+…+(164.6-a 23)2+(164.6-b 1)2+…+(164.6-b 27)2]=1 50[50×164.62-2×164.6×50×164.6+(a 21+a 22+…+a 223)+(b 21+b 22+…+b 227)]=150[50×164.62-2×164.6×50×164.6+23×10.84+23×1702+27×28.84+27×1602]=45.4,所以C正确;由上面的计算可知标准差约为6.7,所以D错误.3.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表评分的平均值及分散程度(不要求计算出具体值,给出结论即可).(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级,估计哪个地区用户的满意度等级为不满意的概率大,请说明理由.解:(1)作出频率分布直方图如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.理由如下:记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.。
用样本估计总体 第1节 华东师大版九年级数学下册同步练习(含答案)
28.2.1. 简单随机抽样练习一、单选题1.一次跳远比赛中,成绩在4.05米以上的有9人,频率为0.3,则参加比赛的共有()A.40人B.30人C.20人D.10人2.某校进行学生睡眠时间调查,将所得数据分成5组.已知第一组的频率是0.18,第二、三、四小组的频率和为0.62,故第五组的频率是()A.0.20B.0.09C.0.31D.不能确定3.某校七年级共有1000人,为了了解这些学生的视力情况,抽查了20名学生的视力,对所得数据进行整理.若数据在4.85~5.15这一小组的频率为0.3,则可估计该校七年级学生视力在4.85~5.15范围内的人数有()A.600人B.300人C.150人D.30人4.小颖随机抽查他家6月份某5天的日用电量(单位:度),结果如下:9,11,7,10,8.根据这些数据,估计他家6月份日用电量为()A.6度B.7度C.8度D.9度5.下列说法正确的是()A.“品尝一勺汤,就知道一锅汤的味道“其蕴藏的数学知识是“通过样本可以估计总体”B.今年春节前4天(农历初一至初四)一位滴滴司机平均每天的纯收入为800元,则由此推算他2月份的月纯收人为56000元C.为掌握我市校外培训机构是否具备应有的资质可采用抽样调查的方式D.为了解我市市民对创建全国文明城市的知晓情况,适宜采用普查方式6.某样本容量是60,分组后,第2组的频率是0.15,那么第2组的频数是()A.9B.18C.60D.400 7.将一个有40个数据的样本统计分成6组,若某一组的频率为0.15,则该组的频数约是()A.1B.0.9C.6.67D.68.中学生骑电动车上学给交通安全带来隐患,为了解中学2 000名学生家长对“中学生骑电动车上学”的态度,从中随机调查400名家长,结果有360名家长持反对态度,则下列说法正确的是()A.调查方式是普查B.该校只有360名家长持反对态度C.样本是360名家长D.该校约有90%的家长持反对态度二、填空题9.某校在全校学生中举办了一次“交通安全知识”测试,张老师从全校学生的答卷中随机地抽取了部分学生的答卷,将测试成绩按“差”、“中”、“良”、“优”划分为四个等级,并绘制成如图所示的条形统计图.若该校学生共有2000人,则其中成绩为“良”和“优”的总人数估计为人.10.为纪念辛亥革命100周年,某校八年级(1)班全体学生举行了“首义精神耀千秋”的知识竞赛.根据竞赛成绩(得分为整数,满分为100分)绘制了频数分布直方图(如图所示),若成绩不少于80分为优秀,且该班有3名学成绩为80分,则学生成绩的优秀率是.11.王老师对本班40个学生所穿校服尺码的数据统计如下:则该班学生所穿校服尺码为“L”的人数有个.12.在一样本容量为80的样本中,已知某组数据的频率为0.7,频数为. 13.已知在一个样本中,40个数据分别在4个组内,第一、二、四组数据的频数分别为5,12,8则第三组的频率为.14.某工厂生产了一批零件共2000件,从中任意抽取了100件进行检查,其中不合格产品2件,则可估计这批零件中约有件不合格.三、解答题15.某校为了解九年级学生近两个月“推荐书目”的阅读情况,随机抽取了该年级的部分学生,调查了他们每人“推荐书目”的阅读本数.设每名学生的阅读本数为n,并按以下规定分为四档:当n<3时,为“偏少”;当3≤n<5时,为“一般”;当5≤n<8时,为“良好”;当n≥8时,为“优秀”.将调查结果统计后绘制成不完整的统计图表:请根据以上信息回答下列问题:(1)求出本次随机抽取的学生总人数;(2)分别求出统计表中的x,y的值;(3)估计该校九年级400名学生中为“优秀”档次的人数.16.小花最近买了三本课外书,分别是《汉语字典》用A表示,《流行杂志》用B表示和《故事大王》用C表示.班里的同学都很喜欢借阅,在五天内小花做了借书记录如下表:(1)在表中填写五天内每本书的借阅频数.(2)计算五天内《汉语字典》的借阅频率.17.为了解八年级学生的课外阅读情况,我校语文组从八年级随机抽取了若干名学生,对他们的读书时间进行了调查并将收集的数据绘成了两幅不完整的统计图,请你依据图中提供的信息,解答下列问题:(每组含最小值不含最大值)(1)从八年级抽取了多少名学生?(2)填空(直接把答案填到横线上)①“2﹣2.5小时”的部分对应的扇形圆心角为多少度;②课外阅读时间的中位数落在多少时间段内.(3)如果八年级共有800名学生,请估算八年级学生课外阅读时间不少于1.5小时的有多少人?参考答案与试题解析1.B 2.A 3.B 4.D 5.A 6.A 7.D 8.D 9.1100 10.62% 11.8 12.56 13.3814.4015.解:(1)由表知被调查学生中“一般”档次的有13人,所占比例是26%,故被调查的学生数是13÷26%=50(人);(2)被调查的学生中“良好”档次的人数为50×60%=30(人), ∴x=30﹣(12+7)=11(人),y=50﹣(1+2+6+7+12+11+7+1)=3(人);(3)由样本数据可知:“优秀”档次所占的百分比为3+150×100%=8%,∴估计九年级400名学生中优秀档次的人数为:400×8%=32(人).16.解:(1)填表如下:(2)总数是14+15+11=40,则五天内《汉语字典》的借阅频率是:1440=720.17.解:(1)总人数=30÷25%=120人;(2)①a%=12120=10%,∴对应的扇形圆心角为360°×10%=36°;②总共120名学生,中位数为60、61,∴落在1~1.5内.(3)不少于1.5小时所占的比例=10%+20%=30%,∴人数=800×30%=240人.。
高二数学用样本估计总体练习题及答案
高二数学用样本估计总体练习题及答案1.关于频率分布直方图,正确的说法是直方图的高表示该组上的个体在样本中出现的频数与组距的比值。
2.样本在区间(-50,50]上的频率为25%。
3.样本方差S²能够估计总体稳定性。
4.(1)这种抽样方法是简单随机抽样。
(2)甲车间的数据茎叶图呈现出正态分布,乙车间的数据茎叶图呈现出偏态分布,说明甲车间的生产情况比乙车间更加稳定。
(3)甲车间的平均值为100.14,标准差为8.59,乙车间的平均值为98.57,标准差为16.66,甲车间的产品比较稳定。
5.该小组成绩的平均数、众数、中位数分别为87、85、85.6.数据a1,a2,…,a20,x这21个数据的方差约为0.1905.7.样本的频率分布能够用来估计总体的频率分布。
8.同学平均成绩好,但___同学的成绩波动更大。
9.一位中学生在30天中记忆英语单词的数量如下:2天记忆51个,3天记忆52个,6天记忆53个,8天记忆54个,7天记忆55个,3天记忆56个,1天记忆57个。
求这位中学生30天中的平均记忆量。
10.从一批棉花中抽取9根棉花的纤维长度如下(单位:mm):82,202,352,321,25,293,86,206,115.求样本平均数、样本方差和样本标准差。
11.有甲、乙两个球队,甲队有6名队员,乙队有20名队员,他们的身高数据如下(单位:mm):甲队身高分别为187,181,175,185,173,179;乙队身高分别为180,179,182,184,183,183,183,176,176,181,177,177,178,180,177,184,177,182,177,183.求两队队员的平均身高,比较甲、乙两队身高的整齐程度。
12.甲、乙两台机床在相同技术条件下同时生产一种尺寸为10mm的零件,现从中各抽测10个,它们的尺寸分别如下(单位:mm):甲10,2,10,1,10,9,8,9,9,10;乙10,3,10,4,9,6,9,9,10,10.求上述两个样本的平均数与方差,并估计哪台机床生产的零件质量更好。
2020版高考数学一轮复习(六十五)随机抽样与用样本估计总体(含解析)
课时跟踪检测(六十五)随机抽样与用样本估计总体一、题点全面练1。
(2018·石家庄模拟)某校一年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为140的样本,则此样本中男生人数为()A。
80 B。
120C。
160 D。
240解析:选A 因为男生和女生的比例为560∶420=4∶3,样本容量为140,所以应该抽取男生的人数为140×错误!=80,故选A.2。
一个总体中有600个个体,随机编号为001,002, (600)利用系统抽样方法抽取容量为24的一个样本,总体分组后在第一组随机抽得的编号为006,则在编号为051~125之间抽得的编号为( )A。
056,080,104 B。
054,078,102C.054,079,104D.056,081,106解析:选D 系统抽样的间隔为错误!=25,编号为051~125之间抽得的编号为006+2×25=056,006+3×25=081,006+4×25=106.3。
(2019·天水模拟)甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为x甲,x乙,标准差分别为s甲,s乙,则( )A。
错误!甲<错误!乙,s甲<s乙B.错误!甲<错误!乙,s甲>s乙C.错误!甲>错误!乙,s甲<s乙D。
错误!甲>错误!乙,s甲>s乙解析:选C 由图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知错误!甲>x乙。
图中数据显示甲同学的成绩比乙同学稳定,故s甲<s乙.4.(2019·中山模拟)某商场在国庆黄金周的促销活动中,对10月1日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则9时至14时的销售总额为( )A。
10万元 B.12万元C。
15万元D。
30万元解析:选D 由图知,9时至10时的销售额频率为0。
28_2 用样本估计总体(重点练)解析版
28.2用样本估计总体(重点练)一、单选题1.(2019·重庆市育才中学九年级期中)为了调查红旗小学六年级学生的兴趣爱好,以下样本最具代表性的是()A.该年级书法社团的学生B.该年级部分女学生C.该年级跑步较快的学生D.从每个班级中,抽取学号为10的整数倍的学生【答案】D【分析】抽样调查中具有代表性是指具有随机性、大众性.【详解】A.书法社团的学生的兴趣爱好大多数是书法,不具代表性,故错误;B.部分女生没有考虑到男生的兴趣爱好,故错误;C.跑步较快的学生兴趣爱好偏向与运动,故错误;D.抽取学号为10的整数倍,具有随机性,故正确.【点睛】此题主要考察抽样调查样本的代表性.2.(2019·湖南望城·九年级期末)为了解我县七年级6000名学生期中数学考试情况,从中抽取了500名学生的数学成绩进行统计.下列判断:①这种调查方式是抽样调查;②6000名学生是总体;③每名学生的数学成绩是个体;④500名学生是总体的一个样本;⑤500名学生是样本容量.其中正确的判断有()A.1个B.2个C.3个D.4个【答案】B【分析】总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.【详解】这种调查方式是抽样调查;故①正确;总体是我市七年级6000名学生期中数学考试情况;故②错误;个体是每名学生的数学成绩;故③正确;样本是所抽取的500名学生的数学成绩,故④错误;样本容量是500,故⑤错误.故选B【点睛】本题考查了总体、个体与样本.总体、个体与样本的考查对象是相同的,所不同的是范围的大小,样本容量是样本中包含的个体的数目,不能带单位,难度适中.3.(2020·山东烟台·二模)为了了解2018年北京市乘坐地铁的每个人的月均花费情况,相关部门随机调查了1000人乘坐地铁的月均花费(单位:元),绘制了如下频数分布直方图.根据图中信息,下面3个推断中,合理的是______.①小明乘坐地铁的月均花费是75元,那么在所调查的1000人中至少有一半的人月均花费超过小明;②估计平均每人乘坐地铁的月均花费的范围是60~120元;③如果规定消费达到一定数额可以享受折扣优惠,并且享受折扣优惠的人数控制在20%左右,那么乘坐地铁的月均花费达到120元的人可享受折扣.A.①②B.①③C.②③D.①②③【答案】D【分析】①根据图中信息可得月均花费超过80元的有500人,故①正确;②根据图中信息,可得大多数人乘坐地铁的月均花费在60-120之间,据此可得平均每人乘坐地铁的月均花费的范围;③该市1000人中,20%左右的人有200人,根据图形可得乘坐地铁的月均花费达到120元的人有200人可以享受折扣.【详解】解:①月均花费超过80元的有200+100+80+50+25+25+15+5=500人,小明乘坐地铁的月均花费是75元,∴所调查的1000人中至少有一半以上的人月均花费超过小明;故①正确;②根据图中信息,可得大多数人乘坐地铁的月均花费在60-120之间,估计平均每人乘坐地铁的月均花费的范围是60-120;故②正确;③∵1000×20%=200,而80+50+25+25+15+5=00,∴乘坐地铁的月均花费达到120元的人可享受折扣,③正确;故选D.【点睛】本题主要考查了频数分布直方图,抽样调查以及用样本估计总体等内容,准确识图并合理分析是解题的关键.二、填空题4.(2021·全国·九年级单元测试)为估计某天鹅湖中天鹅的数量,先捕捉10只,全部做上记号后放飞.过了一段时间后,重新捕捉40只,其中带有标记的天鹅有2只.据此可估算出该地区大约有天鹅________只.【答案】200【分析】重新捕捉40只,数一数带有标记的天鹅有2只,说明在样本中,有标记的所占比例为240,而在总体中,有标记的共有10只,估计所占比例,即可解答.【详解】10240÷=200(只).故答案为200.【点睛】本题考查了通过样本去估计总体,只需将样本“成比例地放大”为总体即可.5.(2019·全国·九年级单元测试)小新家今年4月份头6天用米量如表:估计小新家4月份用米量为________kg.【分析】先计算出这6天一共用米的量,再算出平均每天用米的量,从而计算出小新家4月份用米的总量.【详解】解根据题意得:(0.6+0.8⨯2+0.9⨯2+1.0)÷6=56 (kg),则小新家4月份用米量为: 56⨯30=25(kg);故答案为:25.;【点睛】本题考查的是通过样本去估计总体,总体平均数约等于样本平均数. 6.(2020·北京·九年级专题练习)小明调查了他所在年级三个班学生的身高,并进行了统计,列出如下频数分布表:155cm”可能性最大.【答案】1班【分析】先计算出三个班中身高不低于155cm 的人数占总人数的比例,分别进行比较大小即可.【详解】解:1班中身高不低于155cm 的人数占总人数的比例为3940;2班中身高不低于155cm 的人数占总人数的比例为3040;3班中身高不低于155cm 的人数占总人数的比例为3540;通过比较大小可得,抽到1班的身高不低于155cm 可能性最大.故答案为1班. 【点睛】本题考查的可能性的大小.准确计算概率是解题的关键.7.(2020·广东·东莞市长安雅正学校九年级月考)田大伯从鱼塘捞出200条鱼做上标记再放入池塘,经过一段时间后又捞出300条,发现有标记的鱼有20条,田大伯的鱼塘里鱼的条数约是_____________. 【答案】3000【分析】设鱼塘中估计有鱼条,第一次捞出200条,并将每条鱼做上记号再放入水中,当做了记号完全混于鱼群中,又捞出300条,发现带有记号的鱼有20条,由此根据样本估计总体的思想可以列出方程300:20:200x ,解方程即可求解. 【详解】解:∵20÷300=115∴200÷115=3000.故答案为:3000【点睛】本题考查的是概率问题,利用样本估计总体的思想,理解题意找到相等关系是解题关键. 三、解答题8.(2021·全国·九年级课时练习)为了顾及鱼塘中的鱼数,养鱼者首先从鱼塘中打捞n 条鱼,在每一条鱼身上做好记号后把这些鱼放归鱼塘,再从鱼塘中打捞a 条鱼,如果在这a 条中有b 条鱼是有记号的,那么估计鱼塘中鱼的条数为anb,你认为这种估计方法有道理吗?为什么? 【答案】有道理,理由见解析.【分析】首先求出有记号的b 条鱼在a 条鱼中所占的比例,然后根据用样本中有记号的鱼所占的比例等于鱼塘中有记号的鱼所占的比例,即可求得鱼的总条数.【详解】解:∵打捞a 条鱼,发现其中带标记的鱼有b 条,∴有标记的鱼占b a. ∵共有n 条鱼做上标记,∴鱼塘中估计有n ÷b a=nab(条),∴这种说法有道理. 【点睛】本题考查了用样本估计总体,关键是求出带标记的鱼占的百分比,运用了样本估计总体的思想.9.(2021·河南省淮滨县第一中学九年级期末)一个口袋中有9个红球和若干个白球,在不允许将球倒出来数的前提下,小明采用如下的方法估算其中白球的个数:从口袋中随机摸出一球,记下颜色,然后把它放回口袋中,摇匀后再随机摸出一球,记下颜色…,小明重复上述过程共摸了100次,其中40次摸到白球,请回答:(1)口袋中的白球约有多少个?(2)有一个游乐场,要按照上述红球、白球的比例配置彩球池,若彩球池里共有1200个球,则需准备多少个红球?【答案】(1)小明可估计口袋中的白球的个数是6个.(2)需准备720个红球.试题分析:(1)用白球的个数:(白球的个数+红球的个数)=40:100,列方程求解;(2)用彩球的总数乘以10040100,即可得到红球的个数.试题解析:(1)解:设白球的个数为x个,根据题意得:解得:x=6小明可估计口袋中的白球的个数是6个.(2)1200×=720.答:需准备720个红球.点睛:本题主要考查了用样本估计总体,其本质是利用概率相等来解决问题,如口袋中有9个红球和若干个白球,在不允许将球倒出来数的前提下,随机摸出一个,摸出白球的概率与重复100次摸到40次白球的概率相同,从而列方程求解.10.(2018·安徽·宣城市第六中学九年级月考)中央电视台的“朗读者”节目激发了同学们的读书热情,为了引导学生“多读书,读好书”,某校对七年级部分学生的课外阅读量进行了随机调查,整理调查结果发现,学生课外阅读的本书最少的有5本,最多的有8本,并根据调查结果绘制了不完整的图表,如下所示:(1)统计表中的a=________,b=___________,c=____________;(2)请将频数分布表直方图补充完整;(3)求所有被调查学生课外阅读的平均本数;(4)若该校七年级共有1200名学生,请你分析该校七年级学生课外阅读7本及以上的人数.【答案】(1)a=10,b=0.28,c=50;(2)补图见解析;(3)6.4本;(4)528人.【分析】(1)首先求出总人数,再根据频率,总数,频数的关系即可解决问题;(2)根据a的值画出条形图即可;(3)根据平均数的定义计算即可;(4)用样本估计总体的思想解决问题即可;【详解】(1)由题意c=180.36=50,a=50×0.2=10,b=1450=0.28,c=50;故答案为a=10,b=0.28,c=50;(2)将频数分布表直方图补充完整,如图所示:(3)所有被调查学生课外阅读的平均本数为:(5×10+6×18+7×14+8×8)÷50=320÷50=6.4(本).(4)该校七年级学生课外阅读7本及以上的人数为:(0.28+0.16)×1200=528(人).11.(2019·全国·九年级单元测试)小颖同学学完统计知识后,随机调查了她所在辖区若干名居民的年龄,将调查数据绘制成如下扇形和条形统计图:请根据以上不完整的统计图提供的信息,解答下列问题:(1)小颖同学共调查了多少名居民的年龄,扇形统计图中a,b各等于多少?(2)补全条形统计图;(3)若该辖区年龄在0~14岁的居民约有1500人,请估计年龄在15~59岁的居民的人数.【答案】(1)300,a=20%,b=12%;(2)答案见解析;(3)5100.【分析】(1)根据15——40岁的居民所占百分比求出总人数,再得各段的百分比,从而求出a,b 的值,(2)见下图,(3)根据年龄在0~14岁的居民所占比重求出总人数,乘以年龄在15~59岁的居民的占比即可.【详解】解:(1)根据题意得:144÷48%=300(名),a=60÷300×100%=20%,b=36÷300×100%=12%,(2)41~59岁的居民有300×20%=60(人),补图如下:(3)根据题意得:总人数:1500÷20%=7500(人),7500×(20%+48%)=5100(人).【点睛】本题考查了统计图的实际应用,用样本估计总体,中等难度,从统计图中得到有用信息是解题关键.12.(2019·山西·九年级专题练习)晋剧(山西梆子)是我国北方的一个重要戏剧剧种,也叫中路戏,是国家级非物质文化遗产.某校在传统文化活动周期间拟向同学们推介晋剧,并就“你想要听哪部晋剧曲目”调查了部分学生,选择曲目有:A.《打金枝》,B.《战宛城》,C.《杀宫》,D.《火焰驹》,E,《双锁山》,每个学生只能选择一部,根据统计结果绘制了如下不完整的统计图.请根据以上信息,解答下列问题:(1)请补全条形统计图;(2)在扇形统计图中,扇形A的圆心角是多少度?(3)若该校共有2000名学生,请你估计想听《战宛城》的学生有多少人?(4)要从这些被调查的学生中随机抽取一人进行访谈,那么正好抽到想听《火焰驹》的学生的概率是多少?【答案】(1)补图见解析;(2)54°;(3)500人;(4)15【分析】(1)根据E 的特征,结合两种统计图求出总人数,进而求出B,D 组对应的人数即可; (2)先求出A 组所占的百分比,再乘以360°即可; (3)用2000乘以B 组所占百分比即可; (4)根据概率=D 组人数÷总人数即可解题. 【详解】解:(1)补全条形统计图如解图;调查学生的总人数为2430%80÷=(人),选择B 的人数为8025%20⨯=(人),选择D 的人数为80122082416----=(人),据此补全条形统计图. (2)选择A 的人数所占百分比为12100%15%80⨯=, ∴扇形A 所对应扇形的圆心角度数为3601554%︒︒⨯=.(3)200025%500⨯=(人),∴估计想听《战宛城》的学生有500人;(4)共有80人,其中想听《火焰驹》的有16人,P ∴(正好抽到想听《火焰驹》的学生)161805==, ∴随机抽取一人正好抽到想听《火焰驹》的学生的概率是15【点睛】本题考查了统计与概率,用样本信息估计总体信息,属于简单题,找到两种统计图之间的信息关联是解题关键,主要失分原因是: ①找不到扇形统计图和条形统计图中的对应关系;②补全条形统计时作图不规范;③在计算概率时发生错误.13.(2020·江苏吴江·一模)苏州市某初中学校对本校初中学生完成家庭作业的时间做了总量控制,规定每天完成家庭作业时间不超过1.5小时.该校数学课外兴趣小组对本校初中学生回家完成作业的时间做了一次随机抽样调查,并绘制出频数分布表和频数分布直方图的一部分.(1)a=,b=;(2)补全频数分布直方图;(3)请估计该校1500名初中学生中,约有多少学生在1.5小时以内完成家庭作业.【答案】(1)12;0.2;(2)见解析;(3)975人【分析】(1)首先求得总人数,然后根据频率的定义求得a和b的值;(2)根据(1)即可直接补全直方图;(3)利用总人数乘以对应的频率即可求解.【详解】解:(1)调查的总人数是:4÷0.1=40(人),则a=40×0.3=12(人),b=8÷40=0.2,故答案是:12,0.2;(2)根据(1)求出的频数,补全统计图如下:(3)根据题意得:1500×(0.1+0.3+0.25)=975(人),答:该校1500名初中学生中,约有975名学生在1.5小时以内完成家庭作业.【点睛】此题考查了统计表及频数分布直方图,读懂统计图表.,会计算部分的数量,根据部分的百分比求总体的数量,从统计图中得到必要的信息是解决问题的关键. 14.(2021·山东巨野·一模)2012年6月5日是“世界环境日”,南宁市某校举行了“绿色家园”演讲比赛,赛后整理参赛同学的成绩,制作成直方图(如图).(1)分数段在-----范围的人数最多;(2)全校共有多少人参加比赛?(3)学校决定选派本次比赛成绩最好的3人参加南宁市中学生环保演讲决赛,并为参赛选手准备了红、蓝、白颜色的上衣各1件和2条白色、1条蓝色的裤子.请用“列表法”或“树形图法”表示上衣和裤子搭配的所有可能出现的结果,并求出上衣和能搭配成同一种颜色的概率.【答案】(1)85~90(2)24人(3)1/3【详解】解:(1)由条形图可知,分数段在85~90范围的人数最多为10人,故答案为85~90;(2)全校参加比赛的人数=5+10+6+3=24人;(3)上衣和裤子搭配的所有可能出现的结果如图所示,共有9总搭配方案,其中,上衣和裤子能搭配成同一种颜色的有3种,上衣和裤子能搭配成同一种颜色的概率为:31 93(1)由条形图可直接得出人数最多的分数段;(2)把各小组人数相加,得出全校参加比赛的人数;(3)利用“树形图法”,画出搭配方案,由此可求上衣和裤子能搭配成同一种颜色的概率15.(2020·北京市第十三中学九年级开学考试)某医院医生为了研究该院某种疾病的诊断情况,需要调查来院就诊的病人的两个生理指标x,y,于是他分别在这种疾病的患者和非患者中,各随机选取20人作为调查对象,将收集到的数据整理后,绘制统计图如下:注“●”表示患者,“▲”表示非患者.根据以上信息,回答下列问题:(1)在这40名被调查者中,①指标y低于0.4的有人;②将20名患者的指标x的平均数记作1x,方差记作21s,20名非患者的指标x的平均数记作2x,方差记作22s,则1x2x,21s22s(填“>”,“=”或“<”);(2)来该院就诊的500名未患这种疾病的人中,估计指标x低于0.3的大约有人;(3)若将“指标x低于0.3,且指标y低于0.8”作为判断是否患有这种疾病的依据,则发生漏判的概率多少.【答案】(1)①9;②<,>;(2)100;(3)0.25【分析】(1)①直接统计指标y低于0.4的有人的个数即可;②通过观察图表估算出指标x、y的平均数,然后再进行比较即可确定平均数的大小;根据点的分散程度可以确定方差的大小关系.(2)先估算出样本中未患这种疾病的人中指标x低于0.3的概率,然后500乘以该概率即可;(3)通过观察统计图确定不在“指标x低于0.3,且指标y低于0.8”范围内且患病的人数,最后用概率公式求解即可.【详解】解:(1)①经统计指标y低于0.4的有9人,故答案为9;②观察统计图可以发现,1x大约在0.3左右,2x大约在0.6左右,故1x<2x;观察图表可以发现,x指标的离散程度大于y指标,故21s>22s;故答案为<、>;(2)由统计图可知:在20名未患病的样本中,指标x低于0.3的大约有4人,则概率为420;所以的500名未患这种疾病的人中,估计指标x低于0.3的大约有500×420=100人.故答案为100;(3)通过统计图可以发现有五名患病者没在“指标x低于0.3,且指标y低于0.8”,漏判;则被漏判的概率为520=0.25.答:被漏判的概率为0.25.【点睛】本题考查概率的求法,平均数、方差的估计等基础知识,从统计图中获取信息、估计平均数和方差是解答本题的关键.16.(2021·浙江湖州·九年级月考)感恩节即将来临,小王调查了初三年级部分同学在感恩节当天将以何种方式对帮助过自己的人表达感谢,他将调查结果分为如下四类:A类——当面表示感谢、B类——打电话表示感谢、C类——发短信表示感谢、D类——写书信表示感谢.他将调查结果绘制成了如图所示的扇形统计图和条形统计图.请你根据图中提供的信息完成下列各题:(1)补全条形统计图;(2)在A类的同学中,有4人来自同一班级,其中有2人主持过班会.现准备从他们4人中随机抽出两位同学主持感恩节主题班会课,请用树状图或列表法求抽出1人主持过班会而另一人没主持过班会的概率.【答案】(1)见解析;(2)2 3【分析】(1)联系扇形统计图和条形统计图的信息分别求出调查的学生总数、C类人数和B 类人数,然后画图即可;(2)先采用列表法或树状图法列出所有机会均等的结果,然后求出抽出1人主持过班会而另一人没主持过班会的概率.【详解】(1)调查的学生总数为510÷%50=(人),C类人数为1085015360⨯=(人),B类人数为505151218---=(人),条形统计图为:(2)设主持过班会的两人分别为1A 、2A ,另两人分别为1B 、2B ,填表如下:所以P (抽出1人主持过班会而另一人没主持过班会)82123==. 【点睛】此题主要考查关联扇形统计图与条形统计图、通过列表法与树状图法求概率,解题关键是正确读懂统计图的信息.17.(2021·山东中区·一模)加强劳动教育是学校贯彻“五育并举”的重要举措.为了解学生参加各项劳动的情况,某校对七年级部分学生进行了随机问卷调查,其中一个问题是“你每周在家参加家务劳动的时间是多少?”,共有如下四个选项: A .1小时以下 B .1~2小时(不包含2小时) C .2~3小时(包含2小时) D .3小时以上图①、图②是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息解答以下问题:(1)填空:本次问卷调查一共调查了______名学生; (2)请将图①的条形统计图补充完整; (3)并求出图②中D 部分所对应的圆心角度数;(4)若该校共有1800名学生,请你估计全校可能有多少名学生每周在家参加家务劳动的时间在2小时以上(包含2小时)?【答案】(1)200;(2)见解析;(3)18︒;(4)估计全校可能有360名学生每周在家参加家务劳动的时间在2小时以上(包含2小时)【分析】(1)根据B 选项人数及其占被调查人数的比例计算即可得出答案. (2)用总人数减去其他选项的人数求出D 选项的人数,即可补全统计图; (3)用360︒乘以D 部分所占的百分比即可得出D 部分所对应的圆心角度数;(4)用该校的总人数乘以每周在家参加家务劳动的时间在2小时以上(包含2小时)的人数所占的百分比即可.【详解】解:(1)本次问卷调查一共调查的学生数是:10050%200÷=(名) 故答案为:200;(2)劳动的时间在3小时以上的人数有:200601003010---=(名),补全统计图如下:(3)D 部分所对应的圆心角度数是1036018200⨯=︒︒; (4)根据题意得:30101800360200+⨯=(名), 答:估计全校可能有360名学生每周在家参加家务劳动的时间在2小时以上(包含2小时). 【点睛】本题考查条形统计图、扇形统计图等知识,解题的关键是熟练掌握基本概念,学会用样本估计总体的思想解决问题,属于基础题,中考常考题型.。
随机抽样、用样本估计总体高中数学分类题复习练习含答案解析北京海淀
随机抽样、用样本估计总体一、选择题1.(2018·全国卷I高考理科·T3)同(2018·全国卷I高考文科·T3)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【解题指南】首先设出新农村建设前的经济收入为M,根据题意,得到新农村建设后的经济收入为2M,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出符合题意的选项.【解析】选A.设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A 项符合题意;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项不符合题意;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C 项不符合题意;新农村建设后,养殖收入与第三产业收入的总和占经济收入为30%+28%=58%>50%,所以超过了经济收入的一半,所以D项不符合题意.二、填空题2.(2018·全国Ⅲ高考文科·T14)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是.【命题意图】考查统计与概率知识中的随机抽样,意在考查抽样方法的选择,培养学生的实际应用能力、逻辑推理能力,体现了数学抽象、数学建模、数据分析的数学素养.【解析】根据题干中有大量客户,且不同年龄段客户对其服务的评价有较大差异,可知最合适的抽样方法是分层抽样.答案:分层抽样3.(2018·江苏高考·T3)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为.8999011【解析】=90.答案:90二、解答题4.(12分)(2018·全国卷I高考文科·T19)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数 1 3 2 4 9 26 5 使用了节水龙头50日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数 1 5 13 10 16 5(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图.(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率.(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【解析】(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天的日用水量的平均数为=(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天的日用水量的平均数为=(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机抽样、用样本估计总体
1.某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉
花质量的重要指标).所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有 根棉花纤维的长度小于20 mm.
惠生活 观影指南
爱尚
嘟嘟园
迅播影院
请支持我们,有更多资源和动力
【答案】 30
【解析】 因为频率分布直方图的矩形的高为
,频率概率
故矩形的高⨯组距即为频率.从图中可知长 度小于20 mm 的频率为(0.01+0.01+0.04)50⨯=.3,又总体为100根,故纤维长度小于20 mm 的根 数为1000⨯.3=30根. 惠生活 观影指南 爱尚 嘟嘟园 迅播影院 请支持我们,有更多资源和动力 课后作业夯基
基础巩固
2.从2 008名学生中选取50名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽 样从2 008人中剔除8人,剩下的2 000人再按系统抽样的方法抽取,则这2 008名学生中每人入选的概率( )
A.不全相等
B.均不相等
C.都相等,且为502008
D.都相等,且为140
【答案】 C 【解析】 随机抽样过程中,保证每个个体被抽取的可能性是相等的,所以每人入选的概率都相等,且为502008
. 3.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分
层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年 级的学生中应抽取的人数为… ( )
A.6
B.8
C.10
D.12
【答案】 B
【解析】 分层抽样的原理是按照各部分所占的比例抽取样本,设从高二年级抽取的学生数为n ,
则30640n
=,得n =8. 4.某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的 频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为
[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样
本中净重大于或等于98克并且小于104克的产品的个数是( )
A.90
B.75
C.60
D.45
【答案】A
【解析】样本中产品净重小于100克的频率为(0.050+0.100)⨯2=0.3,频数为36.
样本总数为36120 03
= ..
∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)20
⨯=.75, ∴样本中净重大于或等于98克并且小于104克的产品的个数为1200
⨯.75=90.
5.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5
B.91.5和92
C.91和91.5
D.92和92
【答案】A
【解析】按照从小到大的顺序排列为87,89,90,91,92,93,94,96.
∵有8个数据,∴中位数是中间两个数的平均数:9192
2
+=91.5,
平均数为878990919293949691
8
+++++++=.5,故选A.
6.一组数据的平均数是4.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,
则所得新数据的平均数和方差分别是( )
A.55.2,3.6
B.55.2,56.4
C.64.8,63.6
D.64.8,3.6
【答案】D
【解析】每一个数据都加上60时,平均数也应加上60,而方差不变.
7.为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取
系统抽样,则分段的间隔k为.
【答案】40
【解析】在系统抽样中,确定分段间隔k,对编号进行分段,
(N k N n
=为总体的容量,n 为样本的容量), ∴12004030
N k n ===. 8.高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的办法抽取一个容量为4的样本,已知 学号为6,34,48的同学在样本中,那么还有一个同学的学号应为 .
【答案】 20
【解析】 根据题意,56人应分为4组,每组14人,第一组为6号,第二组为6+14=20号,第三组为
20+14=34号,第四组为34+14=48号,故还有一个同学的学号为20.
9.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数
量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如图,则由此估计该厂工人一天生产该产品数量在[55,70)的人数约占该厂工人总数的百分率是 .
【答案】 52.5%
【解析】 结合频率分布直方图可以看出:生产数量在[55,65)的人数频率为0.04100⨯=.4,生产
数量在[65,75)的人数频率为0.025⨯10=0.25,而生产数量在[65,70)的人数频率约为0.25⨯102
=.125,那么生产数量在[55,70)的人数频率约为0.4+0.125=0.525,即52.5%. 10.(2011江苏高考,6)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方
差2s = .
【答案】 165
【解析】 ∵10685675
x ++++==, ∴2
s = 22222(107)(67)(87)(57)(67)1655
-+-+-+-+-=. 11.为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎
叶图表示如图,则该组数据的方差为.
【答案】 5 【解析】 该运动员6场的总得分为14+17+18+18+20+21=108,平均得分为10818(6
=分),方差为 2222221[(1418)(1718)(1818)(1818)(2018)(2118)]56
-+-+-+-+-+-=,故填5. 12.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如 下表:
惠生活 观影指南 爱尚 嘟嘟园 迅播影院 请支持我们,有更多资源和动力
(1)画出茎叶图,由茎叶图你能获得哪些信息?
(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并判断选谁参加比赛更合适
【解】 (1)画茎叶图,如图所示,中间数为数据的十位数.
从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是
33.5,甲的中位数是33.因此乙总体得分情况比甲好
(2)根据公式得3333x x =,=甲乙;s =甲 3.96s ,=乙 3.35;甲的中位数是33,乙的中位数是
综合比较选乙参加比赛较为合适.。