高考数学艺体生精选好题突围系列(基础篇)专题18统计与统计案例
2016届高考数学理命题猜想专题18统计与统计案例(解析版)
【命题热点突破一】抽样方法某工厂生产的甲、乙、丙、丁四种不同型号的产品分别有150件、120件、180件、150件.为了调查产品的情况,需从这600件产品中抽取一个容量为100的样本,若采用分层抽样法,设甲产品中应抽取的产品件数为x ,某件产品A 被抽到的概率为y ,则x ,y 的值分别为( )A .25,14B .20,16 C .25,1600 D .25,16 【【答案】】D【特别提醒】 三种抽样方法均是等概率抽样,当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.【变式探究】从编号分别为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为10的样本,若编号为58的产品在样本中,则该样本中产品的最大编号为________.【【答案】】74【【解析】】每8件产品抽取一件,编号为58的产品在样本中,则样本中产品的最大编号为58+16=74.【命题热点突破二】用样本估计总体(1)将某市8所中学参加中学生合唱比赛的得分用茎叶图表示(如图18-3所示),其中茎为十位数,叶为个位数,则这组数据的中位数和平均数分别是( )图18-3A .91,91.5B .91,92C .91.5,91.5D .91.5,92(2)2014年6月,一篇关于“键盘侠”(“键盘侠”一词描述了部分网民在现实生活中胆小怕事自私自利,却习惯在网络上大放厥词的一种现象)的时评引发了大家对“键盘侠”的热议.某地区新闻栏目对该地区群众对“键盘侠”的认可度做出调查:在随机抽取的50人中,有14人持认可态度,其余持反对态度.若该地区有9600人,则估计该地区对“键盘侠”持反对态度的有________人.【【答案】】(1)C(2)6912【特别提醒】统计的基本思想之一就是以样本估计总体.以样本的频率估计总体的概率、以样本的特征数估计总体的特征数.【变式探究】(1)某学校随机抽查了本校20个同学,调查他们平均每天在课外进行体育锻炼的时间(分钟),根据所得数据的茎叶图,以5为组距将数据分为八组,分别是[0,5),[5,10),…,[35,40],作出的频率分布直方图如图18-4所示,则原始的茎叶图可能是()图18-5(2)高三年级上学期期末考试中,某班级数学成绩的频率分布直方图如图18-6所示,数据分组依次如下:[70,90),[90,110),[110,130),[130,150].估计该班数学成绩的平均分数为()图18-6A.112B.114C.116D.120【【答案】】(1)B(2)B【命题热点突破三】统计案例例3、某高校共有15 000人,其中男生10 500人,女生4500人,为调查该校学生每周平均参加体育运动时间情况,采用分层抽样的方法,收集了300名学生每周平均参加体育运动时间的样本数据(单位:小时).(1)应收集多少名女生的样本数据?(2)根据这300个样本数据,得到学生每周平均参加体育运动时间的频率分布直方图(如图18-7所示),其中样本数据分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均参加体育运动时间超过4个小时的概率.(3)在样本数据中,有60名女生每周平均参加体育运动的时间超过4个小时,请画出每周平均参加体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)结合列联表可得K 2的观测值k =300×(165×30-45×60)75×225×210×90=10021≈4.762>3.841. 所以有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.【特别提醒】 在计算K 2时要注意公式中各个字母的含义,分子上是总量乘2×2列联表中对角线数字乘积之差的平方,分母上是四个分和量的乘积.【变式探究】为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:小时)与当天投篮命中率y 之间的关系.(1)求小李这5天的平均投篮命中率;(2)用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率. 解:(1)小李这5天的平均投篮命中率y -= 0.4+0.5+0.6+0.6+0.45=0.5.(2)易知x -=1+2+3+4+55=3, 设线性回归方程为y ^=b ^x +a ^,则由公式可得b ^==(-2)×(-0.1)+(-1)×0+0×0.1+1×0.1+2×(-0.1)(-2)2+(-1)2+02+12+22=0.01,所以a ^=y --b ^x -=0.5-0.01×3=0.47, 所以y ^=b ^x +a ^=0.01x +0.47.当x =6时,y ^=0.53,故小李该月6号打6小时篮球的投篮命中率约为0.53.【特别提醒】 回归直线一定过样本点的中心(x ,y),当已知回归直线方程两个系数中的一个时,可以直接代入样本点中心的坐标求得另一个系数.正相关和负相关是根据回归直线方程的斜率判断的:正相关时回归直线方程的斜率为正值;负相关时回归直线方程的斜率为负值.回归直线方程斜率的符号与相关系数的符号是一致的.【高考真题解读】1.(2015·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A .167B .137C .123D .93【答案】 B2.(2015·安徽,6)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32 【答案】 C【解析】 法一 由题意知,x 1+x 2+…+x 10=10x ,s 1则y =1n [(2x 1-1)+(2x 2-1)+…+(2x 10-1)] =1n[2(x 1+x 2+…+x 10)-n]=2x -1,所以S 2==2s 1,故选C.3.(2015·重庆,3)重庆市2013年各月的平均气温(℃)数据的茎叶图如下: 则这组数据的中位数是( )01228 9 2 5 80 0 03 3 8 1 2A .19B .20C .21.5D .23【答案】 B4.(2015·新课标全国Ⅱ,31)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 【答案】 D【解析】从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确;2007年二氧化硫排放量较2006年降低了很多,B选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,即C选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误,故选D.5.(2015·福建,4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y∧=b∧x+a∧,其中b∧=0.76,a∧=y-b∧x.据此估计,该社区一户年收入为15万元家庭的年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元【答案】B6.(2014·山东,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A .6B .8C .12D .18 【答案】 C【解析】 由题图可知,第一组和第二组的频率之和为(0.24+0.16)×1=0.40,故该试验共选取的志愿者有200.40=50人.所以第三组共有50×0.36=18人,其中有疗效的人数为18-6=12.7.(2014·陕西,9)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a(a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( )A .1+a ,4B .1+a ,4+aC .1,4D .1,4+a【答案】 A8.(2014·湖南,2)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3【答案】 D【解析】 因为采取简单随机抽样、系统抽样和分层抽取样本时,总体中每个个体被抽中的概率相等,故选D.9.(2014·广东,6)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A .200,20B .100,20C .200,10D .100,10【答案】A10.(2014·天津,9)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.【答案】 60【解析】 420×300=60(名).11.(2015·江苏,2)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 【答案】 6【解析】 这组数据的平均数为16(4+6+5+8+7+6)=6.12.(2015·湖南,12)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:1314150 0 3 4 5 6 6 8 8 91 1 12 2 23 34 45 5 56 678 0 1 2 2 3 3 3若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.【答案】 41 3.(2015·新课标全国Ⅱ,18)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
2020版高考数学二轮复习 专题六 统计 专题突破练18 统计与统计案例 文
专题突破练18 统计与统计案例1.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.2.(2018全国卷2,文18)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①;=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.3.(2018河北唐山一模,文18)某水产品经销商销售某种鲜鱼,售价为每千克20元,成本为每千克15元.销售宗旨是当天进货当天销售.如果当天卖不出去,未售出的全部降价处理完,平均每千克损失3元.根据以往的销售情况,按[0,100),[100,200),[200,300),[300,400),[400,500]进行分组,得到如图所示的频率分布直方图.(1)根据频率分布直方图计算该种鲜鱼日需求量的平均数(同一组中的数据用该组区间中点值代表);(2)该经销商某天购进了300千克这种鲜鱼,假设当天的需求量为x千克(0≤x≤500),利润为Y元.求Y关于x的函数关系式,并结合频率分布直方图估计利润Y不小于700元的概率.4.某单位N名员工参加“我爱阅读”活动,他们的年龄在25岁至50岁之间,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.(1)求正整数a,b,N的值;(2)现要从年龄低于40岁的员工中用分层抽样的方法抽取42人,则年龄在第1,2,3组的员工人数分别抽取多少?(3)为了估计该单位员工的阅读倾向,现对该单位所有员工中按性别比例抽查的40人是否喜欢阅读国学类书籍进行了调查,调查结果如下所示:(单位:人)喜欢阅读国学类不喜欢阅读国学类合计男14 4 18女8 14 22合计22 18 40下面是年龄的分布表:区间[25,30) [30,35) [35,40) [40,45) [45,50]人数28 a b根据表中数据,我们能否有99%的把握认为该单位员工是否喜欢阅读国学类书籍和性别有关系?附:K2=,其中n=a+b+c+d.P(K2≥k0) 0.05 0.025 0.010 0.005 0.001k03.841 5.024 6.635 7.879 10.8285.(2018百校联盟四月联考,文18)每年的寒冷天气都会带热“御寒经济”,以餐饮业为例,当外面太冷时,不少人都会选择叫外卖上门,外卖商家的订单就会增加,下表是某餐饮店从外卖数据中抽取的5天的日平均气温与外卖订单数日平均气温(℃) -2 -4 -6 -8 -10外卖订单数(份) 50 85 115 140 160(1)经过数据分析,一天内平均气温x(℃)与该店外卖订单数y(份)成线性相关关系,试建立y 关于x的回归方程,并预测气温为-12 ℃时该店的外卖订单数(结果四舍五入保留整数); (2)天气预报预测未来一周内(七天),有3天日平均气温不高于-10 ℃,若把这7天的预测数据当成真实数据,则从这7天任意选取2天,求恰有1天外卖订单数不低于160份的概率.附注:回归方程x+中斜率和截距的最小二乘估计公式分别为:.6.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:旧养殖法新养殖法(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50 kg 箱产量≥50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:,K2=.7.某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在30分以下的学生后,共有男生300名,女生200名.现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表.分数段[40,50) [50,60) [60,70) [70,80) [80,90) [90,100]男 3 9 18 15 6 9女 6 4 5 10 13 2(1)估计男、女生各自的成绩平均分(同一组数据用该组区间中点值作代表),从计算结果看,判断数学成绩与性别是否有关;(2)规定80分以上为优分(含80分),请你根据已知条件作出2×2列联表,并判断是否在犯错误的概率不超过0.1的前提下认为“数学成绩与性别有关”.优分非优分合计男生女生合计100附表及公式P(K2≥k0) 0.100 0.050 0.010 0.001k02.706 3.841 6.635 10.828K2=,其中n=a+b+c+d.8.(2018全国百强校最后一卷,文19)下表为2014年至2017年某百货零售企业的线下销售额(单位:万元),其中年份代码x=年份-2 013.年份代码x 1 2 3 4线下销售额y95 165 230 310(1)已知y与x具有线性相关关系,求y关于x的线性回归方程,并预测2018年该百货零售企业的线下销售额;(2)随着网络购物的飞速发展,有不少顾客对该百货零售企业的线下销售额持续增长表示怀疑,某调査平台为了解顾客对该百货零售企业的线下销售额持续增长的看法,随机调查了55位男顾客、50位女顾客(每位顾客从“持乐观态度”和“持不乐观态度”中任选一种),其中对该百货零售企业的线下销售额持续增长持乐观态度的男顾客有10人、女顾客有20人,能否在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关?参考公式及数据:,K2=,n=a+b+c+d.P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005k02.072 2.706 3.841 5.024 6.635 7.879参考答案专题突破练18统计与统计案例1.解 (1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.=13,=13,×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.2.解(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可得分)3.解(1)=50×0.001 0×100+150×0.002 0×100+250×0.003 0×100+350×0.0025×100+450×0.001 5×100=265.(2)当日需求量不低于300千克时,利润Y=(20-15)×300=1 500(元);当日需求量不足300千克时,利润Y=(20-15)x-(300-x)×3=8x-900(元);故Y=由Y≥700得,200≤x≤500,所以P(Y≥700)=P(200≤x≤500)=0.003 0×100+0.002 5×100+0.001 5×100=0.7.4.解(1)总人数N==280,a=28,第3组的频率是1-5×(0.02+0.02+0.06+0.02)=0.4,所以b=280×0.4=112.(2)因为年龄低于40岁的员工在第1,2,3组,共有28+28+112=168(人),利用分层抽样在168人中抽取42人,每组抽取的人数分别为:第1组抽取的人数为28×=7(人),第2组抽取的人数为28×=7(人),第3组抽取的人数为112×=28(人),所以第1,2,3组分别抽7人、7人、28人.(3)假设H0:“是否喜欢阅读国学类书籍和性别无关”,根据表中数据,求得K2的观测值k=≈6.860 5>6.635,查表得P(K2≥6.635)=0.01,从而能有99%的把握认为该单位员工是否喜欢阅读国学类书籍和性别有关系.5.解 (1)由题意可知=-6,=110,(x i-)2=42+22+02+(-2)2+(-4)2=40,(x i-)(y i-)=4×(-60)+2×(-25)+0×5+(-2)×30+(-4)×50=-550, 所以=-13.75,=110+13.75×(-6)=27.5,所以y关于x的回归方程为=-13.75x+27.5,当x=-12时,=-13.75x+27.5=-13.75×(-12)+27.5=192.5≈193.所以可预测当平均气温为-12 ℃时,该店的外卖订单数为193份.(2)外卖订单数不低于160份的概率就是日平均气温不高于-10 ℃的概率,由题意,设日平均气温不高于-10 ℃的3天分别记作A,B,C,另外4天记作a,b,c,d, 从这7天中任取2天结果有:(A,B),(A,C),(A,a),(A,b),(A,c),(A,d),(B,C),(B,a),(B,b),(B,c),(B,d),(C,a),(C,b ),(C,c),(C,d),(a,b),(a,c),(a,d),(b,c),(b,d),(c,d)共21种,恰有1天平均气温不高于-10 ℃的结果有:(A,a),(A,b),(A,c),(A,d),(B,a),(B,b),(B,c),(B,d),(C,a),(C,b),(C,c),(C,d)共12种,所以所求概率P=.6.解 (1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.箱产量<50 kg 箱产量≥50 kg旧养殖法62 38新养殖法34 66K2=≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.7.解 (1)=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5.=45×0.15+55×0.10+65×0.125+75×0.25+85×0.325+95×0.05=71.5.从男、女生各自的成绩平均分来看,并不能判断数学成绩与性别有关.(2)由频数分布表可知,在抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下:优分非优分合计男生15 45 60女生15 25 40合计30 70 100可得K2=≈1.79.∵1.79<2.706,∴在犯错误的概率不超过0.1的前提下不能认为“数学成绩与性别有关”.8.解(1)由题意得=2.5,=200,=30,x i y i=2 355,所以=71,所以=200-71×2.5=22.5,所以y关于x的线性回归方程为=71x+22.5.由于2 018-2 013=5,所以当x=5时,=71×5+22.5=377.5,所以预测2018年该百货零售企业的线下销售额为377.5万元.持乐观态度持不乐观态度总计男顾客10 45 55女顾客20 30 50总计30 75 105故K2的观测值K2=≈6.109,由于6.109>5.024,所以可以在犯错误的概率不超过0.025 的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关.11。
高考数学二轮复习专题突破—统计与统计案例(含解析)
高考数学二轮复习专题突破—统计与统计案例1.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 附:√74≈8.602.2.(2021·江西赣州二模改编)遵守交通规则,人人有责.“礼让行人”是我国《道路交通安全法》的明文规定,也是全国文明城市测评中的重要内容.《道路交通安全法》第47条明确规定:“机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.否则扣3分罚200元”.下表是2021年1至4月份我市某主干路口监控设备抓拍到的驾驶员不“礼让行人”行为统计数据:(1)请利用所给数据求不“礼让行人”驾驶员人数y 与月份x 之间的经验回归方程y ^=b ^x+a ^,并预测该路口2021年10月不“礼让行人”驾驶员的大约人数(四舍五入);(2)交警从这4个月内通过该路口的驾驶员中随机抽查50人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:依据小概率值α=0.10的独立性检验,分析“礼让行人”行为是否与驾龄有关.参考公式:b ^=∑i=1nx i y i -nx y ∑i=1nx i 2-nx2=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2.χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.(2021·河北石家庄二模改编)某地区在2020年底全面建成小康社会,随着实施乡村振兴战略规划,该地区农村居民的收入逐渐增加,可支配消费支出也逐年增加.该地区统计了2016~2020年农村居民人均消费支出情况,对有关数据处理后,制作如图1的折线图[其中变量y (单位:万元)表示该地区农村居民人均年消费支出,年份用变量t 表示,其取值依次为1,2,3,…].(1)由图1可知,变量y与t具有很强的线性相关关系,求y关于t的经验回归方程,并预测2021年该地区农村居民人均消费支出;2016~2020年该地区农村居民人均消费支出图1(2)在国际上,常用恩格尔系数(其含义是指食品类支出总额占个人消费支出总额的比重)来衡量一个国家和地区人民生活水平的状况.根据联合国粮农组织的标准:恩格尔系数在40%~50%为小康,30%~40%为富裕.已知2020年该地区农村居民平均消费支出构成如图2所示,预测2021年该地区农村居民食品类支出比2020年增长3%,从恩格尔系数判断2021年底该地区农村居民生活水平能否达到富裕生活标准.2020年该地区农村居民人均消费支出构成图2参考公式:经验回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y∑i=1nx i 2-nx 2,a ^=y −b ^x .4.(2021·山东潍坊一模)在对人体的脂肪含量和年龄之间的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据(x i ,y i )(i=1,2,…,20,25<x i <65),其中x i 表示年龄,y i 表示脂肪含量,并计算得到∑i=120x i 2=48 280,∑i=120y i 2=15 480,∑i=120x i y i =27 220,x =48,y =27,√22≈4.7.(1)请用样本相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合,并求y 关于x的经验回归方程y ^=a ^+b ^x (a ^,b ^的计算结果保留两位小数);(2)科学健身能降低人体脂肪含量,下表是甲、乙两款健身器材的使用年限(整年)统计表:某健身机构准备购进其中一款健身器材,以使用年限的频率估计概率,请根据以上数据估计,该机构选择购买哪一款健身器材,才能使用更长久?参考公式:样本相关系数r=∑i=1n(x i -x)(y i -y)√∑i=1n (x i -x)2√∑i=1n(y i -y)2=∑i=1nx i y i -nx y√∑i=1nx i 2-nx 2√∑i=1ny i 2-ny 2;对于一组具有线性相关关系的数据(x i ,y i )(i=1,2,…,n ),其经验回归直线y ^=b ^x+a ^的斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y −b ^x .答案及解析1.解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17. 2.解 (1)由表中数据易知:x =1+2+3+44=52,y =125+105+100+904=105,则b ^=∑i=14x i y i -4x y∑i=14x i 2-4x2=995−1 05030−25=-11,a ^=y −b ^ x =105-(-11)×52=132.5,故所求经验回归方程为y ^=-11x+132.5.令x=10,则y ^=-11×10+132.5=22.5≈23(人),预测该路口10月份不“礼让行人”的驾驶员大约人数为23. (2)零假设为H 0:“礼让行人”行为与驾龄无关.由表中数据可得χ2=50×(10×12−20×8)218×32×30×20≈0.23<2.706=x 0.10,依据小概率值α=0.10的独立性检验,没有充分证据推断H 0不成立,可以认为H 0成立,即认为“礼让行人”行为与驾龄无关.3.解 (1)由已知数据可求t =1+2+3+4+55=3, y =1.01+1.10+1.21+1.33+1.405=1.21,∑i=15t i 2=12+22+32+42+52=55,∑i=15t i y i =1×1.01+2×1.10+3×1.21+4×1.33+5×1.40=19.16,b ^=19.16−5×3×1.2155−5×32=1.0110=0.101,a ^=1.21-0.101×3=0.907,所求经验回归方程为y ^=0.101t+0.907. 当t=6时,y ^=0.101×6+0.907=1.513(万元),故2021年该地区农村居民人均消费支出约为1.513万元.(2)已知2021年该地区农村居民平均消费支出1.513万元,由图2可知,2020年该地区农村居民食品类支出为4 451元,则预测2021年该地区食品类支出为4 451×(1+3%)=4 584.53元,恩格尔系数=4 584.5315 130×100%≈30.3%∈(30%,40%),所以,2021年底该地区农村居民生活水平能达到富裕生活标准.4.解 (1)x 2=2 304,y2=729,∑i=120x i y i -20x y =1 300,∑i=120x i 2-20x 2=2 200,∑i=1ny i 2-20y 2=900,r=∑i=120x i y i -20x y√∑i=120x i 2-20x 2√∑i=1ny i 2-20y2≈0.92,因为y 与x 的样本相关系数接近1,所以y 与x 之间具有较强的线性相关关系,可用线性回归模型进行拟合.由题可得,b ^=∑i=120(x i -x)(y i -y)∑i=120(x i -x)2=∑i=120x i y i -20x y∑i=120x i 2-20x2=1322≈0.591,a ^=y −b ^ x =27-0.591×48≈-1.37,所以y ^=0.59x-1.37.(2)以频率估计概率,设甲款健身器材使用年限为X (单位:年).E (X )=5×0.1+6×0.4+7×0.3+8×0.2=6.6. 设乙款健身器材使用年限为Y (单位:年).E (Y )=5×0.3+6×0.4+7×0.2+8×0.1=6.1.因为E (X )>E (Y ),所以该健身机构购买甲款健身器材更划算.。
专题18 统计与统计案例第01期-2018年高考数学理备考之
2018届高考数学(理)小题精练 专题18 统计与统计案例1.如图是2014年在某电视节目中七位评委为某民族舞蹈打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为A . 84,4.84B . 84,1.6C . 85,1.6D . 85,4 【答案】C2.某中学高一年级从甲、乙两个班各选出7名学生参加国防知识竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x y +的值为( )A . 8B . 168C . 9D . 169 【答案】C【解析】∵甲班学生成绩的平均分是85,∴79+78+80+80+x +85+92+95=85×7,即x =6. ∵乙班学生成绩的中位数是83,甲班学生成绩的中位数是80+x =83,得x =3; ∴若1≤y ,则中位数为81,不成立.若y >1,则中位数为80+y =83,解得y =3. ∴x +y =6+3=9,本题选择C 选项.点睛:茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据. 3.某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为()A. 6万元 B. 8万元 C. 10万元 D. 12万元【答案】C点睛:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.4.如果个数的平均数为,则的平均数为( ) A.3 B.4 C.5 D.6【答案】A【解析】的平均数为1,,,的平均数为,故选A.【思路点睛】本题主要考查平均数的求法,属于中档题.要解答本题首先根据个数的平均数为得到,从而可得的平均数为.5.某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A . 128B . 144C . 174D . 167 【答案】B【解析】女教师人数为: 120*0.7150*0.4144+=. 6.下列说法中正确的是( )①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心(),x y ;③随机误差e 满足()0E e =,其方差()D e 的大小用来衡量预报的精确度; ④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好. A . ①② B. ③④ C. ①④ D. ②③ 【答案】D7.下面是22⨯列联表:则表中a b ,的值分别为( )A . 84,60B . 42,64C . 42, 74D . 74, 42 【答案】B【解析】因2163a +=,故42a =,又22a b +=,则64b =,应选答案B .8.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是( ) A .频率分布直方图 B .回归分析 C . 独立性检验 D . 用样本估计总体 【答案】C【解析】根据题意,结合题目中的数据,列出2×2列联表,求出观测值K 2,对照数表可得出概率结论,这种分析数据的方法是独立性检验.本题选择C 选项. 9.下列说法错误的是( )A . 10xy ≠是5x ≠或2y ≠的充分不必要条件B . 若命题2:,10p x R x x ∀∈++≠,则2:,10p x R x x ⌝∃∈++= C . 线性相关系数r 的绝对值越接近1,表示两变量的相关性越强D . 用频率分布直方图估计平均数,可以用每个小矩形的高乘以底边中点横坐标之和 【答案】D10.某公司为确定明年投入某产品的广告支出,对近5年的广告支出m 与销售额t (单位:百万元)进行了初步统计,得到下列表格中的数据:经测算,年广告支出m 与年销售额t 满足线性回归方程 6.517.5t m =+,则p 的值为( ) A .45 B .50 C .55 D .60 【答案】D考点:回归分析.11.当今人口政策受到人们的广泛关注,下表是某大学人口预测课题组通过研究预测的1564岁人口所占比例的结果:已知所占比例y 关于年份代号t 的线性回归方程为 1.7y t m =-+,则m =( )A .67.8B .68C .68.5D .68.7 【答案】D 【解析】试题分析:因6.6356162626568,3554321=++++==++++=y t ,故m +⨯-=37.16.63,即7.68=m ,应选D .考点:线性回归方程及运用. 12.下列命题中正确的有( )①设有一个回归方程ˆ23yx =-,变量x 增加一个单位时,y 平均增加3个单位; ②命题:p “0x R ∃∈,20010x x -->”的否定p ⌝“x R ∀∈,210x x --≤”;③“命题p 或q 为真”是“命题p 且q 为真”必要不充分条件;④在一个22⨯列联表中,由计算得26.679k =,则有99.9%的把握确认这两个变量间有关系.A .1个B .2个C .3个D .4个本题可以参考独立性检验临界值表【答案】B 【解析】考点:命题的真假.。
2020高考数学文科刷题(2019真题+2019模拟)讲练(课件+优选练)专题18 统计、统计案例
答案 C 解析 由茎叶图得:b 品种所含 β-胡萝卜素普遍高于 a 品种,∴-x a<-x b, 故 A 正确;a 品种的数据波动比 b 品种的数据波动大,∴a 的方差大于 b 的 方差,故 B 正确;b 品种的众数为 3.31 与 3.41,故 C 错误;a 品种的中位数 为3.23+2 3.31=3.27,故 D 正确.故选 C.
与性别有关”.故选 B.
答案
解析
11.(2019·全国卷Ⅰ)某学校为了解 1000 名新生的身体素质,将这些学
生编号为 1,2,…,1000,从这些新生中用系统抽样方法等距抽取 100 名学
生进行体质测验.若 46 号学生被抽到,则下面 4 名学生中被抽到的是( )
A.8 号学生
B.200 号学生
答案 D
答案
解析 由整个互联网行业从业者年龄分布的饼状图可知,互联网行业从 业者中 90 后占了 56%,故 A 正确;由两个统计图知,互联网行业从事技术 岗位的 90 后人数占总人数的 56%×39.6%=22.176%,已经超过了 20%, 所以整个互联网行业从事技术岗位的人数肯定会超过总人数的 20%,故 B 正确;由两个统计图知,互联网行业从事运营岗位的人数 90 后占总人数的 56%×17%=9.52%,超过了 80 前互联网行业从业者人数,故 C 正确;由 两个统计图知互联网行业 80 后的人数占 41%,但没有 80 后的岗位分布图, 因此无法判断互联网行业中从事技术岗位的人数 90 后与 80 后谁多谁少,故 D 不一定正确,故选 D.
答案 D
答案
解析 在频率等高条形图中,a+a b与c+c d相差很大时,我们认为两个分 类变量有关系,在四个选项中(等高的条形图)中,若 x1,x2 所占比例相差越 大,则分类变量 x,y 的相关性越强.故选 D.
高三数学 章末综合测试题(18)统计与统计案例、算法初步(2)
2013届高三数学章末综合测试题(18)统计、统计案例一、选择题:本大题共12小题,每小题5分,共60分.1.①某学校高二年级共有526人,为了调查学生每天用于休息的时间,决定抽取10%的学生进行调查;②一次数学月考中,某班有12人在100分以上,30人在90~100分,12人低于90分,现从中抽取9人了解有关情况;③运动会工作人员为参加4×100 m 接力的6支队安排跑道.就这三个事件,恰当的抽样方法分别为( )A .分层抽样、分层抽样、简单随机抽样B .分层抽样、简单随机抽样、简单随机抽样C .分层抽样、简单随机抽样、简单随机抽样D .系统抽样、分层抽样、简单随机抽样D 解析:事件①中总人数较多,适合用系统抽样;事件②中有明显的层次差异,适合用分层抽样;事件③中总体的个体数较少,适合用简单随机抽样.2.已知下列各组对应变量:①产品的成本与质量; ②学生的数学成绩与总成绩;③人的身高与脚的长度.其中具有相关关系的组数为( )A .3B .2C .1D .0A 解析:由两个变量具有相关关系的含义知,题中三组变量都具有相关关系. 3.对于样本中的频率分布直方图与总体密度曲线的关系,下列说法正确的是( ) A .频率分布直方图与总体密度曲线无关B .频率分布直方图就是总体密度曲线C .样本容量很大的频率分布直方图就是总体密度曲线D .如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线D 解析:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布直方图就会越来越接近于总体密度曲线.4.在样本的频率分布直方图中,共有n 个小长方形,若中间一个小长方形的面积等于另外n -1个小长方形面积和的14,且样本容量为160,则中间一组的频数为( )A .35B .34C .33D .32D 解析:由已知设中间小长方形的频率为x ,则5x =1,∴x =15,∴中间一组频数为15×160=32.5.某校有高一学生300人,高二学生270人,高三学生210人,现教育局督导组欲用分层抽样的方法抽取26名学生进行问卷调查,则下列判断正确的是( )A .高一学生被抽到的概率最大B .高三学生被抽到的概率最大C .高三学生被抽到的概率最小D .每名学生被抽到的概率相等D 解析:用分层抽样法抽样,总体中每个个体被抽到的概率相等,它与每一层的个体数的多少无关.6.在第29届奥运会上,中国运动员取得了51金、21银、28铜的好成绩,稳居世界金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2 548名男性公民中有1 560名持反对意见,2 452名女性公民中有1 200人持反对意见,在运用这些数据说明中国的奖牌数与中国进入体育强国有无关系时,用什么方法最有说服力( )A .平均数与方差B .回归直线方程C .独立性检验D .概率C 解析:根据题意,可以列出列联表,计算K 2的值,说明金牌数与体育强国的关系,故用独立性检验最有说服力.7.从某社区150户高收入家庭,360户中等收入家庭,90户低收入家庭中,用分层抽样法选出100户调查社会购买力的某项指标,则三种家庭应分别抽取的户数依次为( )A .25,60,15B .15,60,25C .15,25,60D .25,15,60A 解析:∵该社区共有家庭150+360+90=600(户),∴每一户被抽到的概率为100600=16, ∴三种家庭应分别抽取的户数为150×16=25,360×16=60,90×16=15.8.一个容量为100的样本,其数据的分组与各组的频数如下表:A .0.13B .0.39C .0.52D .0.64解析:由表知数据在[10,40)上的频数为13+24+15=52,∴其相应的频率为52100=0.52.答案:C9.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”.利用2×2列联表计算,得K2的观测值k≈3.918.经查对临界值表,知P(k2≥3.841)≈0.05.给出下列结论:①在犯错误的概率不超过0.05的前提下,认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.其中正确结论的序号是( )A.①③ B.②④C.① D.③解析:由独立性检验的意义知,当k>3.841时,就有95%的把握认为所研究的两个事件X与Y之间有关系.答案:C10.200辆汽车经过某一雷达地区,时速频率分布直方图如下图所示,则时速超过60 km/h 的汽车数量为( )A.65辆B.76辆C.88辆D.95辆解析:由频率分布直方图可得:设车速为v,当v≥60 km/h时,频率为(0.028+0.010)×10=0.038×10=0.38.∴汽车数量为n=0.38×200=76辆.答案:B11.若数据x1,x2,x3,…,x n的平均数是x,方差是s2,则3x1+5,3x2+5,3x3+5,…,3x n+5的平均数和方差分别是( )A.x,s2B.3x+5,9s2C .3x +5,s 2D .3x +5,9s 2+30s +25B 解析:∵x =1n(x 1+x 2+…+x n ),s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],∴x ′=1n [(3x 1+5)+(3x 2+5)+…+(3x n +5)]3n(x 1+x 2+…+x n )+5=3x +5,s ′2=1n[(3x 1+5-3x -5)2+(3x 2+5-3x -5)2+…+(3x n +5-3x -5)2]=9n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=9s 2.12.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图所示.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力从4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )A .0.27,78B .0.27,83C .2.7,78D .27,83A 解析:∵频率=频数100,∴由题意知,前4组的频率成等比数列,后6组的频率成等差数列. 设前4组的频率分别为a 1,a 2,a 3,a 4,则a 1=0.1×0.1=0.01,a 2=0.3×0.1=0.03, ∴公比q =3, ∴a =a 4=a 1q 3=0.01×33=0.27,设后6组的频数分别为b 1,b 2,b 3,b 4,b 5,b 6,公差为d , 则b 1=0.27×100=27,∴b 1+b 2+…+b 6=6b 1+6×52d =6×27+15d =162+15d .又∵b 1+b 2+…+b 6=100-(0.01+0.03+0.09)×100=87, ∴162+15d =87,d =-5,∴b =b 1+b 2+b 3+b 4=4×27+4×32×(-5)=78.二、填空题:本大题共4个小题,每小题5分,共20分.13.某学校有初中一1 080人,高中生900人,教师120人,现对学校的师生进行样本容量为n 的分层抽样调查,已知抽取的高中生为60人,则样本容量n =__________.解析:由题意,得60900=n 1 080+900+120,故n =140.答案:14014.一个高中研究性学习小组对本地区2002年到2004年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如下图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭__________万盒.解析:由题意得这三年中该地区每年平均销售盒饭为(30×1.0+45×2.0+90×1.5)=10+30+45=85(万盒).答案:8515.已知一个样本中各个个体的值由小到大依次为:4,6,8,9,x ,y,11,12,14,16,且其中位数为10,要使该样本的方差最小,则x ,y 的取值分别为__________.解析:由题意,样本容量为10,其中位数为x +y2=10,即x +y =20,∴样本平均数为x =110(4+6+8+9+x +y +11+12+14+16)=10.∵s 2=110[(4-x )2+(6-x )2+…+(x -x )2+(y -x )2+(11-x )2+…+(16-x )2],∴要使方差最小,x =y =x =10. 答案:10,10 16.给出下列命题:①样本标准差反映了样本数据与样本平均值的偏离程度,标准差越大,偏离程度越大; ②在散点图中,若点的分布是从左下角到右上角,则相应的两个为量正相关;③回归直线方程y ^=b ^x +a ^中截距a ^=b ^y -x ;④第11届全运动会前夕,政府在调查居民收入与来济观看全运会的关系时,抽查了3 000人.经济计算发展K 2的观测值k =6.023,则根据这一数据查阅下表,说明在犯错误的概率不超过0.025的前提下认为居民收入与来济观看全运会存在关系.解析:①由样本标准差的定义可知正确; ②根据两个变量正相关的概念知正确;③由回归地线主程b ^与a ^的关系知③不正确;④经过计算发现k =6.023,则根据这一数据查阅上表,k =6.023>5.024,说明在犯错误的概率不超过0.025的前提下认为居民收入与来济观看全运会存在关系.答案:①②④三、解答题:本大题共6小题,共70分.17.(10分)吸烟有害健康,现在很多公共场所都明令禁止吸烟.为研究是否喜欢吸烟与性别之间的关系,在某地随机抽取400人调研,得到列联表:(参考公式及数据:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),P (K 2>3.841)=0.05,P (K 2>6.635)=0.010, P (K 2>10.828)=0.001)解析:由列联表中的数据得k =400×(120×180-20×80)2140×260×200×200≈109.890>10.828.∴在犯错误的概率不超过0.001的前提下认为“是否喜欢吸烟与性别有关”. 18.(12分)为备战2010年广州第十六届亚运会,某教练对自行车运动员甲、乙两人在相同条件下进行了6次测试,测得它们的最大速度(m/s)的数据如下:解析:x =16(27+38+30+37+35+31)=33,x 乙=16(33+29+38+34+28+36)=33.他们的平均速度相同,再看方差及标准差:s 甲2=16[(-6)2+52+(-3)2+42+22+(-2)2]=473, s 乙2=16[02+(-4)2+52+12+(-5)2+32]=383.则s 甲2>s 乙2,即s 甲>s 乙.故乙的成绩比甲稳定.所以,应选乙参加亚运会.19.(12分)我国是世界上缺水严重的国家之一,如北京、天津等大城市缺水尤其严重,所以国家积极倡导节约用水.某公司为了解一年内用水情况,抽查了10天的用水量如下表:(1)这10天中,该公司用水的平均数是多少? (2)这10天中,该公司每天用水的中位数是多少?(3)你认为应该使用平均数和中位数中哪一个来描述该公司每天的用水量? 解析:(1)x =22+38+40+2×41+2×44+50+2×9510=51(t).(2)中位数=41+442=42.5(t).(3)用中位数42.5 t 来描述该公司的每天用水量较合适, 因为平均数受极端数据22、95的影响较大.20.(12分)随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如右图.(1)根据茎叶图判断哪个班的平均身高较高;(2)现从乙班这10名同学中随机抽取两名身高不低于173 cm 的同学,求身高为176 cm 的同学被抽中的概率.解析:(1)由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~179之间.因此乙班平均身高高于甲班;(2)设身高为176 cm 的同学被抽中的事件为A ,从乙班10名同学中抽中两名身高不低于173 cm 的同学们有:(181,173)、(181,176)、(181,178)、(181,179)、(179,173)、(179,176)、(179,178)、(178,173)、(178,176)、(176,173)共10个基本事件,而事件A 含有4个基本事件:(181,176)、(179,176)、(178,176)、(176,173). ∴P (A )=410=25.21.(12分)某种产品的广告费支出x 与销售额y (单位:百万元)之间有如下对应关系:(1)假定y 与x (2)若实际销售额不少于60百万元,则广告费支出应不少于多少? 解析:(1)x =2+4+5+6+85=5,y =30+40+60+50+705=50.∑5i =1x i 2=145,∑5i =1x i y i =1 380. 设所求回归方程为y ^=b ^x +a ^,则b ^=∑5i =1(x i -x )(y i -y )∑5i =1 (x i -x )2=∑5i =1x i y i -5xy ∑5i =1x i 2-5x 2=1 380-5×5×50145-5×52=6.5. a ^=y -b ^x =50-6.5×5=17.5.(2)由回归方程,得y ^≥60,即6.5x +17.5≥60,解得x ≥8513,故广告费支出应不少于8513百万元.22.(12分)为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:(1)求出表中m ,n ,M ,N 所表示的数分别是多少? (2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5以上的概率.解析:(1)M =10.02=50,m =50-(1+4+20+15+8)=2,N =1,n =m M =250=0.04. (2)作出直角坐标系,组距为4,纵轴表示频率/组距,横轴表示身高,画出直方图如下图所示.(3)身高在[153.5,157.5)范围内的人数最多,估计身高在161.5以上的概率为。
《2016艺体生文化课-百日突围系列》基础篇 专题18 统计与统计案例【学生版】
《2016艺体生文化课-百日突围系列》专题18 统计与统计案例抽样方法【背一背基础知识】1. 简单随机抽样:一般地,从元素个数为N 的总体中逐个不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法:抽签法和随机数法.简单随机抽样适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小。
2.系统抽样:假设要从容量为N 的总体中抽取容量为n 的样本,第一步,先将总体的N 个个体编号;第二步,确定分隔间距k ,对编号进行分段,当N n (n 是样本容量)是整数时,取k =N n ;当Nn (n 是样本容量)不是整数时,先用简单随机抽样剔除N n -[N n ]个个体,取k =[Nn ];第三步,在第1段用简单随机抽样确定第一个个体编号l (l ≤k );第四步,按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号l k +,再加k 得到第3个个体编号2l k +,依次进行下去,直到获取整个样本.系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等。
3.分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.分层抽样的应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.【讲一讲提高技能】1必备技能:在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为Nn(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值. 2典型例题:例1. 某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______.例2. 某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为( )A .90B .100C .180D .300【练一练提升能力】1.为了了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A .50B .40C .25D .202.从3001名学生中选取50名组成参观团,现采用下面的方法选取:先用简单随机抽样从 3001人中剔除1人,剩下的3000人再按系统抽样的方法进行,则每个人被选到的机会( )A .不全相等B 。
艺考生文化课新高考数学百日冲刺复习课时分组冲关:第8章 统计与统计案例 第1节
第八章 第1节1.(2019·福州市一模)为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A .简单随机抽样B .按性别分层抽样C .按年龄段分层抽样D .系统抽样解析:C [根据该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,男女“微信健步走”活动情况差异不大;最合理的抽样方法是按年龄段分层抽样.故选C.]2.为了调查老师对微课堂的了解程度,某市拟采用分层抽样的方法从A ,B ,C 三所中学抽取60名教师进行调查,已知A ,B ,C 三所学校中分别有180,270,90名教师,则从C 学校中应抽取的人数为( )A .10B .12C .18D .24解析:A [根据分层抽样的特征,从C 学校中应抽取的人数为90180+270+90×60=10. 故选A.]3.(2019·洛阳市一模)为了规范学校办学,省电教育厅督察组对某所高中进行了抽样调查,抽查到班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号,33号,46号同学在样本中,那么样本中还有一位同学的编号应是( )A .13B .19C .20D .52 解析:C [用系统抽样抽出的四个学生的号码从小到大:7,?,33,46成等差数列,因此,另一学生编号为7+46-33=20.故选C.]4.(2019·大连调研)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .14解析:B [由系统抽样定义可知,所分组距为84042=20,每组抽取一个,因为包含整数个组,所以抽取个体在区间[481,720]的数目为(720-480)÷20=12.]5.(2019·济南市一模)中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成绩按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为()A.2 B.4 C.5 D.6解析:A[由茎叶图可得,获”诗词达人”称号的有8人,据该次比赛的成绩按照称号的不同进行分层抽样抽选10名学生,设抽选的学生中获得“诗词达人”称号的人数为n,n 10=840,解得n=2人.故选A.]6.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.解析:因为990∶99 000=1∶100,所以普通家庭中拥有3套或3套以上住房的大约为50×100=5 000(户).又因为100∶1 000=1∶10,所以高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).所以约有5 000+700=5 700(户).故5 700÷100 000×100%=5.7%.答案:5.7%7.利用随机数表法对一个容量为500,编号为000,001,002,…,499的产品进行抽样检验,抽取一个容量为10的样本,选取方法是从随机数表第12行第5列、第6列、第7列数字开始由左到右依次选取三个数字(下面摘取了随机数表中的第11行至第12行),根据下表,读出的第3个数是________.18 18 07 92 45 44 17 16 58 09 79 83 86 19 62 06 76 50 03 10 55 23 64 05 0526 62 38 97 75 84 16 07 44 99 83 11 46 32 24 20 14 85 88 45 10 93 72 88 71解析:最先读到的数据的编号是389,向右读下一个数是775,775大于499,故舍去,再下一个数是841,舍去,再下一个数是607,舍去,再下一个数是449,再下一个数是983,舍去,再下一个数是114.故读出的第3个数是114.答案:1148.为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k 为________.解析:在系统抽样中,确定分段间隔k ,对编号进行分段,k =N n(N 为总体的容量,n 为样本的容量),所以k =N n =1 20030=40. 答案:409.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n .解:总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n 36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n 2.所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量为n =6. 10.用分层抽样法从高中三个年级的相关人员中抽取若干人组成研究小组,有关数据见下表:(1)求x ,y 的值;(2)若从高二、高三年级抽取的人中选2人,求这2人都来自高二年级的概率.解:(1)由题意可得x 99=y 27=218,所以x =11,y =3. (2)记从高二年级抽取的3人为b 1,b 2,b 3,从高三年级抽取的2人为c 1,c 2,则从这两个年级抽取的5人中选2人的所有等可能基本事件共有10个:(b 1,b 2),(b 1,b 3),(b 1,c 1),(b 1,c 2),(b 2,b 3),(b 2,c 1),(b 2,c 2),(b 3,c 1),(b 3,c 2),(c 1,c 2),设所选的2人都来自高二年级为事件A ,则A 包含的基本事件有3个:(b 1,b 2),(b 1,b 3),(b 2,b 3).则P (A )=310=0.3,故所选的2人都来自高二年级的概率为0.3.。
2023年高考数学复习:统计与统计案例
该5G产品上市时间x和市场占有率y(单位:%)的几组相关对应数据.如图
所示的折线图中,横轴1代表2021年8月,2代表2021年9月,……,5代
^
^
表2021年12月,根据数据得出y关于x的线性回归方程为 y=0.042x+a .若
用此方程分析并预测该产品市场占有率的
变化趋势,则该产品市场占有率最早何时
例3 (2020·新高考全国Ⅰ改编)为加强环境保护,治理空气污染,环境 监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和 SO2浓度(单位:μg/m3),得下表:
SO2 PM2.5
[0,35]
[0,50] 32
(50,150] 18
(150,475] 4
(35,75]
6
8
12
√C.新农村建设后,养殖收入不变
D.新农村建设后,种植收入在经济收入中所 占比重大幅下降
解析 因为该地区经过一年的新农村建设, 农村的经济收入增加了一倍,不妨设建设前 的经济收入为m,则建设后的经济收入为2m, A选项,从扇形统计图中可以看到,新农村建 设 后 , 种 植 收 入 比 建 设 前 增 加 2m×37% - m×60%=m×14%,故A正确; B选项,新农村建设后,其他收入比建设前增 加 2m×5% - m×4% = m×6%>m×4% , 即 增 加了一倍以上,故B正确;
(1)样本点不一定在回归直线上,但点( x , y )一定在回归直线上.
^
(2)求b时,灵活选择公式,注意公式的推导和记忆. (3)利用相关系数判断相关性强弱,看|r|的大小,而不是r的大小. (4)区分相关系数r与相关指数R2. (5)通过线性回归方程求的都是估计值,而不是真实值.
2019届全国卷高三数学艺体生、学困生补习资料,专题复习资料:专题(18)统计与统计案例(基础篇-含答案)
抽样方法【背一背基础知识】1. 简单随机抽样:一般地,从元素个数为N 的总体中逐个不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法:抽签法和随机数法.简单随机抽样适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小。
2.系统抽样:假设要从容量为N 的总体中抽取容量为n 的样本,第一步,先将总体的N 个个体编号;第二步,确定分隔间距k ,对编号进行分段,当Nn (n 是样本容量)是整数时,取k =N n ;当N n (n 是样本容量)不是整数时,先用简单随机抽样剔除N n -[N n ]个个体,取k =[Nn ];第三步,在第1段用简单随机抽样确定第一个个体编号l (l ≤k );第四步,按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号l k +,再加k 得到第3个个体编号2l k +,依次进行下去,直到获取整个样本.系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等。
3.分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.分层抽样的应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.【讲一讲提高技能】1必备技能:在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为Nn(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值. 2典型例题:例1. 某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______.【答案】25【解析】由题意得抽样比例为45190020=,故应抽取的男生人数为15002520⨯=.【考点】分层抽样.【名师点睛】本题考查抽样方法,要搞清楚三种抽样方法的区别和联系,其中分层抽样是按比例抽样;系统抽样是等距离抽样,属于基础题.例2. 某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为()A.90 B.100 C.180 D.300【答案】C【考点定位】分层抽样.【名师点晴】本题主要考查的是分层抽样,属于容易题.解题时一定要清楚“320”是指抽取前的人数还是指抽取后的人数,否则容易出现错误.解本题需要掌握的知识点是分层抽样,即抽取比例=样本容量总体容量.【练一练提升能力】1.为了了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D .20 【答案】C【解析】由题意知,分段间隔为10002540=,故选C . 2.从3001名学生中选取50名组成参观团,现采用下面的方法选取:先用简单随机抽样从 3001人中剔除1人,剩下的3000人再按系统抽样的方法进行,则每个人被选到的机会( )A .不全相等B 。
专题18统计与统计案例(基础篇)-2021年高考数学备考艺体生百日突围系列(解析版)
Ʌ2016 艺体生文化课-百日突围系列Ɇ抽样方法銟背一背基础知识銠1. 简单随机抽样:一般地,从元素个数fi N 的总体中½个н放回地抽取容䟿fi n 的样$,如果⇿一⅑抽取时总体中的各个个体$相¼的ª能性被抽到,䘉种抽样方法ª做简单随机抽样ˊ最常用的简单随机抽样的方法:抽签法和随机数法ˊ简单随机抽样适用范围是:总体中的个体性质相似,无明显层⅑:总体容䟿较小,尤‰是样$容䟿较小銔工.系统抽样:假设要从容䟿fi N 的总体中抽取容䟿fi n 的样$,第一↕,]将总体的 N 个个体编ª:第=↕,确定分隔间距k N 是样$容䟿)是整数时,取 k N N 是样$容䟿)н是整,对编ª进行分段,fi n (n =n :fi n (nN N N数时,]用简单随机抽样剔除n -[n ]个个体,取 k =[n ]:第й↕,在第 1 段用简单随机抽样确定第一个个体 编ª l (l ≤k ):第四↕,按照一定的规则抽取样$,通常是将 l ࣐k 间隔 k 得到第 2 个个体编ª l + k ,再࣐ k 得到第 3 个个体编ª l + 2k ,依⅑进行f 去,直到获取整个样$ˊ系统抽样的适用范围是:元素个数很多且均衡的总体:各个个体被抽到的机会均等銔左.分层抽样:fi 总体$$明显差别的几部分组fi 时,fi 了使抽取的样$更好地反映总体的情况,常采用分 层抽样 ,将总体中各个个体按某种特征分fi 若Ç个互н交࣐的几部分,⇿一部分ª做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,䘉种抽样方法ª做分层抽样ˊ分层抽样的ƒ用范围是:总体$差异明显的几部分组fi 的情况:分层⅑,在⇿一层抽样时ª采用简单随机抽样或系统抽样ˊ銟讲一讲提高技能銠1 必备技能:在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样$就需要分fi 几个组,则分段 N 间隔即fin( N fi 样$容䟿络,首]确定在第一组中抽取的个体的ª码数,再从⅑面的⇿组中按规则抽取⇿个个体ˊ解决fl 类题目的ޣ键是深刻理解各种抽样方法的特点和适用范围ˊ但无论哪种抽样方法,⇿一 个个体被抽到的概率都是相等的,都等于样$容䟿和总体容䟿的比值ˊ 2 ޣ型例题:例1. 某校高一¢级$ 召00 ࣐学生,‰中女生400 ࣐,按男女比例用分层抽样的方法,从该¢级学生中抽取一个容䟿fi 45 的样$,则ƒ抽取的男生人数fi ˊ銟答案銠2545 1 1銟解析銠$题意得抽样比例fi=,故ƒ抽取的男生人数fi 500 ⨯= 25 ˊ銟考点銠分层抽样ˊ900 20 20例2. 某校老¢銓中¢和青¢教师的人数½f表,采用分层抽样的方法调查教师的身体状况,在抽取的样$中,青¢教师$ 320 人,则该样$的老¢教师人数fiC 3Aˊ90 Bˊ100 叶ˊ180 号ˊ300类别人数老¢教师900中¢教师1800青¢教师1600合计4300銟答案銠叶銟考点定ƒ銠分层抽样.銟࣐师点晴銠$题K要考查的是分层抽样,属于容易题ˊ解题时一定要清楚釐320 金是指抽取前的人数䘈是指抽取⅑的人数,否则容易出现错误ˊ解$题需要掌握的知识点是分层抽样,即抽取比例= 样$容䟿ˊ总体容䟿銟练一练提升能力銠1ˊfi了了解1000 ࣐学生的学习情况,采用系统抽样的方法,从中抽取容䟿fi 40 的样$,则分段的间隔fi C 3A ˊ50B ˊ40C ˊ25Dˊ20銟答案銠C銟解析銠$题意知,分段间隔fi 100040= 25 ,故选Cˊ2.从左001 ࣐学生中选取50 ࣐组fi参㿲团,现采用f面的方法选取:]用简单随机抽样从左001 人中剔除1 人,剩f的左000 人再按系统抽样的方法进行,则⇿个人被选到的机会C 3Aˊн全相等B銔均н相等叶銔无法确定号銔都相等3. $銓Z两套设备生产的¼类产品共4叫00 件,采用分层抽样的方法从中抽取一个容䟿fi 叫0 的样$进行检测ˊ若样$中$ 50 件产品$$设备生产,则Z设备生产的产品总数fi 件ˊ銟答案銠1叫00銟解析銠依题意,设在$生产的设备中抽50x 件,则在Z生产的设备中抽30x 件,所以50x +30x =4800 ,解得x =600 ,故Z设备生产的产品总数fi 1叫00 件ˊ频率分布直方图与茎叶图銟背一背基础知识銠频率1. 鈇频率分$直方‰:在频率分$直方‰中,纵轴表示,数据落在各小组内的频率用各长长方形的面组距〟表示,各小长方形的面〟总和等于1ˊ连接频率分$直方‰中各小长方形k端的中点,就得到频率分$折线‰ˊ随着样$容䟿的增࣐,作‰时所分的组数增࣐,组距ޣ小,相ƒ的频率分$折线‰就会越来越接½ 于一条fi滑的曲线,统计中ƒ之fi总体密度曲线,它能够更࣐精㓶的反映出总体的分$规律ˊ工ˊ频率分$直方‰的↕骤如f:(i络求极差:(ξ络确定组距和组数:(络将数据分组:(fi络列频率分$表: (v络画频率分$直方‰ˊ频率分$直方‰能很容易地表示大䟿数据,非常直㿲地表明分$的形状ˊ左ˊ茎ª‰:茎是指中间的一列数,ª是从茎的旁边生长出来的数ˊ茎ª‰表示数据$两个突出的fi点:‰一是统计‰k没$原始数据的损失,所$信息都ª以从䘉个茎ª‰中得到,‰=是在比赛时随时记录, 方便记录fl表示ˊ4ˊfi样$数据较少时,用茎ª‰表示数据的效果较好,它н但ª以保留原始信息,而且ª以随时记录,㔉记录和表示都带来方便ˊ銟讲一讲提高技能銠1必备技能:(1络在频率分$直方‰中估计中ƒ数和࣐均数的方法鈇中ƒ数:在频率分$直方‰中,中ƒ数G边和右边的直方‰的面〟ƒ该相等ˊ鈈࣐均数:在频率分$直方‰中,࣐均数等于‰中⇿个小矩形面〟$以小矩形¾边中点的横࣐标之和ˊ (工络࣐均数反映了数据取值的࣐均水࣐,标准差銓方差࣐述了一组数据波动的大小ˊ标准差銓方差越大,数据的离散程度越大,越н稳定:标准差銓方差越小,数据的离散程度越小,越稳定ˊ2ޣ型例题:例1 在一⅑马拉松比赛中,左5 ࣐䘀动员的fi绩C单ƒ:分钟3如‰I 所示;若将䘀动员按fi绩$好到差编fi 1由左5 ª,再用系统抽样方法从中抽取只人,则‰中fi绩在区间后1左召,151逐k的䘀动员人数fi( 络A銓左B銓4 叶銓5 号銓6銟答案銠B銟考点定ƒ銠茎ª‰銟࣐师点睛銠系统抽样是指fi总体中个数较多时,将总体分fi均衡的几部分,然⅑按照预]定出的规则, 从⇿一部分抽取 1 个个体,得到所需要的样$的抽样方法,‰实质fi等距抽样. 茎ª‰的fi点是保留了原始数据,便于记录þ表示,能反映数据在各段k的分$情况ˊ缺点fiн能直接反映总体的分$情况. $数据集中情况ª以估计࣐均数大小,再根据‰分散程度ª以估测方差大小ˊ例工某学校组㓷学生参࣐英语测试,fi 绩的频率分$ 直方‰如‰,数据的分组一⅑fi [20, 40),[40, 60),[60,80),8[20,100). 若¼于60 分的人数是15 人,则该班的学生人数是CA3 45 CB3 50 C叶3 55 C号3 60銟分析銠首]根据频率分$直方‰计算出从20 到60 的频率,即能计算出总从数ˊ銟解析銠从20 到60 的频率fi:C0.005+0.013⨯20=0.3,故总人数fi15÷0.3=50人,选B.銟练一练提升能力銠1.fi了研究某药品的疗效,选取若Ç࣐志愿者进行临床试验,所$志愿者的舒张压数据C单ƒ:k布a3的分组区间fi后1工,1左络,后1左,14络,后14,15络,后15,16络,后16,1只逐,将‰按从G到右的亪序分别编ªfi理一组,理=组, ,理五组,右‰是根据试验数据制fi的频率分$直方‰,已知理一组fl理=组共$ 工0 人,理й组中没$疗效的$ 6人,则理й组中$疗效的人数fiC 3A.6B.叫叶.1工号.1叫銟答案銠C2.某学校随机抽取20 个班,调查各班中$网k购物㓿历的人数,所得数据的茎ª‰如‰所示.以组距fi 5 将数据分组fi[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分$直方‰是C3銟答案銠A3. fi比较$銓Z两地某$14 时的气温状况,随机选取该$中的5 天,将䘉5 天中14 时的气温数据C单ƒ:℃3制fi如‰所示的茎ª‰.考虑以f结论:鈇$地该$ 14 时的࣐均气温¼于Z地该$ 14 时的࣐均气温:鈈$地该$ 14 时的࣐均气温高于Z地该$ 14 时的࣐均气温:鈉$地该$ 14 时的࣐均气温的标准差小于Z地该$ 14 时的气温的标准差:鈊$地该$ 14 时的࣐均气温的标准差大于Z地该$ 14 时的气温的标准差.‰中根据茎ª‰能得到的统计结论的标ªfi( 络CA3鈇鈉(B络鈇鈊(叶络鈈鈉(号络鈈鈊銟答案銠B銟解析銠$地数据fi:26, 28, 29, 31, 31:Z地数据fi:28,29,30,31,32:所以,x$ = 26 + 28 + 29 + 31+ 315= 29 xZ=28 + 29 + 30 + 31+ 325= 30,n n nn2= 1 [(26 - 29)2 + (28 - 29)2 + (29 - 29)2 + (31- 29)2 + (31- 29)2 ] = 3.6 $ 5 2 = 1 [(28 - 30)2 + (29 - 30)2 + (30 - 30)2 + (31- 30)2 + (32 - 30)2 ] = 2,即fl 确的$鈇鈊,故选 B . Z 5銟考点定ƒ銠1.茎ª‰:工.࣐均数銓方差銓标准差.銟࣐师点睛銠$题考查茎ª‰的概念以þ࣐均数銓方差銓标准差的概念þ‰计算,解答$题的ޣ键,是记 清¿式,㓶心计算.$题属于基础题,较全面地考查了统计的基础知识.变量间的相关关系与独立性检验銟背一背基础知识銠1ˊ两个变䟿间的相ޣޣ系:鈇$ޣ概念:相ޣޣ系fl 函数ޣ系н¼ˊ函数ޣ系中的两个变䟿间是一种确定性ޣ系ˊ相ޣޣ系是一种非确定性ޣ系,即相ޣޣ系是非随机变䟿fl 随机变䟿之间的ޣ系ˊ如果一个变䟿的值$小变大时另一个变䟿 的值$小变大,䘉种相ޣƒfifl相ޣ:如果一个变䟿的值$小变大时另一个变䟿的值$大变小,䘉种相ޣ ƒfi负相ޣ:如果散点‰中点的分$从整体k 看大致在一条直线䱴½,就ƒ䘉两个变䟿之间ޣ$线性相ޣ ޣ系ˊ鈈回fi 方程: y = b x + a 是两个ޣ$线性相ޣޣ系的变䟿的一组数据(x ,y ),(x ,y ), ,(x ,y) 的回fi1122nn⎧ ∑(x - x )( y - y ) ∑ x y - nx y ⎪i i i i ⎪b = i =1 = i =1方程,‰中a 銓b 是待定参数ˊ a 銓b 的计算¿式⎨ ∑(x - x )2 ∑ x 2 - n (x )2 . ⎪ i =1⎪i i i =1 ⎪⎩a = y - b x2ˊ独立性检验:工×工 列联表BB合计 A次11次1工次1+s sn nn nn(n n-n n构造一个随机变䟿χ2 = 11 22 12 21n1+n2+n+1n+2,利用随机变䟿χ工来判断釐两个分类变䟿$ޣ系金的方法ƒfi 独立性检验:若χ2 > 3.841 ,则$ 95%把握认fi A fl B $ޣ:若χ2 > 6.635 ,则$ 99%把握认fi A fl B $ޣ:‰中χ2=3.841是判断是否$ޣ系的临界值,χ2≤3.841ƒ判断fi没$充分证据显示A fl B $ޣ,而н能作fi小于召5还的䟿!值来判断ˊ銟讲一讲基本技能銠1.必备技能:鈇求回fi直线,使釐离差࣐方和fi最小金的方法ª做最小=$法,用最小=$法求得回fi方程y=b x+a 是两个ޣ$线性相ޣޣ系的变䟿的一组数据(x,y),(x,y), ,(x,y)的回fi方程,‰中a銓b 是待定参1 12 2 n n⎧∑(x -x)( y -y) ∑x y -nx y⎪i i i i⎪b=i=1=i=1数ˊ从a銓b f l r的计算¿式⎨ ∑(x -x)2∑x2 -n(x)2 fl⎪i=1⎪i ii=1⎪⎩a =y-b xn n∑(x i-x)(y i-y)r =∑x i y i -nxyª以看出:(i络回fi直线必过点(x,y):(ξ络b fl r符ª相¼銔鈈回fi銟分析銠是对ޣ$相ޣޣ系的两个变䟿进行统计分析的一种常用方法,K要判断特定䟿之间是否$ 相ޣޣ系,如果$就找出它们之间贴½的数学表达式銔比如线性回fi分析就是分析求出的回fi直线是否$ 意$,而判断的依据就是|r|的大小:|r|鈀1,并且|r|越接½1,线性相ޣ程度越强:|r|越接½0,线性相ޣ程度越弱銔从散点‰来看,¼$在散点‰大致呈线性时,求出的回fi直线方程才$实䱵意$,否则,求出的回fi直线方程毫无意$銔线性相ޣ检验的↕骤如f:(i 络作统计假设:x fl Y нޣ$线性相ޣޣ系;(ξ络根据小概率 0.05 fl n —工 在䱴表中查出 r 的一个临界值r 0.05 : C 3根据样$相ޣ系数计算¿式求出 r 的值:Cfi3作统计推断,如果|r |> r 0.05 ,表明$ 召5还的把握认fi x fl Y 之间ޣ$线性相ޣޣ系:如果|r |鈀r 0.05 ,fi 们没$理$拒‰原来的假设銔䘉时寻找回fi 直线方程是毫无意$的銔鈉注意:线性回fi 分析以散点‰fi基础,ޣ$很强的直㿲性,$散点‰作比较时,拟合效果的好fiª$直㿲性直接判断,没$散点‰时,¼享套用¿式求 r ,再作判断即ªˊ独立性检验没$直㿲性,必享依靠 χ 2作判断ˊ 2.ޣ型例题例 1. 已知变䟿 x 和 y 满足ޣ系 y = - 0.1x + 1 ,变䟿 y fl z fl 相ޣ. f 列结论中fl 确的是C3Aˊ x fl y 负相ޣ, x fl z 负相ޣ Bˊ x fl y fl 相ޣ, x fl z fl 相ޣ 叶ˊ x fl y fl 相ޣ, x fl z 负相ޣ 号ˊ x fl y 负相ޣ, x fl z fl 相ޣ銟答案銠 A .銟考点定ƒ銠$题考查fl 相ޣ銓负相ޣ,⎹þ线性回fi 方程的内容.‰=,н能准确的将fl 相ޣfl 负相ޣ问题进行䖜!fi 直线斜率大于和小于 0 的问题. 例 工. 根据如f 样$数据:得到的回fi 方程fi y ˆ = bx + a ,则C 3Aˊ a > 0 , b < 0Bˊ a > 0 , b > 0叶ˊ a < 0 , b < 0号ˊ a < 0 , b > 0分析:根据已知样$数判断线性回fi 方程中的b fl a 的符ªˊx 左 4 56 只叫y4ˊ0工ˊ5- 0.50ˊ5- 2.0- 3.0銟答案銠A銟解析銠依题意,画散点‰知,两个变䟿负相ޣ,所以b < 0 , a > 0 ˊ选 Aˊ 例 3.已知 x fl y 之间的几组数据如f 表:假设根据k 表数据所得线性回fi 直线方程fi y = b x + a , 若某¼学根据k 表 中的前两组数据 (1, 0) 和 (2, 2) 求得的直线方程fi y ' = b 'x + a ', 则以f 结论fl 确的是CPA ˊ b> b ', a > a ' B ˊ b > b ', a < a ' C ˊ b < b ', a > a ' D ˊ b< b ', a < a '銟解析銠散点‰如右,显然⅑四个点都н在直线 y = b 'x + a ' 的Gk 方,所以回fi 直线斜率ƒ该更小,纵截距更大,故选 C.銟练一练提升能力銠1. 高й¢级267 ƒ学生参࣐期$考试,某班37 ƒ学生的语文fi 绩,数学fi 绩fl 总fi 绩在全¢级中的排࣐情况如f‰所示,$銓Z 銓ffi 该班йƒ学生ˊ从䘉⅑考试fi 绩看,鈇在$銓Z 两人中,‰语文fi 绩࣐⅑比‰总fi 绩࣐⅑靠前的学生是 :x 1 2 3 4 5 6 y21334鈈在语文和数学两个科目中,f¼学的fi绩࣐⅑更靠前的科目是ˊ銟答案銠Z:数学銟解析銠鈇$‰ª知,$的语文fi绩排࣐比总fi绩排࣐靠⅑:而Z的语文fi绩排࣐比总fi绩排࣐靠前,故填Z.鈈$‰ª知,比f的数学fi绩排࣐䘈靠⅑的人比较多:而总fi绩的排࣐中比f排࣐靠⅑的人数比较少, 所以f的数学fi绩的排࣐更靠前,故填数学.銟考点定ƒ銠散点‰.銟࣐师点晴銠$题K要考查的是散点‰,属于容易题ˊ解题时一定要抓fi重要y眼釐语文金和釐更金,否则很容易出现错误ˊ解fl类‰象题一定要㿲察仔㓶,分析‰彻,提取必要的信息ˊ3.已知变䟿x f l y f l相ޣ,且$㿲测数据算得样$࣐均数x =3,y =3.5 ,则$该㿲测的数据算得的线性回fi方程ª能是( )A. y= 0.4x+ 2.3 C. y=-2x+ 9.5B. y= 2x- 2.4C. y=-0.3x+ 4.4銟答案銠A4.釐十一金期间,䛒pfi通过随机询问 100 ࣐性别н¼的居民是否能做到‘fi盘量行动,得到如f的列联表,参照䱴表,得到的fl确的结论是 C 3k 2 =n(ad -bc)2(a +b)(c +d )(a +c)(b +d )Aˊ在犯错误的概率н超过 1还的前提f,认fi釐该fi居民能否做到‘fi盘量fl性别$ޣ金Bˊ在犯错误的概率н超过 1还的前提f,认fi釐该fi居民能否做到‘fi盘量fl性别无ޣ金叶ˊ$召0还以k的把握认fi釐该fi居民能否做到‘fi盘量fl性别$ޣ金号ˊ$召0还以k的把握认fi釐该fi居民能否做到‘fi盘量fl性别无ޣ金P(k 2 ≥k ) 0.10 0.05 0.0工5图工.只06左.叫41 5.0工4C 一3 选择题C 12*5=60 分31ˊ对一个容䟿fi N 的总体抽取容䟿fi n 的样$,fi 选取简单随机抽样銓系统抽样和分层抽样й种н¼方法抽取样$时,总体中⇿个个体被抽中的概率分别fi p 1, p 2 , p 3 ,则C 3A. p 1 = p 2 < p 3B. p 2 = p 3 < p 1C. p 1 = p 3 < p 2D. p 1 = p 2 = p 3銟答案銠D2ˊ重庆fi 工01左 ¢各$的࣐均气温C°叶3数据的茎ª‰如f0 叫 召1 工 5 叫 工 0 0 左左 叫左1工则䘉组数据中的中ƒ数是C 3(A 络 1召 (B 络 工0 (叶 络 工1.5 (号 络工左銟答案銠B銟解析銠$茎ª‰ª知总共 1工 个数据,处在fl 中间的两个数是第ޣ和第七个数,它们都是 工0,$中ƒ数的定$ª知:‰中ƒ数就是 工0,故选 B. 銟考点定ƒ銠茎ª‰fl中ƒ数.銟࣐师点睛銠$题考查复数的概念和䘀算,采用分母实数!和利用共fi 复数的概念进行!解求解.$题属于基础题,注意䘀算的准确性.3ˊ某中学$高中生3500 人,初中生1500 人,fi了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容䟿fi n 的样$,已知从高中生中抽取70 人,则n fiC 3A.100B.150C.200D.250銟答案銠A70= 100 ˊ故选Aˊ銟解析銠n =(3500 +1500)⨯35004.设样$数据x1,x2, ,x10的均值和方差分别fi 1和4,若y i=x i+a C a fi非零常数,i=1,2, ,103,则y1, y2, y10 的均值和方差分别fiC 3C A31+a,4C B31+a,4+a C C31,4C D31,4+a銟答案銠A銟解析銠5.某学校$男銓女学生各500 ࣐.fi了解男女学生在学趣fl±余爱好方面是否fl在显著差异,拟从全体学生中抽取100 ࣐学生进行调查,则宜采用的抽样方法是C 3Aˊ抽签法Bˊ随机数法Cˊ系统抽样法Dˊ分层抽样法2 326ˊ某¿¼10 ƒ员fl 的$fl 资C 单ƒ:元3fi x , x ,…, x ,‰均值和方差分别fi x 和s 2,若从f$起1210⇿ƒ员fl 的$fl 资增⅑100 元,则䘉10 ƒ员flf$fl 资的均值和方差分别fiC A 3 x , s 2 +1002C B 3 x +100 , s 2 +1002C C 3 x , s2銟答案銠 DC D 3 x +100 , s27.在一组样$数据C x 1,y 13,C x 2,y 23,…,C x n ,y n 3C n 鈁2,x 1,x 2,…,x n н全相等3的散点‰中,若所$样 $点C x i ,y i 3(i =1,2,…,n 络都在直线 y =1x +1 k,则䘉组样$数据的样$相ޣ系数fiC A 3—1 C B 30C C 1銟答案銠DC D 31銟解析銠根据样子相ޣ系数的定$ª知,fi 所$样$点都在直线k 时,相ޣ系数fi 1,选 D. 8.采用系统抽样方法从960 人中抽取32 人做问卷调查,fifl 将他们随机编ªfi 1, 2 ,……, 960 ,分组⅑ 在第一组采用简单随机抽样的方法抽到的ª码fi 9 .抽到的32 人中,编ª落入区间[1, 450] 的人做问卷 A , 编ª落入区间[451, 750] 的人做问卷 B ,‰余的人做问卷C .则抽到的人中,做问卷C 的人数fi C 3A. 7B. 9 叶.10 号.159.f ‰是两组各7 ࣐¼学体重C 单ƒ: kg 3数据的茎ª‰ˊ设1, 2 两组数据的࣐均数依⅑fi x 1 和 x 2 ,标准差依⅑fi s 1 和 s 2 , ‡C3C 注:标准差 s = ,‰中 x fi x , x , , x 的࣐均数312nAˊ x 1 > x 2 , s 1 > s 2Bˊ x 1 > x 2 , s 1 < s 2叶ˊ x 1 < x 2 , s 1 < s 2号ˊ x 1 < x 2 , s 1 > s 21 0. 某学校fi 了了解й¢级銓ޣ¢级銓 九¢级䘉й个¢级之间的学生视力是否fl 在显著差异,拟从䘉й个¢级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( 络(A 络抽签法 (B 络系统抽样法 (叶络分层抽样法 (号络随机数法銟答案銠叶銟解析銠按照各种抽样方法的适用范围ª知,ƒ使用分层抽样.选 叶銟考点定ƒ銠$题考查几种抽样方法的概念銓适用范围的判断,考查ƒ用数学方法解决实䱵问题的能力. 銟࣐师点睛銠样$抽样是现实生活中常½的һ件,一般地,抽签法和随机数表法适用于样$总体较少的抽1 [(x - x )2 + (x - x )2 + + (x - x )2 ]n1 2 n样,系统抽样法适用于要将样$总体均衡地分fi 次个部分,从⇿一部分中按规则抽取一个个体:分层抽样法则是fi总体明显的分fi几个层⅑时,在⇿一个层⅑中按照相¼的比例抽取抽取样$.$题条件适合于分层抽样的条件,故ƒ选用分层抽样法.属于简单题.11.学校fi了解学生在课外读物方面的支出情况,抽取了n 个¼学进行调查,结果显示䘉些¼学的支出都在后10,50络C单ƒ:元3,‰中支出在[30, 50)C单ƒ:元3的¼学$6只人,‰频率分$直方‰如右‰所示,则n 的值fiC 3Aˊ100Bˊ1工0 叶ˊ1左0 号ˊ左召0銟答案銠A12.㔉出f列五个命题:鈇某班级一共$ 5工࣐学生,现将该班学生随机编ª,用系统抽样的方法抽取一个容易fi 4 的样$,已知只ª,左左ª,46ª¼学在样$中‡样$另一ƒ¼学的编ªfi工左;鈈一组数据 1銓工銓左銓4銓5 的࣐均数銓÷数銓中ƒ数相¼;鈉一组数据 a銓0銓1銓工銓左,若该组数据的࣐均值fi 1,则样$标准差fi 工;鈊根据ޣ$线性相ޣޣ系的两个变䟿的统计数据所得的回fi直线方程fi 本称a末+b 中,b称工,x =1, y = 3 ,则a 称1;鈋如‰是根据抽样检测⅑得出的产品样$净重(单ƒ:克络数制的频率分$直方‰,已知样$中产品净重小于 100 克的个数是左6,则样$中净重大于或等于召叫克,并且小于 104 克的产品的个数是召0.銟答案銠B銟解析銠鈇$系统抽样的原知抽样的间隔fi 5工÷4称1左,故抽取的样$的编ª分别fi 只,只+1左,只+1左×工,只+1左×左,即只ª銓工0 ª銓左左ª銓46 ª,鈇是假命题;C=3 填空题C4*5=20 分313ˊ已知样$数据x, x2 , ⋅⋅⋅,x n 的均值x =5,则样$数据2x1 +1 ,2x2 +1 ,⋅⋅⋅,2x n +1的均值1fi ˊ銟答案銠11銟考点定ƒ銠均值的性质ˊ銟࣐师点晴銠$题K要考查的是均值的性质,属于容易题ˊ解$题需要掌握的知识点是均值和方差的性质,即数据x,x, ,x的均值fi x,方差fi s2,则C13数据x±a,x±a, ,x±a 的均值fi x ±a ,1 2 n 1 2 nn方差fi s 2 :C 工3数据kx , kx , , kx 的均值fi kx ,方差fi k 2 s 2:C 左3数据kx ± a , kx± a , ,12n12kx ± a 的均值fi kx ± a ,方差fi k 2 s 2 ˊ14ˊ某大学fi 了解在校$科生对参⅑某亩社会实践活动的意向,拟采用分层抽样的方法,从该校四个¢级的$科生中抽取一个容䟿fi 300 的样$进行调查ˊ已知该校一¢级銓=¢级銓й¢级銓四¢级的$科生人数之比fi 4:5:5:6,则ƒ从一¢级$ 科生中抽取 ࣐学生ˊ銟答案銠60ˊ4銟解析銠ƒ从一¢级抽取300⨯= 60 ࣐ˊ4 +5 + 5 + 615.某¾䱵会议在"Ӝp 开,fi 了搞好对外宣传fl 作,会ª组选聘了 16 ࣐男记者和 14 ࣐女记者担任对外翻译fl 作,调查发现,男銓女记者中分别$ 10 人和 6 人会俄语ˊC 13根据以k 数据完fi 以f 2×2 列联表:并回答能否在犯错的概率н超过 0.10 的前提f 认fi 性别fl 会俄语$ޣ?.2n (ad —bc )2参考¿式:K =(a +b )(c +d )(a +c )(b + 参考数据:,‰中 n =a +b +c +dd )C 23会俄语的 6 ࣐女记者中$ 4 人曾在俄罗斯fl 作过,若从会俄语的 6 ࣐女记者中随机抽取 2 人做¼声翻译,则抽出的 2 人都在俄罗斯fl 作过的概率是ˊ16. 某电子商ª¿¼对10000 ࣐网购物者工014 ¢度的⎸费情况进行统计,发现⎸费金额C单ƒ:万元3都在区间[0.3, 0.9] 内,‰频率分$直方‰如‰所示.C釙3直方‰中的a :C釚3在䘉些购物者中,⎸费金额在区间[0.5, 0.9] 内的购物者的人数fi .銟答案銠C釙3左:C釚36000.銟考点定ƒ銠$题考查频率分$直方‰,属基础题.銟࣐师点睛銠以实䱵问题fi背景,重点考查频率分$直方‰,灵活䘀用频率直方‰的规律解决实䱵问题, 能较好的考查学生基$知识的识记能力和灵活䘀用能力.。
艺考参考答案专题十五统计与统计案例
1.(2016·山东,3,易)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1401.D[考向2]由题意知,每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故每周的自习时间不少于22.5小时的人数为200×0.7=140.2.(2016·课标Ⅲ,4,易)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个2.D[考向2]由题图分析可知,平均最高气温高于20 ℃的只有七、八月份.故D不正确.3.(2016·北京,8,难)某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.6人,则( )A .2号学生进入30秒跳绳决赛B .5号学生进入30秒跳绳决赛C .8号学生进入30秒跳绳决赛D .9号学生进入30秒跳绳决赛3.B [考向2]由数据可知,进入立定跳远决赛的8人为1-8号,可以进入30秒跳绳决赛的6人需要从1-8号中产生,数据排序后可知第3,6,7号一定能进入跳绳决赛,此外还需要3人,需要从63,a ,63,60,a -1五个得分中取前3个,若得63分的人未进入决赛,则得60分的人就会进入决赛,与事实矛盾,所以5号学生能进入决赛,故选B.4.(2015·课标Ⅱ,3,易)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关4.D [考向2]由图知A ,B ,C 正确;而自2006年以来二氧化硫排放量与年份负相关,所以D 错误.5.(2014·重庆,3,易)某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( )A .100B .150C .200D .250 5.A [考向1]由分层抽样的特点可知703 500=n3 500+1 500,解得n =100.6.(2012·山东,4,易)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差6.D [考向3]由众数、平均数、中位数、标准差的定义知:A 样本中各数据都加2后,只有标准差不改变,故选D.7.(2015·山东,6,中)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③ D .②④7.B [考向3]由茎叶图可知,甲地的气温依次是26,28,29,31,31,乙地的气温依次是28,29,30,31,32,∴x -甲=26+28+29+31+315=29,s 甲=15[(29-26)2+(29-28)2+(29-29)2+(29-31)2+(29-31)2]3.6,x -乙=28+29+30+31+325=30,s 乙=15[(30-28)2+(30-29)2+(30-30)2+(30-31)2+(30-32)2]2.故x -甲<x -乙,s 甲>s 乙,①④正确.故选B.8.(2014·山东,8,中)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .188.C [考向2]第一组与第二组的频率和为0.24+0.16=0.40,频数为20,所以样本容量为200.40=50(人),所以第三组志愿者有50×0.36=18(人).因为第三组中没有疗效的有6人,所以有疗效的人数为18-6=12(人).9.(2013·四川,7,中)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )9.A[考向2]方法一:由题意知样本容量为20,组距为5. 列表如下:方法二:由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、频率组距也分别相等.比较四个选项知A正确,故选A.思路点拨:借助已知茎叶图得出各小组的频数,再由频率公式求出各小组的频率,进一步求出频率组距并得出答案. 10.(2015· 广东,12,易)已知样本数据x 1,x 2,…,x n 的均值x -=5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.10.[考向3]【解析】 因为样本数据x 1,x 2,…,x n 的均值x -=5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为1n (2x 1+1+2x 2+1+…+2x n +1)=1n [2(x 1+x 2+…+x n )+n ]=2×1n (x 1+x 2+…+x n )+1=2x -+1=11. 【答案】 1111.(2015·湖北,14,中)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.11.[考向2]【解析】 (1)由频率和为1可得0.02+0.08+0.15+0.2+0.25+0.1a =1,解得a =3.(2)消费金额在[0.5,0.9]内的频率为0.3+0.2+0.08+0.02=0.6,所以人数为10 000×0.6=6 000.【答案】 (1)3 (2)6 00012.(2016·课标Ⅰ,19,12分,中)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数. (1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件? 12.[考向2,3]解:(1)当x ≤19时,y =3 800; 当x >19时,y =3 800+500(x -19)=500x -5 700. 所以y 与x 的函数解析式为 y =⎩⎨⎧3 800,x ≤19,500x -5 700,x >19(x ∈N ). (2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100×(3 800×70+4 300×20+4 800×10)=4 000. 若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1100×(4 000×90+4 500×10)=4 050. 比较两个平均数可知,购买1台机器的同时应购买19个易损零件.13.(2015·安徽,17,12分,易)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为:[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布直方图中a 的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率. 13.[考向4]解:(1)由频率分布直方图可知:(0.004+a +0.018+0.022×2+0.028)×10=1,解得a =0.006.(2)由频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4, 所以该企业职工对该部门评分不低于80的概率的估计值为0.4.(3)受访职工中评分在[50,60)的有50×0.006×10=3(人),记为A 1,A 2,A 3; 受访职工中评分在[40,50)的有50×0.004×10=2(人),记为B 1,B 2.从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是{A 1,A 2},{A 1,A 3},{A 1,B 1},{A 1,B 2},{A 2,A 3},{A 2,B 1},{A 2,B 2},{A 3,B 1},{A 3,B 2},{B 1,B 2}.又因为所抽取2人的评分都在[40,50)的结果有1种,即{B 1,B 2}, 故所求的概率为P =110.14.(2014·湖南,17,12分,易)某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b -),(a ,b ),(a -,b ),(a -,b -),(a ,b ),(a ,b ),(a ,b -),(a -,b ),(a ,b -),(a -,b -),(a ,b ),(a ,b -),(a -,b ),(a ,b ),其中a ,a -分别表示甲组研发成功和失败;b ,b -分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. 14.[考向4]解:(1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数为x -甲=1015=23.方差为s 2甲=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-232×10+⎝ ⎛⎭⎪⎫0-232×5=29. 乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1, 其平均数为x -乙=915=35.方差为s 2乙=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-352×9+⎝ ⎛⎭⎪⎫0-352×6=625. 因为x -甲>x -乙,s 2甲<s 2乙,所以甲组的研发水平优于乙组. (2)记E ={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b -),(a -,b ),(a ,b -),(a -,b ),(a ,b -),(a ,b -),(a -,b ),共7个,故事件E 发生的频率为715.将频率视为概率,即所求概率为P (E )=715.,三种抽样方法是统计的基础,高考中主要考查在应用问题中构造抽样模型、识别模型及选择适当的抽样方法抽取样本三个方面,一般以选择题、填空题出现,题目多为中低档,分值为5分.在复习时,一定要把握三种抽样方法的适用条件及操作步骤.1(1)(2015·北京,4)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )A.90B.100C.180(2)(2014·广东,6)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.20 B.25 C.40 D.50(3)(2013·江西,5)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08 B【解析】(1)设该样本中的老年教师人数为x,由题意及分层抽样的特点得x900=3201 600,解得x=180.(2)∵从1 000名学生中抽取40个样本,∴样本数据分段间隔为k=1 00040=25.(3)从随机数表第1行的第5列和第6列数字开始,由左到右依次选取两个数字开始向右读,第一个数为65,不符合条件;第二个数为72,不符合条件;第三个数为08,符合条件,所以前5个个体的编号为08,02,14,07,01.故选D.【答案】(1)C(2)B(3)D解题(1)时,根据分层抽样的抽样比相等这一特征求解;解题(2)时,利用系统抽样的特点进行求解;解题(3)时,注意所抽编号不能重复,否则误选C.1.(2014·湖南,3)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1 C.p1=p3<p2D.p1=p2=p31.D在简单随机抽样、系统抽样和分层抽样中,每个个体被抽中的概率均为nN,所以p1=p2=p3,故选D.2.(2014·湖北,11)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.2.【解析】由已知可知抽样比为804 800=160,设甲设备生产的产品有x件,则有160=50x,所以x=3 000.所以乙设备生产的产品有4 800-3 000=1 800(件).【答案】 1 800抽样方法中的计算问题(1)系统抽样中的计算问题:系统抽样中被抽取的个体相邻的两个样本编号的间距相等,据此,若有n个总体,希望抽取m个个体,确定抽样间距时,若nm为整数,则抽样间距为nm;否则,一般先剔除几个个体,使得nm为整数,抽样间距一般为不大于nm的最大整数.(2)分层抽样中的计算问题:分层抽样满足“每层中抽取的个体数量本层的总个体数量=样本容量总体数量”,即“n1N1=n2N2=…=nN或n1∶n2∶…∶n=N1∶N2∶…∶N”,据此在已知每层间的个体数量或数量比、样本容量、总体数量中的两个时,就可以求出第三个.统计图表是统计部分的重要内容之一,是高考的热点,主要考查频率分布表、频率分布直方图及茎叶图的识别与应用,题型有小题,也有大题,难度为低中档.在复习时,一定要抓住频率分布表、频率分布直方图及茎叶图各自的特点及识别的方法,这是将图表信息转化为数据信息的关键.2(1)(2015·湖南,2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3 B.4 C.5 D.6(2)(2014·北京,18,13分)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:①从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;②求频率分布直方图中的a,b的值;③假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)【解析】(1)35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,由茎叶图知在区间[139,151]上共有20个数据,分在4个小组中,每组取1人,共取4人,故选B.(2)①根据频数分布表知,100名学生中课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其课外阅读时间少于12小时的概率为0.9.②课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以a=频率组距=0.172=0.085.课外阅读时间落在组[8,10)内的有25人,频率为0.25.所以b=频率组距=0.252=0.125.③样本中的100名学生课外阅读时间的平均数在第4组.解题(1)时,先将1~35个数据进行分组,再根据茎叶图确定在区间[139,151]上的数据,然后由系统抽样确定人数;解题(2)①时,先由频率分布表读取课外阅读时间不少于12小时的学生数,从而可得课外阅读时间少于12小时的学生数,再由公式求频率;解题②时,先由频率分布表确定相应两组的频率,再由矩形高等于相应的频率组距,计算a,b;解题③时,根据频率分布直方图作出估计.1.(2015·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123 C.137 D.1671.C初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,则该校女教师的人数为77+60=137.2.(2013·重庆,6)如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2 B.0.4 C.0.5 D.0.62.B由茎叶图知落在区间[22,30)内的数据有22,22,27,29,共4个,因为共有10个数据,所以数据落在区间[22,30)内的频率为410=0.4,故选B.从频率分布直方图中得出有关数据的方法(1)频率:频率分布直方图中横轴表示组别,纵轴表示频率组距,频率=组距×频率组距;(2)频率比:频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形髙的比也就是频率比,从而根据已知的几组数据个数比求有关值;(3)众数:最高小长方形底边中点的横坐标;(4)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(5)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和;(6)性质应用:若纵轴上存在参数值,则根据所有小长方形的高之和×组距=1,列方程即可求得参数值.茎叶图的绘制方法及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.样本的数字特征主要涉及平均数、方差(标准差)、众数、中位数,是高考考查统计知识的热点内容,主要考查这些数字特征的计算以及运用平均数、方差(标准差)解决一些实际问题,多以选择题或填空题形式考查,属于容易题,有时与统计图表交汇以解答题形式出现. 复习时,一定要说明各样本数字特征的含义,熟练掌握各自的计算公式和方法.3(2014·广东,17,13分)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.(1)20名工人年龄的数据表――――――→众数、极差定义众数、极差;(3)20名工人年龄的数据表―――――→平均数公式平均数x - ―――――――→s 2计算公式s 2.【解析】 (1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40-19=21.(2)这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数x -=120(19×1+28×3+29×3+30×5+31×4+32×3+40×1)=30,故方差s 2=120[1×(19-30)2+3×(28-30)2+3×(29-30)2+5×(30-30)2+4×(31-30)2+3×(32-30)2+1×(40-30)2]=120×(121+12+3+0+4+12+100)=12.6.解题(1)(3)的关键是理解众数、极差、方差的概念,掌握其计算方法并细心计算;解题(2)的关键是熟练掌握茎叶图的绘制方法.(2015·广东,17,12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 解:(1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得 x =0.007 5,∴直方图中x 的值为0.007 5. (2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a ,则(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,解得a =224,即中位数为224.(3)月平均用电量在[220,240)的用户有0.012 5×20×100=25(户),同理可求月平均用电量为[240,260),[260,280),[280,300)的用户分别有15户、10户、5户,故抽取比例为1125+15+10+5=15,∴从月平均用电量在[220,240)的用户中应抽取25×15=5(户).用样本的数字特征估计总体问题的类型及解法(1)直接给出样本数据:根据平均数、中位数、众数、方差、标准差的概念进行相关计算得出相应数据.(2)给出统计图表,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性反映方差(标准差)的大小.(3)实际应用:用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.当所得数据平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.从近几年高考命题看,将概率的计算与统计中的抽样方法、频率分布表、频率分布直方图、茎叶图、样本的数字特征等综合起来,以生活中热点为背景,已成为高考的热点问题,该类题目较全面地考查了学生用概率与统计知识解决实际问题的能力,考查学生的应用意识和分析问题的能力,以解答题为主,中等难度.4(2015·课标Ⅱ,18,12分)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.B 地区用户满意度评分的频数分布表(1)均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度分为三个等级:(1)B 地区用户满意度评分的频率分布表―――――――→频率分布直方图的画法B 地区用户满意度评分的频率分布直方图――――――――――→A 地区频率分布表两地区的平均值及分散程度.(2)A ,B 两地区满意度评分的频率分布直方图―――――――→用户满意度的三个等级表A ,B 两地区用户的满意度等级为不满意的概率――――――→根据大小结论【解析】 (1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.(1)作频率分布直方图的关键:由频率分布表准确计算出在各组中的频率.比较平均值及分散程度的关键:要认真观察图表的规律和特点,从中得到数据所具有的特点和规律.(2)利用频率分布直方图分别计算两地区用户不满意的概率估计值,然后进行比较.(2014·课标Ⅱ,19,12分)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表示市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.,解决统计与概率综合问题的方法解概率统计综合题时,首先要处理好数据,然后再根据题目的要求进行相关计算;试题中的统计只要按照相关的统计计算公式计算即可;试题中的概率部分,首先要确定类型,然后确定解决问题的方法.频率的稳定值即为概率,可用频率估计概率.在有些需要对实际问题作出解释的问题中,要根据计算结果的实际意义进行解释.1.(2016·山东青岛一模,3)某校共有高一、高二、高三学生共1 290人,其中高一480人,高二比高三多30人,为了解该校学生健康状态,现采用分层抽样方法进行调查,在抽取的样本中有高一学生96人,则该样本中的高三学生人数为()A.84 B.78 C.81 D.961.B[考向1]∵高一480人,高二比高三多30人,∴设高三x人,则x+x+30+480=1 290,解得x=390.故高二420人,高三390人.若在抽取的样本中有高一学生96人,则该样本中的高三学生人数为96480×390=78(人).2.(2016·四川成都联考,4)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号001、002、…、699、700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第5个样本编号是( )33 21 18 34 29 78 64 56 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42 84 42 12 53 31 34 57 86 07 36 25 30 07 32 85 23 45 78 89 07 23 68 96 08 04 32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45 A.607 B .328 C .253 D .0072.B [考向1]从第5行第6个数2开始向右读,第一个数为253,符合条件,第二个数为313,符合条件,第三个数为457,符合条件,以下依次为:860,736,253,007,328, 其中860,736不符合条件且253与第一个重复了不能取,这样007是第四个数,第五个数应为328.故第五个数为328.3.(2015·湖南岳阳一中质检,4)甲、乙两位歌手在“中国好声音”选拔赛中,5次得分情况如图所示.记甲、乙两人的平均得分分别为x -甲,x -乙,则下列判断正确的是( )A.x -甲<x -乙,甲比乙成绩稳定B.x -甲<x -乙,乙比甲成绩稳定C.x -甲>x -乙,甲比乙成绩稳定D.x -甲>x -乙,乙比甲成绩稳定3.B [考向3]x -甲=76+77+88+90+945=85,x -乙=75+88+86+88+935=86,s 2甲=15[(76-85)2+(77-85)2+(88-85)2+(90-85)2+(94-85)2]=52, s 2乙=15[(75-86)2+(88-86)2+(86-86)2+(88-86)2+(93-86)2]=27.6, 所以x -甲<x -乙,s 2甲>s 2乙,故乙比甲成绩稳定.。
高考数学(命题热点提分)专题18 统计与统计案例 理(2021年最新整理)
2017年高考数学(深化复习+命题热点提分)专题18 统计与统计案例理编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017年高考数学(深化复习+命题热点提分)专题18 统计与统计案例理)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017年高考数学(深化复习+命题热点提分)专题18 统计与统计案例理的全部内容。
专题18 统计与统计案例1.某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人.现采取分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()A.15,5,25 B.15,15,15C.10,5,30 D.15,10,20解析:先确定抽样比为错误!=错误!,则依次抽取的人数分别为错误!×300=15,错误!×200=10和错误!×400=20。
故选D。
答案:D2.某同学进入高三后,4次月考的数学成绩的茎叶图如图.则该同学数学成绩的方差是()A.125 B.55C.45 D.3错误!解析:由茎叶图知平均值为114+126+128+1324=125,∴s2=错误![(125-114)2+(125-126)2+(125-128)2+(125-132)2]=45.答案:C3.为了判定两个分类变量X和Y是否有关系,应用K2独立性检验法算得K2的观测值为5,又已知P(K2≥3。
841)=0.05,P(K2≥6。
635)=0.01,则下列说法正确的是()A.有95%的把握认为“X和Y有关系”B.有95%的把握认为“X和Y没有关系”C.有99%的把握认为“X和Y有关系”D.有99%的把握认为“X和Y没有关系”解析:依题意,K2=5,且P(K2≥3。
高考数学(第02期)小题精练系列 专题18 统计与统计案例 理(含解析)(2021年最新整理)
2017年高考数学(第02期)小题精练系列专题18 统计与统计案例理(含解析)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017年高考数学(第02期)小题精练系列专题18 统计与统计案例理(含解析))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017年高考数学(第02期)小题精练系列专题18 统计与统计案例理(含解析)的全部内容。
专题18 统计与统计案例1. 甲、乙两棉农,统计连续五年的面积产量(千克/亩)如下表:棉农甲6872706971棉农乙6971686869则平均产量较高与产量较稳定的分别是( )A.棉农甲,棉农甲B.棉农甲,棉农乙 C.棉农乙,棉农甲 D.棉农乙,棉农乙【答案】B【解析】考点:数据的平均数与方差的计算.2.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[)20,40,[)80,100,若低于60分的人数是15人,则该班的学生人数是()60,80,[)40,60[)A.45 B.50 C.55 D.60【答案】B【解析】试题分析:频率为0.15200.3⨯=,人数为150.350÷=人.考点:频率分布直方图.3. 如图是一名篮球运动员在最近5场比赛中所得分数的茎叶图,若该运动员在这5场比赛中的得分的中位数为12,则该运动员这5场比赛得分的平均数不可能为( ) A .685B .695C .14D .715【答案】D 【解析】考点:1、茎叶图的应用;2、中位数与平均值的性质。
4. 一个样本容量为8的样本数据,它们按一定顺序排列可以构成一个公差不为0的等差数列{}n a ,若35a =,且125,,a a a 成等比数列,则此样本数据的中位数是( )A .6B .7 C.8 D .9 【答案】C 【解析】试题分析:因为125,,a a a 成等比数列,所以5122a a a =,设公差为d 由因为35a =,所以)25)(25()5(2d d d +-=-,解得:02==d d 或(舍),945,72554=+==+=a a ,样本容量为8时,中位数为8254=+a a ,故选C.考点:等差等比数列;中位数.5. 某高校调查了400名大学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25)[25,27.5),[27.5,30].根据此直方图,这400名大学生中每周的自习时间不少于25小时的人数是__________。
高考数学考点专项突破 统计与统计案例(含解析)
学习资料统计与统计案例一、单选题1、(江苏金陵中学开学初调研)已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测的数据算得的线性回归方程可能是( )A .0.4.3ˆ2yx =+ B .2 2.4ˆyx =- C .9ˆ2.5yx =-+ D .0.3 4.4ˆyx =-+ 【答案】A 【解析】因为与正相关,排除选项C 、D,又因为线性回归方程恒过样本点的中心,故排除选项B;故选A .2、(山东青岛中学调研)已知两个变量x 和y 之间有线性相关关系,经调查得到如下样本数据,根据表格中的数据求得同归方程ˆˆˆybx a =+,则下列说法正确的是( ) A .0a >,0b > B .0a >,0b < C .0a <,0b > D .0a <,0b <【答案】B【解析】由已知数据,可知y 随着x 的增大而减小, 则变量x 和变量y 之间存在负相关的关系,0b ∴<, 当0x =时,则 3.50a y =>>,即:0a >,0b <. 故选:B.3、(2020届山东省济宁市高三3月月考)下列说法正确的是( )A .回归直线ˆˆˆy bx a =+至少经过其样本数据()()()122,,,,,i n n x y x y x y 中的一个点B .从独立性检验可知有99%的把握认为吃地沟油与患胃肠癌有关系时,我们就说如果某人吃地沟油,那么他有99%可能患胃肠癌C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .将一组数据的每一个数据都加上或减去同一个常数后,其方差也要加上或减去这个常数 【答案】C【解析】回归直线ˆˆˆy bx a =+可以不经过其样本数据()()()122,,,,,i n n x y x y x y 中的一个点,则A 错误;从独立性检验可知有99%的把握认为吃地沟油与患胃肠癌有关系时,我们就说如果某人吃地沟油,那么他有99%可能患胃肠癌,则B 错误;在残差图中,残差点分布的带状区域的宽度越窄,表示数据的残差越小,其模型拟合的精度越高,即C 正确; 将一组数据的每一个数据都加上或减去同一个常数后,其平均数也加上或减去同一个常数,则其方差不变,故D 错误, 故选:C4、(江西省抚州市临川区第一中学2017—2018学年高二下学期期末)临川一中舞蹈社为了研究男女学生对舞蹈的喜爱程度,随机调查学校110名学生是否喜欢跳舞,由列联表和公式()()()()()22n ad bc K a b c d a c b d -=++++计算出2K ,并由此作出结论:“有99%的可能性认为学生喜欢跳舞与性别有关”,则2K 可以为( )A 。
高考数学备考艺体生百日突围系列 专题18统计与统计案例(基础篇 )原卷版 Word版缺答案
《2016艺体生文化课-百日突围系列》专题18 统计与统计案例抽样方法【背一背基础知识】1. 简单随机抽样:一般地,从元素个数为N 的总体中逐个不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法:抽签法和随机数法.简单随机抽样适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小。
2.系统抽样:假设要从容量为N 的总体中抽取容量为n 的样本,第一步,先将总体的N 个个体编号;第二步,确定分隔间距k ,对编号进行分段,当Nn (n 是样本容量)是整数时,取k =N n ;当N n (n 是样本容量)不是整数时,先用简单随机抽样剔除N n -[N n ]个个体,取k =[Nn ];第三步,在第1段用简单随机抽样确定第一个个体编号l (l ≤k );第四步,按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号l k +,再加k 得到第3个个体编号2l k +,依次进行下去,直到获取整个样本.系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等。
3.分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.分层抽样的应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.【讲一讲提高技能】1必备技能:在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为Nn(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值.2典型例题:例1. 某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______.例2. 某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为()A.90 B.100 C.180 D.300【练一练提升能力】1.为了了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25 D.202.从3001名学生中选取50名组成参观团,现采用下面的方法选取:先用简单随机抽样从3001人中剔除1人,剩下的3000人再按系统抽样的方法进行,则每个人被选到的机会()A.不全相等 B。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题18 统计与统计案例抽样方法【背一背基础知识】1. 简单随机抽样:一般地,从元素个数为N 的总体中逐个不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法:抽签法和随机数法.简单随机抽样适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小。
2.系统抽样:假设要从容量为N 的总体中抽取容量为n 的样本,第一步,先将总体的N 个个体编号;第二步,确定分隔间距k ,对编号进行分段,当N n (n 是样本容量)是整数时,取k =N n ;当N n(n 是样本容量)不是整数时,先用简单随机抽样剔除N n -[N n ]个个体,取k =[N n];第三步,在第1段用简单随机抽样确定第一个个体编号l (l ≤k );第四步,按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号l k +,再加k 得到第3个个体编号2l k +,依次进行下去,直到获取整个样本.系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等。
3.分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.分层抽样的应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样. 【讲一讲提高技能】1必备技能:在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为Nn(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值. 2典型例题:例1. 已知某地区中小学生人数和近视情况分别如图1和如图2所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )图1初中生4500名高中生2000名小学生3500名图2A.200,20B.100,20C.200,10D.100,10 【分析】本题考查分层抽样与统计图,直接应用概念解题. 【答案】A例2. 某校高一、高二、高三分别有学生1600名、1200名、800名,为了解该校高中学生的牙齿健康状况,按各年级的学生数进行分层抽样,若高三抽取20名学生,则高一、高二共抽取的学生数为 . 【分析】分层抽样即按比例分配. 【答案】70【练一练提升能力】1.为了了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A .50 B .40 C .25 D .20 【答案】C【解析】由题意知,分段间隔为10002540,故选C . 2.从3001名学生中选取50名组成参观团,现采用下面的方法选取:先用简单随机抽样从 3001人中剔除1人,剩下的3000人再按系统抽样的方法进行,则每个人被选到的机会( ) A .不全相等 B 。
均不相等 C 。
无法确定 D 。
都相等3. 甲、乙两套设备生产的同类产品共4800件,采用分层抽样的方法从中抽取一个容量为80 的样本进行检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 【答案】1800频率分布直方图与茎叶图【背一背基础知识】1. ①频率分布直方图:在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各长长方形的面积表示,各小长方形的面积总和等于1.连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体的分布规律.2.频率分布直方图的步骤如下:(ⅰ)求极差;(ⅱ)确定组距和组数;(ⅲ)将数据分组;(ⅳ)列频率分布表;(ⅴ)画频率分布直方图.频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状. 3.茎叶图:茎是指中间的一列数,叶是从茎的旁边生长出来的数. 茎叶图表示数据有两个突出的优点:其一是统计图上没有原始数据的损失,所有信息都可以从这个茎叶图中得到,其二是在比赛时随时记录,方便记录与表示.4.当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留原始信息,而且可以随时记录,给记录和表示都带来方便. 【讲一讲提高技能】 1必备技能:(1)在频率分布直方图中估计中位数和平均数的方法①中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.②平均数:在频率分布直方图中,平均数等于图中每个小矩形面积乘以小矩形底边中点的横坐标之和.(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.2典型例题:例1。
某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[)[)[)[)20,40,40,60,60,80,820,100.若低于60分的人数是15人,则该班的学生人数是(A)45(B)50(C)55(D)60【分析】首先根据频率分布直方图计算出从20到60的频率,即能计算出总从数.例2.某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.(1)根据茎叶图计算样本平均值为;(2)日加工零件个数大于样本均值的工人为优秀工人,该车间有名优秀工人;(3) 从该车间12名工人中,任取2人,则恰有1名优秀工人的概率是.【练一练提升能力】1.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为理一组,理二组,⋅⋅⋅⋅⋅⋅,理五组,右图是根据试验数据制成的频率分布直方图,已知理一组与理二组共有20人,理三组中没有疗效的有6人,则理三组中有疗效的人数为()A.6B.8C.12D.18【答案】C2.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()【答案】A变量间的相关关系与独立性检验【背一背基础知识】 1.两个变量间的相关关系:①有关概念:相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.如果一个变量的值由小变大时另一个变量的值由小变大,这种相关称为正相关;如果一个变量的值由小变大时另一个变量的值由大变小,这种相关称为负相关;如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系.②回归方程: y bx a =+是两个具有线性相关关系的变量的一组数据1122()()()n n x y x y x y ,,,,,,的回归方程,其中a b 、是待定参数. a b 、的计算公式1122211()()()()n ni i i i i i n ni ii i x x y y x y nx y b x x x n x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑.2.独立性检验:2×2列联表构造一个随机变量()21122122121212n n n n n n n n n χ++++-=,利用随机变量χ2来判断“两个分类变量有关系”的方法称为独立性检验:若23.841χ>,则有95%把握认为A 与B 有关;若26.635χ>,则有99%把握认为A 与B 有关; 其中23.841χ=是判断是否有关系的临界值,23.841χ≤应判断为没有充分证据显示A 与B 有关,而不能作为小于95%的量化值来判断.【讲一讲基本技能】 1.必备技能:①求回归直线,使“离差平方和为最小”的方法叫做最小二乘法,用最小二乘法求得回归方程y bx a =+是两个具有线性相关关系的变量的一组数据1122()()()n n x y x y x y ,,,,,,的回归方程,其中a b 、是待定参数.从a b 、与r 的计算公式1122211()()()()nni i i i i i n ni i i i x x y y x y nx y b x x x n x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑与 ()()nniii ix x y y x y nxyr ---==∑∑可以看出:(ⅰ)回归直线必过点(),x y ;(ⅱ)b 与r 符号相同。
②回归【分析】是对具有相关关系的两个变量进行统计分析的一种常用方法,主要判断特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式。
比如线性回归分析就是分析求出的回归直线是否有意义,而判断的依据就是|r |的大小:|r |≤1,并且|r |越接近1,线性相关程度越强;|r |越接近0,线性相关程度越弱。
从散点图来看,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。
线性相关检验的步骤如下:(ⅰ)作统计假设:x 与Y 不具有线性相关关系;(ⅱ)根据小概率0.05与n -2在附表中查出r 的一个临界值0.05r ; (ⅲ)根据样本相关系数计算公式求出r 的值;(ⅳ)作统计推断,如果|r |>0.05r ,表明有95%的把握认为x 与Y 之间具有线性相关关系; 如果|r |≤0.05r ,我们没有理由拒绝原来的假设。
这时寻找回归直线方程是毫无意义的。
③注意:线性回归分析以散点图为基础,具有很强的直观性,有散点图作比较时,拟合效果的好坏可由直观性直接判断,没有散点图时,只须套用公式求r ,再作判断即可.独立性检验没有直观性,必须依靠2χ作判断.2.典型例题例1. 根据如下样本数据:得到的回归方程为a bx y+=ˆ,则( ) A .0a > ,0<b B .0a > ,0>b C .0a < ,0<b D .0a < ,0>b 分析:根据已知样本数判断线性回归方程中的b 与a 的符号. 【答案】A例2.已知x y 与之间的几组数据如下表:1 假设根据上表数据所得线性回归直线方程为,y bx a =+若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为,y b x a '''=+则以下结论正确的是( )A .,b b a a ''>>B .,b b a a ''><C .,b b a a ''<>D .,b b a a ''<<【解析】散点图如右,显然后四个点都不在直线y b x a ''=+的左上方,所以回归直线斜率应该更小,纵截距更大,故选C. 【练一练提升能力】1. 已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测的数据算得的线性回归方程可能是( ).0.4 2.3A y x =+ .2 2.4B y x =- .29.5C y x =-+ .0.3 4.4C y x =-+【答案】A2.“十一”期间,邢台市通过随机询问100名性别不同的居民是否能做到‘光盘’行动,得到如下的列联表,参照附表,得到的正确的结论是 ( )22()()()()()n ad bc k a b c d a c b d -=++++A .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”(一) 选择题(12*5=60分)1.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为123,,p p p ,则( )123.A p p p =< 231.B p p p =< 132.C p p p =< 123.D p p p ==【答案】D2.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是( ) A .总体 B .个体C .样本的容量D .从总体中抽取的一个样本 【答案】A3.某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( ).100A .150B .200C .250D【答案】A【解析】()70350015*********n =+⨯=.故选A . 4.设样本数据1210,,,x x x 的均值和方差分别为1和4,若i i y x a =+(a 为非零常数, 1,2,,10i =),则12,10,y y y 的均值和方差分别为( )(A )1+,4a (B )1,4a a ++ (C )1,4 (D )1,4+a【答案】A 【解析】试题分析:由题得:121010110x x x +++=⨯=;2221210(1)(1)(1)10440x x x -+-++-=⨯=5.【2013年普通高等学校招生全国统一考试(湖南卷)理】某学校有男、女学生各500名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法6.某公司10位员工的月工资(单位:元)为1x ,2x ,…,10x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为 (A )x ,22s 100+ (B )100x +,22s 100+ (C )x ,2s (D )100x +,2s 【答案】D7.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为(A )-1 (B )0 (C )12 (D )1【答案】D【解析】根据样子相关系数的定义可知,当所有样本点都在直线上时,相关系数为1,选D.8.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,……,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷C 的人数为 ( ) A.7 B.9 C.10 D.159. 【陕西工大附中第一次适应性训练】下图是两组各7名同学体重(单位:kg )数据的茎叶图.设1,2两组数据的平均数依次为1x 和2x ,标准差依次为1s 和2s ,那么( )(注:标准差s =x 为12,,,n x x x 的平均数)A .12x x >,12s s >B .12x x >,12s s < C .12x x <,12s s < D .12x x <,12s s >10.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查。