统计与统计案例真题与解析
统计案例练习题(附答案)
统计案例练习题(附答案)一、选择题 1.对具有线性相关关系的两个变量建立的线性回归方程y=a+bx中,回归系数b( ) A.可以小于0 B.只能大于0 C.可能等于0 D.只能小于0 【解析】b可能大于0,也可能小于0,但当b=0时,x,y不具有线性相关关系.【答案】 A 2.下列两个变量间的关系不是函数关系的是( ) A.正方体的棱长与体积 B.角的弧度数与它的正弦值 C.单产为常数时,土地面积与粮食总产量 D.日照时间与水稻亩产量【解析】∵A、B、C都可以得出一个函数关系式,而D不能写出确定的函数关系式,它只是一个不确定关系.【答案】 D 3.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元) 4 2 3 5 销售额y(万元) 49 26 39 54 根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为( ) A.63.36万元 B.65.5万元C.67.7万元 D.72.0万元【解析】x=4+2+3+54=3.5, y=49+26+39+544=42,∴a=y-bx=42-9.4×3.5=9.1,∴回归方程为y=9.4x+9.1,∴当x=6时,y=9.4×6+9.1=65.5,故选B. 【答案】 B 4.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程y=bx+a,那么下列说法中不正确的是( ) A.直线y=bx+a必经过点(x,y) B.直线y=bx+a至少经过点(x1,y1)(x2,y2),…,(xn,bn)中的一个点 C.直线y=bx+a的斜率为∑ni=1xiyi-nx•y∑ni=1x2i-nx2 D.直线y=bx+a的纵截距为y-bx 【解析】回归直线可以不经过任何一个点.其中A:由a=y-bx代入回归直线方程y=bx+y-ax,即y=b(x-x)+y过点(x,y).∴B错误.【答案】 B 5.已知两个变量x和y 之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y 的观测数据的平均数都是t,则下列说法正确的是( ) A.l1与l2一定有公共点(s,t) B.l1与l2相交,但交点一定不是(s,t) C.l1与l2必定平行 D.l1与l2必定重合【解析】由于回归直线y=bx+a恒过(x,y)点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t).【答案】 A 二、填空题 6.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y=0.849x-85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为________.【解析】将x=172代入线性回归方程y=0.849x-85.712,有y=0.849×172-85.712=60.316(kg).【答案】60.316 kg 7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本的资料进行线性回归分析,结果如下:x=72,y=71,∑6i=1x2i=79,∑6i=1xiyi=1 481. b=1 481-6×72×7179--1.818 2, a=71-(-1.8182)×72≈77.36,则销量每增加1 000箱,单位成本下降________元.【解析】由上表可得,y=-1.818 2x+77.36,销量每增加1千箱,则单位成本下降1.818 2元.【答案】 1.818 2 8.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254. 【答案】0.254 三、解答题 9.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 工作年限x/年 3 5 6 7 9 推销金额y/万元 2 3 3 4 5 (1)求年推销金额y关于工作年限x的线性回归方程; (2)若第6名推销员的工作年限为11年,试估计他的年推销金额.【解】(1)设所求的线性回归方程为y=bx+a,则b=i=--=-=1020=0.5, a=y-bx=0.4. 所以年推销金额y关于工作年限x的线性回归方程为y=0.5x+0.4. (2)当x=11时,y=0.5x+0.4=0.5×11+0.4 =5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元. 10.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数.现观测得到(x,y)的4组值为(8,5),(12,8),(14,9),(16,11). (1)假设y与x之间存在线性相关关系,求y与x之间的线性回归方程. (2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1) 【解】(1)设回归方程为y=a+bx,则x=8+12+14+164=12.5, y=5+8+9+114=8.25,∑4i=1x2i=660,∑4i =1xiyi=438, b=∑4i=1xiyi-4xy∑4i=1x2i-4x2=438-4×12.5×8.25660-4×12.52≈0.73, a=y-bx=8.25-0.73×12.5=-0.875,所以所求回归方程为y=-0.875+0.73x. (2)由y≤10,即-0.875+0.73x≤10,得x≤10.8750.73≈15,即机器速度不得超过15转/秒. 11.高二(3)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)之间有如下数据:x 24 15 23 19 16 11 20 16 17 13 y 92 79 97 89 64 47 83 68 71 59 若某同学每周用于数学学习的时间为18小时,试预测该同学的数学成绩.【解】显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.i 1 2 3 4 5 6 7 8 9 10 xi 24 15 23 19 16 11 20 16 17 13 yi 9279 97 89 64 47 83 68 71 59 xiyi 2 208 1 185 2 231 1 691 1 024 517 1 660 1 088 1 207 767 ∑10i=1x2i=3 182,∑10i=1xiyi=13 578于是可得b=∑10i=1xiyi-10xy∑10i=1x2i-10x2=545.4154.4≈3.53, a=y-bx=74.9-3.53×17.4≈13.5. 因此可求得回归直线方程为y=3.53x+13.5. 当x=18时,y=3.53×18+13.5≈77. 故该同学预计可得77分左右.。
2016届高考数学理命题猜想专题18统计与统计案例(解析版)
【命题热点突破一】抽样方法某工厂生产的甲、乙、丙、丁四种不同型号的产品分别有150件、120件、180件、150件.为了调查产品的情况,需从这600件产品中抽取一个容量为100的样本,若采用分层抽样法,设甲产品中应抽取的产品件数为x ,某件产品A 被抽到的概率为y ,则x ,y 的值分别为( )A .25,14B .20,16 C .25,1600 D .25,16 【【答案】】D【特别提醒】 三种抽样方法均是等概率抽样,当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.【变式探究】从编号分别为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为10的样本,若编号为58的产品在样本中,则该样本中产品的最大编号为________.【【答案】】74【【解析】】每8件产品抽取一件,编号为58的产品在样本中,则样本中产品的最大编号为58+16=74.【命题热点突破二】用样本估计总体(1)将某市8所中学参加中学生合唱比赛的得分用茎叶图表示(如图18-3所示),其中茎为十位数,叶为个位数,则这组数据的中位数和平均数分别是( )图18-3A .91,91.5B .91,92C .91.5,91.5D .91.5,92(2)2014年6月,一篇关于“键盘侠”(“键盘侠”一词描述了部分网民在现实生活中胆小怕事自私自利,却习惯在网络上大放厥词的一种现象)的时评引发了大家对“键盘侠”的热议.某地区新闻栏目对该地区群众对“键盘侠”的认可度做出调查:在随机抽取的50人中,有14人持认可态度,其余持反对态度.若该地区有9600人,则估计该地区对“键盘侠”持反对态度的有________人.【【答案】】(1)C(2)6912【特别提醒】统计的基本思想之一就是以样本估计总体.以样本的频率估计总体的概率、以样本的特征数估计总体的特征数.【变式探究】(1)某学校随机抽查了本校20个同学,调查他们平均每天在课外进行体育锻炼的时间(分钟),根据所得数据的茎叶图,以5为组距将数据分为八组,分别是[0,5),[5,10),…,[35,40],作出的频率分布直方图如图18-4所示,则原始的茎叶图可能是()图18-5(2)高三年级上学期期末考试中,某班级数学成绩的频率分布直方图如图18-6所示,数据分组依次如下:[70,90),[90,110),[110,130),[130,150].估计该班数学成绩的平均分数为()图18-6A.112B.114C.116D.120【【答案】】(1)B(2)B【命题热点突破三】统计案例例3、某高校共有15 000人,其中男生10 500人,女生4500人,为调查该校学生每周平均参加体育运动时间情况,采用分层抽样的方法,收集了300名学生每周平均参加体育运动时间的样本数据(单位:小时).(1)应收集多少名女生的样本数据?(2)根据这300个样本数据,得到学生每周平均参加体育运动时间的频率分布直方图(如图18-7所示),其中样本数据分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均参加体育运动时间超过4个小时的概率.(3)在样本数据中,有60名女生每周平均参加体育运动的时间超过4个小时,请画出每周平均参加体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)结合列联表可得K 2的观测值k =300×(165×30-45×60)75×225×210×90=10021≈4.762>3.841. 所以有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.【特别提醒】 在计算K 2时要注意公式中各个字母的含义,分子上是总量乘2×2列联表中对角线数字乘积之差的平方,分母上是四个分和量的乘积.【变式探究】为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:小时)与当天投篮命中率y 之间的关系.(1)求小李这5天的平均投篮命中率;(2)用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率. 解:(1)小李这5天的平均投篮命中率y -= 0.4+0.5+0.6+0.6+0.45=0.5.(2)易知x -=1+2+3+4+55=3, 设线性回归方程为y ^=b ^x +a ^,则由公式可得b ^==(-2)×(-0.1)+(-1)×0+0×0.1+1×0.1+2×(-0.1)(-2)2+(-1)2+02+12+22=0.01,所以a ^=y --b ^x -=0.5-0.01×3=0.47, 所以y ^=b ^x +a ^=0.01x +0.47.当x =6时,y ^=0.53,故小李该月6号打6小时篮球的投篮命中率约为0.53.【特别提醒】 回归直线一定过样本点的中心(x ,y),当已知回归直线方程两个系数中的一个时,可以直接代入样本点中心的坐标求得另一个系数.正相关和负相关是根据回归直线方程的斜率判断的:正相关时回归直线方程的斜率为正值;负相关时回归直线方程的斜率为负值.回归直线方程斜率的符号与相关系数的符号是一致的.【高考真题解读】1.(2015·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A .167B .137C .123D .93【答案】 B2.(2015·安徽,6)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32 【答案】 C【解析】 法一 由题意知,x 1+x 2+…+x 10=10x ,s 1则y =1n [(2x 1-1)+(2x 2-1)+…+(2x 10-1)] =1n[2(x 1+x 2+…+x 10)-n]=2x -1,所以S 2==2s 1,故选C.3.(2015·重庆,3)重庆市2013年各月的平均气温(℃)数据的茎叶图如下: 则这组数据的中位数是( )01228 9 2 5 80 0 03 3 8 1 2A .19B .20C .21.5D .23【答案】 B4.(2015·新课标全国Ⅱ,31)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 【答案】 D【解析】从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确;2007年二氧化硫排放量较2006年降低了很多,B选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,即C选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误,故选D.5.(2015·福建,4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y∧=b∧x+a∧,其中b∧=0.76,a∧=y-b∧x.据此估计,该社区一户年收入为15万元家庭的年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元【答案】B6.(2014·山东,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A .6B .8C .12D .18 【答案】 C【解析】 由题图可知,第一组和第二组的频率之和为(0.24+0.16)×1=0.40,故该试验共选取的志愿者有200.40=50人.所以第三组共有50×0.36=18人,其中有疗效的人数为18-6=12.7.(2014·陕西,9)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a(a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( )A .1+a ,4B .1+a ,4+aC .1,4D .1,4+a【答案】 A8.(2014·湖南,2)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3【答案】 D【解析】 因为采取简单随机抽样、系统抽样和分层抽取样本时,总体中每个个体被抽中的概率相等,故选D.9.(2014·广东,6)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A .200,20B .100,20C .200,10D .100,10【答案】A10.(2014·天津,9)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.【答案】 60【解析】 420×300=60(名).11.(2015·江苏,2)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 【答案】 6【解析】 这组数据的平均数为16(4+6+5+8+7+6)=6.12.(2015·湖南,12)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:1314150 0 3 4 5 6 6 8 8 91 1 12 2 23 34 45 5 56 678 0 1 2 2 3 3 3若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.【答案】 41 3.(2015·新课标全国Ⅱ,18)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
高三一轮复习专题训练:统计、统计案例(最新题,14页)
2 分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,求解此类问
------ 珍贵文档 ! 值得收藏! ------
------ 精品文档 ! 值得拥有! ------
题需先求出抽样比 —— 样本容量与总体容量的比, 则各层所抽取的样本容量等于该层个体总 数与抽样比的乘积 .
三、预测押题不能少
解析: 由题意知, 0.15(x+ 1)+ 0.2- 0.15 x- 0.2= 0.15. 答案: 0.15
统计与概率的交汇
统计与统计案例的主要内容是随机抽样、 样本估计总体、 变量的相关性、 回归分析和独 立性检验, 该部分内容在高考中占有一定的位置, 近两年高考中由单纯考查统计及统计案例 转化为与概率交汇命题且背景贴近生活,角度新颖,试题多为解答题,难度中档.
D. b^<b′, a^<a′
[解析 ] 由 (1,0), (2,2) 求 b′ , a′,则
2- 0 b′ = = 2,a′ = 0-2× 1=- 2.
2- 1 由上表数据求 b^, a^,
6
xiyi= 0+ 4+ 3+12+ 15+24= 58,
i=1
13 x = 3.5, y = 6 ,
6
x2i = 1+Βιβλιοθήκη 4+ 9+ 16+ 25+ 36= 91,
3n 60= 260,解得 n=13.
(2)将某班的 60 名学生编号为: 01,02,…, 60,采用系统抽样方法抽取一个容量为 5 的 样本,且随机抽得的一个号码为 04,则剩下的四个号码依次是 ________.
解析: 依据系统抽样方法的定义知,将这 60 名学生依次按编号每 12 人作为一组,即
1. (1) 某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为
8-1统计与统计案例
专题8 第1讲统计与统计案例一、选择题1.(2011·湛江测试)某学校进行问卷调查,将全校4200名同学分为100组,每组42人按1~42随机编号,每组的第34号同学参与调查,这种抽样方法是() A.简单随机抽样B.分层抽样C.系统抽样D.分组抽样[答案] C[解析]一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.2.(文)(2011·重庆文,4)从一堆苹果中任取10只,称得它们的质量如下(单位:克):12512012210513011411695120134则样本数据落在[114.5,124.5)内的频率为()A.0.2 B.0.3C.0.4 D.0.5[答案] C[解析]在[114.5,124.5]范围内的频数m=4,样本容量n=10,∴所求频率410=0.4. (理)(2011·四川理,1)有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5)2[15.5,19.5) 4[19.5,23.5)9[23.5,27.5)18[27.5,31.5)11[31.5,35.5)12[35.5,39.5)7[39.5,43.5) 3根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是()A.16B.13C.12D.23[答案] B[解析]因为[31.5,35.5)12[35.5,39.5)7[39.5,43.5)3故[31.5,43.5)的概率为12+7+366=13,故选B.3.(2011·山东理,7)某产品的广告费用x与销售额y的统计数据如下表根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额大约为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元[答案] B[解析] 依题意:x =3.5,y =42, 又b ^=9.4,∴42=9.4×3.5+a ^. 而a ^=9.1,∴y ^=9.4x +9.1, 当x =6时,y ^=65.5,故选B.4.(2011·大连模拟)某养兔场引进了一批新品种,严格按照科学配方进行喂养,四个月后管理员称其体重(单位:kg),将有关数据进行整理后分为五组,并绘制频率分布直方图(如图所示).根据标准,体重超过6kg 属于超重,低于5kg 的不够分量.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25,0.20,0.10,0.05,第二小组的频数为400,则该批兔子的总数和体重正常的频率分别为( )A .1000,0.50B .800,0.50C .800,0.60D .1000,0.60[答案] D[解析] 第二组的频率为1-0.25-0.20-0.10-0.05=0.40,所以兔子总数为4000.40=1000只,体重正常的频率为0.40+0.20=0.60.故选D.5.(文)(2011·江西文,7)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x[答案] D[解析] 由图可以不难发现众数为5.中位数为5+62=5.5,平均值x =2×3+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930(理)(2011·江西理,6)变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( )A .r 2<r 1<0 B. 0<r 2<r 1 C. r 2<0<r 1 D .r 2=r 1[答案] C[解析] 对于第一组数据x -=10+11.3+11.8+12.5+135=11.75,y -=1+2+3+4+55=3.∑i =15(x i -x -)(y i -y -)=(x 1-x -)(y 1-y -)+(x 2-x -)(y 2-y -)…(x 5-x -)(y 5-y -)=1.75×(-2)+(-0.45)×(-1)+0.05×0+0.75×1+1.25×2=0.2. ∑i =15(x i -x -)2=(x 1-x -)2+(x 2-x -)2+…+(x 5-x -)2=1.752+(-0.45)2+0.052+0.752+1.252=5.3925.∑i =15(y i -y -)2=(y 1-y -)2+(y 2-y -)2+…+(y 5-y -)2=(-2)2+(-1)2+02+12+22=10, 代入公式中有r 1=0.25.3925×10=0.27.09≈0.0282.同理r 2中∑i =15(x i -x -)(y i -y -)=-4.36<0,故r 2<0,∴r 2<0<r 1,故选C.6.(2011·湖南理,4)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” [答案] C[解析] ∵6.635<K 2=7.8<10.828,∴我们有99%的把握认为二者有关,或者说在犯错的概率不超过1%的前提下二者有关. 7.(2011·合肥二检)甲、乙两名学生的六次数学测验成绩(百分制)的茎叶图如图所示.①甲同学成绩的中位数大于乙同学成绩的中位数; ②甲同学的平均分比乙同学的平均分高; ③甲同学的平均分比乙同学的平均分低;④甲同学成绩的方差小于乙同学成绩的方差. 上面说法正确的是( ) A .③④ B .①②④ C .②④ D .①③④[答案] A[解析] 由茎叶图知甲同学的成绩为72,76,80,82,86,90;乙同学的成绩为69,78,87,88,92,96.故甲同学成绩的中位数小于乙同学成绩的中位数,①错;计算得甲同学的平均分为81,乙同学的平均分为85,故甲同学的平均分比乙同学的平均分低,因此②错、③对;计算得甲同学成绩的方差小于乙同学成绩的方差,故④对.所以说法正确的是③④,选A.8.(2011·东北四市联考)在2011年5月1日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:y ^=-3.2x +a (参考公式:回归方程y ^=bx +a ,a =y --b x -),则a =( )A .-24B .35.6C .40.5D .40[答案] D[解析] 价格的平均数是x -=9+9.5+10+10.5+115=10,销售量的平均数是y -=11+10+8+6+55=8,由y ^=-3.2x +a 知b =-3.2,所以a =y --b x -=8+3.2×10=40,故选D.二、填空题9.(2011·湖北文,11)某市有大型超市200家、中型超市400家、小型超市1400家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为100的样本,应抽取中型超市________家.[答案] 20[解析] 属简单题,关键是清楚每一层的抽取比例都一样是n N.由于所有超市共计200+400+1400=2000家,需抽取100家,则抽取比例为1002000所以中型超市抽取400×1002000=20家.10.(文)(2011·广东文,13)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这56号打6小时篮球的投篮命中率为________.[答案] 0.5 0.53[解析] 小李这5天的平均投篮命中率y =0.4+0.5+0.6+0.6+0.45=0.5,可求得小李这5天的平均打篮球时间x =3.根据表中数据可求得b ^=0.01,a ^=0.47,故回归直线方程为y ^=0.47+0.01x ,将x =6代入得6号打6小时篮球的投篮命中率约为0.53.(理)(2011·广东理,13)某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm 、170cm 和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.[答案] 185[解析] 设儿子身高y 与父亲身高x 有关系,列表如下:∵x =13(173+170+176)=173,y =13+176+182)=176,∑i =13x i y i =173×170+170×176+176×182=91362,∑i =13x 2i =1732+1702+1762=89805, ∴b ^=91362-3×173×17689805-3×1732=1,a ^=y -b ^x =176-173=3 ∴回归直线方程为y ^=x +3, ∴x =182时,y ^=182+3=185(cm).11.(文)(2011·西城抽样)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有________名.[答案] 40[解析] 由题知,成绩大于等于80分且小于90分的学生所占的频率为1-(0.005×2+0.025+0.045)×10=0.2,所以这200名同学中成绩大于等于80分且小于90分的学生有200×0.2=40名.(理)(2011·福州二检)若样本a 1,a 2,a 3,a 4,a 5的方差是3,则样本2a 1+3,2a 2+3,2a 3+3,2a 4+3,2a 5+3的方差是________.[答案] 12[解析] 若a -表示样本a 1,a 2,a 3,a 4,a 5的均值,则样本2a 1+3,2a 2+3,2a 3+3,2a 4+3,2a 5+3的均值为2a -+3.又15∑i =15 (a i -a -)2=3,∴15∑i =15[(2a i +3)-(2a -+3)]2=15∑i =15 (2a i -2a -)2=12. 12.把容量为1000的某个样本数据分为10组,并填写频率分布表.若前3组的频率依次构成公差为0.05的等差数列,且后7组的频率之和是0.79.则前3组中频率最小的一组的频数是________.[答案] 20[解析] 设前3组中频率最小的一组的频率是x .由题意得前3组的频率之和是1-0.79=0.21,则x +(x +0.05)+(x +0.05×2)=0.21,由此解得x =0.02,即前3组中频率最小的一组的频率是0.02,相应的频数是0.02×1000=20.三、解答题13.(2010·广东文,17)某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:(1)(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率.[解析](1)由于大于40岁的42人中有27人收看新闻节目,而20至40岁的58人中,只有18人收看新闻节目,故收看新闻节目的观众与年龄有关.(2)27×545=3,∴大于40岁的观众应抽取3名.(3)由题意知,设抽取的5名观众中,年龄在20岁至40岁的为a1,a2,大于40岁的为b1,b2,b3,从中随机取2名,基本事件有:(a1,a2),(a1,b1),(a1,b2),(a1,b3),(a2,b1),(a2,b2),(a2,b3),(b1,b2),(b1,b3),(b2,b3)共十个,设恰有一名观众年龄在20至40岁为事件A,则A中含有基本事件6个:(a1,b1),(a1,b2),(a1,b3),(a2,b1),(a2,b2),(a2,b3),∴P(A)=610=3 5.14.(文)(2011·郑州二次质检)某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:(1)试分析估计两个班级的优秀率;(2)由以上统计数据填写下面2×2列联表,并问是否有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.参考公式及数据:K2=(a+b)(c+d)(a+c)(b+d),[解析] 甲班优秀人数为30人,优秀率为3050=60%,乙班优秀人数为25人,优秀率为2550=50%,所以甲、乙两班的优秀率分别为60%和50%. (2)因为K 2=100×(50×50×55×45=99≈1.010,所以由参考数据知,没有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.(理)(2011·广东广州)某校高三(1)班的一次数学测试成绩的茎叶图如图所示和频率分布直方图如图所示,都受到不同程度的破坏,但可见部分如下,据此回答如下问题:(1)求全班人数;(2)求分数在[80,90)之间的人数;并计算频率分布直方图中[80,90)间的矩形的高; (3)若要从分数在[80,100]之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[90,100]之间的概率.[解析] (1)由茎叶图知,分数在[50,60)之间的频数为2,由频率分布直方图知,分数在[50,60)之间的频率为0.008×10=0.08,所以,全班人数为20.08=25(人).(2)分数在[80,90)之间的人数为25-2-7-10-2=4人,分数在[80,90)之间的频率为425=0.16,所以频率分布直方图中[80,90)间的矩形的高为0.1610=0.016.(3)将[80,90)之间的4个分数编号为1,2,3,4;[90,100]之间的2个分数编号为5,6. 则在[80,100)之间的试卷中任取两份的基本事件为:(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共15个,其中至少有一个在[90,100]之间的基本事件有(1,5),(1,6),(2,5),(2,6),(3,5),(3,6),(4,5),(4,6),(5,6)共9个,故至少有一份分数在[90,100]之间的概率是915=35.15.(2011·安徽文,20)某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y =b x +a ; (2)利用(1)中所求的直线方程预测该地2012年的粮食需求量.[解析] 由所给数据分析,年需求量与年份之间近似直线上升,可对数据进行预处理如下表对预处理后的数据,容易算出x =0,y =3.2∑i =15x i y i =-4×(-21)+(-2)×(-11)+2×19+4×29=260∑i =15x 2i =16+4+0+4+16=40∴b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=26040=6.5,∴a ^=y -b ^x =3.2 ∴所求回归直线方程y -257=6.5(x -2006)+3.2即y =6.5(x -2006)+260.2(2)当x =2012时,y =6.5(2012-2006)+260.2=299.2万吨=300万吨 故预测2012年粮食需求量约为300万吨.。
高考数学二轮复习专题突破—统计与统计案例(含解析)
高考数学二轮复习专题突破—统计与统计案例1.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 附:√74≈8.602.2.(2021·江西赣州二模改编)遵守交通规则,人人有责.“礼让行人”是我国《道路交通安全法》的明文规定,也是全国文明城市测评中的重要内容.《道路交通安全法》第47条明确规定:“机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.否则扣3分罚200元”.下表是2021年1至4月份我市某主干路口监控设备抓拍到的驾驶员不“礼让行人”行为统计数据:(1)请利用所给数据求不“礼让行人”驾驶员人数y 与月份x 之间的经验回归方程y ^=b ^x+a ^,并预测该路口2021年10月不“礼让行人”驾驶员的大约人数(四舍五入);(2)交警从这4个月内通过该路口的驾驶员中随机抽查50人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:依据小概率值α=0.10的独立性检验,分析“礼让行人”行为是否与驾龄有关.参考公式:b ^=∑i=1nx i y i -nx y ∑i=1nx i 2-nx2=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2.χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.(2021·河北石家庄二模改编)某地区在2020年底全面建成小康社会,随着实施乡村振兴战略规划,该地区农村居民的收入逐渐增加,可支配消费支出也逐年增加.该地区统计了2016~2020年农村居民人均消费支出情况,对有关数据处理后,制作如图1的折线图[其中变量y (单位:万元)表示该地区农村居民人均年消费支出,年份用变量t 表示,其取值依次为1,2,3,…].(1)由图1可知,变量y与t具有很强的线性相关关系,求y关于t的经验回归方程,并预测2021年该地区农村居民人均消费支出;2016~2020年该地区农村居民人均消费支出图1(2)在国际上,常用恩格尔系数(其含义是指食品类支出总额占个人消费支出总额的比重)来衡量一个国家和地区人民生活水平的状况.根据联合国粮农组织的标准:恩格尔系数在40%~50%为小康,30%~40%为富裕.已知2020年该地区农村居民平均消费支出构成如图2所示,预测2021年该地区农村居民食品类支出比2020年增长3%,从恩格尔系数判断2021年底该地区农村居民生活水平能否达到富裕生活标准.2020年该地区农村居民人均消费支出构成图2参考公式:经验回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y∑i=1nx i 2-nx 2,a ^=y −b ^x .4.(2021·山东潍坊一模)在对人体的脂肪含量和年龄之间的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据(x i ,y i )(i=1,2,…,20,25<x i <65),其中x i 表示年龄,y i 表示脂肪含量,并计算得到∑i=120x i 2=48 280,∑i=120y i 2=15 480,∑i=120x i y i =27 220,x =48,y =27,√22≈4.7.(1)请用样本相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合,并求y 关于x的经验回归方程y ^=a ^+b ^x (a ^,b ^的计算结果保留两位小数);(2)科学健身能降低人体脂肪含量,下表是甲、乙两款健身器材的使用年限(整年)统计表:某健身机构准备购进其中一款健身器材,以使用年限的频率估计概率,请根据以上数据估计,该机构选择购买哪一款健身器材,才能使用更长久?参考公式:样本相关系数r=∑i=1n(x i -x)(y i -y)√∑i=1n (x i -x)2√∑i=1n(y i -y)2=∑i=1nx i y i -nx y√∑i=1nx i 2-nx 2√∑i=1ny i 2-ny 2;对于一组具有线性相关关系的数据(x i ,y i )(i=1,2,…,n ),其经验回归直线y ^=b ^x+a ^的斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y −b ^x .答案及解析1.解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17. 2.解 (1)由表中数据易知:x =1+2+3+44=52,y =125+105+100+904=105,则b ^=∑i=14x i y i -4x y∑i=14x i 2-4x2=995−1 05030−25=-11,a ^=y −b ^ x =105-(-11)×52=132.5,故所求经验回归方程为y ^=-11x+132.5.令x=10,则y ^=-11×10+132.5=22.5≈23(人),预测该路口10月份不“礼让行人”的驾驶员大约人数为23. (2)零假设为H 0:“礼让行人”行为与驾龄无关.由表中数据可得χ2=50×(10×12−20×8)218×32×30×20≈0.23<2.706=x 0.10,依据小概率值α=0.10的独立性检验,没有充分证据推断H 0不成立,可以认为H 0成立,即认为“礼让行人”行为与驾龄无关.3.解 (1)由已知数据可求t =1+2+3+4+55=3, y =1.01+1.10+1.21+1.33+1.405=1.21,∑i=15t i 2=12+22+32+42+52=55,∑i=15t i y i =1×1.01+2×1.10+3×1.21+4×1.33+5×1.40=19.16,b ^=19.16−5×3×1.2155−5×32=1.0110=0.101,a ^=1.21-0.101×3=0.907,所求经验回归方程为y ^=0.101t+0.907. 当t=6时,y ^=0.101×6+0.907=1.513(万元),故2021年该地区农村居民人均消费支出约为1.513万元.(2)已知2021年该地区农村居民平均消费支出1.513万元,由图2可知,2020年该地区农村居民食品类支出为4 451元,则预测2021年该地区食品类支出为4 451×(1+3%)=4 584.53元,恩格尔系数=4 584.5315 130×100%≈30.3%∈(30%,40%),所以,2021年底该地区农村居民生活水平能达到富裕生活标准.4.解 (1)x 2=2 304,y2=729,∑i=120x i y i -20x y =1 300,∑i=120x i 2-20x 2=2 200,∑i=1ny i 2-20y 2=900,r=∑i=120x i y i -20x y√∑i=120x i 2-20x 2√∑i=1ny i 2-20y2≈0.92,因为y 与x 的样本相关系数接近1,所以y 与x 之间具有较强的线性相关关系,可用线性回归模型进行拟合.由题可得,b ^=∑i=120(x i -x)(y i -y)∑i=120(x i -x)2=∑i=120x i y i -20x y∑i=120x i 2-20x2=1322≈0.591,a ^=y −b ^ x =27-0.591×48≈-1.37,所以y ^=0.59x-1.37.(2)以频率估计概率,设甲款健身器材使用年限为X (单位:年).E (X )=5×0.1+6×0.4+7×0.3+8×0.2=6.6. 设乙款健身器材使用年限为Y (单位:年).E (Y )=5×0.3+6×0.4+7×0.2+8×0.1=6.1.因为E (X )>E (Y ),所以该健身机构购买甲款健身器材更划算.。
统计与统计案例练习题及知识点总结(全面)-高考数学
统计与统计案例练习题与知识点总结1.为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间【答案】C【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.020.040.066%+==,故A 正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.040.0230.1010%+⨯==,故B 正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.100.140.2020.6464%50%++⨯==>,故D 正确;该地农户家庭年收入的平均值的估计值为30.0240.0450.1060.1470.2080.2090.10100.10110.04120.02130.02140.027.68⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(万元),超过6.5万元,故C 错误.综上,给出结论中不正确的是C.故选:C.【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于⨯频率组距组距.2.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++()2P K k ≥0.0500.0100.001k3.8416.63510.828【答案】(1)75%;60%;(2)能.【分析】本题考查频率统计和独立性检验,属基础题,根据给出公式计算即可【详解】(1)甲机床生产的产品中的一级品的频率为15075% 200=,乙机床生产的产品中的一级品的频率为12060% 200=.(2)()22400150801205040010 6.63527013020020039K⨯-⨯==>>⨯⨯⨯,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.1.随机抽样(1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.用样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积的总和等于1.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.(3)茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x=x1+x2+…+x nn,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s=1[x1-x2+x2-x2+…+x n-x2].n[(x1-x)2+(x2-x)2+…+(x n-x)2](x n是样本数据,n是样本容量,x是样本平均数).(5)方差:s2=1n4.相关关系与回归方程(1)相关关系的分类①正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.②负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(2)线性相关关系如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3)回归方程①最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.②回归方程方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.(4)回归分析①定义:对具有相关关系的两个变量进行统计分析的一种常用方法.②样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心.③相关系数当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.5.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表y 1y 2总计x 1a b a +b x 2c d c +d 总计a +cb +da +b +c +d构造一个随机变量K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d 为样本容量.(3)独立性检验:利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验.1.如图为国家统计局2021年1月19日发布的2020年各季度社会消费品零售总额及增速,则下列说法:①各季度社会消费品零售总额增速最快的是4季度;②各季度社会消费品零售总额增速最快的是2季度;③各季度社会消费品零售总额增量最大的是4季度;④各季度社会消费品零售总额增量最大的是2季度.其中所有正确说法的序号为()A.①④B.②③C.①③D.②④2.下图是2020年我国居民消费价格月度涨跌幅度图(来源于国家统计局网站)下列说法错误的是()A.1~12月月度同比的平均值为2.55B .1~12月月度环比的平均值为负数C .1~12月月度同比整体为下降趋势D .1~12月月度环比的方差大于月度同比的方差3.已知相关变量x 和y 的散点图如图所示,若用()11ln y b k x =⋅与22y kx b =+拟合时的相关系数分别为12,r r 则比较12,r r 的大小结果为()A .12r r >B .12r r =C .12r r <D .不确定4.下列说法中错误的个数是①某校共有女生2021人,用简单随机抽样的方法先剔除21人,再按系统抽样的方法抽取为200人,则每个女生被抽到的概率为110;②由样本数据得到的回归直线方程y bx a =+$$$必经过样本中心点()x y ;③如果落在回归直线上的样本点越多,则回归直线方程的拟合效果就越好;④在一个2×2列联表中,由计算得出220.21K =,而()210.8280.001P K ≥≈,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系.()A .1B .2C .3D .45.质检机构为检测一大型超市某商品的质量情况,从编号为1~120的该商品中利用系统抽样的方法抽8件进行质检,若所抽样本中含有编号67的商品,则下列编号一定被抽到的是()A .112B .53C .38D .96.2020年是全面实现小康社会目标的一年,也是全面打赢脱贫攻坚战的一年,某研究性学习小组调查了某脱贫县的甲、乙两个家庭,对他们过去6年(2014年到2019年)的家庭收入情况分别进行统计,发现他们的收入逐年增长,得到这两个家庭的年人均纯收入(单位:百元/人)茎叶图.对甲、乙两个家庭的年人均纯收入(以下分别简称“甲”“乙”)情况的判断,不正确的是()A.过去的6年,“甲”的极差小于“乙”的极差B.过去的6年,“甲”的平均值小于“乙”的平均值C.过去的6年,“甲”的中位数小于“乙”的中位数D.过去的6年,“甲”的平均增长率小于“乙”的平均增长率7.为了普及新冠肺炎知识,增强疫情防控意识,某学校从高一和高二两个年级各抽取5位同学参加新冠肺炎知识测试,得分(十分制)情况如下表所示,则下列描述正确的是()高一年级组高二年级组得分45678得分569频数11111频数311A.高一年级组数据的平均数为6分,高二年级组数据的平均数为5分B.两组数据的中位数都是6分C.高一年级组数据的极差小于高二年级组数据的极差D.高一年级组成绩的方差小于高二年级组成绩的方差8.某中学2018年的高考考生人数是2015年高考考生人数的1.5倍,为了更好地对比该校考生的升学情况,统计了该校2015年和2018年的高考情况,得到如图柱状图:则下列结论正确的是()A.与2015年相比,2018年一本达线人数减少B .与2015年相比,2018年二本达线人数增加了0.5倍C .2015年与2018年艺体达线人数相同D .与2015年相比,2018年不上线的人数有所增加9.m 个数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据,则下列关于这组新数据的说法正确的是()A .平均数为aB .中位数为2bC D .方差为2c10.已知变量y 关于x 的回归方程为0.5bx y e -=,其一组数据如表所示:若5x =,则预测y 值可能为()x1234ye3e 4e 6e A .5e B .112e C .7e D .152e 11.给出下列说法:①回归直线ˆˆˆy bx a =+恒过样本点的中心(x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数||r 就越接近1;③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5个单位.其中说法正确的是()A .①②④B .②③④C .①③④D .②④12.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是()性别说谎不说谎总计男6713女8917总计141630A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关13.下列四个命题中,正确的有()①两个变量间的相关系数r 越小,说明两变量间的线性相关程度越低;②命题“x ∃∈R ,使得210x x ++<”的否定是:“对x ∀∈R ,均有210x x ++>”;③命题“p g ∧为真”是命题“p q ∨为真”的必要不充分条件;④若函数322()3f x x ax bx a =+++在1x =-有极值0,则2a =,9b =或1a =,3b =.A .0B .1C .2D .314.某中学共有1000人,其中男生700人,女生300人,为了了解该校学生每周平均体育锻炼时间的情况以及经常进行体育锻炼的学生是否与性别有关(经常进行体育锻炼是指:周平均体育锻炼时间不少于4小时),现在用分层抽样的方法从中收集200位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如图.已知在样本数据中,有40位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理()附:()()()()()22n ad bc K a c b d a d b c -=++++,其中n a b c d =+++.()20P K k ≥0.100.050.010.0050k 2.7063.8416.6357.879A .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”B .有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有90%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”15.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为()A.0.2B.0.4C.0.5D.0.616.设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01B.0.1C.1D.1017.下图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.5,5B.3,5C.3,7D.5,718.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次[0,200](200,400](400,600]空气质量等级1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.0500.0100.001k 3.841 6.63510.82819.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.0500.0100.001k 3.841 6.63510.82820.为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿性别男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老年人的比例?说明理由附:1.C 【分析】根据折线统计图比较各季度社会消费品零售总额增速,可判断①②的正误;计算各季度社会消费品零售总额增量,可判断③④的正误.【详解】第1季度社会消费品零售总额增速为19.0%-,第2季度社会消费品零售总额增速为 3.9%-,第3季度社会消费品零售总额增速为0.9%,第4季度社会消费品零售总额增速为4.6%,故①正确,②错误;第2季度社会消费品零售总额增量为9.377.86 1.51-=(万亿元),第3季度社会消费品零售总额增量为10.119.370.74-=(万亿元),第4季度社会消费品零售总额增量为11.8710.11 1.76-=(万亿元).故③正确,④错误.故选:C.2.D 【分析】根据图表数据计算平均数,然后判断A 和B ;根据图表数据的变化趋势判断C 和D.【详解】同比平均数:()5.4 5.2 4.3 3.3 2.4 2.5 2.7 2.4 1.70.50.50.72.5512++++++++++-+=,环比平均数:()()()()()()1.40.8 1.20.90.80.10.60.40.20.30.60.20.02512++-+-+-+-++++-+-+=-,1-12月月度同比的平均值为2.55,选项A 正确;1~12月月度环比的平均值为0.025-,选项B 正确;观察图表可以得出,1~12月月度同比整体为下降趋势,选项C 正确;1~12月月度环比的波动小于月度同比的波动,选项D 错误.故选:D .3.C 【分析】由散点图可知,对数形式的拟合程度高,再根据负相关,比较两个相关系数大小.【详解】由散点图可知,()11ln y b k x =拟合比用22y k x b =+拟合的程度高,故12r r >;又因为此关系为负相关,1212,r r r r ∴->-<故选:C 4.B 【分析】由古典概型的特征可判断①;由回归直线方程的特征可判断②③;由独立性检验思想可判断④.【详解】①错误,古典概率中,每个个体被抽的概率都是一样的,都等于2002021;②正确由回归直线方程的特征可知回归直线方程y bx a =+$$$必经过样本中心点(),x y ;③错误,落在回归直线附近的样本点越多,则回归直线方程的拟合效果越好;④正确,当220.21K =,而()210.8280.001P K ≥≈,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系所以错误个数为2.故选:B.5.A 【分析】根据系统抽样的特征,结合所给编号求出第一组抽取商品编号,即可求解.【详解】由题意知,组距为120158=,设第一组抽取编号为k ,则第n 组抽取的编号为15(1)n k -+,样本中含有编号67的商品,即15(51)67k ⨯-+=,可得7k =,因为1577112⨯+=,即第8组中抽取商品的编号为112.故选:A 6.B 【分析】对茎叶图进行数据分析,分别计算极差、平均数、中位数、及平均增长率,依次判断四个选项.【详解】对于A ,甲的极差为42366-=,乙的极差为41347-=,所以“甲”的极差小于“乙”的极差,A 正确;对于B ,甲的平均数是1230(363737384042)66⨯+++++=,乙的平均数为1228(343638394041)66⨯+++++=,所以“甲”的平均值大于“乙”的平均值,B 错误;对于C ,甲的中位数是1(3738)37.52⨯+=,乙的中位数是1(3839)38.52⨯+=,所以,“甲”的中位数小于“乙”的中位数,C 正确;对于D ,设过去6年甲的平均增长率为x ,则()636142x +=,解得:1x =-,即过去61-;1-.因为42413634<,所以“甲”的平均增长率小于“乙”的平均增长率,D 正确.故选:B.7.D 【分析】根据表中数据,依次讨论各选项即可得答案.【详解】对于A 选项,高一年级和高二年级的平均分均为6分,故A 选项错误;对于B 选项,高一年级的中位数是6,高二年级的中位数是5,故B 选项错误;对于C 选项,高一年级的极差为4,高二年级的极差为3,故高一年级组数据的极差大于高二年级组数据的极差,故C 选项错误;对于D 选项,高一年成绩的方差为()()()()()2222221465666768625S ⎡⎤=-+-+-+-+-=⎣⎦,高二年级成绩的方差为()()()222213566696 2.45S ⎡⎤=-+-+-=⎣⎦,满足,故D 选项正确;故选:D 8.D 【分析】设2015年该校参加高考的人数为S ,则2018年该校参加高考的人数为1.5S ,观察柱状统计图,找出各数据,再利用各数量间的关系列式计算得到【详解】设2015年该校参加高考的人数为S ,则2018年该校参加高考的人数为1.5S.对于选项A :2015年一本达线人数为0.28S ,2018年一本达线人数为0.24×1.5S =0.36S ,可见一本达线人数增加了,故A 错误;对于选项B :2015年二本达线人数为0.32S ,2018年二本达线人数为0.4×1.5S =0.6S ,显然2018年二本达线人数不是增加了0.5倍,故B 错误;对于选项C :2015年和2018年艺体达线率没变,但是人数是不相同的,故C 错误;对于选项D :2015年不上线人数为0.32S ,2018年不上线人数为0.28×1.5S=0.42S ,不达线人数有所增加,故D 正确.故选:D 9.B 【分析】m 个12,,,n x x x 数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据122,2,,2n x x x ,根据平均数、中位数、方差、标准差的定义进行判断即可.【详解】m 个12,,,n x x x 数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据122,2,,2n x x x ,则由于平均数为所有数之和除以m ,故平均数变为2a ,故A 错;中位数为这组数从小到大排列后中间的那个数或中间两数和的平均数,由于每个数都变为原来2倍,所以中位数也变为原来的2倍,即2b ,故B 对;方差描述的是这组数的波动情况,12,,,n x x x 的方差为c ,则122,2,,2n x x x 的方差为224c c =2c =,故C,D 错;故选:B 【点睛】熟悉平均数、中位数、方差、标准差的概念,特别是一组数据扩大某个倍数或增加某个数值的情况下,平均数、中位数、方差、标准差的变化.10.D 【分析】将回归方程左右同时取对数得:ln 0.5y bx =-,看作回归直线的形式,由回归直线过样本中心点可构造方程求得b ,由此得到回归方程;将5x =代入回归方程即可求得结果.【详解】由0.5bx y e-=得:ln 0.5y bx =-,346ln ln ln ln 12340.544e e e e b ++++++∴=⋅-,解得: 1.6b =,∴回归方程为 1.60.5x y e -=,若5x =,则1580.52y e e -==.故选:D.【点睛】关键点点睛:本题考查非线性回归中的预估值的求解,解题关键是能够通过对指数型回归模型左右同时取对数,将其变为线性回归的形式来进行求解.11.B 【分析】①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的.【详解】对于①中,回归直线ˆˆˆy bx a =+恒过样本点的中心(x y ,但不一定过一个样本点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数||r 就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位,所以是正确的.故选:B.【点睛】本题主要考查了统计知识的相关概念及判定,其中解答中熟记回归直线方程的特征,回归系数的含义,相关系数的意义,以及方程的计算方法是解答的关键,属于基础题.12.D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D 13.A 【分析】根据相关系数的定义可知①错误;根据特称命题(又叫存在性命题)的否定可知②错误;根据真值表即可判断“p q ∧为真”是命题“p q ∨为真”的充分不必要条件,故③错误;由条件可得,(1)0,(1)0,f f '-=-=解得a=2,b=9或a=1,b=3,经检验,当a=1,b=3时,22()3633(1)0f x x x x '=++=+≥恒成立,此时()f x 没有极值点,故④错误。
高级统计师高级统计实务与案例解析考题试卷及答案
高级统计师高级统计实务与案例解析考题试卷及答案P210第一题(10分)请简述相关解析与回归解析的区别和联系。
答:区别:1、两者研究的目的不同;一个是关系密切的程度和方向 ; 另一个是相关的具体形式,也就是数量变动关系;2、研究的方法不同:前者用散点图定性表示,或者用相关系数定量表示,后者是用回归方程表示的;3、结果不同:前者两个变量只能计算一个相关系数;后者则一个是自变量,一个是因变量.当然也可能只有一个方程;4、变量的地位不同:前者认为两个都是随机的,后者认为自变量是确定的,因变量是随机的.联系:有共同的研究对象,是相同的变量或事物;两者互补的,前者是后者的基础,后者是前者的进一步拓展。
P127第二题(10分)在某地实施一项抽样调查,根据以往经验,预计空户率为 5%,因拒访等原因造成的无回答率为 15%。
若要保证最终有效样本量能够达到 200户,最少应抽取多少样本户?答“设要抽取 X户,有 5%的空户率,则能抽上的只有(1-5%),无回答率为 15%,说明能回答的只有 1-15% ,X(1-5%)(1-15%)=200 X=247.2按照向上取整原则=248户.知识点:(1)可能由于空户率或无回答率,改变了内部差异的性质;(2)无回答误差:由于无回答现象的发生而导致调查获得的统计数据与社会经济现象的直实数据之间的差距就是无回答误差.(3)无回答是指由于种种原因不能从单位中获得研究所需要的有用的数据或记录.P102 第三题(15分)某建筑装饰工程公司年报上报从业人员劳动报酬 153.7万元。
某市统计局在例行执法检查时,经查阅有关单据、凭证、统计台帐,询问有关人员,认真进行核实,发现该企业全年共计支付:(1)职工工资 88.7万元;(2)职工年终奖、安全奖等各类奖金 12.6万元;(3)职工交通费补助 11.2万元;(4)职工洗理费、书报费等3.4万元;(5)职工独生子女费0.6万元;(6)职工岗位津贴 53.8万元;(7)职工食堂伙食补贴 20万元;(8)职工其它工资性补贴和津贴 2.1万元。
统计有关经典例题解析、及高考题50道,带答案
【经典例题】【例1】(2008广东).为了调查某厂工人生产某种产品的能力,随机抽 查了20位工人某天生产该产品的数量.产品数量的分组区间为[)45,55,[)[)[)55,65,65,75,75,85,[)85,95由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)55,75的 人数是 . 【答案】13【解析】20(0.06510)13⨯⨯=,故答案为13.【例2】(2009山东)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( ).A. 90B.75C. 60D.45【答案】A【解析】产品净重小于100克的概率为(0.050+0.100)×2=0.300, 已知样本中产品净重小于100克的个数是36,设样本容量为n , 则300.036=n,所以120=n ,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A.【例3】(2009上海)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。
根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A. 甲地:总体均值为3,中位数为4B. 乙地:总体均值为1,总体方差大于0C. 丙地:中位数为2,众数为3D. 丁地:总体均值为2,总体方差为3 【答案】D【解析】根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A 中,中位数为4,可能存在大于7的数;同理,在选项C 中也有可能;选项B 中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D 中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故答案选D.第8题图【例4】(2009湖北)下图是样本容量为200的频率分布直方图。
统计学计算题例题及计算分析
计算分析题解答参考1.1.某厂三个车间一季度生产情况如下:计算一季度三个车间产量平均计划完成百分比和平均单位产品成本.解:平均计划完成百分比=实际产量/计划产量=733/(198/0。
9+315/1。
05+220/1。
1) =101.81%平均单位产量成本 X=∑xf/∑f=(15*198+10*315+8*220)/733 =10。
75(元/件) 1。
2.某企业产品的有关资料如下:试分别计算该企业产品98年、99年的平均单位产品成本.解:该企业98年平均单位产品成本 x=∑xf/∑f=(25*1500+28*1020+32*980)/3500 =27。
83(元/件)该企业99年平均单位产品成本x=∑xf /∑(m/x )=101060/(24500/25+28560/28+48000/32) =28.87(元/件)1。
3.1999年某月甲、乙两市场三种商品价格、销售量和销售额资料如下: 试分别计算三种商品在两个市场上的平均价格。
解:三种商品在甲市场上的平均价格x=∑xf/∑f=(105*700+120*900+137*1100)/2700 =123.04(元/件)三种商品在乙市场上的平均价格x=∑m/∑(m/x)=317900/(126000/105+96000/120+95900/137) =117.74(元/件)2.1.某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为22件,标准差为3.5件;乙组工人日产量资料:试比较甲、乙两生产小组中的哪个组的日产量更有代表性? 解:∵X 甲=22件 σ甲=3。
5件∴V 甲=σ甲/ X 甲=3.5/22=15。
91% 列表计算乙组的数据资料如下:∵x 乙=∑xf/∑f=(11*10+14*20+17*30+20*40)/100 =17(件)σ乙=√[∑(x-x)2f]/∑f =√900/100 =3(件) ∴V 乙=σ乙/ x 乙=3/17=17。
概率与统计:统计与统计案例
y1 x1 x2 总计 a c
y2 b d
总计 a+b c+d
a+c
b+d
n
2 n ( ad - bc ) 则 K2= (其中 n=a+b+ (a+b)(c+d)(a+c)(b+d)
c+d 为样本容量).
【题型突破】
题型一、抽样方法 【例 1】 (1) 某校老年、中年和青年教师的人数见下表,采用分层
(2)根据题意,样本中分数不小于 50 的频率为 (0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为 100-100×0.9-5=5. 5 所以总体中分数在区间[40,50)内的人数估计为 400× =20. 100 (3)由题意可知,样本中分数不小于 70 的学生人数为 (0.02+0.04)×10×100=60, 1 所以样本中分数不小于 70 的男生人数为 60×2=30. 所以样本中的男生人数为 30×2=60,女生人数为 100-60=40, 男生和女生人数的比例为 60∶40=3∶2. 所以根据分层抽样原理, 总体中男生和女生人数的比例估计为 3∶2.
易求 x 甲=65.2, x 乙=61.8,知 x 甲> x 乙,②正确. 又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散, ∴s 甲<s 乙,③错误, 因此符合茎叶图所给数据的结论是①②④.
【答案】 C
【例3】我国是世界上严重缺水的国家,某市政府为了鼓励居民节
约用水,计划调整居民生活用水收费方案,拟确定一个合理的 月用水量标准 x( 吨 ) ,一位居民的月用水量不超过 x 的部分按平 价收费,超出x的部分按议价收费 .为了了解居民用水情况,通 过抽样,获得了某年100位居民每人的月均用水量(单位:吨),
江苏2018届高考数学总复习专题11.2统计与统计案例试题含解析
专题11.2 统计与统计案例【三年高考】1. 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取▲ 件.【答案】18【解析】应从丙种型号的产品中抽取30060181000⨯=件,故答案为18.【考点】分层抽样【名师点睛】在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i∶N i=n∶N.2.【2016江苏】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 . 【答案】0.1【考点】方差【名师点睛】本题考查的是总体特征数的估计,重点考查了方差的计算,本题有一定的计算量,属于简单题.认真梳理统计学的基础理论,特别是系统抽样和分层抽样、频率分布直方图、方差等,针对训练近几年的江苏高考类似考题,直观了解本考点的考查方式,强化相关计算能力.3.【2015江苏高考,2】已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 【答案】6【解析】46587666x+++++==【考点定位】平均数4. 【2017课标3,理3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳【答案】A【解析】【考点】 折线图【名师点睛】将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图,频率分布折线图的的首、尾两端取值区间两端点须分别向外延伸半个组距,即折线图是频率分布直方图的近似,他们比频率分布表更直观、形象地反映了样本的分布规律.5. 【2017山东,理5】为了研究某班学生的脚长(单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为(A )160 (B )163 (C )166 (D )170【答案】C【解析】试题分析:由已知22.5,160,160422.570,42470166x y a y ==∴=-⨯==⨯+= ,选C.【考点】线性相关与线性回归方程的求法与应用.【名师点睛】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断.求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性.6. 【2017课标1,文2】为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数【答案】B【解析】 试题分析:刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B【考点】样本特征数【名师点睛】众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平; 中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平; 平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.7. 【2017山东,文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为A. 3,5B. 5,5C. 3,7D. 5,7【答案】A【解析】【考点】茎叶图、样本的数字特征【名师点睛】由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐. 利用茎叶图对样本进行估计是,要注意区分茎与叶,茎是指中间的一列数,叶是从茎的旁边生长出来的数.8.【2016高考新课标3理数改编】某旅游城市为向游客介绍本地的气温情况,绘制了一年中︒,B 月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15C︒.下面叙述不正确的是.点表示四月的平均最低气温约为5C︒以上②七月的平均温差比一月的平均温差大①各月的平均最低气温都在0C︒的月份有5个③三月和十一月的平均最高气温基本相同④平均气温高于20C【答案】④【解析】︒均在虚线框内,所以各月的平均最低气温都在0℃以上,①正确;由试题分析:由图可知0C图可在七月的平均温差大于7.5C ︒,而一月的平均温差小于7.5C ︒,所以七月的平均温差比一月的平均温差大,②正确;由图可知三月和十一月的平均最高气温都大约在5C ︒,基本相同,③正确;由图可知平均最高气温高于20℃的月份有3个或2个,所以④不正确. 考点:1、平均数;2、统计图.【易错警示】解答本题时易错可能有两种:(1)对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;(2)估计平均温差时易出现错误,错选②.9.【2016高考上海理数】某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77则这组数据的中位数是_________(米).【答案】1.76【解析】试题分析:将这6位同学的身高按照从矮到高排列为:1.69,1.72,1.75,1.77,1.78,1.80,这六个数的中位数是1.75与1.77的平均数,显然为1.76.考点:中位数的概念.【名师点睛】本题主要考查中位数的概念,是一道基础题目.从历年高考题目看,涉及统计的题目,往往不难,主要考查考生的视图、用图能力,以及应用数学解决实际问题的能力. 10.2016高考北京文数】某网店统计了连续三天售出商品的种类情况:第一天售出19种商品,第二天售出13种商品,第三天售出18种商品;前两天都售出的商品有3种,后两天都售出的商品有4种,则该网店①第一天售出但第二天未售出的商品有______种;②这三天售出的商品最少有_______种.【答案】①16;②29C BA139142考点: 统计分析【名师点睛】本题将统计与实际情况结合,创新味十足,是能力立意的好题,关键在于分析商品出售的所有可能的情况,分类讨论做到不重复不遗漏,另外,注意数形结合思想的运用.11.【2015高考重庆,文4改编】重庆市2013年各月的平均气温(°C)数据的茎叶图如下 08 9 12 5 8 20 0 3 3 8 3 1 2则这组数据中的中位数是 .【答案】20【解析】由茎叶图可知总共12个数据,处在正中间的两个数是第六和第七个数,它们都是20,由中位数的定义可知:其中位数就是20.12.【2015高考陕西,文2改编】某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为 .(高中部)(初中部)男男女女60%70%【答案】137 【解析】由图可知该校女教师的人数为11070%150(160%)7760137⨯+⨯-=+=.13.【2015高考湖北,文2改编】我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 石.【答案】169【解析】设这批米内夹谷的个数为x ,则由题意并结合简单随机抽样可知,282541534x =,即281534169254x =⨯≈. 14.【2015高考广东,文12】已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为 .【答案】11【解析】因为样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,所以样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为2125111x +=⨯+=,所以答案应填:11.15.【2015高考北京,文14】高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .【答案】乙;数学【解析】①由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙.②由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成绩的排名更靠前,故填数学.16.【2015高考北京,文17】某超市随机选取1000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.(I )估计顾客同时购买乙和丙的概率;(II )估计顾客在甲、乙、丙、丁中同时购买中商品的概率;(III )如果顾客购买了甲,则该顾客同时购买乙、丙、丁中那种商品的可能性最大? (Ⅲ)与(Ⅰ)同理,可得:顾客同时购买甲和乙的概率可以估计为2000.21000=,顾客同时购买甲和丙的概率可以估计为1002003000.61000++=,顾客同时购买甲和丁的概率可以估计为1000.11000=,所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大. 16.【2015高考广东,文17】某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图2.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户?【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=得:0.0075x =,所以直方图中x 的值是0.0075(2)月平均用电量的众数是2202402302+=,因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=得:224a =,所以月平均用电量的中位数是224(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=户,月平均用电量为[)240,260的用户有0.00752010015⨯⨯=户,月平均用电量为[)260,280的用户有0.0052010010⨯⨯=户,月平均用电量为[]280,300的用户有0.0025201005⨯⨯=户,抽取比例11125151055==+++,所以月平均用电量在[)220,240的用户中应抽取12555⨯=户【2018年高考命题预测】概率统计试题在试卷中的题型仍是填空题型,纵观近几年高考数学试卷中,概率与统计是必考题,而且是基础题,有时以直方图或茎叶图提供问题的背景信息,预测2018年仍会出现此类题,因此掌握概率与统计的基础知识是学习的关键.【2018年高考考点定位】本知识点主要是:随机抽样常以选择、填空题考查分层抽样,难度较低.在用样本估计总体中,会读图、识图,会从频率分布直方图中分析样本的数字特征(众数、中位数、平均数等);重视茎叶图;要重视线性回归方程,不仅会利用公式求,还要能分析其特点(正相关、负相关、回归方程过样本点中心);重视独立性检验( 2×2列联表).【考点1】抽样方法、总体分布的估计【备考知识梳理】1.简单随机抽样:一般地,设一个总体的个体数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.3.总体:在数理统计中,通常把被研究的对象的全体叫做总体.4.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.【规律方法技巧】分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法可以不同);(4)汇合成样本.解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估计.【考点针对训练】1.某小区共有1000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为 ,平均数为 .【答案】155;156.8【解析】根据中位数的定义知中位数由200.005200.0150.0200.5m ⨯+⨯+⨯=,解得5m =,所以中位数为:1505155+=;平均数为:1200.0051400.0151600.0201800.0052000.0032200.002156.8⨯+⨯+⨯+⨯+⨯+⨯=,所以答案为:155;156.8.2.某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.(1)求直方图中的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户? 【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=得:0.0075x =,所以直方图中的值是0.0075.(2)月平均用电量的众数是2202402302+=;因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=得:224a =,所以月平均用电量的中位数是224.【考点2】相关性、最小二乘估计与统计案例 【备考知识梳理】1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.(2)从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.(3)若两个变量x 和y 的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关. 如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的. 2.回归方程 (1)最小二乘法如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用表达式[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2来刻画这些点与直线y =a +bx 的接近程度,使得上式达到最小值的直线y =a +bx 就是我们所要求的直线,这种方法称为最小二乘法. (2)回归方程方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ,b 是待定参数.∑∑∑∑=-=--=--=-Λ--=---=ni ni i ni ii ni ixn xy x n yx x xy y x xb 12211121)())((,-Λ-Λ-=x b y a3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y =bx +a 的斜率和截距的最小二乘法估计分别为:∑∑∑∑=-=--=--=-Λ--=---=ni ni i ni ii ni ixn xy x n yx x xy y x xb 12211121)())((,-Λ-Λ-=x b y a ).其中x =1n ∑i =1nx i ,y =1n ∑i =1ny i ,(x ,y )称为样本点的中心.(3)相关系数①1()()nniii x x y y x yn x yr -------==∑∑r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系. 4.独立性检验(1)设A ,B 为两个变量,每一个变量都可以取两个值,变量A :A 1,A 2=A 1;变量B :B 1,B 2=B 1. 2×2列联表构造一个随机变量2()()()()()n ad bc K a b c d a c b d -=++++其中d c b a n +++=为样本容量.(2)独立性检验:利用随机变量来判断“两个变量有关联”的方法称为独立性检验. (3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断①当χ2≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的;②当χ2>2.706时,有90%的把握判定变量A ,B 有关联; ③当χ2>3.841时,有95%的把握判定变量A ,B 有关联; ④当χ2>6.635时,有99%的把握判定变量A ,B 有关联.【规律方法技巧】1.“相关关系与函数关系”的区别:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.2.三点提醒: 一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.三是独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.3.正确理解计算b ,a 的公式和准确的计算是求线性回归方程的关键.回归直线方程y =bx +a 必过样本点中心(x ,y ).在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.4.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,具体做法是根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算2K 值,2K 值越大,说明“两个变量有关系”的可能性越大. 【考点针对训练】1.已知x 、y 的取值如下表所示,若y 与x 线性相关,且yˆ=0.95x +,则=____________.【答案】6.2 【解析】244310=+++=x ,5.447.68.43.42.2=+++=y ,样本中心点,在回归直线上,所以代入aˆ295.05.4+⨯=,所以6.2ˆ=a 2.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附:22n(ad bc )K (a b )(c d )(a c )(b d )-=++++参照附表,在如下结论:A .在犯错误的概率不超过l %的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过l %的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关” 中正确的是 . 【答案】C【解析】由表计算得:22100(45153010)==3.0355457525K ⨯-⨯⨯⨯⨯,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,填C .【两年模拟详解析】1. 【苏北三市(连云港、徐州、宿迁)2017届高三年级第三次调研考试】已知一组数据3,6,9,8,4,则该组数据的方差是__________. 【答案】 (或5.2)【解析】2. 【2016-2017学年度苏锡常镇四市高三教学情况调研(二)】下表是一个容量为10的样本数据分组后的频数分布.若利用组中值近似计算本组数据的平均数x ,则x 的值为 .【答案】19.7 【解析】3. 【南京市、盐城市2017届高三年级第一次模拟】已知样本数据12345,,,,x x x x x 的方差23s =,则样本数据123452,2,2,2,2x x x x x 的方差为 ▲ . 【答案】12【解析】由题意得方差为2224312s =⨯=4. 【2017年第三次全国大联考江苏卷】已知样本7,8,9,,x y 的平均数为,且60xy =,则此样本的方差为_____________. 【答案】2 【解析】因为78985x y++++=,所以16x y +=,而60xy =,所以610x y =⎧⎨=⎩或106x y =⎧⎨=⎩,从而样本的方差为22221[(1)01(2)2]25⨯-+++-+=.5. 【2017年高考原创押题预测卷02(江苏卷)】某人次上班途中所花的时间(单位:分钟)分别为9,11,10,8,12,则这组数据的标准差为_______. 【答案】2【解析】因为这组数据的平均数是10591110812=++++=x ,所以其方差25)109()1011()1010()108()1012(222222=-+-+-+-+-=s ,故所求这组数据的标准差2=s .6. 【淮安、宿迁、连云港、徐州苏北四市2016届高三第二次调研】交通部门对某路段公路上行驶的汽车速度实施监控,从速度在h km /9050-的汽车中抽取150辆进行分析,得到数据的频率分布直方图如图所示,则速度在h km /70以下的汽车有 辆.)【答案】75【解析】由频率分布直方图得,速度在h km /70以下的汽车所占频率为(0.020.03)100.5+⨯=,则速度在h km /70以下的汽车有1500.575⨯=辆7.【江苏省清江中学数学模拟试卷】某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有 根在棉花纤维的长度大于25mm.【答案】40【解析】(0.0550.0250.015)10040⨯+⨯+⨯⨯=.8.【扬州市2015—2016学年度第一学期期末检测试题】某学校从高三年级共800名男生中随机抽取50名测量身高. 据测量被测学生身高全部介于155cm 和195cm 之间,将测量结果按如下方式分成八组:第一组[)160155,、第二组[)165160,、……、第八组[]195190,. 按上述分组方式得到的频率分布直方图的一部分如图所示,估计这所学校高三年级全体男生身高180cm 以上(含180cm )的人数为 .【答案】144【解析】由图得,身高180cm 以上(含180cm )的频率为()150.0080.0160.0420.060.18-⨯++⨯+=,则人数为8000.18144⨯=9.【南京市、盐城市2016届高三年级第一次模拟考试数学】某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出55人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为 . 【答案】17【解析】高一高二人数之比为10:9,因此高二抽出的人数为18人,高三抽出的人数为55-20-18=17人10.【苏州市2016届高三年级第一次模拟考试】若一组样本数据9,8,x ,10,11的平均数为10,则该组样本数据的方差为 . 【答案】2【解析】由题意得12x =,因此方差为221(12201)25++++=11.【江苏省扬州中学2015—2016学年第二学期质量检测】在一段时间内有2000辆车通过高速公路上的某处,现随机抽取其中的200辆进行车速统计,统计结果如下面的频率分布直方图所示.若该处高速公路规定正常行驶速度为90km/h ~120km/h ,试估计2000辆车中,在这段时间内以正常速度通过该处的汽车约有________辆.【答案】1700【解析】2000(0.0350.030.02)101700⨯++⨯=12.【南京市、盐城市2016届高三年级第二次模拟考试】如图所示,一家面包销售店根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图.若一个月以30天计算,估计这家面包店一个月内日销售量不少于150个的天数为 .【答案】【解析】950)002.0004.0(30=⨯+⨯13.【江苏省南京市2016届高三年级第三次学情调研适应性测试】一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则月收入在[2500,3000)范围内的应抽出人.【答案】25⨯⨯=【解析】由题意得:0.00055001002514.【南京市2016届高三年级第三次模拟考试】甲、乙两位选手参加射击选拔赛,其中连续5轮比赛的成绩(单位:环)如下表:则甲、乙两位选手中成绩最稳定的选手的方差是.【答案】0.02【一年原创真预测】1. 以下四个命题中:R的值判断模型的拟合效果, 2R越大,模型的拟合效果越①在回归分析中,可用相关指数2好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③若数据123,,n x x x x 的方差为1,则1232,2,22n x x x x 的方差为2;④对分类变量与y 的随机变量2k 的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为 . 【答案】2【入选理由】本题考查特称命题真假的判断,回归分析,相关系数,独立性检验等基础知识,意在考查考生转化能力,分析问题解决问题的能力,运算求解能力.此类知识属于高考冷门问题,近年高考有所重视,应多注意,故选此题.2.某单位为了了解某办公楼用电量y (度)与气温x (oC)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:得到的回归方程为a bx y+=ˆ,则a 0,b 0. 【答案】>,<【解析】依题意,画散点图知,两个变量负相关,所以0<b ,0>a .【入选理由】本题考查考查散点图、线性回归方程等基础知识,意在考查考生分析问题解决问题的能力,运算求解能力.近年高考加强了对线性回归方程的考查,应多注意,故选此题. 3.2015国际滑联世界花样滑冰锦标赛于3月23日至29日在上海举行,为调查市民喜欢这项赛事是否与年龄有关,随机抽取了55名市民,得到如下数据表:。
上海国和中学选修1-2第一章《统计案例》测试(含答案解析)
一、选择题1.某校高二(1)班甲、乙两同学进行投篮比赛,他们进球的概率分别是34和45,现甲、乙各投篮一次,恰有一人进球的概率是()A.120B.320C.15D.7202.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握认为是否喜欢抖音和性别有关,则男生至少有()参考公式:0.100.050.0250.0100.0050.0012.7063.841 5.024 6.6357.87910.828A.12人B.18人C.24人D.30人3.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取60名高中生做问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到2K的观测值9.643k ,根据临界值表,以下说法正确的是() P(K2≥k0)0.500.400.250.150.100.050.050.0100.005 k00.4550.708 1.323 2.072 2.706 3.841 5.024 6.6357.879A.在样本数据中没有发现足够证据支持结论“作文成绩优秀与课外阅读量大有关”B.在犯错误的概率不超过0.001的前提下,认为作文成绩优秀与课外阅读量大有关C .在犯错误的概率不超过0.05的前提下,认为作文成绩优秀与课外阅读量大有关D .在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关 4.为了解某班学生喜爱打篮球是否与性别有关,对该班60名学生进行问卷调查,得到如下图所示的22⨯列联表,则至少有( )的把握认为喜爱打篮球与性别有关.附参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.A .99.9%B .99.5%C .99%D .97.5%5.已知变量,X Y ,由它们的样本数据计算得到2K 的观测值 4.328k ≈,2K 的部分临界值表如下:以下判断正确的是( )A .在犯错误的概率不超过0.05的前提下认为变量,X Y 有关系B .在犯错误的概率不超过0.05的前提下认为变量,X Y 没有关系C .有97.5%的把握说变量,X Y 有关系D .有97.5%的把握说变量,X Y 没有关系6.甲罐中有5个红球,2个白球和3个黑球,乙罐中有6个红球,2个白球和2个黑球,先从甲罐中随机取出一个球放入乙罐,分别以1A ,2A ,3A 表示由甲罐取出的球是红球、白球和黑球的事件,再从乙罐中随机取出一个球,以B 表示由乙罐取出的球是红球的事件,下列结论中不正确...的是( ) A .事件B 与事件1A 不相互独立B .1A 、2A 、3A是两两互斥的事件C .17(|)11P B A =D .3()5P B =7.某光学仪器厂生产的透镜,第一次落地打破的概率为0.3;第一次落地没有打破,第二次落地打破的概率为0.4;前两次落地均没打破,第三次落地打破的概率为0.9.则透镜落地3次以内(含3次)被打破的概率是( ). A .0.378 B .0.3C .0.58D .0.9588.抛掷红、黄两颗骰子,当红色骰子的点数为4或6时,两颗骰子的点数之积大于20的概率是( )A .35 B .14 C .12D .13 9.若y 关于x 的线性回归方程0.70.35y x =+是由表中提供的数据求出,那么表中m 的值为( )x3 4 5 6 y3m4.54A .3.5B .3C .2.5D .210.两个变量y 与x 的回归模型中,分别选择了4个不同模型,对于样本点()11,x y ,()22,x y ,…,(),n n x y ,可以用()()22121ˆ1niii n ii y yR y y ==-=--∑∑来刻画回归的效果,已知模型1中20.96R =,模型2中23{5x yy x -==-,模型3中20.55R =,模型4中20.41R =,其中拟合效果最好的模型是( ) A .模型1B .模型2C .模型3D .模型411.通过随机询问100名性别不同的高二学生是否爱吃零食,得到如下的列联表:其中()()()()()22,.n ad bc K n a b c d a b c d a c b d -==+++++++则下列结论正确的是A .在犯错误的概率不超过0.05的前提下,认为“是否爱吃零食与性别有关”B .在犯错误的概率不超过0.05的前提下,认为“是否爱吃零食与性别无关”C .在犯错误的概率不超过0.025的前提下,认为“是否爱吃零食与性别有关”D .在犯错误的概率不超过0.025的前提下,认为“是否爱吃零食与性别无关”12.甲、乙两人同时报考某一所大学,甲被录取的概率为0.6,乙被录取的概率为0.7,两人是否被录取互不影响,则其中至少有一人被录取的概率为( ) A .0.12B .0.42C .0.46D .0.88二、填空题13.在一次三人象棋对抗赛中,甲胜乙的概率为0.4,乙胜丙的概率为0.5,丙胜甲的概率为0.6,比赛顺序如下:第一局,甲对乙;第二局,第一局胜者对丙;第三局,第二局胜者对第一局败者;第四局,第三局胜者对第二局败者.则乙连胜四局的概率为____.14.某校组织甲、乙、丙、丁、戊、己等6名学生参加演讲比赛,采用抽签法决定演讲顺序,在“学生甲和乙都不是第一个出场,且甲不是最后一个出场”的前提下,学生丙第一个出场的概率为__________. 15.已知x 、y 之间的一组数据如下:则线性回归方程ˆya bx =+所表示的直线必经过点________. 16.某学生在上学路上要经过4个路口,假设在各路口是否遇到红灯是相互独立的,遇到红灯的概率都是13,那么该生在上学路上到第3个路口首次遇到红灯的概率为__________.17.已知一组数据的回归直线方程为 1.51y x =-+,且4y =,发现有两组数据( 1.7,2.9)-,( 2.3,5.1)-的误差较大,去掉这两组数据后,重新求得回归直线方程为y x a '''=-+,则当3x '=-时,y '=_____. 18.2019年7月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是3.240y x =-+,且20m n +=,则其中的n =______.19.现有A ,B 两队参加关于“十九大”知识问答竞赛,每队3人,每人回答一个问题,答对者为本队赢1分,答错得0分;A 队中每人答对的概率均为23,B 队中3人答对的概率分别为23,23,13,且各答题人答题正确与否之间互不影响,若事件M表示“A队得2分”,事件N表示“B队得1分”,则()P MN=______.20.一名信息员维护甲乙两公司的5G网络,一天内甲公司需要维护和乙公司需要维护相互独立,它们需要维护的概率分别为0.4和0.3,则至少有一个公司不需要维护的概率为________三、解答题21.为落实中央“坚持五育并举,全面发展素质教育,强化体育锻炼”的指示精神,小明和小亮两名同学每天利用课余时间进行羽毛球比赛.规定每一局比赛中获胜方记2分,失败方记0分,没有平局,谁先获得10分就获胜,比赛结束.假设每局比赛小明获胜的概率都是23.(1)求比赛结束时恰好打了7局的概率;(2)若现在是小明6:2的比分领先,记X表示结束比赛还需打的局数,求X的分布列及期望.22.随着生活质量的提升,家庭轿车保有量逐年递增.方便之余却加剧了交通拥堵和环保问题.绿色出行引领时尚,共享单车进驻城市黄泽市有统计数据显示.2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年齡分为“年轻人”(20岁~391岁)和“非年轻人”( 19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的经常使用共享单车的称为“单车族”.使用次数为5次或不足5次的称为“非单车族”.已知在“单车族”中有56是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为400的样本,请你根据图表中的数据,补全下列22⨯列联表,并判断是否有95%的把握认为经常使用共享单车与年龄有关?使用共享单车情况与年龄列联表年轻人 非年轻人 合计单车族 非单车族 合计是“非年轻人”的人数为随机变量,X 求X 的分布列与期望. 参考数据:独立性检验界值表20()P K k ≥0.15 0.100.050.025 0.010k2.0722.7063.8415.0246.635其中,()()()()()2,n ad bc n a b c d K a b c d a c b d -=+++=++++(注:保留三位小数). 23.奶茶是年轻人非常喜欢的饮品.某机构对于奶茶的消费情况在一商圈附近做了一些调查,发现女性喜欢奶茶的人数明显高于男性,每月喝奶茶的次数也比男性高,但单次奶茶消费金额男性似乎明显高于女性.针对每月奶茶消费是否超过百元进行调查,已知在调查的200人中女性人数是男性人数的4倍,统计如下:超过百元 未超过百元 合计男8关?(2)在月消费超百元的调查者中,同时进行对于品牌喜好的调查.发现喜欢A 品牌的男女均为3人,现从喜欢A 品牌的这6人中抽取2人送纪念品,求这两人恰好都是女性的概率. 附:()()()()()2n ad bc K a b c d a c b d -=++++. 24.小张举办了一次抽奖活动.顾客花费3元钱可获得一次抽奖机会.每次抽奖时,顾客从装有1个黑球,3个红球和6个白球(除颜色外其他都相同)的不透明的袋子中依次不放回地摸出3个球,根据摸出的球的颜色情况进行兑奖.顾客中一等奖,二等奖,三等奖,四等奖时分别可领取的奖金为a 元,10元,5元,1元.若经营者小张将顾客摸出的3个球的颜色分成以下五种情况::1A 个黑球2个红球;:3B 个红球;:c 恰有1个白球;:D 恰有2个白球;:3E 个白球,且小张计划将五种情况按发生的机会从小到大的顺序分别对应中一等奖,中二等奖,中三等奖,中四等奖,不中奖.(1)通过计算写出中一至四等奖分别对应的情况(写出字母即可); (2)已知顾客摸出的第一个球是红球,求他获得二等奖的概率;(3)设顾客抽一次奖小张获利X 元,求变量X 的分布列;若小张不打算在活动中亏本,求a 的最大值.25.某花圃为提高某品种花苗质量,开展技术创新活动,在A ,B 实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图,记综合评分为80分及以上的花苗为优质花苗.(1)用样本估计总体,以频率作为概率,若在A ,B 两块实验地随机抽取3株花苗,求所抽取的花苗中优质花苗数的分布列和数学期望;(2)填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.优质花苗 非优质花苗 合计甲培育法 20乙培育法 10合计附:下面的临界值表仅供参考.20()P K k ≥0.050 0.010 0.001 0k 3.8416.63510.828(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)26.某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计 学习积极性高 18 7 25 学习积极性一般6 19 25 合计242650(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关?并说明理由.参考公式与临界值表:()()()()()22n ac bd K a b c d a c b d -=++++. P(K 2≥k) 0.100 0.050 0.025 0.010 0.001 k2.7063.8415.0246.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】利用相互独立事件的概率乘法公式求得 甲投进而乙没有投进的概率,以及乙投进而甲没有投进的概率,相加即得所求. 【详解】甲投进而乙没有投进的概率为343(1)4520⨯-=,乙投进而甲没有投进的概率为341(1)455-⨯=,故甲、乙各投篮一次,恰有一人投进球的概率是 31720520+=,故选:D 【点睛】本题主要考查了相互独立事件的概率乘法公式的应用,体现了分类讨论的数学思想,属于中档题.2.B解析:B 【解析】 【分析】设男生人数为,女生人数为,完善列联表,计算解不等式得到答案.【详解】设男生人数为,女生人数为喜欢抖音 不喜欢抖音 总计 男生女生总计男女人数为整数 故答案选B 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.3.D解析:D 【解析】分析:根据临界值表,确定犯错误的概率详解:因为根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关. 选D.点睛:本题考查卡方含义,考查基本求解能力.4.C解析:C 【解析】分析:根据列联表中数据,利用公式求得27.333k ≈,对照临界值即可的结果. 详解:根据所给的列联表, 得到()226025151557.333 6.63540203030k ⨯-⨯=≈>⨯⨯⨯,∴至少有0099的把握认为喜爱打篮球与性别有关,故选C.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.5.A解析:A 【解析】分析:根据所给的观测值,对照临界值表中的数据,即可得出正确的结论. 详解:∵观测值 4.328 3.841k ≈>, 而在观测值表中对应于3.841的是0.05,∴在犯错误的概率不超过0.05的前提下认为变量,X Y 有关系. 故选:A .点睛:本题考查了独立性检验的应用问题,是基础题.6.D解析:D 【解析】分析:由题意1A ,2A ,3A是两两互斥事件,条件概率公式求出1(|)P B A ,()()()()123P B P A B P A B P A B =++,对照选项即可求出答案.详解:由题意1A ,2A ,3A是两两互斥事件, ()()()12351213,,10210510P A P A P A =====, ()()()111177211|1112P BA P B A P A ⨯===,()23|11P B A =,()33|11P B A =,而()()()()123P B P A B P A B P A B =++()()()()()()112233|||P A P B A P A P B A P A P B A =++1713332115111011=⨯+⨯+⨯ 511=. 所以D 不正确. 故选:D.点睛:本题考查相互独立事件,解题的关键是理解题设中的各个事件,且熟练掌握相互独立事件的概率简洁公式,条件概率的求法,本题较复杂,正确理解事件的内蕴是解题的关键.7.D解析:D 【详解】分析:分别利用独立事件的概率公式求出恰在第一次、恰在第二次、恰在第三次落地打破的概率,然后由互斥事件的概率公式求解即可.详解:透镜落地3次,恰在第一次落地打破的概率为10.3P=,恰在第二次落地打破的概率为20.70.40.28P=⨯=,恰在第三次落地打破的概率为30.70.60.90.378P=⨯⨯=,∴落地3次以内被打破的概率1230.958P P P P=++=.故选D.点睛:本题主要考查互斥事件、独立事件的概率公式,属于中档题. 解答这类综合性的概率问题一定要把事件的独立性、互斥性结合起来,要会对一个复杂的随机事件进行分析,也就是说能把一个复杂的事件分成若干个互斥事件的和,再把其中的每个事件拆成若干个相互独立的事件的积,这种把复杂事件转化为简单事件,综合事件转化为单一事件的思想方法在概率计算中特别重要.8.D解析:D【解析】抛掷红、黄两枚骰子,第一个数字代表红色骰子,第二个数字代表黄色骰子,当红色骰子的点数为4或6时有(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)共12种,两颗骰子的点数之积大于20的种数有(4,6),6,4),(6,5),(6,6)4种,根据概率公式得,两颗骰子的点数之积大于20的概率41123P==.本题选择D选项.点睛:有关古典概型的概率问题,关键是正确求出基本事件总数和所求事件包含的基本事件数.(1)基本事件总数较少时,用列举法把所有基本事件一一列出时,要做到不重复、不遗漏,可借助“树状图”列举.(2)注意区分排列与组合,以及计数原理的正确使用.9.C解析:C【解析】由表可得样本中心点的坐标为11.54.5,4m+⎛⎫⎪⎝⎭,根据线性回归方程的性质可得11.5 0.7 4.50.354m+⨯+=,解出 2.5m=,故选C. 10.A解析:A【解析】2R值越大效果越好,所以选A.11.A解析:A【解析】由题意得,22100(10302040)4.762 3.84150503070K⨯-⨯=≈>⨯⨯⨯,又因为2 3.841)0.05(P K>=,所以犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”,故选A. 12.D解析:D【解析】由题意知,甲、乙都不被录取的概率为(1-0.6)(1-0.7)=0.12.∴至少有一人被录取的概率为1-0.12=0.88.故选D.考点:相互独立事件的概率.二、填空题13.09【分析】当乙连胜四局时对阵情况是第一局:甲对乙乙胜;第二局:乙对丙乙胜;第三局:乙对甲乙胜;第四局:乙对丙乙胜然后利用概率公式进行求解即可【详解】当乙连胜四局时对阵情况如下:第一局:甲对乙乙胜;解析:09.【分析】当乙连胜四局时,对阵情况是第一局:甲对乙,乙胜;第二局:乙对丙,乙胜;第三局:乙对甲,乙胜;第四局:乙对丙,乙胜,然后利用概率公式进行求解即可【详解】当乙连胜四局时,对阵情况如下:第一局:甲对乙,乙胜;第二局:乙对丙,乙胜;第三局:乙对甲,乙胜;第四局:乙对丙,乙胜.所求概率为P1=(1﹣0.4)2×0.52=0.32=0.09∴乙连胜四局的概率为0.09【点睛】考查运用概率知识解决实际问题的能力,相互独立事件是指,两事件发生的概率互不影响,而对立事件是指同一次试验中,不会同时发生的事件.14.【分析】由条件概率计算方式分别计算事件A:学生甲和乙都不是第一个出场且甲不是最后一个出场的基本事件个数其中分两类乙在最后与乙不在最后计数与事件AB的基本事件个数最后由公式求解即可【详解】设事件A:学解析:1 4【分析】由条件概率计算方式,分别计算事件A:“学生甲和乙都不是第一个出场,且甲不是最后一个出场”的基本事件个数,其中分两类乙在最后与乙不在最后计数,与事件AB的基本事件个数,最后由公式求解即可.【详解】设事件A :“学生甲和乙都不是第一个出场,且甲不是最后一个出场”;事件B :“学生丙第一个出场”,对事件A ,甲和乙都不是第一个出场,第一类:乙在最后,则优先从中间4个位置中选一 个给甲,再将余下的4个人全排列有1444C A ⋅种;第二类:乙没有在最后,则优先从中间4 个位置中选两个给甲乙,再将余下的4个人全排列有2444A A ⋅种,故总的有()14244444n A C A A A =⋅+⋅.对事件AB ,此时丙第一个出场,优先从除了甲以外的4人中选一人安排在最后,再将余下的4人全排列有1444C A ⋅种故()()()14441424444414n AB C A P B A n A C A A A ⋅===⋅+⋅. 故答案为:14【点睛】本题考查条件概率实际应用,属于中档题.15.(155)【解析】由题意可得:线性回归方程过样本中心点即线性回归方程所表示的直线必经过点(155)点睛:(1)正确理解计算的公式和准确的计算是求线性回归方程的关键(2)回归直线方程必过样本点中心解析:(1.5,5) 【解析】由题意可得:0123 1.54x +++==,826454y +++==, 线性回归方程过样本中心点,即线性回归方程ˆya bx =+所表示的直线必经过点(1.5,5) 点睛:(1)正确理解计算,b a 的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程y bx a =+必过样本点中心(),x y .16.【解析】前两个不是红灯第三个是红灯所以概率为 解析:427【解析】前两个不是红灯,第三个是红灯,所以概率为2114(1)3327-= 17.5【分析】分别求出原数据和新数据的样本中心点即可【详解】由回归直线方程过样本中心点可将代入得所以原数据的样本中心点为则去掉两组数据后的新数据的新数据的样本中心点为设新数据的回归直线方程为将代入得当时解析:5 【分析】分别求出原数据和新数据的样本中心点即可【详解】由回归直线方程过样本中心点(,)x y ,可将4y =代入 1.51y x =-+,得2x =-, 所以原数据的样本中心点为(2,4)-,则去掉两组数据( 1.7,2.9)-,( 2.3,5.1)-后的新数据的2( 1.7 2.3)22n x n '----==--,4(2.9 5.1)42n y n '-+==-,新数据的样本中心点为(2,4)-,设新数据的回归直线方程为y x a '''=-+,将(2,4)-代入得2a '=,∴当3x '=-时,5y '=.故答案为:5 【点睛】回归直线一定经过样本中心点(,)x y18.10【分析】计算代入回归直线方程与结合求解出的值【详解】依题意代入回归直线方程得①根据题意②解①②组成的方程组得故填【点睛】本小题主要考查回归直线方程过样本中心点考查方程的思想属于基础题解析:10 【分析】计算,x y ,代入回归直线方程,与20m n +=结合,求解出n 的值. 【详解】 依题意4030,55m n x y ++==,代入回归直线方程得30403.24055n m++=-⨯+①,根据题意20m n +=②,解①②组成的方程组得10m n ==,故填10. 【点睛】本小题主要考查回归直线方程过样本中心点(),x y ,考查方程的思想,属于基础题.19.【分析】事件为队三人有一人答错其余两人答对计算其概率事件为队三人人答错其余一人答对计算其概率再根据独立事件同时发生的概率公式求出【详解】队总得分为分即事件为队三人有一人答错其余两人答对其概率队得分即 解析:427【分析】事件M 为A 队三人有一人答错,其余两人答对,计算其概率()P M ,事件N 为B 队三人2人答错,其余一人答对,计算其概率()P N ,再根据独立事件同时发生的概率公式求出()P MN .【详解】A 队总得分为2分,即事件M 为A 队三人有一人答错,其余两人答对,其概率()2232241339P M C ⎛⎫⎛⎫=⨯-= ⎪ ⎪⎝⎭⎝⎭, “B 队得1分,即事件N 即为B 队三人2人答错,其余一人答对,则()22122221111111133333331333P N ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=-⨯-⨯+-⨯⨯-+⨯-⨯-= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭, A 队得2分B 队得一分,即事件,M N 同时发生,则()()()7491432P MN P M P N ==⨯=. 故答案为:427. 【点睛】本题考查了独立事件同时发生的概率计算,还考查了学生的分析理解能力,运算能力,属于中档题.20.88【分析】根据相互独立事件概率计算公式和对立事件的概率计算公式直接求解即可【详解】"至少有一个公司不需要维护"的对立事件是"两公司都需要维护"所以至少有一个公司不需要维护的概率为故答案为088【点解析:88 【分析】根据相互独立事件概率计算公式和对立事件的概率计算公式直接求解即可. 【详解】"至少有一个公司不需要维护"的对立事件是"两公司都需要维护", 所以至少有一个公司不需要维护的概率为10.30.40.88p =-⨯=, 故答案为0.88. 【点睛】本题主要考查概率的求法以及相互独立事件概率计算公式和对立事件的概率计算公式的应用.三、解答题21.(1)2081;(2)分布列见解析,()23681E X =. 【分析】(1)利用事件的独立性,分两种情况,恰 好打了7局小明获胜和恰好打了7局小亮获胜,再概率相加即可.(2)X 的可能取值为2,3,4,5,利用二项分布,分别求出其相应的概率,列出分布列即可. 【详解】(1)恰 好打了7局小明获胜的概率是525416721152C 333P ⨯⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭,恰好打了7局小亮获胜的概率为252426721152333P C ⨯⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭, ∴比赛结束时恰好打了7局的概率为5212715215220381P P P ⨯+⨯=+==. (2)X 的可能取值为2,3,4,5,()224239P X ⎛⎫=== ⎪⎝⎭,()2312321283C 33327P X ⎛⎫==⨯⨯==⎪⎝⎭, ()2241434421113134C C 333381P X ⎛⎫⎛⎫⎛⎫==⨯⨯+⨯== ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭, ()2341344521212485C C 3333381P X ⎛⎫⎛⎫⎛⎫==⨯⨯+⨯⨯== ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭ 或()334421885C 33381P X ⎛⎫==⨯⨯== ⎪⎝⎭. ∴X 的分布列如下:()2345927818181E X =⨯+⨯+⨯+⨯=.【点睛】方法点睛:求解离散型随机变量X 的分布列的步骤:①理解X 的意义,写出X 可能取的全部值;②求X 取每个值的概率;③写出X 的分布列.求离散型随机变量的分布列的关键是求随机变量所取值对应的概率.22.(1)表格见解析,有;(2)分布列见解析,0.3. 【分析】(1)补全的列联表,利用公式求得2 4.167 3.841K ≈>,即可得到结论;(2)由(1)的列联表可知,经常使用单车的“非年轻人”的概率,即可利用独立重复试验求解随机变量X 取每个数值的概率,列出分布列,求解数学期望. 【详解】(1)补全的列联表如下:()24002004012040 4.167 3.84124016032080K ⨯⨯-⨯=≈>⨯∴⨯⨯,(2K 要求保留三位小数,否则扣一分)即有95%的把握可以认为经常使用共享单车与年龄有关. (2)由(1)的列联表可知,既是“单车族”又是“非年轻人”占样本总数的频率为40100%10%400⨯=, 即在抽取的用户中既是“单车族”又是“非年轻人”的概率为0.1, 随机变量X 可取0,1,2,3()()330010. 10.729,P X C ==-=()()211310.110.10.243P X C ==-=()()12320.1210.10.027,P X C ==-=()33330.130.001,P X C ===则()~3,0.1,X BX ∴的分布列为X ∴的数学期望30.10.3E X =⨯=.【点睛】方法点睛:本题主要考查了22⨯列联表,独立性检验,二项分布,二项分布的期望,解题方法如下:(1)根据题意,找出对应数据,补全列联表,求得K2K2的值,对比数据,得出结论; (2)根据题意,得到经常使用单车的“非年轻人”的概率,之后利用独立重复试验,结合二项分布的相关公式求得结果. 23.(1)表格见解析,有;(2)15. 【分析】(1)设男性每月奶茶消费未超过百元的人数为x ,根据题中条件得出关于x 的方程,解出x 的值,进而可完善22⨯列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)设喜欢A 品牌的女性为1A 、2A 、3A ,男性为1B 、2B 、3B ,利用列举法列举出所有的基本事件,并确定事件“这两人恰好都是女性”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率. 【详解】(1)设男性每月奶茶消费未超过百元的人数为x ,则()848200x x +++=,32x ∴=,2K 的观测值()200814432161003.030 2.706401602417633k ⨯-⨯==≈>⨯⨯⨯,因此,有90%的把握认为月消费奶茶超过百元与性别有关.(2)设喜欢A 品牌的女性为1A 、2A 、3A ,男性为1B 、2B 、3B ,从喜欢A 品牌的这6人中抽取2人送纪念品,所有的基本事件有:()12,A A 、()13,A A 、()11,A B 、()12,A B 、()13,A B 、()23,A A 、()21,A B 、()22,A B 、()23,A B 、()31,A B 、()32,A B 、()33,A B 、()12,B B 、()13,B B 、()23,B B ,共15种,设“这两人恰好都是女性”为事件M ,则事件M 包含的基本事件有:()12,A A 、()13,A A 、()23,A A ,共3种,()31155P M ∴==, 因此,抽取的这两人恰好都是女性的概率为15. 【点睛】方法点睛:求解古典概型概率的方法如下: (1)列举法; (2)列表法; (3)数状图法; (4)排列组合数的应用.24.(1)中一至四等奖分别对应的情况是,,,B A E C .(2)118;(3)194. 【分析】(1)求出一至四等奖的概率,即可写出分别对应的类别;(2)顾客摸出的第一个球是红球的条件下,利用条件概率计算公式即可得出他获得二等奖的概率.(3)若经营者不打算在这个游戏的经营中亏本,求出分布列得到期望,即可求a 的最大值. 【详解】。
统计和概率经典例题(含答案解析和解析)
统计与概率经典例题(含答案及解析)1.(本题8分)为了解学区九年级学生对数学知识的掌握情况,在一次数学检测中,从学区2000名九年级考生中随机抽取部分学生的数学成绩进行调查,并将调查结果绘制成如下图表:⑴表中a和b所表示的数分别为:a= .,b= .;⑵请在图中补全频数分布直方图;⑶如果把成绩在70分以上(含70分)定为合格,那么该学区2000名九年级考生数学成绩为合格的学生约有多少名?2.为鼓励创业,市政府制定了小型企业的优惠政策,许多小型企业应运而生,某镇统计了该镇1﹣5月新注册小型企业的数量,并将结果绘制成如下两种不完整的统计图:(1)某镇今年1﹣5月新注册小型企业一共有家.请将折线统计图补充完整;(2)该镇今年3月新注册的小型企业中,只有2家是餐饮企业,现从3月新注册的小型企业中随机抽取2家企业了解其经营状况,请用列表或画树状图的方法求出所抽取的2家企业恰好都是餐饮企业的概率.3.(12分)一个不透明的口袋装有若干个红、黄、蓝、绿四种颜色的小球,小球除颜色外完全相同,为估计该口袋中四种颜色的小球数量,每次从口袋中随机摸出一球记下颜色并放回,重复多次试验,汇总实验结果绘制如图不完整的条形统计图和扇形统计图.根据以上信息解答下列问题:(1)求实验总次数,并补全条形统计图;(2)扇形统计图中,摸到黄色小球次数所在扇形的圆心角度数为多少度?(3)已知该口袋中有10个红球,请你根据实验结果估计口袋中绿球的数量.4.(本题10分)某校为了解2014年八年级学生课外书籍借阅情况,从中随机抽取了40名学生课外书籍借阅情况,将统计结果列出如下的表格,并绘制成如图所示的扇形统计图,其中科普类册数占这40名学生借阅总册数的40%.类别科普类教辅类文艺类其他册数(本)128 80 m 48(1)求表格中字母m的值及扇形统计图中“教辅类”所对应的圆心角a的度数;(2)该校2014年八年级有500名学生,请你估计该年级学生共借阅教辅类书籍约多少本?5.(10分)将如图所示的版面数字分别是1,2,3,4的四张扑克牌背面朝上,洗匀后放在桌面上(“A”看做是“1”)。
19统计与统计案例 Word版含解析
A .26,16,8B .25,17,8C .25,16,9D .24,17,96.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x -甲、x -乙,中位数分别为m 甲、m 乙,则( )A.x -甲<x -乙,m 甲>m 乙B.x -甲<x -乙,m 甲<m 乙C.x -甲>x -乙,m 甲>m 乙D.x -甲>x -乙,m 甲<m 乙7.[2018·江西南城一中、高安中学等九校3月联考]随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线 一线 总计愿生 45 20 65不愿生 13 22 35总计 58 42 100由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),得K 2=100×(45×22-20×13)265×35×58×42≈9.616. 参照下表,P (K 2≥k ) 0.050 0.010 0.001k 3.841 6.635 10.828正确的结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿公式b =∑i =1n x i y i -n x -y-∑i =1n x 2i-n x -2=∑i =1n(x i -x -)(y i -y -)∑i =1n (x i -x -)2,a =y --b x -)正确命题的个数为( )A .1B .2C .3D .410.[2018·济南市高考模拟考试]如图,茎叶图记录了甲、乙两名射击运动员的5次训练成绩(单位:环),则成绩较为稳定的那位运动员成绩的方差为________.11.[2018·南昌市第二次模拟]从某企业的某种产品中抽取1000件,测量该种产品的一项质量指标值,由测量结果得到如图所示的频率分布直方图.若该产品的这项指标值在[185,215)内,则该产品的这项指标合格,估计该企业这种产品在这项指标上的合格率为________.12.[2018·东北三省四市教研联合体高考模拟试卷(一)]为了解天气转冷时期居民电量使用情况,某调查人员由下表统计数据计算出的回归方程为y ^=-2.11x +61.13,现表中一个数据被污损,则被污损的数据为________.(结果保留整数)气温x /℃ 18 13 10 -1用电量y /度 24 34 · 6413.[2018·武汉市高中毕业生二月调研测试]从某工厂的一个车间抽取某种产品50件,产品尺寸(单位:cm)落在各个小组的频数分布如下表:数据 分组 [12.5, 15.5) [15.5, 18.5) [18.5, 21.5) [21.5, 24.5) [24.5, 27.5) [27.5, 30.5) [30.5, 33.5) 频数 3 8 9 12 10 5 3(1)根据频数分布表,估计该产品尺寸落在[27.5,33.5)内的概率;(2)求这50件产品尺寸的样本平均数x -(同一组中的数据用该组区间的中点值作代表);(3)根据频数分布对应的直方图,可以认为这种产品尺寸z服从正态分布N (μ,σ2),其中μ近似为样本平均数x -,σ2近似为样本方差s 2,经计算得s 2=22.41.利用该正态分布,求P (z ≥27.43).附:①若随机变量z 服从正态分布N (μ,σ2),则P (μ-σ<z <μ+σ)=0.682 7,P (μ-2σ<z <μ+2σ)=0.954 5; ② 22.41≈4.73.14.[2018·广州市普通高中毕业班综合测试]某地1~10岁男童年龄x i (单位:岁)与身高的中位数y i (单位:cm)(i =1,2,…,10)如下表:x /岁 1 2 3 4 5 6 7 8 9 10 y /c m 76.5 88.5 96.8 104.1 111.3 117.7 124.0 130.0 135.4 140.2对上表的数据作初步处理,得到下面的散点图及一些统计量的值.x -y - 101i =∑ (x i -x -)2 101i =∑ (y i -y -)2 101i =∑ (x i -x -)(y i -y -) 5.5 112.4582.50 3 947.71 566.85 (1)求y 关于x 的线性回归方程(线性回归方程系数精确到0.01);(2)某同学认为y =px 2+qx +r 更适宜作为y 关于x 的回归方程类型,他求得的回归方程是y =-0.30x 2+10.17x +68.07.经调查,该地11岁男童身高的中位数为145.3 cm.与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?附:回归方程y ^=a ^+b ^x 中的斜率和截距的最小二乘估计公式分别为:b ^=,a ^=y --b ^x -.15.[2018·武汉市高中毕业生调研]某市高中某学科竞赛中,某区4 000名考生的参赛成绩的频率分布直方图如图所示.(1)求这4 000名考生的平均成绩x -(同一组中数据用该组区间中点值作代表);(2)记70分以上为合格,70分及以下为不合格,结合频率分布直方图完成下表,并判断是否有99%的把握认为该学科竞赛成绩与性别有关?不合格 合格 合计男生 720女生 1 020合计4 000 附:P (K 2≥k 0) 0.010 0.005 0.001k 0 6.635 7.879 10.828K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ). 16.[2018·太原市高三年级模拟试题(一)]某校倡导为特困学生募捐,要求在自动购水机处每购买一瓶矿泉水,便自觉向捐款箱中至少投入一元钱.现负责老师统计了连续5天售出矿泉水的箱数和捐款箱中的收入情况,列表如下:售出矿泉水量x /箱7 6 6 5 6 收入y /元165 142 148 125 150 学校计划将所得的捐款以奖学金的形式奖励给品学兼优的特困生,规定:综合考核前20名的特困生获一等奖学金500元;综合考核21~50名的特困生获二等奖学金300元;综合考核50名以后的特困生不获得奖学金.(1)若x 与y 成线性相关,则某天售出9箱矿泉水时,预计捐款箱中的收入为多少元?(2)甲、乙两名学生获一等奖学金的概率均为25,获二等奖学金的概率均为13,不获得奖学金的概率均为415,已知甲、乙两名学生获得哪个等级的奖学金相互独立,求甲、乙两名学生所获得奖学金之和X 的分布列及数学期望.附:回归方程y ^=b ^x +a ^,其中b ^=,a ^=y --b ^x -.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计与统计案例A 级 基础一、选择题1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n =( )A .860B .720C .1 020D .1 0402.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( )A .13B .19C .20D .513.“关注夕阳、爱老敬老”——某爱心协会从2013年开始每年向敬老院捐赠物资和现金,下表记录了第x 年(2013年是第一年)与捐赠的现金y (单位:万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程y ^=mx +0.35,则预测2019年捐赠的现金大约是( )A.5万元C .5.25万元D .5.5万元4.如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A.3,5 B.5,5 C.3,7 D.5,75.(2019·衡水中学检测)某超市从2019年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下:记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s21,s22,则频率分布直方图(甲)中的a的值及s21与s22的大小关系分别是()A.a=0.015,s21<s22B.a=0.15,s21>s22C.a=0.015,s21>s22D.a=0.15,s21<s22二、填空题6.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.7.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.8.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:分类女男总计喜爱402060不喜爱203050总计6050110________的前提下(约有________的把握)认为“喜爱该节目与否和性别有关”.参考附表:P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.828,其中n (参考公式:K2=(a+b)(c+d)(a+c)(b+d)=a+b+c+d)三、解答题9.微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成2×2的列联表,并判断是否有90%的把握认为“微信控”与“性别”有关?10.(2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数1324926 5日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6) 频数15131016 5布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表).B 级 能力提升11.对某两名高三学生在连续9次数学测试中的成绩(单位:分)进行统计得到如下折线图,下面是关于这两位同学的数学成绩分析.①甲同学的成绩折线图具有较好的对称性,故平均成绩为130分;②根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在区间[110,120]内;③乙同学的数学成绩与测试次号具有比较明显的线性相关性,且为正相关;④乙同学连续九次测验成绩每一次均有明显进步. 其中正确的结论,有________(填写正确的序号).12.(2019·天一大联考)某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了50名购买该家电的消费者,让他们根据实际使用体验进行评分.(1)设消费者的年龄为x ,对该款智能家电的评分为y .若根据统计数据,用最小二乘法得到y 关于x 的线性回归方程为y ^=1.2x +40,且年龄x 的方差为s 2x =14.4,评分y 的方差为s 2y =22.5.求y 与x 的相关系数r ,并据此判断对该款智能家电的评分与年龄的相关性强弱;(2)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为“好评”和“差评”,整理得到如下数据,请判断是否有99%的把握认为对该智能家电的评价与年龄有关.分类 好评 差评 青年 8 16 中老年206附:线性回归直线y ^=b ^x +a ^的斜率b ^=;相关系数r = .独立性检验中的K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d ),其中n =a +b +c +d .临界值表:P (K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828A 级 基础一、选择题1.解析:依题意,分层抽样比为301 200=140.所以81=140(1 000+1 200+n ),解得n =1 040.答案:D2.解析:由系统抽样的原理知,抽样的间隔为52÷4=13,故抽取的样本的编号分别为7,7+13,7+13×2,7+13×3,即7号,20号,33号,46号.所以样本中还有一位同学的编号为20号. 答案:C3.解析:由统计表格,知x -=4.5,y -=3.5, 所以3.5=4.5m +0.35,则m =0.7, 因此y ^=0.7x +0.35,当x =7时,y ^=0.7×7+0.35=5.25(万元), 故2019年捐赠的现金大约是5.25万元. 答案:C4.解析:由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y =5.由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也为66,从而有56+62+65+74+70+x5=66,解得x =3.答案:A5.解析:由(0.020+0.010+0.030+a +0.025)×10=1,得a =0.015.根据频率分布直方图,乙中较稳定,则s 21>s 22.答案:C 二、填空题6.解析:x -=10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98. 答案:0.987.解析:依题意,可将编号为1~35号的35个数据分成7组,每组有5个数据.在区间[139,151]上共有20个数据,分在4个小组内,每组抽取1人,共抽取4人.答案:48.解析:根据列联表中数据,可得K 2的观测值k =110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以在犯错误的概率不超过0.01的前提下(约有99%的把握)认为“喜爱该节目与否和性别有关”.答案:0.01 99% 三、解答题9.解:(1)女性平均使用微信的时间为:0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76(小时). (2)由已知得:2(0.04+a +0.14+2×0.12)=1, 解得a =0.08. 由题设条件得列联表男性 38 12 50 女性 30 20 50 总计6832100所以K 2=(a +b )(c +d )(a +c )(b +d )=100(38×20-30×12)250×50×68×32≈2.941>2.706.所以有90%的把握认为“微信控”与“性别”有关. 10.解:(1)所求的频率分布直方图如下:(2)根据以上数据,该家庭使用节水龙头后,日用水量小于0.35 m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35 m 3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天的日用水量的平均数为x -1=150(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天的日用水量的平均数为 x -2=150(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m 3).B 级 能力提升11.解析:①甲同学的成绩折线图具有较好的对称性,最高130分,平均成绩低于130分,①错误;②根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在区间[110,120]内,②正确;③乙同学的数学成绩与测试次号具有比较明显的线性相关性,且为正相关,③正确;④乙同学在这连续九次测验中第四次、第七次成绩较上一次成绩有退步,故④不正确.答案:②③12.解:(1)相关系数r ===b ^·50s 2x 50s 2y=1.2×1215=0.96. 故对该款智能家电的评分与年龄的相关性较强.(2)由2×2列联表得K 2=50×(8×6-20×16)224×26×28×22≈9.624>6.635. 故有99%的把握认为对该智能家电的评价与年龄有关.。