十年高考理科数学真题 专题十一 概率与统计 三十三 回归分析与独立性检验及答案
十年真题-概率-全国高考理科数学
真题2008-20.(12分)已知5只动物中有1只患有某种疾病,需要通过化验血液来确定患病的动物.血液化验结果呈阳性的即为患病动物,呈阴性即没患病.下面是两种化验方法: 方案甲:逐个化验,直到能确定患病动物为止.方案乙:先任取3只,将它们的血液混在一起化验.若结果呈阳性则表明患病动物为这3只中的1只,然后再逐个化验,直到能确定患病动物为止;若结果呈阴性则在另外2只中任取1只化验.(I )求依方案甲所需化验次数不少于依方案乙所需化验次数的概率;(II比表示依方案乙所需化验次数,求己的期望.2009-1 9 (1 2 分)甲、乙二人进行一次围棋比赛,约定先胜3局者获得这次比赛的胜利,比赛结束,假设在一局中,甲获胜的概率为0.6,乙获胜的概率为0.4,各局比赛结果相互独立。
已知前2局中,甲、乙各胜1局。
(1)求甲获得这次比赛胜利的概率;(2)设£表示从第3局开始到比赛结束所进行的局数,求£的分布列及数学期望。
2010-18( 12分)投到某杂志的稿件,先由两位初审专家进行评审.若能通过两位初审专家的评审,则予以录用;若两位初审专家都未予通过,则不予录用;若恰能通过一位初审专家的评审,则再由第三位专家进行复审,若能通过复审专家的评审,则予以录用,否则不予录用.设稿件能通过各初审专家评审的概率均为0.5,复审的稿件能通过评审的概率为0.3.各专家独立评审.(I)求投到该杂志的1篇稿件被录用的概率;(II)记X表示投到该杂志的4篇稿件中被「录用的篇数,求X的分布列及期望.2 Oil- 1 9(12 分)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测试了每件产品的质量指标值,得到下面试验结果:(I )分别估计用A配方,B配方生产的产品的优质品率;(II)已知用B配方生成的一件产品的利润y (单位:元)与其质量指标值t的关系式为¥= - Z 94 W / < 102,4, ; ^ 302.从用B配方生产的产品中任取一件,其利润记为X (单位:元),求X的分布列及数学期望.(以实验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)201 2 -18.(12 分)某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的「价格出售,如果当天卖不完,剩下的玫瑰花作垃圾处理。
十年高考理科数学真题 专题十一 概率与统计 三十二 统计初步(1)及答案(推荐)
专题十一概率与统计第三十二讲统计初步2019年1 (2019全国II理5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数B.平均数C.方差D.极差2(2019全国II理13)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为__________.3(2019全国III理17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).4(2019浙江7)设0<a<1,则随机变量X的分布列是则当a在(0,1)内增大时A.D(X)增大B.D(X)减小C.D(X)先增大后减小D.D(X)先减小后增大5.(2019江苏5)已知一组数据6,7,8,8,9,10,则该组数据的方差是.2010-2018年一、选择题1.(2018全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例建设后经济收入构成比例则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半2.(2017新课标Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳3.(2017江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.4.(2016年山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是A.56 B.60 C.120 D.1405.(2016年全国III)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图。
玩转高中数学研讨 第33讲 回归分析与独立性检验
专题十一 概率与统计第三十三讲 回归分析与独立性检验1.(2020•全国1卷)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A. y a bx =+B. 2y a bx =+C. e xy a b =+D. ln y a b x =+【答案】D【解析】根据散点图的分布可选择合适的函数模型.【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+.故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.2.(2020•全国2卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i i y ==∑,2021)80i i x x =-=∑(,2021)9000i iy y =-=∑(,201))800i i i x y x y =--=∑((.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);附:相关系数r =12211))))ni iiiin ni i x y x x y y y x ===----∑∑∑((((,≈1.414.【答案】(1)12000;(2)0.94;(3)详见解析【解析】(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;(2)利用公式20120202211()()()()iii iii i x x y y r x x y y ===--=--∑∑∑计算即可;(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.【详解】(1)样区野生动物平均数为201111200602020i i y ==⨯=∑, 地块数为200,该地区这种野生动物的估计值为2006012000⨯= (2)样本(,)i i x y (i =1,2,…,20)的相关系数为20120202211()()220.94809000()()iii iii i x x y y r x x y y ===--===≈⨯--∑∑∑(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性, 由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大, 采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性, 从而可以获得该地区这种野生动物数量更准确的估计.【点晴】本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,是一道容易题.3.(2020•全国3卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,【答案】(1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09;(2)350;(3)有,理由见解析. 【解析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为1、2、3、4的概率; (2)利用每组的中点值乘以频数,相加后除以100可得结果;(3)根据表格中的数据完善22⨯列联表,计算出2K 的观测值,再结合临界值表可得结论.【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=; (2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯= (3)22⨯列联表如下:()221003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.4.(2020•新全国1山东)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO浓度不超过150”的概率;(2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO浓度有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,2()P K k≥0.050 0.010 0.001k 3.841 6.635 10.828 【答案】(1)0.64;(2)答案见解析;(3)有. 【解析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据可得22⨯列联表; (3)计算出2K ,结合临界值表可得结论.【详解】(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的天数有32618864+++=天,所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的概率为640.64100=; (2)由所给数据,可得22⨯列联表为:(3)根据22⨯列联表中的数据可得222()100(64101610)()()()()80207426n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯36007.4844 6.635481=≈>,因为根据临界值表可知,有99%的把握认为该市一天空气中 2.5PM 浓度与2SO 浓度有关.【点睛】本题考查了古典概型的概率公式,考查了完善22⨯列联表,考查了独立性检验,属于中档题.2016-2019年1.(2017山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为 A .160 B .163 C .166 D .1702.(2018全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5=-+y t ;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5=+y t . (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.3.(2016年全国III)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:719.32ii y==∑,7140.17i i i t y ==∑721()0.55ii y y =-=∑7≈2.646.参考公式:相关系数()()niit t y y r --=∑ 回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:121()()()niii ni i t t y y b t t ==--=-∑∑,=.a y bt -答案部分1.C 【解析】因为22.5x =,160y =,所以160422.570a =-⨯=,42470166y =⨯+=,选C . 2.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为ˆ30.413.519226.1y=-+⨯=(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为ˆ9917.59256.5y=+⨯=(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线30.413.5y t =-+上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型ˆ9917.5yt =+可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分. 3.【解析】(Ⅰ)由折线图这数据和附注中参考数据得4=t ,28)(712=-∑=i i t t ,55.0)(712=-∑=i iy y,40.1749.32 2.89==-⨯=,99.0646.2255.089.2≈⨯⨯≈r .因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关相当高,从而可以用线性回归模型拟合y 与t 的关系.(Ⅱ)由331.1732.9≈=y 及(Ⅰ)得71721()()2.89ˆ0.10328()ii i ii tt y y b tt ==--==≈-∑∑, 92.04103.0331.1ˆˆ≈⨯-≈-=t b y a. 所以,y 关于t 的回归方程为:t y10.092.0ˆ+=. 将2016年对应的9=t 代入回归方程得:82.1910.092.0ˆ=⨯+=y. 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.。
十年高考统计与概率分析
2015(Ⅱ) 作图 2013(Ⅱ) 频率分布直方图 2014(Ⅰ) 频率分布直方图 2015(Ⅰ) 散点图 2015(Ⅱ) 茎叶图 2016(Ⅰ) 频率分布直方图 2016(Ⅲ) 折线图 2017(Ⅱ) 频率分布直方图 2017(Ⅱ) 折线图 2018(Ⅲ) 茎叶图
表4-概率计算统计
以购买易损零件所需要的期望值为决策依据,在n=19 与n=20之中选其一,应选用哪个?
以检验费用与赔偿费用和的期望值为决策依据,是否 该对这箱余下的所有产品做检验?
2017(Ⅰ) 试说明上述监控生产过程方法的合理性. 2018(Ⅰ)
2018(Ⅱ) 你认为用哪个模型得到的预测值更可靠?并说明理由.
表3-统计决断问题统计
试题年份 图形类型 考查内容
2009 2009
作图 频率分布直方图
作频率分布直方图 作茎叶图 估计方差,计算平均数 计算概率与方差 计算平均数与方差 求回归方程 估计平均值与分散程度 求分布列 回归分析,相关系数 计算概率,2×2列联表,中 位数 回归分析,统计推断 计算平均数,中位数,2×2 列联表
表5-与函数结合统计
年份 函数类型 问题描述
2011 2012
分段函数购进16枝玫瑰花,求 当天的利润y(单位:元)关于需 求量n(单位:份,n∈N)的函 数解析式 将T表示为X的函数 计算二次型函数的最值 求进货量n为多少时期望达到最大 值 求f(p)的最大值点p0
回归方程 非线性回归方程从统计 的角度计算二次型函数 的最值 茎叶图、从统计的角度 计算概率 分布列、从统计的角度 求最值、统计推断 从统计角度计算概率、 条件概率、期望 相关关系、回归直线方 程
频率分布直方图 232 表格 散点图 222 341
2015(Ⅱ) 18
专题十一《概率与统计》
专题十一概率与统计概率统计抛开了数学中的“确定性”,以“不确定”的视角做出量化的、不确定性的推测,是不同与其它数学知识的重要特征.未来的众多社会规律,也都需要利用概率统计的方法去探究,所以概率统计对社会的良性和稳定发展必将起到至关重要的作用.高考以更加贴近学生日常生活的概率统计背景加强对概率统计知识的考查,也说明了高考改革的方向将更加生活化和理性化,更加贴合学生的日常.这也是提醒我们要自觉养成用“不确定性”眼光去研究生活、看待世界的习惯.一、真题再现(一)统计部分1.(2019年新课标Ⅱ理科)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差【分析】根据题意,由数据的数字特征的定义,分析可得答案.【解答】解:根据题意,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,最中间的一个数不变,即中位数不变,故选:A.【点评】本题考查数据的数字特征,关键是掌握数据的平均数、中位数、方差、极差的定义以及计算方法,属于基础题.2.(2019年新课标Ⅰ文科)某学校为了解1000名新生的身体素质,将这些学生编号1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生【分析】根据系统抽样的特征,从1000名学生从中抽取一个容量为100的样本,抽样的分段间隔为10,结合从第4组抽取的号码为46,可得第一组用简单随机抽样抽取的号码.【解答】解:∵从1000名学生从中抽取一个容量为100的样本,∴系统抽样的分段间隔为=10,∵46号学生被抽到,则根据系统抽样的性质可知,第一组随机抽取一个号码为6,以后每个号码都比前一个号码增加10,所有号码数是以6为首项,以10为公差的等差数列,设其数列为{a n},则a n=6+10(n﹣1)=10n﹣4,当n=62时,a62=616,即在第62组抽到616.故选:C.【点评】本题考查了系统抽样方法,关键是求得系统抽样的分段间隔.3.(2019年江苏)已知一组数据6,7,8,8,9,10,则该组数据的方差是.【分析】先求出一组数据6,7,8,8,9,10的平均数,由此能求出该组数据的方差.【解答】解:一组数据6,7,8,8,9,10的平均数为:=(6+7+8+8+9+10)=8,∴该组数据的方差为:S2=[(6﹣8)2+(7﹣8)2+(8﹣8)2+(8﹣8)2+(9﹣8)2+(10﹣8)2]=.故答案为:.【点评】本题考查一组数据的方差的求法,考查平均数、方差等基础知识,考查运算求解能力,是基础题.4.(2019年新课标Ⅲ文理科)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该学校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.8【分析】作出维恩图,得到该学校阅读过《西游记》的学生人数为70人,由此能求出该学校阅读过《西游记》的学生人数与该学校学生总数比值的估计值.【解答】解:某中学为了了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,作出维恩图,得:∴该学校阅读过《西游记》的学生人数为70人,则该学校阅读过《西游记》的学生人数与该学校学生总数比值的估计值为:=0.7.故选:C.【点评】本题考查该学校阅读过《西游记》的学生人数与该学校学生总数比值的估计值的求法,考查维恩图的性质等基础知识,考查推理能力与计算能力,属于基础题.5.(2019年新课标Ⅱ文科)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[﹣0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:≈8.602.【分析】(1)根据频数分布表计算即可;(2)根据平均值和标准差计算公式代入数据计算即可.【解答】解:(1)根据产值增长率频数表得,所调查的100个企业中产值增长率不低于40%的企业为:=0.21=21%,产值负增长的企业频率为:=0.02=2%,用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%;(2)企业产值增长率的平均数(﹣0.1×2+0.1×24+0.3×53+0.5×14+0.7×7)=0.3=30%,产值增长率的方差s2==[(﹣0.4)2×2+(﹣0.2)2×24+02×53+0.22×14+0.42×7]=0.0296,∴产值增长率的标准差s=≈0.17,∴这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.【点评】本题考查了样本数据的平均值和方差的求法,考查运算求解能力,属基础题.6.(2019年新课标Ⅲ文理科)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【分析】(1)由频率分布直方图的性质列出方程组,能求出乙离子残留百分比直方图中a,b.(2)利用频率分布直方图能估计甲离子残留百分比的平均值和乙离子残留百分比的平均值.【解答】解:(1)C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.则由频率分布直方图得:,解得乙离子残留百分比直方图中a=0.35,b=0.10.(2)估计甲离子残留百分比的平均值为:=2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值为:=3×0.05+4×0.1+5×0.15+6×0.35+7×0.2+8×0.15=6.00.【点评】本题考查频率、平均值的求法,考查频率分布直方图的性质等基础知识,考查推理能力与计算能力,属于基础题.7.(2019年新课标Ⅰ文科)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2=.P(K2≥k)0.0500.0100.001 k 3.841 6.63510.828【分析】(1)由题中数据,结合等可能事件的概率求解;(2)代入计算公式:K2=,然后把所求数据与3.841进行比较即可判断.【解答】解:(1)由题中数据可知,男顾客对该商场服务满意的概率P==,女顾客对该商场服务满意的概率P==;(2)由题意可知,K2==≈4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.【点评】本题主要考查了等可能事件的概率求解及独立性检验的基本思想的应用,属于基础试题.(二)概率部分1.(2019年江苏)从3名男同学和2名女同学中任选2名同学参加志愿者服务,则选出的2名同学中至少有1名女同学的概率是.【分析】基本事件总数n==10,选出的2名同学中至少有1名女同学包含的基本事件个数m=+=7,由此能求出选出的2名同学中至少有1名女同学的概率.【解答】解:从3名男同学和2名女同学中任选2名同学参加志愿者服务,基本事件总数n==10,选出的2名同学中至少有1名女同学包含的基本事件个数:m=+=7,∴选出的2名同学中至少有1名女同学的概率是p=.故答案为:.【点评】本题考查概率的求法,考查古典概型、排列组合等基础知识,考查运算求解能力,考查数形结合思想,是基础题.2.(2019年新课标Ⅲ文科)两位男同学和两位女同学随机排成一列,则两位女同学相邻的概率是()A.B.C.D.【分析】利用古典概型求概率原理,首先用捆绑法将两女生捆绑在一起作为一个人排列找出分子,再全部排列找到分母,可得到答案.【解答】解:方法一:用捆绑法将两女生捆绑在一起作为一个人排列,有A33A22=12种排法,再所有的4个人全排列有:A44=24种排法,利用古典概型求概率原理得:p==,方法二:假设两位男同学为A、B,两位女同学为C、D,所有的排列情况有24种,如下:(ABCD)(ABDC)(ACBD)(ACDB)(ADCB)(ADBC)(BACD)(BADC)(BCAD)(BCDA)(BDAC)(BDCA)(CABD)(CADB)(CBAD)(CBDA)(CDAB)(CDBA)(DABC)(DACB)(DBAC)(DBCA)(DCAB)(DCBA)其中两位女同学相邻的情况有12种,分别为(ABCD)、(ABDC)、(ACDB)、(ADCB)、(BACD)、(BADC)、(BCDA)、(BDCA)、(CDAB)、(CDBA)、(DCAB)、(DCBA),故两位女同学相邻的概率是:p==,故选:D.【点评】本题考查排列组合的综合应用.考查古典概型的计算.3.(2019年新课标Ⅰ理科)我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“”和阴爻“”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是()A.B.C.D.【分析】基本事件总数n=26=64,该重卦恰有3个阳爻包含的基本个数m==20,由此能求出该重卦恰有3个阳爻的概率.【解答】解:在所有重卦中随机取一重卦,基本事件总数n=26=64,该重卦恰有3个阳爻包含的基本个数m==20,则该重卦恰有3个阳爻的概率p===.故选:A.【点评】本题考查概率的求法,考查古典概型、排列组合等基础知识,考查运算求解能力,是基础题.4.(2019年新课标Ⅱ文科)生物实验室有5只兔子,其中只有3只测量过某项指标.若从这5只兔子中随机取出3只,则恰有2只测量过该指标的概率为()A.B.C.D.【分析】本题根据组合的概念可知从这5只兔子中随机取出3只的所有情况数为,恰有2只测量过该指标是从3只侧过的里面选2,从未测的选1,组合数为.即可得出概率.【解答】解:法一:由题意,可知:根据组合的概念,可知:从这5只兔子中随机取出3只的所有情况数为,恰有2只测量过该指标的所有情况数为.∴p==.法二:设其中做过测试的3只兔子为a,b,c,剩余的2只为A,B,则从这5只中任取3只的所有取法有{a,b,c},{a,b,A},{a,b,B},{a,c,A},{a,c,B},{a,A,B},{b,c,A},{b,c,B},{b,A,B},{c,A,B}10种,其中恰好有两只做过测试的取法有{a,b,A},{a,b,B},{a,c,A},{a,c,B},{b,c,A},{b,c,B}6种,故恰有两只做过测试的概率为=.故选:B.【点评】本题主要考查组合的相关概念及应用以及简单的概率知识,本题属基础题.5.(2019年新课标Ⅰ理科)甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4:1获胜的概率是0.18.【分析】甲队以4:1获胜包含的情况有:①前5场比赛中,第一场负,另外4场全胜,②前5场比赛中,第二场负,另外4场全胜,③前5场比赛中,第三场负,另外4场全胜,④前5场比赛中,第四场负,另外4场全胜,由此能求出甲队以4:1获胜的概率.【解答】解:甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,甲队以4:1获胜包含的情况有:①前5场比赛中,第一场负,另外4场全胜,其概率为:p1=0.4×0.6×0.5×0.5×0.6=0.036,②前5场比赛中,第二场负,另外4场全胜,其概率为:p2=0.6×0.4×0.5×0.5×0.6=0.036,③前5场比赛中,第三场负,另外4场全胜,其概率为:p3=0.6×0.6×0.5×0.5×0.6=0.054,④前5场比赛中,第四场负,另外4场全胜,其概率为:p4=0.6×0.6×0.5×0.5×0.6=0.054,则甲队以4:1获胜的概率为:p=p1+p2+p3+p4=0.036+0.036+0.054+0.054=0.18.故答案为:0.18.【点评】本题考查概率的求法,考查相互独立事件概率乘法公式等基础知识,考查运算求解能力,是基础题.6.(2019年上海)某三位数密码,每位数字可在0﹣9这10个数字中任选一个,则该三位数密码中,恰有两位数字相同的概率是.【分析】分别运用直接法和排除法,结合古典概率的公式,以及计数的基本原理:分类和分步,计算可得所求值.【解答】解:方法一、(直接法)某三位数密码锁,每位数字在0﹣9数字中选取,总的基本事件个数为1000,其中恰有两位数字相同的个数为C C=270,则其中恰有两位数字相同的概率是=;方法二、(排除法)某三位数密码锁,每位数字在0﹣9数字中选取,总的基本事件个数为1000,其中三位数字均不同和全相同的个数为10×9×8+10=730,可得其中恰有两位数字相同的概率是1﹣=.故答案为:.【点评】本题考查古典型概率的求法,注意运用直接法和排除法,考查排列组合数的求法,以及运算能力,属于基础题.7.(2019年新课标Ⅱ理科)11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.【分析】(1)设双方10:10平后的第k个球甲获胜为事件A k(k=1,2,3,…),则P (X=2)=P(A1A2)+P()=P(A1)P(A2)+P()P(),由此能求出结果.(2)P(X=4且甲获胜)=P(X=4且甲获胜)=P()+P()=P(A1)P()P(A3)P(A4)+P()P(A2)P(A3)P(A4),由此能求出事件“X=4且甲获胜”的概率.【解答】解:(1)设双方10:10平后的第k个球甲获胜为事件A k(k=1,2,3,…),则P(X=2)=P(A1A2)+P()=P(A1)P(A2)+P()P()=0.5×0.4+0.5×0.6=0.5.(2)P(X=4且甲获胜)=P()+P()=P(A1)P()P(A3)P(A4)+P()P(A2)P(A3)P(A4)=0.5×0.6×0.5×0.4+0.5×0.4×0.5×0.4=0.1.【点评】本题考查概率的求法,考查相互独立事件概率乘法公式等基础知识,考查推理能力与计算能力,是中档题.8.(2019年天津文科)2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(Ⅰ)应从老、中、青员工中分别抽取多少人?(Ⅱ)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为A,B,C,D,E,F.享受情况如表,其中“〇”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.A B C D E F子女教育〇〇×〇×〇继续教育××〇×〇〇大病医疗×××〇××住房贷款利息〇〇××〇〇住房租金××〇×××赡养老人〇〇×××〇(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.【分析】(Ⅰ)根据分层抽样各层所抽比例相等可得结果;(Ⅱ)(i)用列举法求出基本事件数;(ii)用列举法求出事件M所含基本事件数以及对应的概率;【解答】解:(Ⅰ)由已知,老、中、青员工人数之比为6:9:10,由于采用分层抽样从中抽取25位员工,因此应从老、中、青员工中分别抽取6人,9人,10人;(Ⅱ)(i)从已知的6人中随机抽取2人的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{B,C},{B,D},{B,E},{B,F},{C,D},{C,E},{C,F},{D,E},{D,F},{E,F},共15种;(ii)由表格知,符合题意的所有可能结果为{A,B},{A,D},{A,E},{A,F},{B,D},{B,E},{B,F},{C,E},{C,F},{D,F},{E,F},共11种,所以,事件M发生的概率P(M )=.【点评】本题考查了用列举法求古典概型的概率问题以及根据数据分析统计结论的问题,是基础题目9.(2019年北京文科)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:不大于2000元大于2000元仅使用A27人3人仅使用B24人1人(Ⅰ)估计该校学生中上个月A,B两种支付方式都使用的人数;(Ⅱ)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2000元的概率;(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2000元.结合(Ⅱ)的结果,能否认为样本仅使用B的学生中本月支付金额大于2000元的人数有变化?说明理由.【分析】(Ⅰ)从全校所有的1000名学生中随机抽取的100人中,A,B两种支付方式都不使用的有5人,仅使用A的有30人,仅使用B的有25人,求出A,B两种支付方式都使用的人数有40人,由此能估计该校学生中上个月A,B两种支付方式都使用的人数.(Ⅱ)从样本仅使用B的学生有25人,其中不大于2000元的有24人,大于2000元的有1人,从中随机抽取1人,基本事件总数n=25,该学生上个月支付金额大于2000元包含的基本事件个数m=1,由此能求出该学生上个月支付金额大于2000元的概率.(Ⅲ)从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2000元的概率为,虽然概率较小,但发生的可能性为.不能认为样本仅使用B的学生中本月支付金额大于2000元的人数有变化.【解答】解:(Ⅰ)由题意得:从全校所有的1000名学生中随机抽取的100人中,A,B两种支付方式都不使用的有5人,仅使用A的有30人,仅使用B的有25人,∴A,B两种支付方式都使用的人数有:100﹣5﹣30﹣25=40,∴估计该校学生中上个月A,B两种支付方式都使用的人数为:1000×=400人.(Ⅱ)从样本仅使用B的学生有25人,其中不大于2000元的有24人,大于2000元的有1人,从中随机抽取1人,基本事件总数n=25,该学生上个月支付金额大于2000元包含的基本事件个数m=1,∴该学生上个月支付金额大于2000元的概率p==.(Ⅲ)不能认为样本仅使用B的学生中本月支付金额大于2000元的人数有变化,理由如下:上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2000元的概率为,虽然概率较小,但发生的可能性为.故不能认为样本仅使用B的学生中本月支付金额大于2000元的人数有变化.【点评】本题考查频数、概率的求法,考查频数分布表、概率等基础知识,考查推理能力与计算能力,属于基础题.(三)随机变量部分1.(2019年新课标Ⅱ文理科)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为0.98.【分析】利用加权平均数公式直接求解.【解答】解:∵经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,∴经停该站高铁列车所有车次的平均正点率的估计值为:=(10×0.97+20×0.98+10×0.99)=0.98.故答案为:0.98.【点评】本题考查经停该站高铁列车所有车次的平均正点率的估计值的求法,考查加权平均数公式等基础知识,考查推理能力与计算能力,属于基础题.2.(2019年浙江)设0<a<1.随机变量X的分布列是X0a1P则当a在(0,1)内增大时,()A.D(X)增大B.D(X)减小C.D(X)先增大后减小D.D(X)先减小后增大【分析】方差公式结合二次函数的单调性可得结果【解答】解:E(X)=0×+a×+1×=,D(X)=()2×+(a﹣)2×+(1﹣)2×=[(a+1)2+(2a﹣1)2+(a﹣2)2]=(a2﹣a+1)=(a﹣)2+∵0<a<1,∴D(X)先减小后增大故选:D.【点评】本题考查方差的求法,利用二次函数的单调性是关键,考查推理能力与计算能力,是中档题.3.(2019年天津理科)设甲、乙两位同学上学期间,每天7:30之前到校的概率均为.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(Ⅰ)用X表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X的分布列和数学期望;(Ⅱ)设M为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M发生的概率.【分析】(I)甲上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为,故X~B(),可求分布列及期望;(II)设乙同学上学期间的三天中7:30到校的天数为Y,则Y~B(3,),且M={X =3,Y=1}∪{X=2,Y=0},由题意知{X=3,Y=1}与{X=2,Y=0}互斥,且{X=3}与{Y=1},{X=2}与{Y=0}相互独立,利用相互对立事件的个概率公式可求【解答】解:(I)甲上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为,故X~B(3,),从而P(X=k )=,k=0,1,2,3.所以,随机变量X的分布列为:X0123P随机变量X的期望E(X)=3×=2.(II)设乙同学上学期间的三天中7:30到校的天数为Y,则Y~B(3,),且M={X=3,Y=1}∪{X=2,Y=0},由题意知{X=3,Y=1}与{X=2,Y=0}互斥,且{X=3}与{Y=1},{X=2}与{Y=0}相互独立,由(I)知,P(M)=P({X=3,Y=1}∪{X=2,Y=0}=P({X=3,Y=1}+P{X=2,Y =0}=P(X=3)P(Y=1)+P(X=2)P(Y=0)==【点评】本题主要考查了离散型随机变量的分布列与期望,互斥事件与相互独立事件的概率计算公式,考查运算概率公式解决实际问题的能力.4.(2019年北京理科)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:(0,1000](1000,2000]大于2000仅使用A18人9人3人仅使用B10人14人1人(Ⅰ)从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率;(Ⅱ)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1000元的人数,求X的分布列和数学期望;(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2000元的人数有变化?说明理由.【分析】(Ⅰ)从全校所有学生中随机抽取的100人中,A,B两种支付方式都不使用的有5人,仅使用A的有30人,仅使用B的有25人,从而A,B两种支付方式都使用的人数有40人,由此能求出从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率.(Ⅱ)记事件E为“从样本仅使用A的学生中随机抽查3人,他们本月的支付金额都大于2000元”,求出P(E)=,答案示例1:可以认为有变化.P(E)比较小,概率比较小的事件一般不容易发生,一旦发生,就有理由认为本月的支付金额发生了变化,可以认为有变化.答案示例2:无法确定有没有变化.事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生,无法确定有没有变化.【解答】解:(Ⅰ)由题意得:从全校所有学生中随机抽取的100人中,A,B两种支付方式都不使用的有5人,仅使用A的有30人,仅使用B的有25人,∴A,B两种支付方式都使用的人数有:100﹣5﹣30﹣25=40,∴从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率p==0.4.(Ⅱ)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1000元的人数,则X的可能取值为0,1,2,样本仅使用A的学生有30人,其中支付金额在(0,1000]的有18人,超过1000元的有12人,样本仅使用B的学生有25人,其中支付金额在(0,1000]的有10人,超过1000元的有15人,P(X=0)===,P(X=1)===,P(X=2)===,∴X的分布列为:X012P数学期望E(X)==1.(Ⅲ)记事件E为“从样本仅使用A的学生中随机抽查3人,他们本月的支付金额都大于2000元”,假设样本仅使用A的学生中,本月支付金额额大于2000元的人数没有变化,则由上个月的样本数据得P(E)==,答案示例1:可以认为有变化,理由如下:P(E)比较小,概率比较小的事件一般不容易发生,一旦发生,就有理由认为本月的支付金额发生了变化,∴可以认为有变化.答案示例2:无法确定有没有变化,理由如下:事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生,∴无法确定有没有变化.【点评】本题考查概率、离散型随机变量的分布列、数学期望的求法,考查古典概型、相互独立事件概率乘法公式等基础知识,考查推理能力与计算能力,是中档题.5.(2019年新课标Ⅰ理科)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得﹣1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得﹣1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.(1)求X的分布列;(2)若甲药、乙药在试验开始时都赋予4分,p i(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,p i=ap i﹣1+bp i+cp i+1。
十年高考理科数学真题 专题十一 概率与统计 三十三 回归分析与独立性检验及答案
专题十一 概率与统计第三十三讲 回归分析与独立性检验一、选择题1.(2017山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆy bx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为A .160B .163C .166D .1702.(2015福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归本线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为A .11.4万元B .11.8万元C .12.0万元D .12.2万元 3.(2014重庆)已知变量x 与y 正相关,且由观测数据算得样本的平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为A .$0.4 2.3y x =+B .$2 2.4y x =-C .$29.5y x =-+D .$0.3 4.4y x =-+ 4.(2014湖北)根据如下样本数据得到的回归方程为ˆybx a =+,则 A .0a >,0b < B .0a >,0b > C .0a <,0b < D .0a <,0b > 5.(2012新课标)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线112y x =+上,则这组样本数据的样本相关系数为A .−1B .0C .12D .16.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是7.(2012湖南)设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为$y =0.85x -85.71,则下列结论中不正确...的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1cm ,则其体重约增加0.85kgD .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 8.(2011山东)某产品的广告费用x 与销售额y 的统计数据如下表广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归方程ˆˆˆy bx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元二、解答题9.(2018全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5=-+yt ;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5=+yt . (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.10.(2016年全国III)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:719.32ii y==∑,7140.17i i i t y ==∑,721()0.55ii y y =-=∑,7≈2.646.参考公式:相关系数12211()()()(yy)ni ii n ni ii i t t y y r t t ===--=--∑∑∑,回归方程y a bt =+)))中斜率和截距的最小二乘估计公式分别为:121()()()nii i nii tt y y b tt ==--=-∑∑),=.a y bt -)))11.(2015新课标1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xyw821()ii x x =-∑821()ii w w =-∑81()()iii x x yy =--∑81()()iii w w yy =--∑46.65636.8289.8 1.61469 108.8表中i i w x =w =1881i i w =∑.(Ⅰ)根据散点图判断,y a bx =+与y c x =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由) (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)已知这种产品的年利率z 与x 、y 的关系为0.2z y x =-.根据(Ⅱ)的结果回答下列问题:(ⅰ)年宣传费x =49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,)u v ,⋅⋅⋅,(,)n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为121()()ˆ()niii nii u u v v u u β==--=-∑∑,ˆˆv u αβ=-. 12.(2014新课标2)某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(Ⅰ)求y 关于t 的线性回归方程;(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()121nii i ni i tty y b t t ∧==--=-∑∑,ˆˆay bt =- 13.(2012辽宁)电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(I )根据已知条件完成下面22⨯列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷 体育迷 合计 男 女合计(II )将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.21212211222112)(++++-=n n n n n n n n n χ, 附:专题十一 概率与统计第三十三讲 回归分析与独立性检验答案部分1.C 【解析】因为22.5x =,160y =,所以$160422.570a=-⨯=,42470166y =⨯+=,选C .2.B 【解析】∵10.0x =,8.0y =,ˆ0.76b=,∴ˆ80.76100.4a =-⨯=, ∴回归方程为ˆ0.760.4yx =+,把15x =代入上式得, )(2k P ≥χ 0.050.01k3.841 6.635ˆ0.76150.411.8y=?=(万元),选B . 3.A 【解析】由题意可知,相应的回归直线的斜率应为正,排除C 、D .且直线必过点(3,3.5),代入A 、B 得A 正确.4.A 【解析】画出散点图知0,0b a <>.5.D 【解析】因为所有的点都在直线上,这组样本数据完全正相关,故其相关系数为1,故选D.6.D 【解析】因为222152(6221410)5281636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,222252(4201612)521121636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,222352(824128)52961636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,222452(143062)524081636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,则有22224231χχχχ>>>,所以阅读量与性别关联的可能性最大.7.D 【解析】由回归方程为$y =0.85x -85.71知y 随x 的增大而增大,所以y 与x 具有正的线性相关关系,由最小二乘法建立的回归方程得过程知ˆ()ybx a bx y bx a y bx =+=+-=-, 所以回归直线过样本点的中心(x ,y ),利用回归方程可以预测估计总体,所以D 不正确.8.B 【解析】样本中心点是(3.5,42),则ˆˆ429.4 3.59.1ay bx =-=-⨯=,所以回归方程是ˆ9.49.1yx =+,把6x =代入得ˆ65.5y =. 9.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为ˆ30.413.519226.1y=-+⨯=(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为ˆ9917.59256.5y=+⨯=(亿元).(2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线30.413.5y t =-+上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型ˆ9917.5yt =+可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分. 10.【解析】(Ⅰ)由折线图这数据和附注中参考数据得4=t ,28)(712=-∑=i i t t ,55.0)(712=-∑=i iy y,40.1749.32 2.89==-⨯=,99.0646.2255.089.2≈⨯⨯≈r .因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关相当高,从而可以用线性回归模型拟合y 与t 的关系.(Ⅱ)由331.1732.9≈=y 及(Ⅰ)得71721()()2.89ˆ0.10328()ii i ii tt y y b tt ==--==≈-∑∑, 92.04103.0331.1ˆˆ≈⨯-≈-=t b y a. 所以,y 关于t 的回归方程为:t y10.092.0ˆ+=. 将2016年对应的9=t 代入回归方程得:82.1910.092.0ˆ=⨯+=y. 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.11.【解析】(Ⅰ)由散点图可以判断,y c =+适宜作为年销售量y 关于年宣传费x 的回归方程类型.(Ⅱ)令w =y 关于w 的线性回归方程,由于81821()()108.8ˆ681.6()iii ii w w y y dw w ==--===-∑∑. ˆˆ56368 6.8100.6cy dw =-=-⨯=, 所以y 关于w 的线性回归方程为ˆ100.668y w =+,因此y 关于x 的回归方程为ˆ100.6y=+ (Ⅲ)(ⅰ)由(Ⅱ)知,当49x =时,年销售量y 的预报值ˆ100.6576.6y=+= 年利润z 的预报值ˆ576.60.24966.32z=⨯-=. (ⅱ)根据(Ⅱ)得结果知,年利润z 的预报值ˆ0.2(100.620.12zx x =+-=-+.13.66.82==,即46.24x =时,ˆz取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大. 12.【解析】(I ) 由所给数据计算得17t =(1+2+3+4+5+6+7)=4 17y =(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3 7211()t tt =-∑=9+4+1+0+1+4+9=287111()()t tt y y =--∑=(3)( 1.4)(2)(1)(1)(0.7)-⨯-+-⨯-+-⨯-00.110.520.93 1.614+⨯+⨯+⨯+⨯=71117211()()140.528()t t tt y y btt ==--===-∑∑$,$ 4.30.54 2.3ay bt =-=-⨯=$. 所求回归方程为$0.5 2.3y t =+.13.【解析】(I)由频率颁布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:由2×2列联表中数据代入公式计算,得:222112212211212()100(30104515)100 3.0307525455533n n n n n x n n n n ++++-⨯-⨯==≈⨯⨯⨯因为3.030<3.841,所以,没有理由认为“体育迷”与性别有关.(II )由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间12132311{(,),(,),(,),(,)a a a a a a a b Ω=12212231,(,),(,),(,),(,),a b a b a b a b3212(,),(,)}a b b b 其中i a 表示男性,1,2,3i =.j b 表示女性,1,2j =.Ω由10个基本事件组成,而且这些事件的出现时等可能的.用A 表示“任选2人中至少有1名是女性”这一事件,则11122122313212{(,),(,),(,),(,),(,),(,),(,)}A a b a b a b a b a b a b b b = ∴7()10P A =。
高考数学总复习 10-3 相关关系、回归分析与独立性检验
高考数学总复习 10-3 相关关系、回归分析与独立性检1.(2011·济南模拟)对于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定B.线性相关系数可以是正的或负的C.回归分析中,如果r=±1,说明x与y之间完全线性相关D.样本相关系数r∈(-1,1)[答案] D[解析]∵相关系数|r|≤1,∴D错.2.(2011·西安模拟)在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A.①B.①③C.③D.②[答案] C[解析]①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A,B,③正确.排除D,选C.3.(文)(2011·陕西文,9)设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如下图),以下结论正确的是()A.直线l过点(x,y)B.x和y的相关系数为直线l的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同 [答案] A[解析] ∵回归直线方程y ^=a ^+b ^x 中a ^=y --b ^x -,∴y ^=y --b ^x -+b ^x ,当x =x -时,y ^=y -,∴直线l 过定点(x -,y -). (理)(2011·山东文,8)某产品的广告费用x 与销售额y 的统计数据如下表根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元[答案] B[解析] 此题必须明确回归直线方程过定点(x ,y ).易求得x =3.5,y =42,则将(3.5,42)代入y ^=b ^x +a ^中得:42=9.4×3.5+a ^,即a ^=9.1,则y =9.4x +9.1,所以当广告费用为6万元时销售额为9.4×6+9.1=65.5万元.4.(2011·湖南文,5)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由χ2=n ad -bc 2 a +b c +d a +c b +d算得,χ2=110× 40×30-20×20 260×50×60×50≈7.8.附表:A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” [答案] A[解析] 根据独立性检验的定义,由χ2≈7.8>6.635可知,有99%以上把握认为“爱好该项运动与性别有关”.5.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值计算,得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1849,则其回归直线方程为( )A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62x[答案] A[解析] 由∑i =18x i =52,∑i =18y i =228知,x -=6.5,y -=28.5,b ^=∑i =18x i y i -8x -y-∑i =18x 2i -8x -2=1849-8×6.5×28.5478-8×6.52≈2.62,∴a ^=y --b ^x -=28.5-2.62×6.5=11.47.6.(2011·中山四校联考、湖南六校联考)甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:A .甲B .乙C .丙D .丁[答案] D[解析] r 越接近1,相关性越强,残差平方和m 越小,相关性越强,故选D. 7.(2011·辽宁文,14)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.[答案] 0.254[解析] 由回归直线方程为y ^=0.254x +0.321知收入每增加1万元,饮食支出平均增加0.254万元.8.(2011·合肥模拟)已知x 、y 之间的一组数据如下表:3对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +12,利用最小二乘法判断拟合程度更好的直线是________(填l 1或l 2).[答案] l 2[解析] 用y =13x +1作为拟合直线时,所得y 值与y 的实际值的差的平方和为s 1=73;用y =12x +12作为拟合直线时,所得y 值与y 的实际值的差的平方和为s 2=12.∵s 2<s 1,故用直线y =12x +12拟合程度更好.9.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为χ2=50× 13×20-10×7 223×27×20×30≈4.844.因为χ2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.[答案] 5%[解析] 根据独立性检验临界值表可知“x 与y 有关系”的可信度,P (χ2≥3.841)=0.05,∴有95%的可能认为x 与y 有关系,即判断出错的可能性为5%.10.(2010·扬州模拟)为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩:(2)已知该生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理性建议.[解析] (1)x -=100+-12-17+17-8+8+127=100;y -=100+-6-9+8-4+4+1+67=100;∴s 2数学=9947=142,s 2物理=2507, 从而s 2数学>s 2物理,∴物理成绩更稳定.(2)由于x 与y 之间具有线性相关关系,根据回归系数公式得到b ^=∑i =17x i y i -7x -y-∑i =17x 2i -7x -2=497994≈0.5, a ^=y --b ^x -=100-0.5×100=50, ∴回归直线方程为y ^=0.5x +50.当y =115时,x =130,即该生物理成绩达到115分时,他的数学成绩大约为130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.11.(2010·广东文)某市居民2005~2009年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:根据统计资料,居民家庭平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.[答案] 13 正[解析] 找中位数时,将样本数据按大小顺序排列后奇数个时中间一个是中位数,而偶数个时须取中间两数的平均数,由统计资料可以看出,年平均收入增多时,年平均支出也增多,因此两者正相关.12.(2011·佛山二模)在2010年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组数据如下表所示:x 的回归直线方程为________.[答案] y ^=-3.2x +40[解析] ∑i =15x i y i =392,x -=10,y -=8,∑i =15(x i -x -)2=2.5,代入公式,得b ^=-3.2,所以,a ^=y --b ^x -=40,故回归直线方程为y ^=-3.2x +40.13.(2011·东北四校联考)某小卖部为了了解热茶销售量y (杯)与气温x (℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:由表中数据算得线性回归方程y =bx +a 中的b ≈-2,预测当气温为-5℃时,热茶销售量为________杯.(已知回归系数b =∑i =1nx i y i -n x -y-∑i =1nx 2i -n x -2,a =y --b x -)[答案] 70[解析] 根据表格中的数据可求得x -=14×(18+13+10-1)=10,y -=14×(24+34+38+64)=40.∴a =y --b x -=40-(-2)×10=60,∴y ^=-2x +60,当x =-5时,y ^=-2×(-5)+60=70.14.(2011·湖南六校联考)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:13回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=bx +a ;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?(参考公式:b =∑i =1nx i -x - y i -y -∑i =1nx i -x -2,a =y --b x -.)[解析] 将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件空间Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}中共15个基本事件,设抽到相邻两个月的事件为A ,则A ={(1,2),(2,3),(3,4),(4,5),(5,6)}中共5个基本事件,∴P (A )=515=13.(2)由表中数据求得x -=11,y -=24, 由参考公式可得b =187,再由a =y --b x -求得a =-307,[来源:Z&xx&]所以y 关于x 的线性回归方程为y ^=187x -307.(3)当x =10时,y ^=1507,|1507-22|=47<2;同样,当x =6时,y ^=787,|787-12|=67<2.所以,该小组所得线性回归方程是理想的.15.(文)(2011·郑州市质检)某中学对高二甲、乙两个同类班级进行“加强…语文阅读理解‟训练对提高…数学应用题‟得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:(1)试分析估计两个班级的优秀率;(2)由以上统计数据填写下面2×2列联表,并问是否有75%的把握认为“加强…语文阅读理解‟训练对提高…数学应用题‟得分率”有帮助.参考公式及数据:χ2=n ad -bc a +b c +d a +c b +d,[甲班优秀人数为30人,优秀率为3050=60%,乙班优秀人数为25人,优秀率为2550=50%,所以甲、乙两班的优秀率分别为60%和50%.(2)因为χ2=50×50×55×45=10099≈1.010,所以由参考数据知,没有75%的把握认为“加强…语文阅读理解‟训练对提高…数学应用题‟得分率”有帮助.(理)(2011·福建普通高中质检)某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A、B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下.记成绩不低于90分者为“成绩优秀”.(1)个,求抽出的两个均“成绩优秀”的概率;(2)由以上统计数据填写下面列联表,并判断是否有90%的把握认为:“成绩优秀”与教学方式有关.附:χ2=n n 11n 2212n 21n 1+n 2+n +1n +2从不低于86分的成绩中随机抽取2个的基本事件为(86,93),(86,96),(86,97),(86,99),(86,99),(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共15个.而事件A 包含基本事件:(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共10个.所以所求概率为P (A )=1015=23.(2)由已知数据得χ2=40× 1×15-5×19 26×34×20×20≈3.137,由于3.137>2.706,所以有90%的把握认为“成绩优秀”与教学方式有关.1.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表s1、s2、s3) A.s3>s1>s2B.s2>s1>s3C.s1>s2>s3D.s2>s3>s1[答案] B[解析]计算可得甲、乙、丙的平均成绩都为8.5.s1=120[5 7-8.52+5 8-8.5 2+5 9-8.5 2+5 10-8.5 2]=2520.同理s2=2920,s3=2120,∴s2>s1>s3.2.(2010·厦门三中阶段训练)某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是()A.5 C .3 D .2[答案] D[解析] 去掉最低分87,去掉最高分94(假设x ≤4),则7×91=80×2+9+8+90×5+2+3+2+1+x ,∴x =2,符合题意,故选D.3.(2010·广东佛山)为了对2007年佛山市中考成绩进行分析,在60分以上的全体同学中随机抽出8位,他们的数学分数(已折算为百分制)从小到大排列是60、65、70、75、80、85、90、95,物理分数从小到大排列是72、77、80、84、88、90、93、95.(1)若规定85分(包括85分)以上为优秀,求这8位同学中恰有3位同学的数学和物理分数均为优秀的概率;(2)若这8位同学的数学、物理、化学分数事实上对应如下表:(3)求y 与x 、z 与x 的线性回归方程(系数精确到0.01),并用相关指数比较所求回归模型的效果.参考数据:x -=77.5,y -=85,z -=81,∑i =18 (x i -x -)≈1050,∑i =18 (y i -y -)2≈456,∑i =18(z i -z -)≈550,∑i =18 (x i -x -)(y i -y -)≈688,∑i =18 (x i -x -)(z i -z -)≈755,∑i =18 (y i -y ^i )≈7,∑i =18(z i -z ^i )2≈94,1050≈32.4,456≈21.4,550≈23.5.[解析] (1)这8位同学中恰有3位同学的数学和物理分数均为优秀,则需要先从物理的4个优秀分数中选出3个与数学优秀分数对应,种数是C 34A 33(或A 34),然后将剩下的5个数学分数和物理分数任意对应,种数是A 55.根据乘法原理,满足条件的种数是C 34A 33A 55.这8位同学的物理分数和数学分数分别对应的种数共有A 88.故所求的概率P =C 34A 33A 55A 88=114. (2)变量y 与x 、z 与x 的相关系数分别是 r =68832.4×21.4≈0.99,r ′=75532.4×23.5≈0.99可以看出,物理与数学、化学与数学的成绩都是高度正相关. (3)设y 与x 、z 与x 的线性回归方程分别是y ^=bx +a ,z ^=b ′x +a ′根据所给的数据可以计算出,b =6881050=0.65,a =85-0.65×77.5=34.63,b ′=7551050=0.72,a ′=81-0.72×77.5=25.20所以y 与x 和z 与x 的回归方程分别是 y ^=0.65x +34.63,z ^=0.72x +25.20,又y 与x 、z 与x 的相关指数是R 2=1-7456≈0.98,R ′2=1-94550≈0.83故回归模型y ^=0.65x +34.63比回归模型z ^=0.72x +25.20的拟合的效果好.。
十年高考理科数学真题 专题十一 概率与统计 三十二 统计初步(1)及答案
专题十一概率与统计第三十二讲统计初步2019年1 (2019全国II理5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数B.平均数C.方差D.极差2(2019全国II理13)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为__________.3(2019全国III理17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).4(2019浙江7)设0<a<1,则随机变量X的分布列是则当a在(0,1)内增大时A.D(X)增大B.D(X)减小C.D(X)先增大后减小D.D(X)先减小后增大5.(2019江苏5)已知一组数据6,7,8,8,9,10,则该组数据的方差是.2010-2018年一、选择题1.(2018全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例建设后经济收入构成比例则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半2.(2017新课标Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳3.(2017江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.4.(2016年山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是A.56 B.60 C.120 D.1405.(2016年全国III)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图。
高考真题——回归分析和独立性检验
高考真题——回归分析和独立性检验副标题一、选择题(本大题共9小题,共45.0分)1.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()参考公式:K2=附表:列联表中c的值为30,b的值为35B. 列联表中c的值为15,b的值为50C. 根据列联表中的数据,若按的可靠性要求,能认为“成绩与班级有关系”D. 根据列联表中的数据,若按的可靠性要求,不能认为“成绩与班级有关系”2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表2表3表4成绩视力 C. 智商 D. 阅读量3.下列两个变量中具有相关关系的是()A. 正方形的面积与边长B. 匀速行驶的车辆的行驶距离与时间C. 人的身高与体重D. 人的身高与视力4.下列说法:①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;②设有一个线性回归方程=3-5x,变量x增加1个单位时,y平均增加5个单位;③线性回归方程=x+必过(,);④设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越高;⑤在一个2×2列联表中,由计算得K2的值,则K2的值越大,判断两个变量间有关联的把握就越大.其中错误的个数是()A. 0B. 1C. 2D. 35.某次考试,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理分数对应如下表:绘出散点图如下:根据以上信息,判断下列结论:①根据此散点图,可以判断数学成绩与物理成绩具有线性相关关系;②根据此散点图,可以判断数学成绩与物理成绩具有一次函数关系;③甲同学数学考了80分,那么,他的物理成绩一定比数学只考了60分的乙同学的物理成绩要高.其中正确的个数为A. 0B. 3C. 2D. 16.有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:附:K2=据此表,可得()A. 认为机动车驾驶技术与性别有关的可靠性不足B. 认为机动车驾驶技术与性别有关的可靠性超过C. 认为机动车驾驶技术与性别有关的可靠性不足D. 认为机动车驾驶技术与性别有关的可靠性超过7.如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程y=b2x+a2,相关系数为r2.则()A. B. C. D.8.由K2=得K2=≈8.333>7.879A. 有以上的把握认为“爱好该项运动与性别有关”B. 有以上的把握认为“爱好该项运动与性别无关”C. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”D. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”9.有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和身体健康情况;④圆的半径与面积;⑤汽车的重量和每千米耗油量.其中两个变量成正相关的是()A. ①③B. ②④C. ②⑤D. ④⑤二、填空题(本大题共1小题,共5.0分)10.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级的排名情况如图所示,甲、乙、丙为该班三位学生。
理科数学2010-2019高考真题分类训练专题十一 概率与统计第三十三讲 回归分析与独立性检验
专题十一 概率与统计第三十三讲 回归分析与独立性检验一、选择题1.(2017山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为 A .160 B .163 C .166 D .1702.(2015福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归本线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为A .11.4万元B .11.8万元C .12.0万元D .12.2万元3.(2014重庆)已知变量x 与y 正相关,且由观测数据算得样本的平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为A .0.4 2.3y x =+B .2 2.4y x =-C .29.5y x =-+D .0.3 4.4y x =-+ 4.(2014湖北)根据如下样本数据得到的回归方程为ˆybx a =+,则 A .0a >,0b < B .0a >,0b > C .0a <,0b < D .0a <,0b >5.(2012新课标)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线112y x =+上,则这组样本数据的样本相关系数为A .−1B .0C .12D .16.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是7.(2012湖南)设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x -85.71,则下列结论中不正确...的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1cm ,则其体重约增加0.85kgD .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 8.(2011山东)某产品的广告费用x 与销售额y 的统计数据如下表根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元二、解答题9.(2018全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5=-+y t ;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5=+yt . (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.10.(2016年全国III)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:719.32ii y==∑,7140.17i i i t y ==∑0.55=≈2.646.参考公式:相关系数()()ni it t y y r --=∑ 回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:121()()()nii i nii tt y y b tt ==--=-∑∑,=.a y bt -11.(2015新课标1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中i w =w =1881i i w =∑.(Ⅰ)根据散点图判断,y a bx =+与y c =+y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)已知这种产品的年利率z 与x 、y 的关系为0.2z y x =-.根据(Ⅱ)的结果回答下列问题:(ⅰ)年宣传费x =49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,)u v ,⋅⋅⋅,(,)n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为121()()ˆ()niii nii u u v v u u β==--=-∑∑,ˆˆv u αβ=-. 12.(2014新课标2)某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(Ⅰ)求y 关于t 的线性回归方程;(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()121nii i ni i tty y b t t ∧==--=-∑∑,ˆˆay bt =- 13.(2012辽宁)电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性. (I )根据已知条件完成下面22⨯列联表,并据此资料你是否认为“体育迷”与性别有关?(II )将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率. 21212211222112)(++++-=n n n n n n n n n χ, 附:。
【高考数学总复习】:回归性分析与独立性检验(知识点讲解+真题演练+详细解答)
量,例如某同学的数学成绩与化学成绩。
2.线性回归分析 (1) 散点图:将样本中的各对数据在直角坐标系中描点而得到的图形叫做散点图,它直观地 描述了两个变量之间是否有相关关系,是判断两个变量相关性的重要依据。 (2) 回归直线:散点图中点的整体分布在一条直线左右,则称这两个变量之间具有线性相关
(a b)(c d)(a c)(b d )
通过对统计量 K2 的研究,一般情况下认为:
①当 K 2 ≤3.841 时,认为变量 X 与 Y 是无关的。
②当 K 2 >3.841 时,有 95%的把握说变量 X 与 Y 有关;
④ 当 K 2 >6.635 时,有 99%的把握说变量 X 与 Y 有关;
定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。
2.分类变量的理解: 分类变量是说明事物类别的一个名称,其取值是分类数据。如“性别”就是一个分类变 量,其变量值为“男”或“女”;“行业”也是一个分类变量,其变量值可以为“零售 业”,说明 X 与 Y 无关的把握越小
6. 右表是对与喜欢足球与否的统计列联表依据表中的数据,得到( )
A. K 2 9.564 B. K 2 3.564 C. K 2 2.706 D. K 2 3.841
7. 对两个分类变量 A、B 的下列说法中正确的个数为( ). ①A 与 B 无关,即 A 与 B 互不影响;②A 与 B 关系越密切,则 K2 的值就越大;③K2
x yw
46.6 563 6.8
8
(xi x )2
i 1
【2023高考必备】2013-2022十年全国高考数学真题分类(全国通用):概率统计解答题(解析版)
解析:(1)设甲在三个项目中获胜的事件依次记为 A, B,C ,所以甲学校获得冠军的概率为
P P ABC P ABC P ABC P ABC
0.5 0.4 0.8 0.5 0.4 0.8 0.5 0.6 0.8 0.5 0.4 0.2 0.16 0.16 0.24 0.04 0.6 . (2)依题可知, X 的可能取值为 0,10, 20,30 ,所以,
P X 0 0.5 0.4 0.8 0.16 ,
P X 10 0.5 0.4 0.8 0.5 0.6 0.8 0.5 0.4 0.2 0.44 ,
P X 20 0.5 0.6 0.8 0.5 0.4 0.2 0.5 0.6 0.2 0.34 ,
P X 30 0.5 0.6 0.2 0.06 .
i=1
, 1.896 1.377 .
n
n
(xi x)2 ( yi y)2
i=1
i=1
【答案】(1) 0.06m2 ; 0.39m3
(2) 0.97
(3)1 2 0 9 m 3
解析:【小问 1 详解】
样本中 10 棵这种树木的根部横截面积的平均值 x 0.6 0.06 10
样本中 10 棵这种树木的材积量的平均值 y 3.9 0.39 10
得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间 [20,70) 的概率; (3)已知该地区这种疾病的患病率为 0.1% ,该地区年龄位于区间[40, 50) 的人口占该地区总人口的 16% .从该地区中任选一人,若此人的年龄位于区间[40, 50) ,求此人患这种疾病的概率.(以样本数
高考数学一轮复习题库:第十一章概率与统计11.9回归分析与独立性检验
5.甲、乙、丙、丁四位同学各 自对 A,B 两变量的线性相关性做试验,并用回归分析方 法分别求得相关系数 r 与残差平方和 m 如下表:
甲
乙
丙
丁Hale Waihona Puke r 0.82 0.78 0.69 0.85
m 106 115 124 103
则哪位同学的试验结果体现 A,B 两变量更强的线性相关性 ( ).
A.甲
随机抽取了 100 名观
众进行调查,其中女性有 55 名.下面是根据调查结果绘制的观众日均收看该体育节目时间
的频率分布直方图:
将日均收看该体育节 目时间不低于 40 分钟的观众称为“体育迷”,已知“体育迷”中 有 10 名女性.
(1)根据已知条件完成下面的 2× 2 列联表,并据此资料你是否认为“体育迷”与性别有 关?
年份 /年
2007 2008 2009 2010 2011
收入 x/万元
11.5 12.1
13
13.3
15
支出 Y/万元
6.8
8.8
9.8
10
12
根据统计资料, 居民家庭年平均收入的中位数是 __________ ,家庭年平均收入与年平均
支出有 __________ 线性相关关系.
三、解答题
11.电视传媒公司为了解某地区观众对某类体育节目的收视情况,
非体育迷
体育迷
合计
男
女
合计
(2)将日均收看该体育节目不低于 50 分钟的观众称为“超级体育迷”,已知“超级体育
迷”中有 2 名女性.若从“超级体育迷”中任意选取
附: K 2=
n ad- bc 2
.
a+ b c+ d a+ c b+ d
高考数学真题专题十一 概率与统计第三十三讲 回归分析与独立性检验答案
专题十一 概率与统计第三十三讲 回归分析与独立性检验答案部分1.C 【解析】因为22.5x =,160y =,所以$160422.570a=-⨯=,42470166y =⨯+=,选C .2.B 【解析】∵10.0x =,8.0y =,ˆ0.76b=,∴ˆ80.76100.4a =-⨯=, ∴回归方程为ˆ0.760.4yx =+,把15x =代入上式得, ˆ0.76150.411.8y=?=(万元),选B . 3.A 【解析】由题意可知,相应的回归直线的斜率应为正,排除C 、D .且直线必过点(3,3.5),代入A 、B 得A 正确.4.A 【解析】画出散点图知0,0b a <>.5.D 【解析】因为所有的点都在直线上,这组样本数据完全正相关,故其相关系数为1,故选D.6.D 【解析】因为222152(6221410)5281636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,222252(4201612)521121636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,222352(824128)52961636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,222452(143062)524081636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,则有22224231χχχχ>>>,所以阅读量与性别关联的可能性最大.7.D 【解析】由回归方程为$y =0.85x -85.71知y 随x 的增大而增大,所以y 与x 具有正的线性相关关系,由最小二乘法建立的回归方程得过程知ˆ()ybx a bx y bx a y bx =+=+-=-, 所以回归直线过样本点的中心(x ,y ),利用回归方程可以预测估计总体,所以D 不正确.8.B 【解析】样本中心点是(3.5,42),则ˆˆ429.4 3.59.1ay bx =-=-⨯=,所以回归方程是ˆ9.49.1yx =+,把6x =代入得ˆ65.5y =. 9.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为ˆ30.413.519226.1y=-+⨯=(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为ˆ9917.59256.5y=+⨯=(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线30.413.5y t =-+上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型ˆ9917.5yt =+可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分. 10.【解析】(Ⅰ)由折线图这数据和附注中参考数据得4=t ,28)(712=-∑=i i t t ,55.0)(712=-∑=i iy y,40.1749.32 2.89==-⨯=,99.0646.2255.089.2≈⨯⨯≈r .因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关相当高,从而可以用线性回归模型拟合y 与t 的关系.(Ⅱ)由331.1732.9≈=y 及(Ⅰ)得71721()()2.89ˆ0.10328()ii i ii tt y y b tt ==--==≈-∑∑, 92.04103.0331.1ˆˆ≈⨯-≈-=t b y a. 所以,y 关于t 的回归方程为:t y10.092.0ˆ+=. 将2016年对应的9=t 代入回归方程得:82.1910.092.0ˆ=⨯+=y. 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.11.【解析】(Ⅰ)由散点图可以判断,y c =+适宜作为年销售量y 关于年宣传费x 的回归方程类型.(Ⅱ)令w =y 关于w 的线性回归方程,由于81821()()108.8ˆ681.6()iii ii w w y y dw w ==--===-∑∑. ˆˆ56368 6.8100.6cy dw =-=-⨯=, 所以y 关于w 的线性回归方程为ˆ100.668y w =+,因此y 关于x 的回归方程为ˆ100.6y=+ (Ⅲ)(ⅰ)由(Ⅱ)知,当49x =时,年销售量y 的预报值ˆ100.6576.6y=+= 年利润z 的预报值ˆ576.60.24966.32z=⨯-=. (ⅱ)根据(Ⅱ)得结果知,年利润z 的预报值ˆ0.2(100.620.12zx x =+-=-+.13.66.82==,即46.24x =时,ˆz取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大. 12.【解析】(I ) 由所给数据计算得17t =(1+2+3+4+5+6+7)=417y =(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3 7211()t tt =-∑=9+4+1+0+1+4+9=287111()()t tt y y =--∑=(3)( 1.4)(2)(1)(1)(0.7)-⨯-+-⨯-+-⨯-00.110.520.93 1.614+⨯+⨯+⨯+⨯=71117211()()140.528()t t tt y y btt ==--===-∑∑$,$ 4.30.54 2.3ay bt =-=-⨯=$. 所求回归方程为$0.5 2.3y t =+.13.【解析】(I)由频率颁布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:由2×2列联表中数据代入公式计算,得:222112212211212()100(30104515)100 3.0307525455533n n n n n x n n n n ++++-⨯-⨯==≈⨯⨯⨯因为3.030<3.841,所以,没有理由认为“体育迷”与性别有关.(II )由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间12132311{(,),(,),(,),(,)a a a a a a a b Ω=12212231,(,),(,),(,),(,),a b a b a b a b3212(,),(,)}a b b b 其中i a 表示男性,1,2,3i =.j b 表示女性,1,2j =.Ω由10个基本事件组成,而且这些事件的出现时等可能的.用A 表示“任选2人中至少有1名是女性”这一事件,则11122122313212{(,),(,),(,),(,),(,),(,),(,)}A a b a b a b a b a b a b b b = ∴7()10P A =。
高考数学一轮复习 第十一章概率与统计11.9回归分析与独立性检验练习 理 新人教A版
课时作业63 回归分析与独立性检验一、选择题1.下面是一个2×2y 1 y 2 合计 x 1a 21 73 x 2 22 25 47 合计b 46 120则表中a ,b A .94,72 B .52,50 C .52,74 D .74,522.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( ).图1图2A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ).A .若K 2的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患有肺病B .由独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病C .若统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确4.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③回归直线方程y ^=b ^x +a ^必过点(x ,y );④有一个2×2列联表中,由计算得K 2的观测值k =13.079,则有99.9%的把握认为这两个变量间有关系.其中错误的个数是( ).A .0B .1C .2D .3P (K 2≥k ) 0.5 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 5.甲、乙、丙、丁四位同学各自对A ,B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.85m 106 115 124 103则哪位同学的试验结果体现A ,B 两变量更强的线性相关性( ).A .甲B .乙C .丙D .丁6.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x /万元 4 2 3 5销售额y /万元 49 26 39 54 根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( ).A .63.6万元B .65.5万元C .67.7万元D .72.0万元7.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( ).A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x ,y )二、填空题8.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:理科 文科 合计男 13 10 23女 7 20 27合计 20 30 50已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2的观测值k =50×13×20-10×7223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性约为__________.9.某单位为了了解用电量y (千瓦时)与气温x (℃)之间的关系,随机统计了某4天的用气温/℃ 18 13 10 -1用电量/千瓦时 24 34 38 64由表中数据得线性回归方程y =b x +a 中b =-2,预测当气温为-4 ℃时,用电量约为________千瓦时.10.某市居民2007~2011年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)年份/年 2007 2008 2009 2010 2011收入x /万元 11.5 12.1 13 13.3 15支出Y /万元 6.8 8.8 9.8 10 12根据统计资料,居民家庭年平均收入的中位数是__________,家庭年平均收入与年平均支出有__________线性相关关系.三、解答题11.(2012辽宁高考)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷 体育迷 合计男女合计(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:K 2=n ad -bc 2a +b c +d a +c b +d. P (K 2≥k ) 0.05 0.01k 3.841 6.63512.为了比较注射A ,200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B .下表1和表2分别是注射药物A 和药物B 后的试验结果.(疱疹面积单位:mm 2)疱疹面积 [60,65) [65,70) [70,75) [75,80)频数 30 40 20 10疱疹面积 [60,65) [65,70) [70,75) [75,80) [80,85)频数 10 25 20 30 15(1)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;图1 注射药物A后皮肤疱疹面积的频率分布直方图图2 注射药物B后皮肤疱疹面积的频率分布直方图(2)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.疱疹面积小于70 mm2疱疹面积不小于70 mm2合计注射药物A a=b=注射药物B c=d=合计n=2附:K2=P(K2≥k)0.1000.0500.0250.0100.001k 2.706 3.841 5.024 6.63510.828参考答案一、选择题1.C 解析:∵a +21=73,∴a =52.又a +22=b ,∴b =74.2.C 3.C4.B 解析:一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于回归直线方程y ^=3-5x ,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y ^=b ^x +a ^必过点(x ,y ),③正确;因为K 2的观测值k =13.079>10.828,故有99.9%的把握认为这两个变量有关系,④正确.5.D 解析:丁同学所得相关系数r 最大,残差平方和m 最小,所以A ,B 两变量线性相关性更强.6.B 解析:样本中心点是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1,所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.7.D 解析:A 中,相关系数不是l 的斜率;B 中,x 和y 负相关;C 中,样本点的个数分布无规律;D 正确.二、填空题8.5% 解析:由K 2的观测值k ≈4.844>3.841,故认为选修文科与性别有关系出错的可能性约为5%.9.68 解析:x =10,y =40,∵回归方程过点(x ,y ),∴40=-2×10+a ^.∴a ^ =60.∴y ^=-2x +60.令x =-4,得y ^=(-2)×(-4)+60=68.10.13万元 正 解析:根据中位数的定义,居民家庭年平均收入的中位数是13万元,家庭年平均收入与年平均支出有正线性相关关系.三、解答题11.解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2列联表如下:非体育迷 体育迷 合计男 30 15 45女 45 10 55合计 75 25 100将2×2K 2的观测值k =100×(30×10-45×15)275×25×45×55=10033≈3.030. 因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间为Ω={(a 1,a 2),(a 1,a 3),(a 2,a 3),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a3,b2),(b1,b2)}.其中a i表示男性,i=1,2,3.b j表示女性,j=1,2.Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A表示“任选2人中,至少有1人是女性”这一事件,则A={(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)},事件A由7个基本事件组成,因而P(A)=7 10 .12.解:(1)图1 注射药物A后皮肤疱疹面积的频率分布直方图图2 注射药物B后皮肤疱疹面积的频率分布直方图可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.疱疹面积小于70 mm2疱疹面积不小于70 mm2合计注射药物A a=70b=30100注射药物B c=35d=65100 合计10595n=200k=100×100×105×95≈24.56,由于k>10.828,所以有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.。
十年高考理科数学真题 专题十一 概率与统计 三十二 统计初步(1)及答案
专题十一概率与统计第三十二讲统计初步2019年1 (2019全国II理5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数B.平均数C.方差D.极差2(2019全国II理13)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为__________.3(2019全国III理17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).4(2019浙江7)设0<a<1,则随机变量X的分布列是则当a在(0,1)内增大时A.D(X)增大B.D(X)减小C.D(X)先增大后减小D.D(X)先减小后增大5.(2019江苏5)已知一组数据6,7,8,8,9,10,则该组数据的方差是.2010-2018年一、选择题1.(2018全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例建设后经济收入构成比例则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半2.(2017新课标Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳3.(2017江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.4.(2016年山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是A.56 B.60 C.120 D.1405.(2016年全国III)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图。
十年高考理科数学真题 专题十一 概率与统计 三十二 统计初步(1)及答案
专题十一概率与统计第三十二讲统计初步2019年1 (2019全国II理5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数B.平均数C.方差D.极差2(2019全国II理13)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为__________.3(2019全国III理17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).4(2019浙江7)设0<a<1,则随机变量X的分布列是则当a在(0,1)内增大时A.D(X)增大B.D(X)减小C.D(X)先增大后减小D.D(X)先减小后增大5.(2019江苏5)已知一组数据6,7,8,8,9,10,则该组数据的方差是.2010-2018年一、选择题1.(2018全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例建设后经济收入构成比例则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半2.(2017新课标Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳3.(2017江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.4.(2016年山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是A.56 B.60 C.120 D.1405.(2016年全国III)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图。
高考数学一轮复习 第十一章概率与统计11.9回归分析与独立性检验试题 新人教A版
课时作业63 回归分析与独立性检验一、选择题1.下面是一个2×2y 1 y 2 合计 x 1a 21 73 x 222 25 47 合计b 46 120则表中a ,b A .94,72 B .52,50 C .52,74 D .74,522.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( ).图1图2A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ).A .若K 2的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患有肺病B .由独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病C .若统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确4.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③回归直线方程y ^=b ^x +a ^必过点(x ,y );④有一个2×2列联表中,由计算得K 2的观测值k =13.079,则有99.9%的把握认为这两个变量间有关系.其中错误的个数是( ).A .0B .1C .2D .3P (K 2≥k ) 0.5 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828法分别求得相关系数r 甲 乙 丙 丁r 0.82 0.78 0.69 0.85m 106 115 124 103).A .甲B .乙C .丙D .丁6广告费用x /万元 4 2 3 5销售额y /万元 49 26 39 54根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( ).A .63.6万元B .65.5万元C .67.7万元D .72.0万元7.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( ).A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x ,y )二、填空题8.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:理科 文科 合计男 13 10 23女 7 20 27合计 20 30 50已知P (K 2根据表中数据,得到K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性约为__________.9.某单位为了了解用电量y (千瓦时)与气温x (℃)之间的关系,随机统计了某4天的用气温/℃ 18 13 10 -1用电量/千瓦时 24 34 38 64由表中数据得线性回归方程y =b x +a 中b =-2,预测当气温为-4 ℃时,用电量约为________千瓦时.10.某市居民2007~2011年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)年份/年 2007 2008 2009 2010 2011收入x /万元 11.5 12.1 13 13.3 15支出Y /万元 6.8 8.8 9.8 10 12支出有__________线性相关关系.三、解答题11.(2012辽宁高考)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷 体育迷 合计男女合计(2)已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(. P (K 2≥k ) 0.05 0.01k 3.841 6.63512.(2013名游客对景区的服务是否满意,得到如下的列联表:男 女 总计满意 50 30 80不满意 10 20 30总计 60 50 110(1)从这50抽取一个容量为5的样本,问样本中满意与不满意的女游客各有多少名?(2)从(1)中的5名女游客样本中随机选取两名作深度访谈,求选到满意与不满意的女游客各一名的概率;(3)根据以上列联表,问有多大把握认为“游客性别与对景区的服务满意”有关?参考答案一、选择题1.C 解析:∵a +21=73,∴a =52.又a +22=b ,∴b =74.2.C 3.C4.B 解析:一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于回归直线方程y ^=3-5x ,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y ^=b ^x +a ^必过点(x ,y ),③正确;因为K 2的观测值k =13.079>10.828,故有99.9%的把握认为这两个变量有关系,④正确.5.D 解析:丁同学所得相关系数r 最大,残差平方和m 最小,所以A ,B 两变量线性相关性更强.6.B 解析:样本中心点是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1,所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.7.D 解析:A 中,相关系数不是l 的斜率;B 中,x 和y 负相关;C 中,样本点的个数分布无规律;D 正确.二、填空题8.5% 解析:由K 2的观测值k ≈4.844>3.841,故认为选修文科与性别有关系出错的可能性约为5%.9.68 解析:x =10,y =40,∵回归方程过点(x ,y ),∴40=-2×10+a ^.∴a ^=60.∴y ^=-2x +60.令x =-4,得y ^=(-2)×(-4)+60=68.10.13万元 正 解析:根据中位数的定义,居民家庭年平均收入的中位数是13万元,家庭年平均收入与年平均支出有正线性相关关系.三、解答题11.解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2 非体育迷 体育迷 合计男 30 15 45女 45 10 55合计 75 25 100将2×2K 2的观测值k =100×(30×10-45×15)275×25×45×55=10033≈3.030. 因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间为Ω={(a 1,a 2),(a 1,a 3),(a 2,a 3),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)}.其中a i 表示男性,i =1,2,3.b j 表示女性,j =1,2.Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A 表示“任选2人中,至少有1人是女性”这一事件,则A ={(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)}, 事件A 由7个基本事件组成,因而P (A )=710. 12.解:(1)根据分层抽样可得:样本中满意的女游客约有550×30=3(名),样本中不满意的女游客约有550×20=2(名). (2)记样本中对景区的服务满意的3名女游客为a 1,a 2,a 3,对景区的服务不满意的2名女游客为b 1,b 2,从这5名女游客中随机选取两名,共有10个等可能的基本事件为(a 1,a 2);(a 1,a 3);(a 1,b 1);(a 1,b 2);(a 2,a 3);(a 2,b 1);(a 2,b 2);(a 3,b 1);(a 3,b 2);(b 1,b 2).其中事件A “选到满意与不满意的女游客各一名”包含了6个基本事件:(a 1,b 1);(a 1,b 2);(a 2,b 1);(a 2,b 2);(a 3,b 1);(a 3,b 2).所以所求的概率为P (A )=610=35. (3)假设H 0:该景区游客性别与对景区的服务满意无关,则K 2应该很小.根据题中的列联表得K 2=110×(50×20-30×10)280×30×60×50=53972≈7.486. 由P (K 2≥6.635)=0.010,可知有99%的把握认为“该景区游客性别与对景区的服务满意”有关.。
十年高考理科数学真题 专题十一 概率与统计 三十二 统计初步(1)及答案
专题十一概率与统计第三十二讲统计初步2019年1 (2019全国II理5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数B.平均数C.方差D.极差2(2019全国II理13)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为__________.3(2019全国III理17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).4(2019浙江7)设0<a<1,则随机变量X的分布列是则当a在(0,1)内增大时A.D(X)增大B.D(X)减小C.D(X)先增大后减小D.D(X)先减小后增大5.(2019江苏5)已知一组数据6,7,8,8,9,10,则该组数据的方差是.2010-2018年一、选择题1.(2018全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例建设后经济收入构成比例则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半2.(2017新课标Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳3.(2017江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.4.(2016年山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是A.56 B.60 C.120 D.1405.(2016年全国III)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图。
高考数学一轮复习 第十一章概率与统计11.9回归分析与独立性检验试题 新人教A版
课时作业63 回归分析与独立性检验一、选择题1.下面是一个2×2则表中a ,b A .94,72 B .52,50 C .52,74 D .74,522.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( ).图1图2A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ).A .若K 2的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患有肺病B .由独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病C .若统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确4.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③回归直线方程y ^=b ^x +a ^必过点(x ,y );④有一个2×2列联表中,由计算得K 2的观测值k =13.079,则有99.9%的把握认为这两个变量间有关系.其中错误的个数是( ).A .0B .1C .2D .3法分别求得相关系数r).A .甲B .乙C .丙D .丁6根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( ).A .63.6万元B .65.5万元C .67.7万元D .72.0万元7.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( ).A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x ,y )二、填空题8.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:已知P (K 2根据表中数据,得到K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性约为__________.9.某单位为了了解用电量y (千瓦时)与气温x (℃)之间的关系,随机统计了某4天的用由表中数据得线性回归方程y =b x +a 中b =-2,预测当气温为-4 ℃时,用电量约为________千瓦时.10.某市居民2007~2011年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)支出有__________线性相关关系.三、解答题11.(2012辽宁高考)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?(2)已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(.12.(2013名游客对景区的服务是否满意,得到如下的列联表:(1)从这50抽取一个容量为5的样本,问样本中满意与不满意的女游客各有多少名?(2)从(1)中的5名女游客样本中随机选取两名作深度访谈,求选到满意与不满意的女游客各一名的概率;(3)根据以上列联表,问有多大把握认为“游客性别与对景区的服务满意”有关?参考答案一、选择题1.C 解析:∵a +21=73,∴a =52.又a +22=b ,∴b =74.2.C 3.C4.B 解析:一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于回归直线方程y ^=3-5x ,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y ^=b ^x +a ^必过点(x ,y ),③正确;因为K 2的观测值k =13.079>10.828,故有99.9%的把握认为这两个变量有关系,④正确.5.D 解析:丁同学所得相关系数r 最大,残差平方和m 最小,所以A ,B 两变量线性相关性更强.6.B 解析:样本中心点是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1, 所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.7.D 解析:A 中,相关系数不是l 的斜率;B 中,x 和y 负相关;C 中,样本点的个数分布无规律;D 正确.二、填空题8.5% 解析:由K 2的观测值k ≈4.844>3.841,故认为选修文科与性别有关系出错的可能性约为5%.9.68 解析:x =10,y =40,∵回归方程过点(x ,y ),∴40=-2×10+a ^.∴a ^=60.∴y ^=-2x +60.令x =-4,得y ^=(-2)×(-4)+60=68.10.13万元 正 解析:根据中位数的定义,居民家庭年平均收入的中位数是13万元,家庭年平均收入与年平均支出有正线性相关关系.三、解答题11.解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2将2×2K 2的观测值k =100×(30×10-45×15)275×25×45×55=10033≈3.030. 因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间为Ω={(a 1,a 2),(a 1,a 3),(a 2,a 3),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)}.其中a i 表示男性,i =1,2,3.b j 表示女性,j =1,2.Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A 表示“任选2人中,至少有1人是女性”这一事件,则A ={(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)}, 事件A 由7个基本事件组成,因而P (A )=710. 12.解:(1)根据分层抽样可得:样本中满意的女游客约有550×30=3(名),样本中不满意的女游客约有550×20=2(名). (2)记样本中对景区的服务满意的3名女游客为a 1,a 2,a 3,对景区的服务不满意的2名女游客为b 1,b 2,从这5名女游客中随机选取两名,共有10个等可能的基本事件为(a 1,a 2);(a 1,a 3);(a 1,b 1);(a 1,b 2);(a 2,a 3);(a 2,b 1);(a 2,b 2);(a 3,b 1);(a 3,b 2);(b 1,b 2).其中事件A “选到满意与不满意的女游客各一名”包含了6个基本事件:(a 1,b 1);(a 1,b 2);(a 2,b 1);(a 2,b 2);(a 3,b 1);(a 3,b 2).所以所求的概率为P (A )=610=35. (3)假设H 0:该景区游客性别与对景区的服务满意无关,则K 2应该很小.根据题中的列联表得K 2=110×(50×20-30×10)280×30×60×50=53972≈7.486. 由P (K 2≥6.635)=0.010,可知有99%的把握认为“该景区游客性别与对景区的服务满意”有关.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题十一 概率与统计第三十三讲 回归分析与独立性检验一、选择题1.(2017山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆy bx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为A .160B .163C .166D .1702.(2015福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归本线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为A .11.4万元B .11.8万元C .12.0万元D .12.2万元 3.(2014重庆)已知变量x 与y 正相关,且由观测数据算得样本的平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为A .$0.4 2.3y x =+B .$2 2.4y x =-C .$29.5y x =-+D .$0.3 4.4y x =-+ 4.(2014湖北)根据如下样本数据得到的回归方程为ˆybx a =+,则 A .0a >,0b < B .0a >,0b > C .0a <,0b < D .0a <,0b > 5.(2012新课标)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线112y x =+上,则这组样本数据的样本相关系数为A .−1B .0C .12D .16.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是7.(2012湖南)设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为$y =0.85x -85.71,则下列结论中不正确...的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1cm ,则其体重约增加0.85kgD .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 8.(2011山东)某产品的广告费用x 与销售额y 的统计数据如下表广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归方程ˆˆˆy bx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元二、解答题9.(2018全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5=-+yt ;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5=+yt . (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.10.(2016年全国III)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:719.32ii y==∑,7140.17i i i t y ==∑,721()0.55ii y y =-=∑,7≈2.646.参考公式:相关系数12211()()()(yy)ni ii n ni ii i t t y y r t t ===--=--∑∑∑,回归方程y a bt =+)))中斜率和截距的最小二乘估计公式分别为:121()()()nii i nii tt y y b tt ==--=-∑∑),=.a y bt -)))11.(2015新课标1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xyw821()ii x x =-∑821()ii w w =-∑81()()iii x x yy =--∑81()()iii w w yy =--∑46.65636.8289.8 1.61469 108.8表中i i w x =w =1881i i w =∑.(Ⅰ)根据散点图判断,y a bx =+与y c x =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由) (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)已知这种产品的年利率z 与x 、y 的关系为0.2z y x =-.根据(Ⅱ)的结果回答下列问题:(ⅰ)年宣传费x =49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,)u v ,⋅⋅⋅,(,)n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为121()()ˆ()niii nii u u v v u u β==--=-∑∑,ˆˆv u αβ=-. 12.(2014新课标2)某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(Ⅰ)求y 关于t 的线性回归方程;(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()121nii i ni i tty y b t t ∧==--=-∑∑,ˆˆay bt =- 13.(2012辽宁)电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(I )根据已知条件完成下面22⨯列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷 体育迷 合计 男 女合计(II )将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.21212211222112)(++++-=n n n n n n n n n χ, 附:专题十一 概率与统计第三十三讲 回归分析与独立性检验答案部分1.C 【解析】因为22.5x =,160y =,所以$160422.570a=-⨯=,42470166y =⨯+=,选C .2.B 【解析】∵10.0x =,8.0y =,ˆ0.76b=,∴ˆ80.76100.4a =-⨯=, ∴回归方程为ˆ0.760.4yx =+,把15x =代入上式得, )(2k P ≥χ 0.050.01k3.841 6.635ˆ0.76150.411.8y=?=(万元),选B . 3.A 【解析】由题意可知,相应的回归直线的斜率应为正,排除C 、D .且直线必过点(3,3.5),代入A 、B 得A 正确.4.A 【解析】画出散点图知0,0b a <>.5.D 【解析】因为所有的点都在直线上,这组样本数据完全正相关,故其相关系数为1,故选D.6.D 【解析】因为222152(6221410)5281636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,222252(4201612)521121636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,222352(824128)52961636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,222452(143062)524081636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,则有22224231χχχχ>>>,所以阅读量与性别关联的可能性最大.7.D 【解析】由回归方程为$y =0.85x -85.71知y 随x 的增大而增大,所以y 与x 具有正的线性相关关系,由最小二乘法建立的回归方程得过程知ˆ()ybx a bx y bx a y bx =+=+-=-, 所以回归直线过样本点的中心(x ,y ),利用回归方程可以预测估计总体,所以D 不正确.8.B 【解析】样本中心点是(3.5,42),则ˆˆ429.4 3.59.1ay bx =-=-⨯=,所以回归方程是ˆ9.49.1yx =+,把6x =代入得ˆ65.5y =. 9.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为ˆ30.413.519226.1y=-+⨯=(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为ˆ9917.59256.5y=+⨯=(亿元).(2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线30.413.5y t =-+上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型ˆ9917.5yt =+可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分. 10.【解析】(Ⅰ)由折线图这数据和附注中参考数据得4=t ,28)(712=-∑=i i t t ,55.0)(712=-∑=i iy y,40.1749.32 2.89==-⨯=,99.0646.2255.089.2≈⨯⨯≈r .因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关相当高,从而可以用线性回归模型拟合y 与t 的关系.(Ⅱ)由331.1732.9≈=y 及(Ⅰ)得71721()()2.89ˆ0.10328()ii i ii tt y y b tt ==--==≈-∑∑, 92.04103.0331.1ˆˆ≈⨯-≈-=t b y a. 所以,y 关于t 的回归方程为:t y10.092.0ˆ+=. 将2016年对应的9=t 代入回归方程得:82.1910.092.0ˆ=⨯+=y. 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.11.【解析】(Ⅰ)由散点图可以判断,y c =+适宜作为年销售量y 关于年宣传费x 的回归方程类型.(Ⅱ)令w =y 关于w 的线性回归方程,由于81821()()108.8ˆ681.6()iii ii w w y y dw w ==--===-∑∑. ˆˆ56368 6.8100.6cy dw =-=-⨯=, 所以y 关于w 的线性回归方程为ˆ100.668y w =+,因此y 关于x 的回归方程为ˆ100.6y=+ (Ⅲ)(ⅰ)由(Ⅱ)知,当49x =时,年销售量y 的预报值ˆ100.6576.6y=+= 年利润z 的预报值ˆ576.60.24966.32z=⨯-=. (ⅱ)根据(Ⅱ)得结果知,年利润z 的预报值ˆ0.2(100.620.12zx x =+-=-+.13.66.82==,即46.24x =时,ˆz取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大. 12.【解析】(I ) 由所给数据计算得17t =(1+2+3+4+5+6+7)=4 17y =(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3 7211()t tt =-∑=9+4+1+0+1+4+9=287111()()t tt y y =--∑=(3)( 1.4)(2)(1)(1)(0.7)-⨯-+-⨯-+-⨯-00.110.520.93 1.614+⨯+⨯+⨯+⨯=71117211()()140.528()t t tt y y btt ==--===-∑∑$,$ 4.30.54 2.3ay bt =-=-⨯=$. 所求回归方程为$0.5 2.3y t =+.13.【解析】(I)由频率颁布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:由2×2列联表中数据代入公式计算,得:222112212211212()100(30104515)100 3.0307525455533n n n n n x n n n n ++++-⨯-⨯==≈⨯⨯⨯因为3.030<3.841,所以,没有理由认为“体育迷”与性别有关.(II )由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间12132311{(,),(,),(,),(,)a a a a a a a b Ω=12212231,(,),(,),(,),(,),a b a b a b a b3212(,),(,)}a b b b 其中i a 表示男性,1,2,3i =.j b 表示女性,1,2j =.Ω由10个基本事件组成,而且这些事件的出现时等可能的.用A 表示“任选2人中至少有1名是女性”这一事件,则11122122313212{(,),(,),(,),(,),(,),(,),(,)}A a b a b a b a b a b a b b b = ∴7()10P A =。