高中数学人教A版选修2-3第三章 统计案例 过关检测 (6)
(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
数学教案 人教a版选修2_3 同步练习-第3章统计案例跟踪训练含解析
回归分析的基本思想及其初步应用[A 组 学业达标]1.下列两个变量之间的关系不是函数关系的是( ) A .角度和它的余弦值 B .正方形的边长和面积 C .正n 边形的边数和内角度数和 D .人的年龄和身高解析:函数关系就是一种变量之间的确定性的关系.A ,B ,C 三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f(θ)=cos θ,g(a)=a 2,h(n)=nπ-2π.D 选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高.故选D.答案:D2.设一个线性回归方程为y ^=2-1.5x ,则变量x 增加一个单位时( ) A.y ^平均增加1.5个单位 B.y ^平均增加2个单位 C.y ^平均减少1.5个单位 D.y ^平均减少2个单位解析:由线性回归方程y ^=2-1.5x 中x 的系数为-1.5,知C 项正确. 答案:C 3.有下列数据:x 1 2 3 y35.9912.01A .y =3×2x -1B .y =log 2xC .y =3xD .y =x 2解析:当x =1,2,3时,分别代入求y 值,离y 最近的值模拟效果最好,可知A 模拟效果最好. 答案:A4.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=-2.756x +7.325.②y 与x 负相关且y ^=3.476x +5.648 ③y 与x 正相关且y ^=-1.226x -6.578 ④y 与x 正相关且y ^=8.967x +8.163 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④解析:根据题意,依次分析4个结论:对于①,y 与x 负相关且y ^=-2.756x +7.325,此结论正确,线性回归方程符合负相关的特征; 对于②,y 与x 负相关且y ^=3.476x +5.648,此结论错误,由线性回归方程知,此两变量的关系是正相关;对于③,y 与x 正相关且y ^=-1.226x -6.578,此结论错误,由线性回归方程知,此两变量的关系是负相关;对于④,y 与x 正相关且y ^=8.967x +8.163,此结论正确,线性回归方程符合正相关的特征;故②③一定错误.答案:B5.对具有线性相关关系的变量x ,y ,测得一组数据如下表:x 2 4 5 6 8 y2040607080根据上表,利用最小二乘法得它们的回归直线方程为y ^=10.5x +a ^,据此模型来预测当x =20时,y 的估计值为________.解析:由已知得x -=5,y -=54,则(5,54)满足回归直线方程y ^=10.5x +a ^,解得a ^=1.5,因此y ^=10.5x +1.5,当x =20时y ^=10.5×20+1.5=211.5.答案:211.56.如图是x 和y 的一组样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.解析:去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.答案:D(3,10)7.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围,令z =ln y ,求得回归直线方程为z ^=0.25x -2.58,则该模型的回归方程为____________________.解析:由z =ln y ,z ^=0.25x -2.58, 得ln y ^=0.25x -2.58,∴y ^=e 0.25x -2.58. 故该模型的回归方程为y ^=e 0.25x -2.58. 答案:y ^=e 0.25x -2.588.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,求社区一户年收入为15万元的家庭的年支出.解析:由题意可得x -=15×(8.2+8.6+10.0+11.3+11.9)=10,y -=15×(6.2+7.5+8.0+8.5+9.8)=8,可得a ^=8-0.76×10=0.4. ∴回归直线方程为y ^=0.76x +0.4.把x =15代入可得y ^=0.76×15+0.4=11.8.故社区一户年收入为15万元的家庭的年支出为11.8万元.9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求线性回归方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解析:(1)x -=8+8.2+8.4+8.6+8.8+96=8.5,y -=16(90+84+83+80+75+68)=80,∵b ^=-20,a ^=y --b ^ x -, ∴a ^=80+20×8.5=250, ∴线性回归方程y ^=-20x +250;(2)设工厂获得的利润为L 元,则L =x(-20x +250)-4(-20x +250)=-20⎝⎛⎭⎪⎫x -3342+361.25,∴该产品的单价应定为8.25元,工厂获得的利润最大.[B 组 能力提升]10.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是a 1,a 2,R 2的值分别为b 1,b 2,下列说法正确的是( )A .若a 1<a 2,则b 1<b 2,A 的拟合效果更好B .若a 1<a 2,则b 1<b 2,B 的拟合效果更好C .若a 1<a 2,则b 1>b 2,A 的拟合效果更好D .若a 1<a 2,则b 1>b 2,B 的拟合效果更好解析:由残差平方和以及R 2的定义式可得若a 1<a 2,则b 1>b 2,A 的拟合效果更好. 答案:C11.近10年来,某市社会商品零售总额与职工工资总额(单位:亿元)数据如下:A.y ^=2.799 1x -27.248 552 B.y ^=2.799 1x -23.548 452 C.y ^=2.699 2x -23.749 352 D.y ^=2.899 2x -23.749 452解析:x -=41.72,y -=93.23,代入验证可知B 选项正确. 答案:B12.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.解析:将x =160代入y ^=0.85x -82.71,得y ^=0.85×160-82.71=53.29, 所以残差e ^=y -y ^=53-53.29=-0.29.答案:-0.2913.已知一个线性回归方程为y ^=1.5x +45,x ∈{1,5,7,13,19},则y -=________. 解析:∵x -=1+5+7+13+195=9,且y ^=1.5x +45, ∴y -=1.5×9+45=58.5. 答案:58.514.假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如表统计资料:x 2 3 4 5 6 y2.23.85.56.57.0已知∑i =15x 2i=90,∑i =15x i y i =112.3.b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2,a =y --b ^ x -. (1)求x -,y -.(2)x 与y 具有线性相关关系,求出线性回归方程. (3)估计使用年限为10年时,维修费用约是多少? 解析:(1)x -=4,y -=5.(2)b ^=∑i =15x i y i -5x - y-∑i =15x 2i -5x -2=1.23,a ^=y --b ^ x -=5-1.23×4=0.08.所以线性回归方程为y ^=1.23x +0.08.(3)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用年限为10年时,维修费用约为12.38万元.15.菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的统计表:x1 2 3 4 5y 58 54 39 29 10(1)令w =x 2,利用给出的参考数据求出y 关于w 的回归方程y ^=b ^w +a ^.(a ^,b ^精确到0.1)参考数据:∑i =15w i =55,∑i =15(w i -w -)(y i -y -)=-751,∑i =15(w i -w -)2=374,其中w i =x 2i ,w -=15∑i =15w i .(2)对于某种残留在蔬菜上的农药,当它的残留量不高于20微克时对人体无害,为了放心食用该蔬菜,请估计至少需要用多少千克的清水清洗1千克蔬菜?(精确到0.1,参考数据5≈2.24)附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为β^=∑i =1nu i -u-v i -v-∑i =1nu i -u-2,α^=v --β^ u -.解析:(1)由题意得,w -=11,y -=38.b ^=∑i =15w i -w-y i -y-∑i =15w i -w-2=-751374≈-2.0,a ^=y --b ^w =60.0,所以y ^=-2.0w +60.0. (2)由(1)得,y ^=-2.0w +60.0, 所以y ^=-2.0x 2+60.0,当y ^≤20时,即-2.0x 2+60.0≤20,解得x≥25≈4.5,所以为了放心食用该蔬菜,估计需要用4.5千克的清水清洗1千克蔬菜.独立性检验的基本思想及其初步应用[A组学业达标]1.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是( )A.频率分布直方图B.回归分析C.独立性检验D.用样本估计总体解析:根据题意,结合题目中的数据,列出2×2列联表,求出K2观测值,对照数表可得出概率结论,这种分析数据的方法是独立性检验.答案:C2.观察下列各图,其中两个分类变量x,y之间关系最强的是( )解析:观察等高条形图发现x1x1+y1和x2x2+y2相差越大,就判断两个分类变量之间关系越强.答案:D3.如表是一个2×2列联表:则表中a,b的值分别为( )y1y2总计x1 a 21 73x222 25 47总计 b 46 120A.94,72C.52,74 D.74,52解析:a=73-21=52,b=a+22=74,故选C.答案:C4.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果K2的观测值k>5.024,那么在犯错误的概率不超过________的前提下认为“X与Y有关系”()P(K2≥k 0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.87910.828A.0.25 B .0.05 C .0.1D .0.025解析:因为K 2的观测值k >5.024,而在临界值表中对应于5.024的是0.025,所以可以在犯错误的概率不超过0.025的前提下认为“X 和Y 有关系”.答案:D5.分类变量X 和Y 的列表如下,则下列说法判断正确的是( )y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c +dA.ad -bc 越小,说明X 与Y 的关系越弱 B .ad -bc 越大,说明X 与Y 的关系越强 C .(ad -bc)2越大,说明X 与Y 的关系越强 D .(ad -bc)2越接近于0,说明X 与Y 的关系越强解析:列联表可以较为准确地判断两个变量之间的相关关系程度, 由K 2=a +b +c +dad -bc2a +b a +cb +dc +d,当(ad -bc)2越大,K 2越大,表明X 与Y 的关系越强.(ad -bc)2越接近0,说明两个分类变量X 和Y 无关的可能性越大. 即所给说法判断正确的是C. 答案:C6.某部门通过随机调查89名工作人员的休闲方式,了解读书和健身的人数,得到的数据如表:读书 健身 总计 女 24 31 55 男 8 26 34 总计325789在犯错误的概率不超过________的前提下认为性别与休闲方式有关系. 解析:由列联表中的数据,得K 2的观测值为k =89×24×26-31×8255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.答案:0.107.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天的结果如下表所示:死亡 存活 总计 第一种剂量 14 11 25 第二种剂量 6 19 25 总计203050进行统计分析的统计假设是________,K 2=________,说明两种电离辐射剂量对小白鼠的致死作用________.(填“相同”或“不相同”)参考公式:K 2=n ad -bc2a +bc +d a +cb +d解析:统计假设是“小白鼠的死亡与使用的电离辐射剂量无关”,由列联表中数据得K 2=5.33>3.841,所以在犯错误的概率不超过0.05的前提下认为小白鼠的死亡与使用的电离辐射剂量有关.所以两种电离辐射剂量对小白鼠的致死作用不相同.答案:小白鼠的死亡与使用的电离辐射剂量无关 5.33 不相同 8.下表是关于男婴与女婴出生时间调查的列联表:晚上 白天 总计 男婴 45 A B 女婴 E 35 C 总计98D180那么,A =________,B =E =________. 解析:由列联表知识得⎩⎪⎨⎪⎧ 45+E =98,98+D =180,A +35=D ,E +35=C ,B +C =180,解得⎩⎪⎨⎪⎧A =47,B =92,C =88,D =82,E =53.答案:47 92 88 82 539.网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?解析:根据题目所给的数据得到如下2×2列联表:经常上网 不经常上网总计 不及格80120200及格 120 680 800 总计2008001 000得出等高条形图如图所示:比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关.10.随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n 个人,其中男性占调查人数的25.已知男性中有一半的人的休闲方式是运动,而女性中只有13的人的休闲方式是运动.(1)完成下列2×2列联表:运动 非运动总计 男性 女性 总计n(2)数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动? 解析:(1)补全2×2列联表如下:运动 非运动 总计 男性 15n 15n 25n 女性 15n 25n 35n 总计25n 35n n(2)则P(K 2≥k 0)=3.841. 由于K 2的观测值k =n ⎝ ⎛⎭⎪⎫n 5·2n 5-n 5·n 522n 5·3n 5·2n 5·3n 5=n 36,故n36≥3.841,即n≥138.276. 又由15n ∈Z ,故n≥140.故若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的至少有140人.(3)根据(2)的结论,本次被调查的人中,至少有25×140=56(人)的休闲方式是运动.[B 组 能力提升]11.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,故在犯错误的概率不超过________的前提下认为糖尿病患者与遗传有关系.( )A .0.001B .0.005C .0.01D .0.025解析:可以先作出如下列联表(单位:人): 糖尿病患者与遗传列联表糖尿病发病糖尿病不发病总计 阳性家族史 16 93 109 阴性家族史17 240 257 总计33333366根据列联表中的数据,得到K 2的观测值为 k =366×16×240-17×932109×257×33×333≈6.067>5.024.故在犯错误的概率不超过0.025的前提下认为糖尿病患者与遗传有关系. 答案:D12.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是________(填序号). ①若K 2的观测值k =6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.解析:K 2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.答案:③13.根据下表计算:不看电视 看电视 男 37 85 女35143K 2的观测值k≈________(保留3位小数). 解析:k =300×37×143-85×352122×178×72×228≈4.514.答案:4.51414.某学校为了解该校高三年级学生在市一练考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在[120,150]内为优秀.(1)由以上频率分布直方图填写下列2×2列联表.若按是否优秀来判断,是否有99%的把握认为该校的文理科数学成绩有差异.文科 理科 总计 优秀 非优秀 总计5050100(2)某高校派出2140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试.若甲教授面试的学生人数为ξ,求ξ的分布列和均值.解析:(1)由频率分布直方图知,该校文科学生中数学成绩优秀的人数为(0.010+0.004+0.002)×10×50=8,故非优秀人数为50-8=42.该校理科学生中数学成绩优秀的人数为(0.020+0.014+0.006)×10×50=20,故非优秀人数为50-20=30.则2×2列联表如下:文科 理科 总计 优秀 8 20 28 非优秀 42 30 72 总计5050100∴K 2的观测值k =100×8×30-42×20250×50×28×72≈7.143>6.635,故有99%的把握认为该校文理科数学成绩有差异.(2)由(1)知,该校随机抽取的学生成绩中一练数学成绩在140分以上的学生为4人,ξ的可能取值为1,2,3.将4人分给两名教授每名教授至少1名学生的不同分法种数为⎝⎛⎭⎪⎫C 34+C 24C 22A 22A 22=14,则P(ξ=1)=C 1414=27,P(ξ=2)=C 2414=37,P(ξ=3)=C 3414=27.∴ξ的分布列为:ξ 1 2 3 P273727∴E(ξ)=1×27+2×37+3×27=2.15.某校为了了解学生对消防知识的了解情况,从高一年级和高二年级各选取100名同学进行消防知识竞赛.图(1)和图(2)分别是对高一年级和高二年级参加竞赛的学生成绩按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.(1)请计算高一年级和高二年级成绩小于60分的人数.(2)完成2×2列联表,并回答:在犯错误的概率不超过多少的前提下认为“学生所在的年级与消防常识的了解存在相关性”?成绩小于60分人数成绩不小于60分人数总计高一 高二 总计附:临界值表及参考公式: K 2=n ad -bc 2a +bc +d a +cb +d ,n =a +b +c +d. P(K 2≥k 0)0.15 0.100.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828解析:(1)高一年级成绩低于60分的人数为:(0.03+0.04)×10×100=70; 高二年级成绩低于60分的人数为: (0.035+0.015)×10×100=50. (2)2×2列联表如下:成绩小于60分人数成绩不小于60分人数总计 高一 70 30 100 高二 50 50 100 总计12080200由于K 2的观测值k =200×50×70-50×302100×100×120×80≈8.333>7.879,所以在犯错误的概率不超过0.005的前提下认为“学生所在的年级与消防知识的了解存在相关性”.。
人教版数学高二A版选修2-3单元检测第三章统计案例(附答案)
数学人教版A2-3第三章 统计案例单元检测(时间:45分钟,满分:100分)一、选择题(每小题6分,共48分)1( ).A .一次函数模型B .二次函数模型C .指数函数模型D .对数函数模型2.工人月工资y (元)随劳动生产率x (千元)变化的回归方程为ˆy=50+80x .下列判断错误的是( ).A .劳动生产率为1 000元时,工资约为130元B .劳动生产率提高1 000元时,工资提高130元C .劳动生产率提高1 000元时,工资提高80元D .当月工资约为210元时,劳动生产率为2 000元3.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为ˆy=0.66x +1.562.若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( ).A .83%B .72%C .67%D .66%4.若两个变量的残差平方和是325,21()nii x y =-∑=923,则随机误差对预报变量的贡献率约为( ). A .64.8% B .60% C .35.2% D .40% 5.下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②用相关指数可以刻画回归的效果,值越小说明模型的拟合效果越好; ③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型拟合效果越好.其中说法正确的是( ). A .①② B .②③ C .①③ D .①②③6.(创新题)独立检验中,假设H 0:变量X 与变量Y 没有关系,则在H 0成立的情况下,P (K 2≥6.635)=0.010表示的意义是( ). A .变量X 与变量Y 有关系的概率为1%B .变量X 与变量Y 没有关系的概率为99.9%C .变量X 与变量Y 没有关系的概率为99%D .变量X 与变量Y 有关系的概率为99%7( ).A.K2=9.564 B.K2=3.564 C.K2<2.706 D.K2>3.841 8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是().A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关二、填空题(每小题6分,共18分)9.(创新题)已知回归直线ˆy=bx+a斜率的估计值是52,且样本点的中心为(4,5).则当x=-2时,ˆy的值为______.10.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1,2,…,n),若e i恒为0,则R2为________.11.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的试根据上述数据计算K2=______,比较这两种手术对病人又发作心脏病的影响有没有差别______.三、解答题(共34分)12.(10分)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,求该老师用线性回归分析的方法预测他孙子的身高为多少.13.(12分)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表2:注射药物B后皮肤疱疹面积的频数分布表完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与14.(12分)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差;(2)你能残差分析这个模型能较好地刻画零件数和加工时间的关系吗?参考答案1答案:A解析:画出散点图可观察得点都在一条直线上,故A正确.2答案:B解析:当x=1(千元)时,ˆy=130元,A正确;当ˆy=210元时,x=2105080-=2千元,D正确;当x增加一个单位时,ˆy增加80,C正确.3答案:A解析:因为当ˆy=7.675时,x=7.675 1.5620.66-≈9.262,所以7.6759.262≈0.829≈83%.4答案:C解析:由题意可知随机误差对预报变量的贡献率约为325923=0.352.5答案:C解析:相关指数R2越大,说明模型拟合效果越好,故②错误.6答案:D解析:由题意知变量X与Y没有关系的概率为0.01,即认为变量X与Y有关系的概率为99%.7答案:D解析:由K2=2()()()()()n ad bca b c d a c b d-++++,得K2的观测值k=285(4012528)68174540⨯⨯⨯⨯⨯⨯-≈4.722>3.841.8答案:D解析:根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.9答案:-10解析:由已知b=52且4b+a=5,∴a=-5,5ˆ2y x=-5.∴x=-2时,y=-10.10答案:1解析:e i恒为0,说明随机误差总为0,于是y i=ˆy,故R2=1.11答案:1.78不能作出这两种手术对病人又发作心脏病的影响有差别的结论解析:提出假设H0:两种手术对病人又发作心脏病的影响没有差别.根据列联表中的数据,可以求得K2的观测值k=2392(3916729157)68324196196⨯⨯⨯⨯⨯⨯-≈1.78.当H 0成立时,K 2≈1.78,而K 2<2.072的概率为0.85.所以,不能否定假设H 0.也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.12解:由题意父亲身高x cm 与儿子身高y cm 对应关系如下表:则1731701763x ++==173,1701761823y ++==176, 31()()iii x x y y =--∑=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)×(182-176)=18,321()ii x x =-∑=(173-173)2+(170-173)2+(176-173)2=18.∴18ˆ18b==1. ∴ˆˆay bx =-=176-173=3. ∴线性回归直线方程ˆˆˆybx a =+=x +3. ∴可估计孙子身高为182+3=185(cm).由列联表中的数据,得K 2的观测值为k =2200(70653530)10010010595⨯⨯⨯⨯⨯⨯-≈24.561>10.828.因此,有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.14解:(1)根据表中数据作出散点图,如图所示.间对零件数的线性回归方程为ˆy=0.668x+54.93.(2)以零件数为横坐标,残差为纵坐标作出残差图如图所示.由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好.但需注意,由残差图也可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.。
最新整理高中数学人教A版选修2-3本章测评:第三章统计案例1 Word版含解析.doc
本章测评一、选择题(每题只有一个正确答案,请把正确答案的序号填写在题后的括号内)1.下列说法正确的是( )A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义B.独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义C.相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的D.独立性检验如果得出的结论有99%的可信度就意味着这个结论一定是正确的思路解析:相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义.答案:C2.设有一个回归方程为x yˆ8.22ˆ-=,则变量x 增加一个单位时( ) A.y 平均增加2.8个单位 B.y 平均增加2个单位C.y 平均减少2.8个单位D.y 平均减少2个单位思路解析:根据回归方程可知y 是关于x 的单调递减函数,并且由系数知,x 增加一个单位,相应的y 值平均减少1.5个单位.答案:C3.为了研究男子的年龄与吸烟的关系,抽查了100个男人,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:年龄 合计 不超过40岁 超过40岁吸烟量不多于20支/天50 15 65 吸烟量多于20支/天10 25 35 合计60 40 100 则有____________的把握确定吸烟量与年龄有关. …( )A.99.9%B.99%C.95%D.没有理由 思路解析:利用题中列联表,代入公式计算.K 2=40603565)15102550(1002⨯⨯⨯⨯-⨯⨯≈22.16>10.828, 所以我们有99.9%的把握确定吸烟量与年龄有关.答案:A4.下列关于线性回归直线方程yˆ=a+bx 的叙述错误的是 ( ) A.这是根据样本数据近似得出的关系式B.根据回归直线方程可以近似估计某一变量x 对应的y 值C.根据回归直线方程可以估计某一组数据的大致分布情况D.对于同一组数据可以得到若干条直线方程,其中任意一条都可以作为回归直线方程思路解析:回归直线方程是近似描述数据之间的一种关系式,根据回归直线方程可以估计某一变量x 值对应的数值,它是根据样本数据得到的最贴近实际的一条而不是所有直线中的任意一条直线,所以,选项D 是错误的.答案:D5.根据表中提供的数据:x 49.2 50.0 49.3 49.0 49.0 49.5 50.8 50.2 y a 17.0 16.8 16.6 16.7 16.8 b 17.0 若表中数据满足线性相关关系,则表中a,b 的值最有可能是( )A.16.7 50.2B.16.7 16.9C.49.0 50.8D.50.0 47.1思路解析:根据表中数据的特点可以发现y 随着x 的增大而增大,结合表中数据的大小特点可知选项B 最有可能.答案:B 6.根据下表内容,下列说法正确的是( )事件A A 的对立事件 合计方法1a b a+b 方法2c d c+d 合计a+c b+d a+b+c+d A.不论a 、b 、c 、d 取什么值,方法1和方法2对事件A 的影响都是有区别的B.当dc b a =时,可以认为方法1和方法2对事件A 的影响有非常大的区别 C.|dc c b a a +-+|的值越大,说明方法1和方法2对事件A 发生影响的区别越大 D.|dc c b a a +-+|的值越大,说明方法1和方法2对事件A 发生影响的区别越小 思路解析:当b a a +与d c c +的差越大,则两个变量有关系的可能性越大. 答案:C二、填空题(请把正确答案直接填写在题后的括号内)7.一台机器可以按各种不同速度运转,其生产的物件有一些会有缺点,每小时生产有缺点物件的多寡,随机器运转的速度而变化,下列为其试验结果:速度(转/秒) 每小时生产有缺点物件数8 512 814 916 11则机器速度影响每小时生产有缺点物件数的回归直线方程为________________.思路解析:直接代入回归直线方程的公式,回归直线方程:yˆ=a+bx,其中回归系数是:.,1221x b y a x n xy x n y x b n i in i i i-=--=∑∑==答案:yˆ=0.728 6x-0.857 1 8.对于一条线性回归直线yˆ=a+bx,如果x=3时,对应的y 的估计值是17,当x=8时,对应的y 的估计值是22,那么,可以估计出回归直线方程是_____________,根据回归直线方程判断当x=_____________时,y 的估计值是38.思路解析:首先把两组值代入回归直线方程得⎩⎨⎧==⇒⎩⎨⎧=+=+.14,1228173a b a b a b 所以回归直线方程是yˆ=x+14.令x+14=38,可得x=24. 答案:yˆ=x+14 24 9.在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验,对这两个回归方程进行检验,与实际数据(个数)对比结果如下:与实际相符数据个数 与实际不符合数据个数 合计甲回归方程32 8 40 乙回归方程40 20 60 合计72 28 100 则从表中数据分析,_____________回归方程更好(即与实际数据更贴近).思路解析:可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,也可以画出二维条形图进行判断.甲回归方程的数据准确率为544032=,而乙回归方程的数据准确率为326040=,显然甲的准确率高些,因此甲回归方程好些. 答案:甲10.假如由数据:(1,2),(3,4),(2,2),(4,4),(5,6),(3,3.6)可以得出线性回归方程yˆ=a+bx 必经过的定点是以上点中的_____________.思路解析:易知,线性回归方程yˆ=a+bx 必经过定点(y x ,),而根据计算可知这几个点中满足条件的是(3,3.6).答案:(3,3.6)三、解答题(请写出详细解题过程)11.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据.(单位:kg )施化肥量x15 20 25 30 35 40 45 水稻产量y 330345 365 405 445 450 455 (1)画出散点图;(2)求y 关于x 的线性回归方程;(3)若施化肥量为38 kg,其他情况不变,请预测水稻的产量.思路分析:首先根据表中数据可以画出散点图,然后根据散点图的趋势判断相关关系是正相关还是负相关;利用最小二乘法求出回归直线系数,从而得到回归方程,把x=38代入方程即可估计出施肥量为38 kg 时水稻的产量.解:(1)根据表中数据可得散点图如下:(2)根据回归直线方程系数的公式计算可得回归直线方程yˆ=4.75x+257. (3)把x=38代入回归直线方程得y=438,所以,可以预测,施化肥量为38 kg,其他情况不变,水稻的产量是438 kg.12.在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲是否与性别有关?并给出结论的可信度.思路分析:本题应首先作出调查数据的列联表,再根据列联表画出二维条形图或者是三维柱形图,根据图形粗略给出结论,再根据独立性检验得出结论的可信度.解:根据题目中的数据可得列联表如下:色盲 不色盲 合计男人38 442 480 女人6 514 520 合计44 956 1 000 根据列联表作出二维条形图如下:从二维条形图来看,在男人中患色盲的比例为:48038,比在女人中患色盲的比例5206要大,其差值|48038-5206|≈0.068,差值较大,因而我们可以认为性别与患色盲是有关的,根据列联表中所给的数据可以有:a=38,b=442,c=6,d=514,代入公式K 2=))()()(()(2d b c a d c b a bc ad n ++++-,可得K 2=95644520480)442651438(10002⨯⨯⨯⨯-⨯⨯≈27.1,由于K 2≈27.1>10.828,所以,我们有99.9%的把握认为性别与色盲有关,这个结论只对调查的480名男人和520名女人适用.。
高中数学第三章统计案例本章测评(含解析)新人教A版选修23
高中数学第三章统计案例本章测评(含解析)新人教A版选修23(时间:90分钟满分:100分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法中错误的是( )A.如果变量x与y之间存在线性相关关系,则我们根据试验数据得到的点(x i,y i)(i=1,2,…,n)将散布在某一条直线的附近B.如果两个变量x与y之间不存在线性关系,那么根据它们的一组数据(x i,y i)(i=1,2,…,n)不能写出一个线性方程C.设x,y是具有相关关系的两个变量,且y关于x的线性回归方程为x+叫做回归系数D.为使求出的线性回归方程有意义,可用统计检验的方法来判断变量y与x之间是否存在线性相关关系解析:任何一组(x i,y i)(i=1,2,…,n)都能写出一个线性方程,只是有的无意义.答案:B2.在建立两个变量y与x的回归模型时,分别选择了4个不同的模型,它们的相关指数R2如下,其中拟合得最好的模型为( )A.模型1的相关指数R2为0.75B.模型2的相关指数R2为0.90C.模型3的相关指数R2为0.25D.模型4的相关指数R2为0.55解析:相关指数R2的值越大,意味着残差平方和越小,也就是说拟合效果越好.答案:B3.下列关于独立性检验的说法中,错误的是( )A.独立性检验依据小概率原理B.独立性检验得到的结论一定正确C.样本不同,独立性检验的结论可能有差异D.独立性检验不是判定两类事物是否相关的唯一方法答案:B4.一位母亲记录了儿子3~9岁的身高,数据略,由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A.身高一定是145.83cmB.身高在145.83cm以上C.身高在145.83cm左右D.身高在145.83cm以下解析:只能预测,不能确定实际值.答案:C5.为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了200位老年人,结构如下:性别是否需要志愿者男需要70 0不需要30 0附:P( K2>k0).05.01.001k03.8416.63510.828K2=参照附表,得到的正确结论是( ).A.在犯错误的概率不超过0.1%的前提下认为“该地区的老年人是否需要志愿者提供帮助与性别有关”B.在犯错误的概率不超过0.1%的前提下认为“该地区的老年人是否需要志愿者提供帮助与性别无关”C.最多有99%的把握认为“该地区的老年人是否需要志愿者提供帮助与性别有关”D.最多有99%的把握认为“该地区的老年人是否需要志愿者提供帮助与性别无关”解析:由公式可计算K2的观测值k==≈18.18>10.828,所以在犯错误的概率不超过0.1%的前提下认为“该地区的老年人是否需要志愿者提供帮助与性别有关”,故选A.答案:A6.三点(3,10),(7,20),(11,24)确定的线性回归方程是( )A.=1.75x-5.75B.=1.75x+5.75C.=-1.75x+5.75D.=-1.75x-5.75xz解析:设回归直线为x+,则由公式得=1.75,=5.75.答案:B7.下列说法:①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1,或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.正确的有( )A.①②B.②③C.①③D.①②③解析:由相关系数的定义可知①③正确.答案:C8.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( )A.83%B.72%C.67%D.66%解析:因为当=7.675时,x=≈9.262,所以≈0.829≈83%.答案:A9.若对于变量y与x的10组统计数据的回归模型中,相关指数R2=0.95,又知残差平方和为120.53,那么(y i-)2的值为( )A.241.06B.2410.6C.253.08D.2530.8解析:由R2=1-,得0.95=1-,得(y i-)2==2410.6.答案:B10.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线l1和l2,已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s ,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法正确的是( )A.直线l1和直线l2有交点(s,t)B.直线l1和直线l2相交,但交点未必是点(s,t)C.直线l1和直线l2由于斜率相等,所以必定平行D.直线l1和直线l2必定重合解析:l1与l2都过样本中心点(s,t).答案:A二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中的横线上)11.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系.其中具有相关关系的是.解析:②⑤中两个变量之间的关系是确定性关系,不是相关关系.①③④中两个变量之间具有相关关系.答案:①③④12.由数据:(1,2),(3,4),(2,2),(4,4),(5,6),(3,3.6)得出的线性回归方程x必经过的定点是以上点中的.解析:易知,线性回归方程x必经过定点(),而根据计算可知这几个点中满足条件的是(3,3.6).答案:(3,3.6)13.下列是关于男婴与女婴出生时间调查的列联表晚上白天总计男婴45a b女婴e35c 总计98d180那么a=,b=,c=,d=,e=.解析:∵45+e=98,∴e=53;∵e+35=c,∴c=88;∵98+d=180,∴d=82;∵a+35=d,∴a=47;∵45+a=b,∴b=92.答案:47 92 88 82 5314.某学校对校选课程“人与自然”的选修情况进行了统计,得到如下数据:选未选总计男405 45450女23022450总计635265900那么,在犯错误的概率不超过的前提下认为选修“人与自然”与性别有关.解析:K2=,k≈163.8>10.828,即在犯错误的概率不超过0.001的前提下认为选修“人与自然”与性别有关.答案:0.00115.对有关数据的分析可知,每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压度y(单位:kg/cm2)之间具有线性相关关系,其线性回归方程为=0.30x+9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7kg/cm2,则每立方米混凝土的水泥用量最少应为kg.(精确到0.1kg)解析:由已知,0.30x+9.99≥89.7,解得x≥265.7.答案:265.7三、解答题(本大题共2小题,共25分.解答时应写出文字说明、证明过程或演算步骤)16.(10分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高18 725学习积极性一般6 1925合计24 265(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?并说明理由.分析:(1)运用古典概型概率公式求值.(2)求出随机变量,说明关系.解:(1)积极参加班级工作的学生有24人,不太主动参加班级工作且学习积极性一般的学生有19人,总人数为50人,∴抽到积极参加班级工作的学生的概率为;抽到不太主动参加班级工作且学习积极性一般的学生的概率为.(2)k=≈11.5,∵k>10.828,∴在犯错误的概率不超过0.001的前提下认为学习积极性与对待班级工作的态度有关系.17.(15分)在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:年龄x23273941454955354565758661 脂肪含量y9.517.821.225.927.526.328.229.630.231.430.833.535.234.6(1)作出散点图,并判断y与x是否线性相关,若线性相关,求线性回归方程;(2)求相关指数R2,并说明其含义;(3)给出37岁时人的脂肪含量的预测值.分析:先作出样本数据的散点图,进而求出回归模型,并依据公式求出R2,进而说明拟合效果.解:(1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.设线性回归方程为x+,则由计算器算得≈0.576,=-0.448,所以线性回归方程为=0.576x-0.448.(2)(y i-)2≈37.78.(y i-)2≈644.99.R2=1-≈0.941.R2≈0.941,表明年龄解释了94.1%的脂肪含量变化.(3)当x=37时,=0.576×37-0.448≈20.9,故37岁时人的脂肪含量约为20.9%.。
人教A版高中数学选修2-3第三章《统计案例》测试题(含答案解析)(2)
高中新课标选修(2-3)第三章统计案例综合测试题一、选择题1.下列属于相关现象的是( ) A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 答案:B2.如果有95%的把握说事件A 和B 有关,那么具体算出的数据满足( ) A.2 3.841K > B.2 3.841K < C.2 6.635K > D.2 6.635K <答案:A3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大( ) A.E B.C C.D D.A答案:A4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人)9 根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A.90% B.95%C.99%D.100%答案:C5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:1你认为婴儿的性别与出生时间有关系的把握为( ) A.80% B.90%C.95%D.99%答案:B6.已知有线性相关关系的两个变量建立的回归直线方程为y a bx =+,方程中的回归系数b ( ) A.可以小于0 B.只能大于0 C.可以为0D.只能小于0答案:A7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 答案:C8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①②B.②③C.①③D.①②③答案:C9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:如果某天气温是2℃,则这天卖出的热饮杯数约为( ) A.100 B.143C.200D.243答案:B10.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于()A.0.3~0.4 B.0.4~0.5 C.0.5~0.6 D.0.6~0.7答案:B二、填空题11.某矿山采煤的单位成本Y与采煤量x有关,其数据如下:则Y对x的回归系数.答案:0.1229-12.对于回归直线方程 4.75257y x=+,当28x=时,y的估计值为.答案:39013.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则2K=.答案:16.37314.某工厂在2005年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据:0 2.55则月总成本y对月产量x的回归直线方程为.答案: 1.2150.975y x=+三、解答题15.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:对于教育机构的研究项目,根据上述数据能得出什么结论.解:22392(3916715729)1.7819619668324K⨯⨯-⨯=≈⨯⨯⨯.因为1.78 2.706<,所以我们没有理由说人具有大学专科以上学历(包括大学专科)和对待教育改革态度有关.16.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数=9.1+0.006×吨位.(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少?(2)对于最小的船估计的船员数为多少?对于最大的船估计的船员数是多少?解:由题意知:(1)船员平均人数之差=0.006×吨位之差=0.006×1000=6,∴船员平均相差6人;(2)最小的船估计的船员数为:9.1+0.006×192=9.1+1.152=10.252≈10(人).最大的船估计的船员数为:9.1+0.006×3246=9.1+19.476=28.576≈28(人).17.假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录:11(1)作出这些数据的散点图;(2)求出这些数据的回归方程;(3)对于这个例子,你如何解释回归系数的含义?(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从3~16岁身高的年均增长数.(5)解释一下回归系数与每年平均增长的身高之间的联系.解:(1)数据的散点图如下:(2)用y表示身高,x表示年龄,则数据的回归方程为y=6.317x+71.984;(3)在该例中,回归系数6.317表示该人在一年中增加的高度; (4)每年身高的增长数略.3~16岁身高的年均增长数约为6.323cm ; (5)回归系数与每年平均增长的身高之间近似相等.18.某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表:已知721280ii x ==∑,2145309ii y ==∑,13487i i i x y ==∑.(1)求x y ,; (2)画出散点图;(3)判断纯利y 与每天销售件数x 之间是否线性相关,如果线性相关,求出回归方程. 解:(1)345678967x ++++++==,6669738189909179.867y ++++++=≈;(2)略;(3)由散点图知,y 与x 有线性相关关系, 设回归直线方程:y bx a =+,5593487761337 4.7528073628b -⨯⨯===-⨯,79.866 4.7551.36a =-⨯=.∴回归直线方程 4.7551.36y x =+.。
高中数学人教A版选修2-3:阶段质量检测(三) 统计案例 Word版含解析
阶段质量检测(三) 统计案例(时间120分钟 满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .可以小于0 B .大于0 C .能等于0D .只能小于0解析:选A ∵b ^=0时,则r =0,这时不具有线性相关关系,但b ^可以大于0也可以小于0.2.每一吨铸铁成本y (元)与铸件废品率x %建立的回归方程y ^=56+8x ,下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元解析:选C 根据回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.3.下表显示出样本中变量y 随变量x 变化的一组数据,由此判断它最可能是( )A .线性函数模型B .二次函数模型C .指数函数模型D .对数函数模型解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.4.试验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A .y ^=x +1B . y ^=x +2 C .y ^=2x +1 D .y ^=x -1解析:选A 由题意发现,(x ,y )的四组值均满足y ^=x +1,故y ^=x +1为回归直线方程.5.下列关于等高条形图说法正确的是( ) A .等高条形图表示高度相对的条形图 B .等高条形图表示的是分类变量的频数 C .等高条形图表示的是分类变量的百分比 D .等高条形图表示的是分类变量的实际高度 解析:选C 由等高条形图的特点及性质进行判断.6.根据一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析存在线性相关关系,求得其回归方程y ^=0.85x -85.7,则在样本点(165,57)处的残差为( )A .54.55B .2.45C .3.45D .111.55解析:选B 把x =165代入y ^=0.85x -85.7,得y =0.85×165-85.7=54.55,由57-54.55=2.45,故选B .7.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 解析:选C 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C 正确.8.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%解析:选A将y=7.675代入回归方程,可计算得x≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83≈83%,即约为83%.9.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:则在犯错误的概率不超过__________的前提下认为吸烟量与年龄有关()A.0.001 B.0.01C.0.05 D.没有理由解析:选A K2=100×(50×25-10×15)265×35×60×40≈22.16>10.828,所以我们在犯错误的概率不超过0.001的前提下认为吸烟量与年龄有关.10.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线为l1和l2,已知在两人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t,那么下列说法正确的是()A.直线l1和直线l2有交点(s,t)B.直线l1和直线l2相交,但交点未必是点(s,t)C.直线l1和直线l2由于斜率相等,所以必定平行D.直线l1和直线l2必定重合解析:选A l1与l2都过样本中心(x,y).11.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:对于以下数据,对同一样本能说明X 与Y 有关的可能性最大的一组为( ) A .a =9,b =8,c =7,d =6 B .a =9,b =7,c =6,d =8 C .a =8,b =6,c =9,d =7 D .a =6,b =7,c =8,d =9解析:选B 对于同一样本|ad -bc |越小,说明X 与Y 之间的关系越弱,|ad -bc |越大, 故检验知选B .12.两个分类变量X 和Y, 值域分别为{x 1,x 2}和{y 1,y 2}, 其样本频数分别是a =10, b =21, c +d =35. 若X 与Y 有关系的可信程度不小于97.5%, 则c 等于( )A .3B .4C .5D .6解析:选A 列2×2列联表如下:故K 2的观测值k =66×[10(35-c )-21c ]31×35×(10+c )(56-c )≥5.024. 把选项A, B, C, D 代入验证可知选A .二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上) 13.已知某车间加工零件的个数x 与所花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工600个零件大约需要________h .解析:当x =600时,y ^=0.01×600+0.5=6.5. 答案:6.514.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),若e i 恒为0,则R 2为________.解析:e i 恒为0,说明随机误差总为0,于是y i =y ^,故R 2=1. 答案:115.下列是关于出生男婴与女婴调查的列联表那么A =______,B =______,C ______,D =________,E =________. 解析:∵45+E =98,∴E =53,∵E +35=C ,∴C =88,∵98+D =180,∴D =82, ∵A +35=D ,∴A =47,∵45+A =B ,∴B =92. 答案:47 92 88 82 5316.已知x ,y 之间的一组数据如表,对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +12,利用最小二乘法判断拟合程度更好的直线是________.解析:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 1=⎝⎛⎭⎫1-432+(2-2)2+(3-3)2+⎝⎛⎭⎫4-1032+⎝⎛⎭⎫5-1132=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝⎛⎭⎫3-722+(4-4)2+⎝⎛⎭⎫5-922=12.因为S 2<S 1,故用直线l 2:y =12x +12,拟合程度更好.答案:y =12x +12三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算步骤)17.(本小题满分10分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)试说明在这三种心理障碍中哪一种与性别关系最大?解:对于上述三种心理障碍分别构造三个随机变量K 21,K 22,K 23,由表中数据可得K 21=110×(5×60-25×20)230×80×25×85≈0.863,K 22=110×(10×70-20×10)230×80×20×90≈6.366,K 23=110×(15×30-15×50)230×80×65×45≈1.410.因为K 22的值最大,所以说谎与性别关系最大.18.(本小题满分12分)有人统计一个省的6个城市某一年的人均国内生产总值(人均GDP)x 和这一年各城市患白血病的儿童数量y ,其数据如下表所示:(1)画出散点图,并判断是否线性相关; (2)求y 与x 之间的回归方程. 解:(1)作散点图(如下图所示).由散点图可知y 与x 具有线性相关关系.(2)将数据代入公式,可得b ^≈23.253,a ^≈102.151. 故y 与x 之间的线性回归方程是y ^=23.253x +102.151.19.(本小题满分12分)某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下表所示(单位:人):(1)求m ,n ;(2)能否在犯错误的概率不超过0.005的情况下认为教学方式与成绩有关系? 解:(1)m =45-15=30,n =50+50=100. (2)由表中的数据,得K 2的观测值为 k =100×(35×30-15×20)250×50×55×45≈9.091.因为9.091>7.879,所以能在犯错误的概率不超过0.005的前提下认为教学方式与成绩有关系.20.(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.解:(1)2×2列联表如下K 2=200×(50×40-60×50)2110×90×100×100≈2.02<2.706,所以没有理由认为选择不同的工艺与生产出一等品有关.(2)由题知运用甲工艺生产单件产品的利润X 的分布列为X 的数学期望为E (X )=30×0.5+20×0.3+15×0.2=24,X 的方差为D (X )=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.乙工艺生产单件产品的利润Y 的分布列为Y 的数学期望为E (Y )=30×0.6+20×0.1+15×0.3=24.5,Y 的方差为D (Y )=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25. 由上述结果可以看出D (X )<D (Y ),即甲工艺波动小,虽然E (X )<E (Y ),但相差不大,所以以后选择甲工艺.21.(本小题满分12分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:附:K 2的观测值k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)在犯错误的概率不超过0.01的前提下是否可认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?请说明理由.解:(1)调查的500位老人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为70500=14%.(2)随机变量K2的观测值k=500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,因此,在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关.(3)由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据中能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并且采用分层抽样方法比采用简单随机抽样的方法更好.22.(本小题满分12分)某市为了对学生的数理(数学与物理)学习能力进行分析,从10 000名学生中随机抽出100位学生的数理综合学习能力等级分数(6分制)作为样本,分数频数分布如下表:(1)如果以能力等级分数大于4分作为良好的标准,从样本中任意抽取2名学生,求恰有1名学生为良好的概率.(2)统计方法中,同一组数据常用该组区间的中点值(例如区间(1,2]的中点值为1.5)作为代表:①据此,计算这100名学生数理学习能力等级分数的期望μ及标准差σ(精确到0.1);②若总体服从正态分布,以样本估计总体,估计该市这10 000名学生中数理学习能力等级在(1.9,4.1)范围内的人数.(3)从这10 000名学生中任意抽取5名同学,他们数学与物理单科学习能力等级分数如下表:①请画出上表数据的散点图;②请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^(附参考数据:129≈11.4).解:(1)样本中学生为良好的人数为20人.故从样本中任意抽取2名学生,则仅有1名学生为良好的概率为C 120×C 180C 2100=3299. (2)①总体数据的期望约为:μ=0.5×0.03+1.5×0.17+2.5×0.30+3.5×0.30+4.5×0.17+5.5×0.03=3.0,标准差σ=[(0.5-3)2×0.03+(1.5-3)2×0.17+(2.5-3)2×0.3+(3.5-3)2×0.3+(4.5-3)2×0.17+(5.5-3)2×0.03]12= 1.29≈1.1,②由于μ=3,σ=1.1当x ∈(1.9,4.1)时,即x ∈(μ-σ,μ+σ),故数理学习能力等级分数在(1.9,4.1)范围中的概率为0.682 6.数理习能力等级分数在(1.9,4.1)范围中的学生的人数约为10 000×0.682 6=6 826人.(3)①数据的散点图如图:②设线性回归方程为y ^=b ^x +a ^,则b ^=∑i =15x i y i -5x y ∑i =15x 2i -5x2=1.1,a ^=y -b ^x =-0.4.故回归直线方程为y ^=1.1x -0.4.第11页共11页。
2017-2018学年人教A版高中数学选修2-3检测:第三章 统
温馨提示:此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。
关闭Word文档返回原板块。
阶段通关训练(三)(60分钟100分)一、选择题(每小题5分,共30分)1.船员人数关于船的吨位的线性回归方程是=95+0.06x.如果两艘轮船吨位相差1000吨.则船员平均人数相差( )A.40B.57C.60D.95【解析】选C.由题意,由于线性回归方程是=95+0.06x,两艘轮船吨位相差1000吨,所以船员平均人数的差值是0.06×1000=60.2.已知呈线性相关关系的变量x,y之间的关系如表所示,则回归直线一定过点( )A.(0.1,2.11)B.(0.2,2.85)C.(0.3,4.08)D.(0.275,4.797 5)【解析】选D.回归直线一定过点(错误!未找到引用源。
),通过表格中的数据计算出错误!未找到引用源。
,易知选D.3.(2017·青岛高二检测)某校高三年级学生学习数学的时间(x)与考试成绩(y)之间建立线性回归直线方程y=x,经计算,方程为=20-0.8x,该方程参数计算( )A.值是明显不对的B.值是明显不对的C.值和值都是不对的D.值和都是正确的【解析】选 B.一般来说,学习的时间与考试成绩基本上是正相关的,所以值应是正值.4.某个工业企业生产性固定资产价值与工业增加值数据如下(单位:万元):根据上表数据计算的相关系数为( )A.0B.-0.8973C.1.0228D.0.9918 【解析】选D.利用相关系数的计算公式即可求得.5.(2017·厦门高二检测)为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:由以上数据计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是( )A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.在犯错误的概率不超过0.001的前提下认为课外阅读量大与作文成绩优秀有关D.在犯错误的概率不超过0.005的前提下认为课外阅读量大与作文成绩优秀有关【解析】选 D.根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关.6.(2017·哈尔滨高二检测)某咖啡厅为了了解热饮的销售量y(个)与气温x(℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:由表中数据,得线性回归方程当气温为-4℃时,预测销售量约为( ) A.68 B.66 C.72 D.70【解析】选A.因为=(18+13+10-1)=10,=(24+34+38+64)=40,所以40=-2×10+,所以=60,当x=-4时,y=-2×(-4)+60=68.二、填空题(每小题5分,共20分)7.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.如果K2≥5.024,那么推断“X与Y有关系”犯错误的概率不超过________.【解析】由表可知k0=5.024对应的P为0.025,即P(K2≥5.024)=0.025,从而推出“X与Y有关系”犯错误的概率不超过0.025.答案:0.0258.(2017·临沂高二检测)若施肥量x(kg)与小麦产量y(kg)之间的回归直线方程为=250+4x,当施肥量为50kg时,预计小麦产量为________.【解析】将x=50代入回归方程得=450kg.答案:450kg9.吃零食是中学生中普遍存在的现象.吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表:试回答吃零食与性别有关系吗?(答有或没有)________.【解析】k===≈4.722>3.841.故约在犯错误的概率不超过0.05的前提下认为“吃零食与性别”有关.答案:有10.(2017·太原高二检测)对具有线性相关关系的变量x和y,测得一组数据如下:若已求得它们的回归直线的斜率为 6.5,则这条回归直线方程为___________.【解析】由数据表得=5,=50,所以=-6.5=17.5.所以回归直线方程为=17.5+6.5x.答案:=17.5+6.5x三、解答题(共4小题,共50分)11.(12分)在一段时间内,某种商品的价格x(单位:元)和需求量y(单位:件)之间的一组数据如下:求出y 关于x 的回归直线方程,并说明拟合效果的好坏.【解析】因为错误!未找到引用源。
2019-2020学年数学人教A版选修2-3检测:第三章统计案例测试卷
(时间: 90 分钟 满分: 150 分 )
一、选择题 (本大题共 12 小题,每小题 5 分,共 60 分.在每小题给出的四个选项中,只
有一项是符合题目要求的 )
1.对于回归直线方程 y^ = b^x+ a^,下列说法不正确的是 (
)
A .直线必经过点 (-x , -y ) B. x 增加 1 个单位时, y 平均增加 b^ 个单位 C.样本数据中 x=0 时,可能有 y= a^ D.样本数据中 x= 0 时,一定有 y= a^ 解析: 回归直线方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近
似值. 答案: D 2.根据如下样本数据:
x3 4
5
6
7
8
y 4 2.5 - 0.5 0.5 -2 - 3
得到的回归直线方程为 y^= b^ x+ a^,则 (
)
A.a^>0, b^ <0 B.a^>0, b^ >0
C.a^<0, b^ >0 D.a^<0, b^ <0
解析: 根据题意,画出散点图.根据散点图,知两个变量为负相关,且回归直线与
甲班
优秀 10
不优秀 35
合计 45
乙班
7
38
45
合计
17
73
90
利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于
()
A . 0.3~ 0.4 B. 0.4~ 0.5
C. 0.5~ 0.6 D. 0.6~ 0.7
解析: 因为
90× 10× 38- 7× 35 K 2= 45× 45×17× 73
也就是选修该课程与性别有关出错的可能性不超过
专题07:人教A版选修2-3第三章统计案例综合提升检测题(解析版)
专题07:人教A 版选修2-3第三章统计案例综合提升检测题(解析版)一、单选题1.若由一个22⨯列联表中的数据计算得2 4.013K =,那么有( )把握认为两个变量有关系.A .95%B .97.5%C .99%D .99.9%【答案】A 【分析】由2 3.841K >可对照临界值表得到结果. 【详解】2 4.013 3.841K =>,∴有()10.05100%95%-⨯=的把握认为两个变量有关系.故选:A.2.在建立两个变量y 与x 的回归模型中,分别选择了4个不同的模型,模型1的相关指数2R 为0.88,模型2的相关指数2R 为0.945,模型3的相关指数2R 为0.66,模型4的相关指数2R 为0.01,其中拟合效果最好的模型是( ) A .模型1 B .模型2C .模型3D .模型4【答案】B 【分析】由回归模型的原理可知,当相关系数01R <<,且1R →,相关性越强. 【详解】所给四个模型中,模型2的相关指数最大,回归模型的拟合效果越好. 故选:B .3.为研究某种细菌在特定环境下随时间变化的繁殖情况,得到如下实验数据:由最小二乘法得y 与x 的线性回归方程为ˆˆ0.35ybx =+,则样本在(4,3)处的残差为( ) A .-0.15 B .0.15C .-0.25D .0.25【答案】A 【分析】求出样本中心,进而求出ˆb,最后根据残差的定义进行求解即可. 【详解】 因为3456 4.54x +++==, 2.534 4.53.54y +++==,所以有ˆˆ3.5 4.50.350.7bb =+⇒=, 当4x =时,0.740.35 3.15y =⨯+=,所以样本在(4,3)处的残差为:3 3.150.15-=-.故选:A 【点睛】本题考查了样本残差的求法,属于基础题.4.某研究性学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如表()2P K k ≥ 0.150.10 0.05 0.025 0.010 0.005 0.001k2.072 2.7063.841 5.024 6.635 7.879 10.828则下列选项正确的是( )A .有99.5%的把握认为使用智能手机对学习有影响B .有99.5%的把握认为使用智能手机对学习无影响C .有99.9%的把握认为使用智能手机对学习有影响D .有99.9%的把握认为使用智能手机对学习无影响 【答案】A 【分析】根据2K的值,结合附表所给数据,选出正确选项. 【详解】依题意()22304216810787912182010K⨯⨯-⨯==>⨯⨯⨯.,故有99.5%的把握认为使用智能手机对学习有影响,故选:A.【点睛】本题主要考查22⨯列联表独立性检验的知识,属于基础题.5.某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成年份序号x(2012年作为第1年)的函数.运用Excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法中正确的个数为()①销售额y与年份序号x呈正相关关系;②销售额y与年份序号x线性相关不显著;③三次函数回归曲线的效果好于回归直线的拟合效果;④根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为8454亿元.A.1 B.2 C.3 D.4【答案】B【分析】由散点图分布趋势知①正确;由相关系数0.9360.75>知②错误;根据两模型相关系数大小关系可知③正确;将10x=代入三次函数方程即可求得y的预估值,知④错误.【详解】根据图象可知,散点从左下到右上分布,销售额y与年份序号x呈正相关关系,①正确;相关系数0.9360.75>,靠近1,销售额y 与年份序号x 线性相关显著,②错误; 根据三次函数回归曲线的相关指数0.9990.936>,相关指数越大,拟合效果越好,所以三次函数回归曲线的拟合效果好于回归直线的拟合效果,③正确;由三次函数320.16828.14129.027 6.889y x x x =+-+,当10x =时,2698.719y =亿元,④错误. 故选:B .6.某同学用收集到的6组数据对(),(1,2,3,4,5,6)i i x y i =制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线1l 的方程:11y b x a =+,相关系数为1r ,相关指数为21R :经过残差分析确定点E 为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据计算得到回归直线2l 的方程:22y b x a =+,相关系数为2r ,相关指数为22R .则以下结论中,正确的是( )①10r >,20r >;②10b >,20b >;③12b b >;④2212R R >A .①②B .①②③C .②④D .②③④【答案】B 【分析】根据散点图逐项进行判断即可. 【详解】①:由散点图可知,,x y 之间是正相关关系,所以10r >,20r >,故①正确; ②③:由散点图可知,回归直线的斜率是正数,且1l 的斜率大于2l 的斜率,所以10b >,20b >,12b b >,故②③正确;④:由散点图可知,去掉“离群点”E 后,相关性更强,拟合的效果更好,所以2212R R <,故④错误; 故选:B.7.已知变量x ,y 的关系可以用模型kx y c e =⋅拟合,设ln z y =,其变换后得到一组数据下:由上表可得线性回归方程4z x a =-+,则c =( ) A .4- B .4e -C .109D .109e【答案】D 【分析】根据表格数据求,x z ,代入回归方程求参数a ,结合ln z y =得ln z c kx =+,由方程的形式可知ln a c =,即可求c . 【详解】由表格数据知:161718195034413117.5,3944x z ++++++====.由4z x a =-+,得417.539a -⨯+=,则109a =. ∴4109z x =-+,由kxy c e =⋅,得ln ln()ln ln ln kxkxz y c e c ec kx ==⋅=+=+,∴ln 109c =,即109c e =. 故选:D.8.某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下22⨯列联表:则可以说其亲属的饮食习惯与年龄有关的把握为( )附:参考公式和临界值表22()()()()()n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%【答案】C 【分析】计算出2K ,进而作出判断. 【详解】由题意,得2230(42168)10 6.63512182010K ⨯-⨯==>⨯⨯⨯所以有99%的把握认为其亲属的饮食习惯与年龄有关 故选:C .9.对两个变量x ,y 进行回归分析,得到组样本数据()11,x y ,()22,x y ,,(),n n x y ,则下列说法不正确的是( )A .由样本数据得到的回归直线方程ˆˆˆybx a =+必经过样本中心点(),x y B .相关指数2R 越大,残差的平方和越小,其模型的拟合效果越好C .若线性回归方程为ˆ0.610yx =+,当解释变量x 每增加1个单位时,预报变量y 平均增加0.6个单位D .相关系数r 越接近1,变量x ,y 相关性越强 【答案】D 【分析】根据回归直线方程,相关系数,相关指数的定义,分别判断选项. 【详解】由定义知回归直线方程ˆˆˆybx a =+必经过样本中心点(),x y ,故A 正确; 由相关指数2R 的定义知,2R 越大模型拟合效果越好,由残差的平方和定义知,残差的平方和越小模型的拟合效果越好,故B 正确; C 选项是回归直线方程的应用,故C 正确;相关系数r 的范围为11r -≤≤,由定义知r 越接近1,变量x ,y 相关性越强,故D 错误.故选:D .10.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )参考公式附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:A .130B .190C .240D .250【答案】B 【分析】设男、女生的人数都为5x ,列出22⨯列联表,计算2K 的值,查表解不等式即可. 【详解】依题意,设男、女生的人数各为5x ,建立22⨯列联表如下所示:故()2222831010553721x x xx K x x x x =⋅⋅⋅⋅-=,由题可知106.63510.82821x <<,∴139.33510227.388x <<,只有B 符合题意. 故选:B. 【点睛】本题主要考查独立性检验,关键点是建立22⨯列联表代入公式计算,考查数学运算、数学建模的核心素养.11.某商场为了了解毛衣的月销售量y (件)与月平均气温x (C ︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:由表中数据算出线性回归方程y bx a =+中的2b =-,气象部门预测下个月的平均气温为6C ︒,据此估计该商场下个月毛衣销售量约为( ) A .58件 B .40件C .38件D .46件【答案】D 【解析】试题分析:由表格得(),x y 为:()10,38,因为(),x y 在回归方程y bx a =+上且2b =-,()38102a ∴=⨯-+,解得58a =∴2ˆ58y x =-+,当6x =时,26ˆ5846y=-⨯+=,故选D. 考点:1、线性回归方程的性质;2、回归方程的应用.12.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s >< D .270,75x s <>【答案】A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+, 22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <. 故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.二、填空题13.如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是__________.【答案】E . 【详解】分析:由于点越靠近回归直线,则相关性越强,相关系数越大,又由于点E 到回归直线的距离最大,所以要去掉点E.详解:由于点E 到回归直线的距离最大,所以去掉点E 后,剩下的5个点对应的相关系数会最大.点睛:(1)本题主要考查回归直线方程和相关系数,意在考查学生对这些基础知识的掌握水平.(2) 两个变量之间线性相关关系的强弱用相关系数r 来衡量.相关系数()()niix x y y r --=∑ 0r >,表示两个变量正相关;0r <,表示两个变量负相关;r 的绝对值越接近1,表明两个变量的线性相关性越强.r 的绝对值越接近0,表明两个变量之间几乎不存在线性相关关系.通常,r 的绝对值大于0.75时,表明两个变量的线性相关性很强.14.某设备的使用年限x 与所支出的维修费用y 呈线性相关,部分统计数据如下表:根据上表可得y 关于x 的回归直线方程为 1.5y x a =+,据此模型预测,若使用年限为16年,估计维修费用为__________万元.【答案】23. 【分析】先计算样本数据的x 和y ,代入回归直线方程可解得ˆa,然后令16x =,计算ˆy 的值. 【详解】 根据条件可得 2.5345 5.545x ++++==,24 5.5 6.5755y ++++==则中心点为()4,5,代入回归直线方程可得:ˆˆ5 1.541, 1.51ay x =-⨯=-=-. 当16x =时,ˆ 1.516123y =⨯-=(万元),即估计使用年限为16年时,维修费用是23万元. 故答案为:23. 【点睛】本题考查回归直线过样本中心(),x y 这一性质,考查基本计算能力,属于简单题. 15.给出下列命题:①由变量x 和y 的数据得到其回归直线方程ˆ:ˆˆl ybx a =+,则l 一定经过点(),P x y ; ②在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;③线性相关系数r 越大,两个变量的线性相关性越强,反之,线性相关性越弱; ④在回归直线方程0.510y x =-+中,当解释变量x 每增加一个单位时,预报变量y 增加0.5个单位.其中真命题的序号是______. 【答案】①② 【分析】利用回归直线方程的特征以及两个变量之间的关系逐一判断四个选项的正误即可. 【详解】回归直线一定过样本中心点(),P x y ,故①正确; 残差平方和越小,说明模型的拟合效果越好,故②正确;线性相关系数r 的绝对值越大,两个变量的线性相关性越强,反之,线性相关性越弱,故③错误;在回归直线方程0.510y x =-+中,当解释变量x 每增加一个单位时,预报变量y 减少0.5个单位,故④错误. 故答案为:①②.16.如图所示是世界20个地区受教育程度的人口百分比与人均收入的散点图,样本点基本集中在一个条型区域,因此两个变量呈线性相关关系.利用散点图中的数据建立的回归方程为ˆ 3.19388.193yx =+,若受教育的人口百分比相差10%,则其人均收入相差_________.【答案】31.93美元 【分析】设所受教育百分比分别为%,%a b ,且10a b -=,利用回归方程计算即可. 【详解】设所受教育百分比分别为%,%a b ,且10a b -= 根据回归方程为 3.19388.193y x ∧=+, 收入相差大约为:()3.19388.193 3.19388.193 3.1931031.93a b ⨯+-⨯+=⨯=,即受教育的人口百分比相差10%,则其人均收入相差约31.93美元. 故答案为:31.93美元. 【点睛】本题考查了线性回归方程的应用问题,属于中档题.三、解答题17.某百货公司1~6月份的销售量与利润的统计数据如表: 月份1 2 3 4 5 6 销售量x/万件 10 11 13 12 8 6 利润y/万元 222529261612(1)根据2~5月份的统计数据,求出y 关于x 的回归直线方程ˆˆb y=x+ˆa ; (2)若由回归直线方程得到的估计数据与剩下的检验数据的误差均不超过2万元,则认为得到的回归直线方程是理想的,试问所得回归直线方程是否理想?附:1122211()()ˆ)()nnii i ii i nniii i xx y y x ynxybxx xnx====---==--∑∑∑∑【答案】(1)ˆ187y =x-30;7(2) 该小组所得线性回归方程是理想的.【详解】试题分析:(1)直接根据线性回归方程的公式进行计算.(2)利用求出的线性回归方程检验预测值与实际值的差是否不超过2万元.解析:(1)根据表中2~5月份的数据,计算得11,24x y ==,521125132912268161092i ii x y==⨯+⨯+⨯+⨯=∑,52222221113128498ii x ==+++=∑,所以525222241092411241849841174i ii i i x y xyb x x ==--⨯⨯===-⨯-∑∑,1830241177a y bx =-=-⨯=-.故y 关于x 的回归直线方程为:183077y x =-. (2)当10x =时,183015010777y =⨯-=,此时1502227-<;当6x = 时,1830786777y =⨯-=,此时781227-< .故所得的回归直线方程是理想的. 18.某工科院校对A ,B 两个专业的男女生人数进行调查,得到如下的列联表:(1)从B 专业的女生中随机抽取2名女生参加某项活动,其中女生甲被选到的概率是多少?(2)能否在犯错误的概率不超过0.05的前提下,认为工科院校中“性别”与“专业”有关系呢?注:K 2=2()()()()()n ad bc a b c d a c b d -++++【答案】(1)12(2)在犯错误的概率不超过0.05的前提下能认为工科院校中“性别”与“专业”有关系.【解析】(1)设B专业的4名女生为甲、乙、丙、丁,随机选取两个共有(甲,乙),(甲,丙),(甲,丁),(乙,丙),(乙,丁),(丙,丁)6种可能,其中选到甲的共有3种情况,则女生甲被选到的概率是P=36=12.(2)根据列联表中的数据k=2100(1246438)16845050⨯⨯⨯⨯⨯⨯-≈4.762,由于4.762>3.841,因此在犯错误的概率不超过0.05的前提下能认为工科院校中“性别”与“专业”有关系.19.2020年合肥市GDP迈上1万亿新台阶,城市核心竞争力首次进入长江经济带TOP10,金融省会城市竞争力进入全国TOP10,合肥的发展离不开中国科学院合肥分院、中国科学技术大学等一批一流高等学校的人才支撑、科技支撑,再次验证了“科学技术是第一生产力”的科学性.下表是合肥量子通讯关键设备生产企业每月生产的一种核心产品的产量:件()与相应的生产总成本(万元)的四组对照数据:57911200299430611研究人员建立了与的3种回归模型,利用计算机求得相应预报值结果如下:57911①180317453590②215287416617③203294426618(1)请计算3种回归模型的残差(实际值-预报值),根据残差分析判断哪一个模型的拟合效果最好并说明理由.(2)研究人员统计了该核心产品20个月的销售单价(万元),得到频数分布表如下:销售单价分组频数587若以这20个月销售单价的平均值定为今后的销售单价(同一组中的数据用该组区间的中点值作代表),结合你对(1)的判断,当月产量为12件时,预测当月的利润(四舍五入,不保留小数).(可能用到的数据:,)【答案】(1)答案见解析;(2)利润约为347万元.【分析】(1)利用已知的数值直接求3种回归模型的残差,然后比较;(2)先计算出这20个月的销售单价的平均值,再利用模型③的函数表示出生产总成本,进而可表示出当月利润【详解】解析:(1)3种模型的残差数据如下5 7 9 11200 299 430 611 残差20 21 残差12 14残差 5 4根据残差分析,模型③拟合效果最好.理由是残差的绝对值比较小,残差平方和最小. (2)这20个月的销售单价的平均值是,设当月利润为(万元),则(万元)所以(万元),所以当月产量为12件时,预测当片的利润约为347万元20.近年来,国资委、党委高度重视扶贫开发工作,坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效.某贫困县为了响应国家精准扶贫的号召,建了一些蔬菜大棚供村民承包管理,已知土地的使用面积以及相应的管理时间的关系如下表所示:并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示: (1)求出相关系数r (保留三位小数)的大小,并判断管理时间y 与土地使用面积x是否有较强的相关关系?若有,求出线性回归方程ˆˆˆybx a =+. (2)是否有99.9%的把握认为村民的性别与参与管理的意愿有关?参考公式:12211()()ˆ()()niii n niii i x x y y bx x x y ===--=--∑∑∑,ˆˆay bx =-; 22()()()()()n ad bc K a c b da b c d -=++++,n a b c a =+++10.7≈【答案】(1)0.981r ≈;有, 4.2 2.4y x =+;(2)有99.9%的把握认为村民的性别与参与管理的意愿有关. 【分析】(1)利用表中的数据直接求,x y ,再分别计算:61()()iii x x y y =--∑,621()ii x x =-∑,621()ii yy =-∑,然后利用公式计算相关系数和121()()ˆ()niii nii x x yy bx x ==--=-∑∑,ˆˆay bx =-,从而可求出回归方程;(2)依题意,女性村民中不愿意参与管理的人数为50,然后利用22()()()()()n ad bc K a c b d a b c d -=++++公式计算,再与临界值表比较得结论【详解】(1)根据题中数据可得,1(12345)35x =++++=,1(810132024)15y =++++=,计算得:61()()42iii x x yy =--=∑,621()10i i x x =-=∑,621()184i i y y =-=∑则420.9810.7542.8r ==≈≈>,故管理时间y 与土地使用面积x 有较强的相关关系;求得:121()()42ˆ 4.210()niii nii x x y y bx x ==--===-∑∑,ˆˆ15 4.23 2.4a y bx=-=-⨯=. 故回归方程是:ˆ 4.2 2.4yx =+; (2)依题意,女性村民中不愿意参与管理的人数为50, 计算得2K 的观测值为:22300(150505050)18.7510.828200100200100K ⨯⨯-⨯==>⨯⨯⨯故有99.9%的把握认为村民的性别与参与管理的意愿有关.21.我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.(1)在给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量. 参考数据:719.24ii y==∑,7139.75i i i t y ==∑721()0.53ii y y =-≈∑7 2.646≈.参考公式:相关系数()()()()12211niii nni i i i t t y y r t t y y ===--=-⋅-∑∑∑.回归方程ˆˆˆya bt =+中斜率和截距的最小二乘估计公式分别为:()()()121nii i ni i tty y b t t ==--=-∑∑,ˆˆay bx =-. 【答案】(1)散点图见解析,y 与t 的线性相关性相当高;(2)2.02万户. 【分析】(1)由条形图数据可作出散点图;根据相关系数公式,计算出所需数据后,代入公式即可求得0.99r ≈,由此可得结论;(2)利用最小二乘法可计算就得回归直线,将11t =代入回归直线即可求得所求预估值. 【详解】(1)作出散点图如图所示:由条形图数据和参考数据得:4t =,()72128i i t t =-=∑()7210.53i i y y =-≈∑,()()77711139.7549.24 2.79ii i i i i i i tty y t y t y ===--=-=-⨯=∑∑∑,2.790.990.532 2.646r ∴≈≈⨯⨯.y 与t 的相关系数近似为0.99,y ∴与t 的线性相关性相当高.(2)由9.241.327y ==及(1)得:()()()1212.790.1028nii i ni i tty y b t t ==--==≈-∑∑, ˆˆ 1.320.1040.92ay bx ∴=-≈-⨯=,y ∴关于t 的回归方程为ˆ0.100.92y t =+;将11t =代入回归方程得:ˆ0.10110.92 2.02y=⨯+=, ∴预测11月份该省煤改气、煤改电的用户数量达到2.02万户.22.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x (单位:年)与失效费y (单位:万元)的统计数据如下表所示:(1)根据上表数据,计算y 与x 的相关系数r ,并说明y 与x 的线性相关性的强弱. (已知:0.751r ≤≤,则认为y 与x 线性相关性很强;0.30.75r ≤<,则认为与x 线性相关性一般;0.3r <,则认为y 与x 线性相关性较弱)(2)求y 关于x 的线性回归方程,并估算该种机械设备使用10年的失效费.()()nnii i ixx y yx ynx yr ---==∑∑,()()()1122211nniiiii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)9.898,y 与x 线性相关性很强;(2)0.7 1.5y x =+,8.5 【分析】(1)根据相关系数公式,分别求出变量的均值及和值,代入公式求得相关系数,并判断相关性强弱即可;(2)根据第一问求得的值,结合线性回归方程求解公式求得参数a ,b ,写出回归方程,并预测10年的失效费即可. 【详解】 (1)由表知,1(24568)55x =⨯++++=,1(34567)55y =⨯++++=, 512344556687139i ii x y==⨯+⨯+⨯+⨯+⨯=∑,试卷第21页,总21页 5222222124568145i i x==++++=∑,5222222134567135i i y ==++++=∑,9.89810ni ix y nx y r -===≈∑, 故0.751r <<,认为y 与x 线性相关性很强.(2)由(1)知,122211395550.714555n i ii n i i x y nx y b xnx ==--⨯⨯===-⨯-∑∑, 又5x y ==,50.75 1.5a y bx =-=-⨯=,故y 关于x 的线性回归方程为0.7 1.5y x =+,当10x =时,0.710 1.58.5y =⨯+=,即10年的失效费用为8.5万元.【点睛】关键点点睛:利用相关性计算公式及回归方程参数求解公式求解参数及估算预测值.。
高中数学第三章统计案例测评含解析新人教A版选修2_3
第三章测评(时间:120分钟满分:150分)一、选择题(本题共12小题,每小题5分,共60分)1.试验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()A.y^=x+1B.y^=x+2C.y^=2x+1D.y^=x-1,(x,y)的四组值均满足y^=x+1,故y^=x+1即为回归直线方程,不必利用公式计算.2.则下列选项中最佳的回归方程为()A.y=x+1B.y=xD.y=2x+1C.y=2x+13,观察图表可以发现,表格中每组数据的x和y都近似相等,故求出最佳的回归方程为y=x.3.如果能在犯错误的概率不超过0.05的前提下说事件A和B有关系,那么具体计算出的数据()A.K2>3.841B.K2<3.841C.K2>6.63526.635,如果能在犯错误的概率不超过0.05的前提下说明事件A和B有关系,则K2>3.841.4.某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现K2的观测值k=6.023,根据这一数据查阅下表,市政府断言“市民收入增减与旅游愿望有关系”,A.0.1B.0.05D.0.005K2的观测值k=6.023>5.024,∴市政府断言“市民收入增减与旅游愿望有关系”的可信程度为97.5%.即犯错误的概率不超过0.025.5.一位母亲记录了儿子3~9岁的身高,数据如下表.由此建立的身高与年龄的回归模型为y=7.19x+73.93.( )A.身高一定是145.83 cm B .身高在145.83 cm 以上 C.身高在145.83 cm 左右 145.83 cm 以下x=10代入得y=145.83,但这种预测不一定准确,应该在这个值的左右.故选C . 6.下列关于等高条形图说法正确的是( ) A.等高条形图表示高度相对的条形图 B.等高条形图表示的是分类变量的频数 C.等高条形图表示的是分类变量的百分比 . 7.若某地财政收入x 与支出y 满足线性回归方程y=b ^x+a ^+e (单位:亿元),其中b ^=0.8,a ^=2,|e|<0.5,如果今年该地区财政收入10亿元,那么年支出预计不会超过( ) A.10亿 B.9亿 亿 D.9.5亿y=10+e.因为|e|<0.5,所以y<10.5,故不会超过10.5亿.8.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:由上表中数据计算得K 2=105×(10×30-20×45)255×50×30×75≈6.109,请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )A.1%B.99% D.97.5%9.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y 与父亲的身高x 的回归直线方程y ^=a ^+b ^x 中,b ^( ) A.在(-1,0)内 B.等于0 C.在(0,1)内D.在〖1,+∞)内,b ^的取值范围应为0<b ^<1.10.假设有两个分类变量X 和Y ,2}和{y 1,y 2},其2×2列联表如下:对于以下数据,对同一样本能说明X 与Y 有关的可能性最大的一组为( ) A.a=9,b=8,c=7,d=6 B .a=9,b=7,c=6,d=8 b=6,c=9,d=7 D .a=6,b=7,c=8,d=9|ad-bc|越小,说明X 与Y 之间的关系越弱,|ad-bc|越大,说明X 与Y 之间的关系越强.|ad-bc|越大,K 2越大,|ad-bc|越小,则K 2越小.11.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a=10,b=21,c+d=35.若X 与Y 有关系的可信程度不小于97.5%,则c 等于( ) B.4 C .5 D.62×2列联表如下:故K2的观测值k=66×〖10(35-c)-21c〗231×35×(10+c)(56-c)≥5.024.把选项A,B,C,D代入验证可知选A.12.在两个学习基础相当的班级实行某种教学措施的试验,测试结果见下表,则试验效果与教学措施()A.有关B.无关C.关系不明确K2的观测值k=100×(48×12-38×2)250×50×86×14≈8.306>7.879,则认为“试验效果与教学措施有关”的概率约为0.995.二、填空题(本题共4小题,每小题5分,共20分)13.已知某车间加工零件的个数x与所花费时间y(单位:h)之间的线性回归方程为y^=0.01x+0.5,则加工600个零件大约需要h.x=600时,y^=0.01×600+0.5=6.5.14.下面是一个2×2列联表:则b-d=.15.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下2×2列联表:则在犯错误的概率不超过的前提下认为喜爱打篮球与性别有关.(请用百分数表示)2的观测值k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=50×(20×15-5×10)225×25×30×20≈8.333>7.879,所以在犯错误的概率不超过0.5%的前提下认为喜爱打篮球与性别有关..5%16.某部门通过随机调查89,得到的数据如下表:你认为性别与休闲方式有关系的把握为.,得K2的观测值为k=89×(24×26-31×8)255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系,即认为性别与休闲方式有关系的把握为90%.三、解答题(本题共6小题,共70分.解答时应写出必要的文字说明、证明过程或演算步骤)17.(10分)调查男、女乘客在一次恶劣气候的飞行航程中晕机的情况,共调查了89位乘客,其中男乘客有24人晕机,31人不晕机;女乘客有8人晕机,26人不晕机.根据此材料能否在犯错误的概率不超过0.05的前提下认为在恶劣气候飞行中男性比女性更容易晕机?2×2列联表:根据公式计算得K2的观测值为k=89×(24×26-31×8)255×34×32×57≈3.689<3.841.所以在犯错误的概率不超过0.05的前提下我们不能认为恶劣气候飞行中男性比女性更容易晕机.18.(12分)班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学, 18名男同学中随机抽取一个容量为7的样本进行分析.(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)(2)如果随机抽取的7:①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列和数学期望;②根据上表数据,求物理成绩y关于数学成绩x的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分?。
高中数学选修2-3第三章《统计案例》测试卷(含答案解析)
一、选择题1.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是( )A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关 2.下列说法中错误的是( )A .先把高二年级的2000名学生编号:1到2000,再从编号为1到50的学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这种抽样方法是系统抽样法.B .一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x .C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1.D .若一组数据1,a ,3的平均数是2,则该组数据的方差是23. 3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表,根据表中数据则可判定秃发与患心脏病有关,那么这种判定出错的可能性为( ) 患心脏病情况秃发情况 患心脏病无心脏病 秃发 20 300 不秃发5450A .0.1B .0.05C .0.01D .0.995.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01k kk P k C ξ-== 6.对于独立性检验,下列说法正确的是( ) A .2 3.841K >时,有95%的把握说事件A 与B 无关 B .2 6.635K >时,有99%的把握说事件A 与B 有关 C .2 3.841K ≤时,有95%的把握说事件A 与B 有关 D .2 6.635K >时,有99%的把握说事件A 与B 无关7.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k ≥ 0.0500.025 0.010 0.005 0.001 k3.8415.0246.6357.87910.828由以上数据,计算得到K 2的观测值k ≈9.643,根据临界值表,以下说法正确的是( ) A .没有充足的理由认为课外阅读量大与作文成绩优秀有关 B .有0.5%的把握认为课外阅读量大与作文成绩优秀有关 C .有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关8.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程35=-,变量x增加一个单位时,y平均增加5个单位;y x(),x y;③线性回归直线y bx a=+必过④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K2=13.079.则其两个变量间有关系的可能性是90%.其中错误的个数是( )A.1 B.2C.3 D.49.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1;③若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为2;④对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y有关系”的把握程度越大.其中真命题的个数为()A.1 B.2C.3 D.410.如表为某公司员工工作年限x(年)与平均月薪y(千元)对照表.已知y关于x的线性回归方程为0.70.35=+,则下列结论错误的是()y xA.回归直线一定过点(4.5,3.5)B.工作年限与平均月薪呈正相关C.t的取值是3.5 D.工作年限每增加1年,工资平均提高700元x C之间的关系,随机统计了11.某商场为了解毛衣的月销售量y(件)与月平均气温()某4个月的月销售量与当月平均气温,其数据如下表:)C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5812.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计人数后,得到2×2列联表,则随机变量2K 的观测值为A .0.600B .0.828C .2.712D .6.004二、填空题13.回归方程ˆˆ 2.50.2x y=+在样本(4,1.2)处的残差为________. 14.甲、乙两人在5次综合测评中成绩的茎叶图如图所示,其中一个数字被污损,记甲、乙的平均成绩分别为x -甲,x -乙,则x -甲>x -乙的概率是________.15.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450由表中数据计算得到K 2的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.16.某单位为了了解用电量y (度)与气温x (度)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下的对照表由表中数据,得回归直线方程ˆˆˆybx a =+,若ˆ2b =-,则ˆa =________. 17.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温(如表),并求得线性回归方程为^=-2x +60.不小心丢失表中数据c ,d ,那么由现有数据知2c+d=______. x c 13 10 -1 y243438d18.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品 不喜欢甜品 合计 南方学生 60 20 80 北方学生 10 10 20 合计7030100根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”__________.(填有或没有)附:()()()()()22n ad bc K a b c d a c b d -=++++()20P K k ≥ 0.10 0.05 0.010 0.005 0k2.7063.8416.6357.87919.给出下列四个结论:(1)相关系数r 的取值范围是1r <;(2)用相关系数r 来刻画回归效果,r 的值越大,说明模型的拟合效果越差;(3)一个袋子里装有大小相同的5个白球和5个黑球,从中任取4个,则其中所含白球个数的期望是2;(4) 一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c ,且(),,0,1a b c ∈,已知他投篮一次得分的数学期望为2,则213a b+的最小值为163.其中正确结论的序号为______________. 20.有如下四个命题:①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分别为45和44.②相关系数0.83r =-,表明两个变量的相关性较弱.③若由一个2⨯2列联表中的数据计算得2K 的观测值 4.103k ≈,那么有95%的把握认为两个变量有关.④用最小二乘法求出一组数据(,),(1,,)i i x y i n =的回归直线方程ˆˆˆy bx a =+后要进行残差分析,相应于数据(,),(1,,)i i x y i n =的残差是指()ˆˆˆi i ie y bx a =-+. 以上命题“错误”的序号是_________________三、解答题21.目前,新冠病毒引发的肺炎疫情在全球肆虐,为了解新冠肺炎传播途径,采取有效防控措施,某医院组织专家统计了该地区500名患者新冠病毒潜伏期的相关信息,数据经过汇总整理得到如图所示的频率分布直方图(用频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏者”,潜伏期高于平均数的患者,称为“长潜伏者”.(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;(2)为研究潜伏期与患者年龄的关系,从上述500名患者中抽取300人,得到如下列联表,根据列联表判断是否有97.5%的把握认为潜伏期长短与患者年龄有关:短潜伏者 长潜伏者 合计 60岁及以907016022()()()()()n ad bc K a b c d a c b d -=++++22.某土特产超市为预估2021年元旦期间游客购买土特产的情况,对2020年元旦期间的购买情况进行随机抽样并统计,得到如下数据:(1)估计游客平均购买金额(同一组中的每个数据可用该组区间的中点值代替); (2)根据以上数据完成22⨯列联表,并判断是否有90%的把握认为购买金额是否少于60元与性别有关.附:参考公式和数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++. 附表:)20k23.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下: 研发费用x (百万元)2 3 6 10 13 14 销量y (万盒)1122.544.5(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.24.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 25.云南是世界茶树的原产地之一,也是中国四大茶产区之一,独特的立体气候为茶叶的种质资源多样性创造了良好的自然条件,茶叶产业是云南高原特色农业的闪亮名片.某大型茶叶种植基地为了比较A 、B 两品种茶叶的产量,某季采摘时,随机选取种植A 、B 两品种茶叶的茶园各30亩,得到亩产量(单位:kg/亩)的茎叶图如下(整数位为茎,小数位为叶,如55.4的茎为55,叶为4):亩产不低于60kg的茶园称为“高产茶园”,其它称为“非高产茶园”.(1)请根据已知条件完成以下22⨯列联表,并判断是否有95%的把握认为“高产茶园”与茶叶品种有关?(2)用样本估计总体,将频率视为概率,现从该种植基地A品种的所有茶园中随机抽取4亩,且每次抽取的结果相互独立,设被抽取的4亩茶园中“高产茶园”的亩数为X,求X 的分布列和数学期望()E X.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++26.2020年5月22日晚,国际权威医学杂志《柳叶刀》在线发表了全球首个新冠疫苗临床试验结果,该试验结果来自我国的陈薇院士和朱凤才教授团队、由于非人灵长类动物解剖生理、组织器官功能和免疫应答反应等性状与人类非常接近,所以常选择恒河猴进行科研和临床实验.某生物制品研究所将某一型号疫苗用在恒河猴身上进行科研和临床实验,得到部分数据如下表.现从注射疫苗的恒河猴中任取1只,取到感染病毒的恒河猴的概率为2 5 .95%把握认为注射此种疫苗有效?(2)在感染病毒的恒河猴中,按未注射疫苗和注射疫苗的比例抽取5只进行病理分析,然后从这5只恒河猴中随机抽取3只对注射疫苗情况进行核实,求恰好抽到2只未注射疫苗的恒河猴的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D2.C解析:C 【分析】根据题意,对选项中的命题进行分析,判断真假性即可. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,所以A 正确; 对于B ,一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x ,所以B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数||r 的值越接近于1,所以C 错误;对于D ,一组数据1、a 、3的平均数是2,所以2a =;所以该组数据的方差是222212[(12)(22)(32)]33s =⨯-+-+-=,所以D 正确.故选:C . 【点睛】本题主要考查抽样和统计,考查方差和平均数的计算,考查两个随机变量的相关性,意在考查学生对这些知识的理解掌握水平3.D解析:D 【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.C解析:C【分析】首先列出22⨯联表,通过计算出2K的值,然后作统计推断,得出正确的结论.【详解】列出22⨯联表如下图所示:277520450530015.96825750455320K⨯⨯-⨯=≈⨯⨯⨯6.635>,故判断错误的概率不超过0.01,故选C.【点睛】本小题主要考查补全22⨯联表,考查2K的计算以及独立性检验的概念,属于基础题. 独立性检验的步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22n ad bc K a b c d a c b d -=++++()()()()(),计算2K 的观测值;(3)比较2K 与临界值的大小关系作统计推断. 5.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.6.B解析:B 【分析】根据独立性检验中卡方的概念知,选B. 【详解】根据独立性检验中卡方的概念知,2 6.635K >时,有99%的把握说事件A 与B 有关选B. 【点睛】本题主要考查了独立性检验中卡方的概念,属于中档题.7.D解析:D 【解析】 【分析】由题意结合独立性检验的结论和临界值表给出结论即可. 【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关, 即有99.5%的把握认为课外阅读量大与作文成绩优秀有关. 本题选择D 选项. 【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.8.C解析:C 【解析】对于①,方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故正确;对于②,一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均减小5个单位,故不正确;对于③,线性回归直线ˆˆˆybx a =+必过样本中心点(),x y ,故正确;对于④,曲线上的点与该点的坐标之间具有一一对应关系,故不正确;对于⑤,有一个2×2列联表中,由计算得213.079K =,则其两个变量间有关系的可能性是99.9%,故不正确. 故选C.9.B解析:B【解析】由题意得,若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为4,所以③不正确;对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.10.C解析:C 【解析】由已知中的数据可得:3456 4.54x +++== , 2.54 4.51144t ty ++++==,∵数据中心点(),x y 一定在回归直线上,∴110.7 4.50.354t+=⨯+解得3t =,故C 错误;故11 3.54t+=, 回归直线一定过点(4.53.5,),ABD 正确;故选C .11.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.12.A解析:A 【解析】本题主要考查独立性检验.由题所给统计表可知a=11,b=34,a+b=45,c=8,d=37,c+d=45,a+c=19,b+d=71,n=90,所以,()()()()()220.600n ad bc k a b c d a c b d -=≈++++ .本题选择A 选项.二、填空题13.【分析】根据残差的定义直接计算即可【详解】由题当x=4时故所以回归方程在样本处的残差为故答案为:【点睛】本题主要考查了残差的概念考查了运算能力属于容易题 解析:9-【分析】根据残差的定义直接计算即可. 【详解】由题当x =4时,4ˆ 2.50.210.2y=+=⨯, 故1.210.29-=-所以回归方程ˆˆ 2.50.2x y=+在样本(4,1.2)处的残差为9-. 故答案为:9- 【点睛】本题主要考查了残差的概念,考查了运算能力,属于容易题.14.【解析】由茎叶图知乙=90甲=89+污损处可取数字012…9共10种而甲>乙时污损处对应的数字有6789共4种故甲>乙的概率为答案:解析:25 【解析】由茎叶图知x 乙=90,x 甲=89+5x.污损处可取数字0,1,2,…,9,共10种,而x 甲>x 乙时,污损处对应的数字有6,7,8,9,共4种,故x 甲>x 乙的概率为25. 答案:25. 15.不能【解析】查表知若要在犯错误的概率不超过001的前提下认为喜欢玩电脑游戏与认为作业多有关则临界值k0=6635本题中k≈5059<6635所以不能在犯错误的概率不超过001的前提下认为喜欢玩电脑游解析:不能 【解析】查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635.本题中,k≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.考点:独立性检验.16.【解析】试题分析:由题意得即样本中心点代入回归直线方程得考点:回归直线方程的应用 解析:60【解析】试题分析:由题意得181********x ++-==,24343864404y +++==,即样本中心点15(,40)2,代入回归直线方程,得15402602ˆˆaa =-⨯+⇒=. 考点:回归直线方程的应用.17.100【解析】点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是非随机变量与随机变量的关系如果线性相关则直接根据用公式求写出回归方程回归直线方程解析:100 【解析】2296,44c dx y ++==962260,1002,2100ˆ4ˆ2d c ay bx d c c d ++=-=+==-+= 点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求ˆˆ,ab ,写出回归方程,回归直线方程恒过点(),x y . 18.有【解析】根据表中数据计算观测值对照临界值知有95的把握认为南方学生和北方学生在选用甜品的饮食习惯方面有差异解析:有 【解析】根据表中数据,计算观测值22100(60102010)1003.8417030802021K ⨯-⨯==>⨯⨯⨯,对照临界值知,有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”。
最新整理高中数学人教A版选修2-3本章测评:第三章统计案例3 Word版含解析.doc
本章知识结构本章测试1下列两个变量之间的关系哪个不是函数关系( ) A.角度和它的余弦值 B.正方形边长和面积C.正n边形的边数和顶点角度之和D.人的年龄和身高思路解析:函数关系就是两个变量之间有确定性的关系.A 、B 、C 都是函数关系,我们甚至可以写出它们的函数表达式为f(θ)=cosθ,g(a)=a 2,h(n)=nπ-2π.D 不是函数关系,对于年龄确定的人群,仍可以有不同身高的人. 答案:D2某工厂某产品产量(千件)与单位成本x(元)满足回归直线方程y=77.36-1.82x,则以下说法中正确的是( )A.产量每增加1 000件,单位成本下降1.82元B.产量每减少1 000件,单位成本下降1.82元C.产量每增加1 000件,单位成本上升1.82元D.产量每减少1 000件,单位成本上升1.82元思路解析:在回归直线方程a x by ˆˆ++=中,b ˆ=-1.82是斜率的估计值,说明产量每增加1 000件,单位成本下降1.82元. 答案:A3下列有关线性回归的说法,不正确的是( )A.变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C.线性回归直线方程最能代表观测值x,y之间的关系D.任何一组观测值都能得到具有代表意义的回归直线方程 思路解析:D 中并非任何一组观测值都能得到具有代表意义的回归直线方程,只是说总体上大多数观测值符合,也可能有个别的观测值差距较大. 答案:D4实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为( )A.y=x+1B.y=x+2C.y=2x+1D.y=x-1 思路解析:由题意发现,(x,y)的四组值均满足y=x+1,故y=x+1即为回归直线方程,不必利用公式计算. 答案:A5对于回归分析,下列说法错误的是( )A.在回归分析中,变量间的关系若是确定性关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的或负的C.回归分析中,如果r 2=1或r=±1,说明x与y之间完全线性相关D.样本相关系数r ∈(-1,1)思路解析:由定义可知,相关系数|r|≤1,故D 错误. 答案:D6为了研究男子的年龄与吸烟的关系,抽查了100个男人,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表: 年龄 合计 不超过40岁 超过40岁吸烟量不多于20支/天50 15 65 吸烟量多于20支/天10 25 35 合计60 40 100 则有____________的把握确定吸烟量与年龄有关( ) A.99.9% B.99%C.95%D.没有理由思路解析:利用题中列联表,代入公式计算K 2=40603565)15102550(1002⨯⨯⨯⨯-⨯⨯≈22.16>10.828,所以我们有99.9%的把握确定吸烟量与年龄有关. 答案:A7分析两个分类变量之间是否有关系的常用方法有______________;独立性检验的基本思想类似于______________.思路解析:根据课本概念填空.答案:频率比较法、图形分析法(三维柱形图、二维条形图、频率分布图)、独立性检验 反证法.8对于回归直线方程=4.75x+257,当x=28时,y的估计值是______________. 思路解析:将x的值代入回归直线方程得估计值y=4.75×28+257=390. 答案:3909若两个分类变量X 与Y 的列联表为______________:y1 y2x15 15 x240 10 则“X 与Y 之间有关系”的概率是______________.思路解析:求“X 与Y 之间有关系”的概率也就是求有多大把握认为“X 与Y 之间有关系”.由题意可求得K 2=)1015)(405)(1040)(155()1540105)(1040155(2++++⨯-⨯+++≈18.8>10.828.即P(K 2≥10.828)≈0.001.所以“X 与Y 之间有关系”的概率是0.999. 答案:0.99910有两个分类变量X 与Y ,其一组观测值如下面的2×2列联表所示:y1 y2 x1 a 20-a x2 15a 30+a其中,a,15-a均为大于5的整数,则a取何值时,有90%的把握认为“X 与Y 之间有关系”?思路解析:要有90%的把握认为“X 与Y 之间有关系”,需要检验随机变量K 2的值大于2.706.故求得K 2后解不等式即可.解:要有90%的把握认为“X 与Y 之间有关系”,需要检验随机变量K 2的值大于2.706.则K 2=9060)607(1350154520)]15)(20()30([6522⨯-=⨯⨯⨯---+a a a a a >2.706解之可得,a>13.36或a<3.78,而原题知a>5且15-a>5,a ∈Z ,即a=6,7,8,9.故不存在这样的整数a使X 与Y 之间有90%的把握认为它们之间有关系. 11已知10只狗的血球体积及红血球数的测量值如下表: 血球体积x(mm)45 42 46 48 42 35 58 4039 50 红血球数y6.53 6.30 9.527.50 6.99 5.90 9.49 6.20 6.558.72(百万)若已知二者相关,求出回归直线方程.思路解析:求回归直线方程,就是由公式计算bˆ与a ˆ的值. 解:由题意得,x =44.50,y =7.37,设回归直线方程为a x by ˆˆ++=,则 bˆ=2121xn xxy n yx ni ini ii --∑∑==≈0.175,aˆ=-0.43.故所求的回归直线方程为y ˆ=0.715x-0.43. 12针对某工厂某产品产量与单位成本的资料进行线性回归分析:轻轻告诉你月份 产量(千件)x单位成本(元/件)yx 2 xy 1 2 73 4 146 2 3 72 9 216 3 4 71 16 284 4 3 73 9 219 5 4 69 16 276 6 5 68 25 340合计21 426 79 1 481 思路解析:这是一个实际应用的回归分析问题,其实就是找出回归方程,通过回归方程来分析产品产量与单位成本的关系.解:设回归直线方程为a x by ˆˆ++=,则 ∑∑=======61612,79,716426,27621i i i i i y x x y x =1 481,所以代入公式,2)27(679712761481ˆ⨯-⨯⨯-=b≈-1.818, 27)818.1(71ˆ⨯--=a≈77.36, 故回归直线方程为yˆ=77.36-1.82x ;故回归系数b的意义可知:产量每增加1 000件,产品的单位成本就降低1.82元.13炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x(0.01%) 104180 190 177 147 134 150 191 204 121 y/min 100200 210 185 155 135 170 205 235 125 (1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求回归直线方程.(3)预报当钢水含碳量为160个0.01%时,应冶炼多少分钟? 思路解析:(1)判定两个变量是否具有线性相关关系,可通过计算相关系数与临界值关系; (2)设回归直线方程,依公式代入相关量计算可得;(3)把x=160代入回归直线方程求解可得. 解:(1)根据题意列表并计算如下:i1 2 3 4 5 6 7 8 9 10 x i 104 180 190 177 147 134 150 191 204 121 y i 100 200 210 185 155 135 170 205 235 125 x i y i 10 36 39 32 22 18 25 39 47 15400 000 900745 785090 500155 940 125287640,312350,265448,172,8.15910110121012=====∑∑∑===i i i i i i i y x y x y x于是r=)10)(10(102101221012101y y x x yx yx i i i i i ii---∑∑∑===≈0.990 6,查表得显著性水平0.05与n-2的相关系数临界值r 0.05=0.632,∴r>r 0.05,所以y与x具有线性相关关系.(2)设所求的回归直线方程为a x by ˆˆ++=,b ˆ=210121011010xxy x yx i ii ii --∑∑==≈1.267,aˆ≈-30.51. 即所求的回归直线方程为yˆ=1 267x-30.51. (3)当x=160时,yˆ=1.267×160-30.51≈172 (min),即大约冶炼172 min. 14研究某特殊药物有无副作用(比如服用后恶心),给50个患者服用此药,给另外50个患者服用安慰剂,记录每类样本中出现恶心的数目如下表:有恶心 无恶心 合计给药A15 35 50 给安慰剂4 46 50 合计19 81 100 试问此药物有无恶心的副作用?思路解析:根据列联表中的数据代入公式求得K 2的值,与临界值进行比较判断得出相应结论.解:由题意,问题可以归纳为独立检验假设H 1:服该药物(A )与恶心(B )独立.为了检验假设,计算统计量K 2=81195050)3544615(1002⨯⨯⨯⨯-⨯⨯≈7.86>6.635.故拒绝H 1,即不能认为药物无恶心副作用,也可以说,我们有99%的把握说,该药物与副作用(恶心)有关.。
人教新课标版数学高二-选修2-3第三章《统计案例》过关检测卷
数学·选修2-3(人教A版)章末过关检测卷(三)第三章统计案例(测试时间:120分钟评价分值:150分)一、选择题(本大题共8小题,每小题5分,共40分;在每小题给出的四个选项中,只有一项是符合题目要求的)1.在画两个变量的散点图时,下面哪个叙述是正确的()A.预报变量在x轴上,解释变量在y轴上B.解释变量在x 轴上,预报变量在y轴上C.可以选择两个变量中任意一个变量在x轴上D.可以选择两个变量中任意一个变量在y轴上答案:B2.下列说法正确的是()①从匀速传递的产品生产流水线上,质检员每10分钟从某处抽取一件产品进行某项指标检测,这样的抽样是分层抽样②某地气象局预报:5月9日本地降水概率为90%,结果这天没下雨,这表明天气预报并不科学③吸烟与健康具有相关关系④在回归直线方程y^=0.1x+10中,当解释变量x每增加一个单位时,预报变量y增加0.1个单位.A.①②B.③④C.①③D.②④解析:①从匀速传递的产品生产流水线上,质检员每10分钟从某处抽取一件产品进行某项指标检测,由于间隔相同,这样的抽样是系统抽样,故①不正确;②降水概率为90%的含义是指降水的可能性为90%,但不一定降水,故②不正确;③吸烟与健康具有相关关系,正确;④在回归直线方程y^=0.1x+10中,回归系数为0.1,当解释变量x每增加一个单位时,预报变量y^增加0.1个单位,故④正确.故选B.答案:B3. 根据一组样本数据(x1,y1),(x2,y2),…,(x n,y n)的散点图分析存在线性相关关系,求得其回归方程y^=0.85x-85.7,则在样本点(165,57)处的残差为()A.54.55 B.2.45 C.3.45 D.111.55解析:把x=165代入y^=0.85x-85.7,得y=0.85×165-85.7=140.25-85.7=54.55,由57-54.55=2.45,故选B.答案:B4.为了研究色盲与性别的关系,调查了1 000人,得到了如下数据,则()A.99.9%的把握认为色盲与性别有关C .95%的把握认为色盲与性别有关D .90%的把握认为色盲与性别有关解析:K 2=1 000×(442×6-38×514)2956×44×480×520≈27.139>10.828.答案:A5.若已知相关指数R 2=0.83,则随机误差对总效应贡献率为( )A .17%B .83%C .27%D .38%答案:A6.已知x 与y 之间的一组数据:则y 与x 的线性回归方程y =b x +a 必过点( ) A .(2,2) B .(1.5,0) C .(1,2) D .(1.5,4) 答案:D7. 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是 ( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”解析:由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C 正确.答案:C8.(2013·福建卷)已知x与y之间的几组数据如下表:x 12345 6y 02133 4假设根据上表数据所得线性回归直线方程为y^=b^x+a^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x +a′,则以下结论正确的是()A.b^>b′,a^>a′B.b^>b′,a^<a′C.b^< b′,a^>a′D.b^ <b′,a^<a′解析:过(1,0)和(2,2)的直线方程为y=2x-2,画出六点的散点图,回归直线的大概位置如图所示,显然b^<b′,a^>a′. 故选C.答案:C二、填空题(本大题共6小题,每小题5分,共30分;将正确答案填在题中的横线上)9.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系.其中有相关关系的是________(填序号).答案:①③④10.若由一个2×2列联表中的数据计算得K2=4.013,那么有________把握认为两个变量有关系.答案:95%11. 某炼钢厂废品率x(%)与成本y(元/t)的线性回归方程为y^=105.492+42.569x.当成本控制在176.5元/t时,可以预计生产的1 000 t钢中,约有__________t钢是废品.解析:因为176.5=105.492+42.569x,所以x=1.668,即成本控制在176.5元/t时,废品率为1.668%. 所以生产的1 000 t钢台,约有1 000×1.668%=16.68(t)钢是废品.答案:16.6812.对具有线性相关关系的变量x与y,测得一组数据如下表所示,若已求得它们的回归直线方程的斜率为6.5,则这条回归直线的方程为__________________.答案:y^=17.5+6.5x13.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9,现发现表中有一个数据模糊看不清,请你推断出该数据的值为________.零件数x (个) 10 2030 40 50 加工时间y (min)6275 81 89解析:零件个数的平均值x -=30,设零件为20个的对应加工时间为t min ,加工时间的平均值y -=307+t 5,因为回归直线必经过点(x -,y -),代入回归方程y ^=0.67x +54.9,计算得t =68.答案:6814.(2013·揭阳一模)一般来说,一个人脚掌越长,他的身高就越高,现对10名成年人的脚掌长x 与身高y 进行测量,得到数据(单位:cm)如下表,作出散点图后,发现散点在一条直线附近,经计算得到数据:∑i =110(x i -x -)(y i -y -)=577.5,∑i =110(x i -x -)2=82.5;某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长为26.5 cm ,则估计案发嫌疑人的身高为__________________cm.x20212223242526272829解析:依题意∑i =110(x i -x -)(y i -y -)=577.5,∑i =110(x i -x -)2=82.5;所以回归方程的斜率b =∑i =110(x i -x -)(y i -y -)∑i =110(x i -x -)2=577.582.5=7,又x -=24.5,y -=171.5,所以截距a =y --b x -=0,即回归方程为y ^=7x ,当x =26.5时,y ^=7×26.5=185.5,则估计案发嫌疑人的身高为 185.5 cm.答案:185.5三、解答题(本大题共6小题,共80分;解答时应写出必要的文字说明、证明过程及演算步骤)15.(本小题满分12分)冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示.解析:由已知数据得到如下2×2列联表由公式K 2=382×(37×202-121×22)2158×224×59×323≈13.11,由于13.11>6.635,故有99%的把握认为含杂质的高低与设备改造是有关的.16.(本小题满分12分)某医院用光电比色计检验尿汞时,得尿汞含量x (mg/L)与消光系数y 的结果如下:x消光系数y64138205285360(1)(2)求相关指数R2.解析:(1)列出散点图,如下图所示.由图可知y与x的散点图大体分布在一条直线周围,因此可以用线性回归的方程来拟合它.设y^=b^x+a^.由b^=∑i=1n(x i-x)(y i-y)∑i=1nx2i-n x2=36.95,a^=y-b^x=-11.3,故所求的回归方程为y^=36.95x-11.3.(2)把相应数值代入R2=1-∑i=1n(y i-y^i)2∑i=1n(y i-y)2,得R2≈0.999.17.(本小题满分14分)为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.(1)根据以上数据列出2×2列联表.(2)40岁以上的人患胃病与否和生活规律有关系吗?为什么?解析:(1)由已知可得2×2列联表:(2)根据列联表中的数据,由计算公式得K 2的观测值为: k =540×(20×260-200×60)280×460×220×320≈9.638,因为9.638>6.635,因此,在犯错误的概率不超过0.01的前提下,认为40岁以上的人患胃病与否和生活规律有关.18.(本小题满分14分)有人统计一个省的6个城市某一年的人均国内生产总值(人均GDP)x 和这一年各城市患白血病的儿童数量y ,其数据如下表所示:人均GDP x /万元 1086431患白血病的儿童数量y /人351 312 207 175 132 180 (2)求y 与x 之间的回归方程.解析:(1)作散点图(如下图所示).由散点图可知y 与x 具有线性相关关系. (2)将数据代入公式,可得b ^≈23.253,a ^≈102.151. 故y 与x 之间的线性回归方程是 y ^=23.253x +102.151.19.(本小题满分14分)关于x 与y 有如下数据:y =7x +17.试比较哪一个模型拟合的效果更好.解析:由①可得y i -y ^i 与y i -y -的关系如下表:所以 ∑i =15(y i -y ^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,∑i =15(y i -y -)2=(-20)2+(-10)2+102+02+202=1 000.所以R 21=1-∑i =15(y i -y ^i )2∑i =15(y i -y -)2 =1-1551 000=0.845.由②可得y i -y ^i 与y i -y -的关系如下表:所以 ∑i =15(y i -y ^i )2=(-1)2+(-5)2+82+(-9)2+(-3)2=180,∑i =15(y i -y -)2=(-20)2+(-10)2+102+02+202=1 000. 所以R 22=1-∑i =15(y i -y ^i )2∑i =15(y i -y -)2 =1-1801000=0.82.由于R 21=0.845,R 22=0.82,0.845>0.82, 所以R 21>R 22.故①的拟合效果好于②的拟合效果.20.(本小题满分14分)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y =bx +a ⎝⎛⎭⎪⎫其中b =187; (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?解析:(1)设抽到相邻两个月的数据为事件A .因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中,抽到相邻两个月的数据的情况有5种,所以P (A )=515=13.(2)由数据求得x -=11,y -=24, 由a =y --b x -=-307,所以关于的线性回归方程为y =187x -307.(3)当x =10时,y ^=1507,⎪⎪⎪⎪⎪⎪1507-22<2;同样, 当x =6时,y ^=787 ,⎪⎪⎪⎪⎪⎪787-12<2.所以,该小组所得线性回归方程是理想的.。
人教版数学高二A版选修2-3单元测试第三章统计案例
第三章过关检测(时间90分钟,满分100分)知识点分布表知识点题号散点图1,11线性回归方程2,3,11回归方程的截距、斜率4,8非线性回归7残差平方和9独立性检验6,12回归分析5,10一、选择题(每小题4分,共40分)1.如下图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是( )2.已知呈线性相关关系的变量x,y之间的关系如下表所示,则回归直线一定过点( )x0.10.20.30.5y 2.11 2.85 4.0810.15A.(0.1,2.11)B.(0.2,2.85)C.(0.3,4.08)D.(0.275,4.797 5)3.两个变量满足如下关系:x510152025y103105110111114则两个变量线性相关程度( )A.很强B.很弱C.无相关性D.不确定4.一位母亲记录了儿子3~9岁的身高,数据如下表.由此建立的身高与年龄的回归模型为y =7.19x +73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A.身高一定在145.83 cmB.身高在145.83 cm 以上C.身高在145.83 cm 左右D.身高在145.83 cm 以下5.对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程的截距和斜率的最小二乘法估计公式分别为_______和∑∑==---=ni ini i ix xy y x xb121)())((ˆ.( )A.a =y -bxB.x by a ˆ-= C.bx y a -=ˆ D.x b y a ˆˆ-= 6.(2009山东潍坊一模)下列关于等高条形图说法正确的是( ) A.等高条形图表示高度相对的条形图 B.等高条形图表示的是分类变量的频数 C.等高条形图表示的是分类变量的百分比 D.等高条形图表示的是分类变量的实际高度 7.身高与体重有关系,可以用分析的方法来判断( )A.残差B.回归C.等高条形图D.独立性检验 8.下列关于K 2的说法中正确的是( )A.K 2在任何相互独立问题中都可以用于检验有关还是无关B.K 2的值越大,两个事件的相关性就越大C.K 2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合D.K 2的观测值k 的计算公式为))()()(()(d b c a d c b a bc ad n k ++++-=9.设在海拔x m 处的大气压强是y Pa,y 与x 之间的关系为kxce y =,其中c 、k 为常量,如果某游客从大气压为1.01×105 Pa 的海平面地区,到了海拔为2 400 m,大气压为0.90×105 Pa 的一个高原地区,则k 与c 的取值分别是( )A.⎩⎨⎧⨯-=⨯=-5510805.41001.1k cB.⎩⎨⎧⨯-=⨯=-54105.31024.2k cC.⎩⎨⎧⨯=⨯=-54103.2106.3k cD.⎩⎨⎧⨯-=⨯=-54103.2107.2k c10.为了探究色盲是否与性别有关,在调查的500名男性中有39名色盲患者,在500名女性中有6名患有色盲,那么你认为色盲与性别有关的把握为( ) A.0 B.95% C.99% D.都不正确 二、填空题(每小题4分,共16分)11.对于一组数据的两个函数模型,其残差平方和分别为180.2和290.7,若从中选取一个拟合程度较好的函数模型,应选_______.12.(2009广东中山一模)许多因素都会影响贫穷,教育也许是其中之一.在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程为6.48.0ˆ+=x y.斜率的估计值为0.8说明________________________________________________.13.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =a +bx i +e i (i =1,2,…,n),若e i 恒为0,则R 2为______.14.下列说法:①回归方程适用于一切样本和总体;②回归方程一般都有时间性;③样本取值的范围会影响回归方程的适用范围;④回归方程得到的预报值是预报变量的精确值,其中正确的是_______.三、解答题(共44分)15.(10分)某地区的人口普查表明,该地区共有男性15 729 245人,其中3 497个是聋哑人,共有女性16 799 031人,其中3 072个是聋哑人,判断该地区性别与是否为聋哑人之间是否有关系.16.(10分)假设关于某设备的使用年限x 和所支出的维修费用y(万元),有如下的统计资料:(1)y 与x 间是否有线性相关关系?若有,求出线性回归方程; (2)估计使用年限为10年时,维修费用是多少? 17.(12分)下表所示是一组试验数据:y 64 138 205 285 360(1)作出散点图,并猜测y 与x 之间的关系; (2)利用所得的模型预报x =10时y 的值.18.(12分)弹簧长度y(cm)随所挂物体质量x(g)不同而变化的情况如下: 物体质量x 5 10 15 20 25 30 弹簧长度y7.258.128.959.9010.9611.80(1)画出散点图;(2)求y 对x 的回归直线方程;(3)预测所挂物体质量为27 g 时的弹簧长度(精确到0.01 cm).参考答案1解析:题图A 中的点不成线性排列,故两个变量不适合线性回归模型.故选A. 答案:A2 解析:回归直线一定过点),(y x ,通过表格中的数据计算出x 和y ,易知选D. 答案:D3 解析:画出散点图如下:由散点图知线性相关性很强. 答案:A4解析:将x =10代入得y =145.83,但这种预测不一定准确,应该在这个值的左右.故选C. 答案:C5解析:由回归方程系数公式可得. 答案:D6解析:由等高条形图的特点及性质进行判断. 答案:C7解析:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,显然,身高和体重具有相关关系. 答案:B8 解析:独立性检验的实质就是利用随机变量K 2来判断“两个分类变量有关系”. 答案:C9解析:将⎩⎨⎧⨯==51001.1,0y x 和⎩⎨⎧⨯==51090.0,4002y x 分别代入kxe c y •=,⎩⎨⎧⨯-=⨯=-,10805.4,1001.155k c 故选A. 答案:A10解析:根据题意可知相关数据的列联表如下:利用公式,可计算得随机变量k 的值约为25.34>6.635,所以色盲与性别有关的把握为99%,故选C. 答案:C11解析:残差平方和越小,函数模型对数据拟合效果越好,反之残差平方和越大,说明函数模型对数据拟合程度效果越差. 答案:第一种12答案:美国一个地区的成年人受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右13解析:若e i 恒为0,则残差平方和0)ˆ(1212==-∑∑==ni i ni i ie yy, 而101)()ˆ(112122=-=---=∑∑==n i ini i iy yyyR . 答案:114解析:①回归方程只适用于我们所研究的样本总体,故①错误.④回归方程得到的预报值可能是取值的平均值,故④错误. 答案:②③ 15解:作列联表:聋哑人 不是聋哑人 总计 男 3 497 15 725 748 15 729 245 女 3 072 16 795 959 16 799 031 总计6 56932 521 70732 528 276828.1063.627075213256960317991624572915)748725150723959795164973(276528322≥≈⨯⨯⨯⨯-⨯⨯=k ,所以有99%的把握认为性别与是否为聋哑人有关. 16 解:(1)作散点图,如图:由散点图可知,y 与x 呈线性相关关系, ,5,4==y x ∑==51290i ix,∑==513.112i i i y x ,所以23.1103.1245905453.112ˆ2==⨯-⨯⨯-=b, 08.0423.15ˆˆ=⨯-=-=x b y a. 所以线性回归方程为yˆ=1.23x +0.08. (2)当x =10年时,yˆ=1.23×10+0.08=12.3+0.08=12.38(万元), 即估计使用10年时,维护费用是12.38万元.17 解:(1)散点图如图所示,从散点图可以看出y 与x 不具有线性相关关系.根据已有知识发现样本点分布在函数a xby +=的图象的周围,其中a,b 为待定参数.设y y xx ='=',1,由已知数据制成下表:序号i x i ′ y i ′ x i ′2 y i ′2 x i ′y i ′ 1 2 64 4 4 096 128 2 4 138 16 19 044 552 3 6 205 36 42 025 1 230 4 8 285 64 81 225 2 280 5 10 360 100 129 600 3 600 ∑301 052220275 9907 7904.210,6='='y x , 故∑=='-'5122405i i x x ,∑=='-'51222.649545i iy y ,计算知b =36.95,a =210.4-36.95×6=-11.3, 所以y′=-11.3+36.95x′. 所求y 对x 的回归曲线方程为3.1195.36-=xy . (2)当x =10时,605.73.111095.36-=-=y . 18 解:(1)散点图如图:(2)采用列表的方法计算aˆ与回归系数b ˆ.50.998.566,5.171056≈⨯==⨯=y x , 183.05.176275250.95.1767.0771ˆ2≈⨯-⨯⨯-=b , 30.65.17183.050.9ˆ≈⨯-=a, y 对x 的回归直线方程为yˆ=6.30+0.183x. (3)当质量为27 g 时,有yˆ=6.30+0.183×27≈11.24 cm. 所以当挂物体的质量为27 kg 时,弹簧的长度大约为11.24 cm.。
高中数学第三章统计案例测试题新人教A版选修2-3
99.99%.
二. 填空题
13 . 有下列关系: ( 1)人的年龄与他(她)拥有的财富之间的关系; ( 2)曲线上的点与该点 的坐标之间的关系; ( 3)苹果的产量与气候之间的关系; ( 4)森林中的同一种树木,其断 面直径与高度之间的关系; ( 5)学生与他(她)的学号之间的关系,其中有相关关系的是
14. 归直线方程为 y=0.5x-0.81 ,则 x=25 时, y 的估计值为
C. b 与 r 的相反
D. a
与 r 的符号相反
r , y 关于 x 的回归直线的
10. 为研究变量 x 和 y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回
归直线方程 l1 和 l2 ,两人计算知 x 相同, y 也相同,下列正确的是 ( )
A. l1 与 l 2 重合
B.
l 1 与 l 2 一定平行
第三章:统计案例
一 . 选择题
1. 炼钢时钢水的含碳量与冶炼时间有 (
)
A. 确定性关系
B. 相关关系
C. 函数关系
D.
无任何关系
2. 下列说法正确的有 ( )
①回归方程适用于一切样本和总体。
②回归方程一般都有时间性。③样本取值的范围
会影响回归方程的适用范围)
y?
6.06
12.09
24.09
48.04
95.77
190.9
y
6
12
25
49
95
190
n
n
e?i 2 = (y i
i=1
i=1
y?i )2 =3.1643
n
(y i
i=1
n
y?i ) 2 =
人教版数学高二-高中数学选修2-3第三章《统计案例》测评A
第三章测评A(基础过关卷)(时间:90分钟,满分:100分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②用相关指数可以刻画回归的效果,值越小说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和大小,残差平方和越小的模型拟合效果越好.其中说法正确的是()A.①②B.②③C.①③D.①②③答案:C2.下列关于回归分析与独立性检验的说法正确的是()A.回归分析和独立性检验没有什么区别B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验D.独立性检验可以100%确定两个变量之间是否具有某种关系解析:回归分析是对两个变量之间的相关关系的一种分析,而相关关系是一种不确定的关系,通过回归分析可以确定两个变量之间具有的近似关系;而独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.答案:C3.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是()A.线性函数模型B.二次函数模型C.指数函数模型D.对数函数模型解析:画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.答案:A4.一位母亲记录了儿子3~9岁的身高数据,由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145.83 cmB.身高在145.83 cm以上C.身高在145.83 cm左右D.身高在145.83 cm以下解析:回归模型只能进行预测,应选C.答案:C5.某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y 与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为()A.72%B.83%C.67%D.66%解析:因为当=7.675时,x=≈9.262,所以≈0.829≈83%.答案:B6.已知一个线性回归方程为=1.5x+45,其中x的取值依次为1,7,5,13,19,则等于()A.60B.46.5C.58.5D.75解析:=9,因为回归直线方程过点(),所以=1.5×+45=1.5×9+45=58.5.答案:C7.有一组观测数据(x1,y1),(x2,y2),…,(x12,y12)得=1.542,=2.847 5,=29.808,=99.208,x i y i=54.243,则回归直线方程为()A.=1.218x-0.969B.=-1.218x+0.969C.=0.969x+1.218D.=1.218x+0.969解析:由公式得≈1.218,≈0.969.∴回归直线方程为=1.218x+0.969.答案:D8.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施()A.有关B.无关C.关系不明确D.以上都不正确解析:随机变量K2的观测值k=≈8.306>6.635,则认为“实验效果与教学措施有关”的概率约为0.99.答案:A9.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面列联表:现判断数学成绩与物理成绩有关系,则判断的出错率为()A.0.5%B.1%C.2%D.5%解析:代入公式得K2的观测值k=≈4.514>3.841,查表可得,判断的出错率为5%.答案:D10.两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于()A.3B.4C.5D.6解析:列2×2列联表如下故K2的观测值k=≥5.024.把选项A,B,C,D代入验证可知选A.答案:A二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中横线上)11.已知某车间加工零件的个数x与所花费时间y(单位:h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要h.解析:当x=600时,=0.01×600+0.5=6.5.答案:6.512.下面是一个2×2列联表:则b-d=.答案:813.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=3e2x+1的图象附近,则可通过转换得到的线性回归方程为.解析:由y=3e2x+1,得ln y=ln(3e2x+1),即ln y=ln 3+2x+1.令u=ln y,v=x,则线性回归方程为u=1+ln 3+2v.答案:y=1+ln 3+2x14.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:则在犯错误的概率不超过的前提下认为吸烟量与年龄有关.解析:利用题中列联表,代入公式计算.K2的观测值为k=≈22.16>10.828,所以我们在犯错误的概率不超过0.001的前提下认为吸烟量与年龄有关.答案:0.00115.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:患慢性气管未患慢性气管合根据列联表数据,求得K 2= (保留3位有效数字),根据下表,有 的把握(填写相应的百分比)认为患慢性气管炎与吸烟有关. 附:K 2=.解析:K 2的观测值k=≈22.2>10.828.∴有99.9%的把握认为患慢性气管炎与吸烟有关.答案:22.2 99.9%三、解答题(本大题共4小题,共25分.解答应写出必要的文字说明、证明过程或演算步骤)16.(6分)在一次恶劣气候的飞行航程中调查男、女乘客在飞机上晕机的情况,共调查了89位乘客,其中男乘客有24人晕机,31人不晕机;女乘客有8人晕机,26人不晕机.根据此材料能否在犯错误的概率不超过0.05的前提下认为在恶劣气候飞行中男性比女性更容易晕机? 解:由已知数据列出2×2列联表:总计32 57 89根据公式计算得K 2的观测值为 k=≈3.689<3.841.所以在犯错误的概率不超过0.05的前提下我们不能认为恶劣气候下飞行中男性比女性更容易晕机.17.(6分)有两个分类变量X 与Y 的取值分别为{x 1,x 2},{y 1,y 2},其2×2列联表为其中a ,15-a 均为大于5的整数,则a 取何值时,在犯错误的概率不超过0.1的前提下认为X 与Y 之间有关系?解:查表可知,要使在犯错误的概率不超过0.1的前提下认为X 与Y 之间有关系,则k ≥2.706,而K 2的观测值为 k=, 由k ≥2.706, 得a>7.19或a ≤2.04.又a>5,且15-a>5,a ∈Z ,即a=8或9.故a 为8或9时,在犯错误的概率不超过0.1的前提下认为X 与Y 之间有关系.18.(6分)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人? 解:设男生人数为x ,依题意可得列联表如下:若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则k≥3.841,K2的观测值为k=≥3.841,解得x>10.24.∵为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,男生至少有12人.19.(7分)假定某企业的某种产品产量与单位成本数据如下:(1)试确定回归直线方程;(2)指出产量每增加1 000件时,单位成本下降多少元;(3)假定产量为6 000件时,单位成本是多少?单位成本为70元时,产量应为多少?解:(1)x i=21,y i=426,=79,=30 268,x i y i=1 481,=3.5,=71,==≈-1.818,≈71+1.818×3.5=77.363,∴回归方程为y=77.363-1.818x.(2)产量每增加1 000件时单位成本下降1.818元.(3)当x=6时,y=66.455;当y=70时,x≈4.所以当产量为6 000件时,单位成本约为66.455元;当单位成本为70元时,产量应约为4 000件.。
(易错题)高中数学高中数学选修2-3第三章《统计案例》检测题(有答案解析)
一、选择题1.以下四个结论,正确的是( )①质检员从匀速传递的产品生产流水线上,每间隔15分钟抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②在回归直线方程0.1.3ˆ1y x =+中,当变量ˆx 每增加一个单位时,变量ˆy增加0.13个单位;③在频率分布直方图中,所有小矩形的面积之和是1;④对于两个分类变量X 与Y ,求出其统计量2K 的观测值k ,观测值k 越大,我们认为“X 与Y 有关系”的把握程度就越大. A .②④B .②③C .①③D .③④2.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问400名不同的大学生是否爱好某项运动,利用22⨯列联表,计算可得2K 的观测值7.556k ≈,附表:参照附表,得到的正确结论是A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关”3.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35,若X 与Y 有关系的可信程度为90%,则c =( ) A .4 B .5 C .6D .74.对四对变量Y 和x 进行线性相关性检验,已知n 是观测值组数,r 是相关系数,且已知: ①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.995 0,则变量Y 和x 具有线性相关关系的是( ) A .①和② B .①和③ C .②和④D .③和④5.近年来,由于大学生不理智消费导致财务方面的新闻层出不穷,无力偿还校园贷,跳楼自杀也偶有发生,一时间人们对大学生的消费观充满了质疑.为进一步了解大学生的消费情况,对S 城某大学的10000名(其中男生6000名,女生4000名)在校本科生,按性别采用分层抽样的方式抽取了1000名学生进行了问卷调查,其中有一项是针对大学生每月的消费金额进行调查统计,通过整理得如图所示的频率分布直方图.已知在抽取的学生中,月消费金额超过2000元的女生有150人.根据上述数据和频率分布直方图,判断下列说法正确的是( )参考数据与参考公式:003 1.732,sin150.258,sin7.50.1305=≈≈.A .月消费金额超过2000元的女生人数少于男生人数B .所调查的同学中月消费金额不超过500元的共有4人C .样本数据的中位数约为1750元D .在犯错的概率不超过0.1%的情况下认为月消费金额在2000元以上的大学生与性别有关 6.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0017.对于独立性检验,下列说法正确的是( ) A .K 2>3.841时,有95%的把握说事件A 与B 无关 B .K 2>6.635时,有99%的把握说事件A 与B 有关 C .K 2≤3.841时,有95%的把握说事件A 与B 有关 D .K 2>6.635时,有99%的把握说事件A 与B 无关8.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.9759.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: )C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5810.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程^^^y b x a =+必过(),x y ;④在一个22⨯列联表中,由计算得213.079K =,则有99%以上的把握认为这两个变量间有关系.其中错误..的个数是( ) A .0 B .1C .2D .311.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.4512.对两个变量x 和y 进行回归分析,得到一组样本数据: ()()1122,,,x y x y ,…(),n n x y ,则下列说法中不正确的是( )A .由样本数据得到的回归方程ˆˆˆy bx a =+必过样本中心(),x yB .残差平方和越小的模型,拟合的效果越好C .若变量y 和x 之间的相关系数为0.9362r =-,则变量y 和x 之间具有线性相关关系D .用相关指数2R 来刻画回归效果, 2R 越小,说明模型的拟合效果越好二、填空题13.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________.14.设样本数据x 1,x 2,…,x 2 017的方差是4,若y i =x i -1(i =1,2,…,2 017),则y 1,y 2,…,y 2 017的方差为______.15.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450由表中数据计算得到K 2的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.16.某汽车销售公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:百辆)的影响,对近8年的年宣传费i x 和年销售量i y (1,2,...,8)i =数据作了初步处理,得到年销售量y 与年宣传费具有近似关系:ˆyb x a =+以及一些统计量的值如下:81i i x ==∑372.8,81i i y ==∑450.4,81i i x ==∑54.4,81i i y ==∑76.2 .已经求得近似关系中的系数68b =,请你根据相关回归分析方法预测当年宣传费100x =(千元)时,年销售量y =__________(百辆). 17.某单位为了了解用电量度与气温之间的关系,随机统计了某天的用电量与当天气温.由表中数据得回归直线方程中,据此预测当气温为5℃时,用电量的度数约为____.18.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,可以有_______%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.超重 不超重 合计 偏高 4 1 5 不偏高31215独立性检验临界值表独立性检验随机变量2K 值的计算公式:22()()()()()n ad bc K a b c d a c b d -=++++19.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法; ②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误.20.关于变量,x y 的一组样本数据11()a b ,,22()a b ,,……,(),n n a b (2n ≥,12,,,n a a a ⋅⋅⋅不全相等)的散点图中,若所有样本点(,)i i a b (1,2,,i n =⋅⋅⋅)恰好都在直线21y x =-+上,则根据这组样本数据推断的变量,x y 的相关系数为_____________.三、解答题21.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据:关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii xx =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii n ii x y nx y bxnx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑22.2017年10月9日,教育部考试中心下发了《关于2018年普通高考考试大纲修订内容的通知》,在各科修订内容中明确提出,增加中华优秀传统文化的考核内容,积极培育和践行社会主义核心价值观,充分发挥高考命题的育人功能和积极导向作用.鞍山市教育部门积极回应,编辑传统文化教材,在全是范围内开设书法课,经典诵读等课程.为了了解市民对开设传统文化课的态度,教育机构随机抽取了200位市民进行了解,发现支持开展的占75%,在抽取的男性市民120人中支持态度的为80人.(1)完成22⨯列联表(2)判断是否有99.9%的把握认为性别与支持有关?附:22()()()()()n ad bc K a b c d a c b d -=++++.23.某工厂新购置甲、乙两种设备,分别生产A,B两种产品,为了解这两种产品的质量,随机抽取了200件进行质量检测,得到质量指标值的频数统计表如下:产品质量22⨯列联表(1)求a,b,n的值,并估计A产品质量指标值的平均数;(2)若质量指标值大于50,则说明该产品质量高,否则说明该产品质量一般.请根据频数表完成22⨯列联表,并判断是否有99%的把握认为质量高低与引入甲、乙设备有关.附:()()()()()22n ad bcKa b c d a c b d-=++++.24.某中学在2020年元旦校运动会到来之前,在高三年级学生中招募了16名男性志愿者和14名女性志愿者,其中男性志愿者,女性志愿者中分别有10人和6人喜欢运动会,其他人员均不喜欢运动会.(1)根据题设完成下列22⨯列联表:(2)在犯错误的概率不超过0.050的前提下能否有95%的把握认为喜欢运动会与性别有关?并说明理由.(3)如果喜欢运动会的女性志愿者中只有3人懂得医疗救护,现从喜欢运动会的女性志愿者中随机抽取2人负责医疗救护工作,求“抽取得2名志愿者都懂得医疗救护”的概率.注:()()()()()()22n ad bcK n a b c da b c d a c b d-==+++ ++++临界值表25.为了解某班学生喜爱玩游戏是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到喜爱玩游戏的学生的概率为3 5 .(1)请将上面的列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.005的前提下认为喜爱玩游戏与性别有关?说明你的理由;(3)以该班学生的情况来估计全校女生喜爱玩游戏的情况,用频率代替概率.现从全校女生中抽取3人进一步调查,设抽到喜爱玩游戏的女生人数为ξ,求ξ的期望.下面的临界值表供参考:(参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)26.为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了100个样本,统计结果为:服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本.(1)根据所给样本数据画出22⨯列联表;(2)请问能有多大把握认为药物有效?附公式:()()()()()22=n ad bcKa b c d a c b d-++++.【参考答案】***试卷处理标记,请不要删除一、选择题1.D解析:D【分析】利用系统抽样和分层抽样的知识判断①的正确性;利用回归直线方程的知识判断②的正确性;利用频率分布直方图的知识判断③的正确性;利用独立性检验的知识判断④的正确性.【详解】①,是系统抽样,不是分层抽样,所以①错误. ②,y 增加0.1,所以②错误. ③,在频率分布直方图中,所有小矩形的面积之和是1,所以③正确. ④,对于两个分类变量X 与Y ,求出其统计量2K 的观测值k ,观测值k 越大,我们认为“X 与Y 有关系”的把握程度就越大,所以④正确. 综上所述,正确的序号为③④. 故选:D 【点睛】本小题主要考查抽样方法、回归直线方程、频率分布直方图和独立性检验等知识,属于基础题.2.B解析:B 【分析】根据2K 的观测值7.556k ≈,对照表中数据,即可得到相应的结论. 【详解】根据2K 的观测值7.556k ≈,对照表中数据得出有0.01的几率说明这两个变量之间的关系是不可信的,即有10.0199%-=的把握说明两个变量之间有关系,故选B . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)3.B解析:B 【解析】 【分析】根据22⨯列联表,以及独立检验随机变量的临界值参考表,计算2K 对应的值,验证24,5,6,7,c K =是否恰好满足即可【详解】列22⨯列联表可知:当5c =时,()22661030521 3.024 2.70615513135K ⨯⨯-⨯=≈>⨯⨯⨯,所以5c =时,X 与Y 有关系的可信程度为90%,而其余的值4,6,7c c c ===皆不满足,故选B . 【点睛】独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)4.B解析:B 【解析】分析:先查相关系数检验的临界值表,再判断变量Y 和x 具有线性相关关系的选项. 详解: 查相关系数检验的临界值表 ①r 0.05=0.754,r >r 0.05; ②r 0.05=0.514,r <r 0.05; ③r 0.05=0.482,r >r 0.05; ④r 0.05=0.997,r 0.05>r.∴y 和x 具有线性相关关系的是①③.故答案为B.点睛:本题主要考查相关系数,意在考查学生对这些知识的掌握水平.5.D解析:D 【解析】分析:由题意首先求得a 的值,然后结合分层抽样的定义和独立性检验的结论逐一考查所给选项是否正确即可.详解:由直方图知,(0.004+0.013+0.014+a +0.027+0.039+0.08)×5=1,解得a =0.023, 故月消费金额超过2000元的大学生人数为(0.023+0.014+0.013)×5×1000=250人, 由分层抽样知,男生、女生抽样的人数分别为600人和400人, 由题知,月消费金额超过2000元的男生人数为100人,故A 选项错误; 月消费金额不超过500元的人数为0.004×5×1000=20人,故选项B 错误; 又由频率分布直方图知,当消费金额小于1750元时, 频率为(0.004+0.027+0.039)×5+0.08×5×12=0.55>0.5.选项C 错误; 由条件可以列出列联表:故K2的观测值()()()()()50010.8289n ad bcka b c d a c b d-==>++++,所以在犯错的概率不超过0.1%的情况下可以判断月消费金额在2000元以上的大学生与性别有关.本题选择D选项.点睛:解决频率分布直方图的问题,关键在于找出图中数据之间的联系.这些数据中,比较明显的有组距、频率组距,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积=组距×频率组距=频率,小长方形面积之和等于1,即频率之和等于1,就可以解决直方图的有关问题.6.D解析:D【解析】10.828,10.0010.99999.90k≥∴-==,则有099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bcKa b a d a c b d-=++++计算2K的值;(3) 查表比较2K与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.B解析:B【解析】由独立性检验的知识知:K2>3.841时,有95%的把握认为“变量X与Y有关系”;K2>6.635时,有99%的把握认为“变量X与Y有关系”.故选项B正确.8.C解析:C【解析】∵P(k>5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X和Y 有关系”.考点:独立性检验.9.A解析:A【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.10.B解析:B 【解析】一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于回归方程y 35x =-,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y = b x +a 必过点(),x y ,③正确;因为213.079 6.635K =>,故有0099以上的把握认为这两个变量间有关系,④正确,即错误的个数为1,故选B.11.D解析:D 【解析】57(0.85165ˆ85.7) 2.45Y Yσ=-=-⨯-= 12.D解析:D 【解析】逐一分析所给的各个选项:A. 由样本数据得到的回归方程ˆˆˆy bx a =+必过样本中心(),x yB. 残差平方和越小的模型,拟合的效果越好C. 若变量y 和x 之间的相关系数为0.9362r =-,则变量y 和x 之间具有线性相关关系D. 用相关指数2R 来刻画回归效果,2R 越大,说明模型的拟合效果越好,该说法错误. 本题选择D 选项.二、填空题13.【解析】∵P(K2≥3841)≈005∴判断性别与是否爱好运动有关出错的可能性不超过5点睛:根据卡方公式计算再与参考数据比较就可确定可能性 解析:5%【解析】∵P (K 2≥3.841)≈0.05.∴判断性别与是否爱好运动有关,出错的可能性不超过5%. 点睛:根据卡方公式计算2K ,再与参考数据比较,就可确定可能性.14.4【解析】设样本数据的平均数为则yi =2xi -1的平均数为2-1则y1y2…y2017的方差为(2x1-1-2+1)2+(2x2-1-2+1)2+…+(2x2017-1-2+1)2=4×(x1-)2解析:4 【解析】设样本数据的平均数为,则y i =2x i -1的平均数为2-1,则y 1,y 2,…,y 2 017的方差为[(2x 1-1-2+1)2+(2x 2-1-2+1)2+…+(2x 2 017-1-2+1)2]=4× [(x 1-)2+(x 2-)2+…+(x 2 017-)2]=4×4=1615.不能【解析】查表知若要在犯错误的概率不超过001的前提下认为喜欢玩电脑游戏与认为作业多有关则临界值k0=6635本题中k≈5059<6635所以不能在犯错误的概率不超过001的前提下认为喜欢玩电脑游解析:不能 【解析】查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635.本题中,k≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关. 考点:独立性检验.16.6【解析】试题分析:由得当时所以年销售量7806考点:回归方程解析:6 【解析】试题分析:由ˆˆa y bx =-得ˆ100.6a =6ˆ8100.6y x ∴=+,当100x =时ˆ780.6y=,所以年销售量y =780.6 考点:回归方程17.40【解析】试题分析:∵∴∴当时考点:线性回归方程解析:40 【解析】 试题分析:∵,,∴,∴当时,考点:线性回归方程18.5【分析】计算并与临界值表中数据比较即可得出答案【详解】故有的把握认为该学校至周岁的男生的身高和体重之间有关系故答案为:975【点睛】本题主要考查了独立性检验的实际应用属于中档题解析:5 【分析】计算2K ,并与临界值表中数据比较,即可得出答案.【详解】2220(41213) 5.934 5.024713515K ⨯-⨯=≈>⨯⨯⨯故有97.5%的把握认为该学校15至16周岁的男生的身高和体重之间有关系. 故答案为:97.5 【点睛】本题主要考查了独立性检验的实际应用,属于中档题.19.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④ 【解析】①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.20.-【解析】所有样本点都在直线上说明这两个变量间完全负相关故其相关系数为-1故填-1解析:-1 【解析】所有样本点都在直线上,说明这两个变量间完全负相关,故其相关系数为-1,故填-1.三、解答题21.(1)0.94r ≈,线性相关性较弱;(2) +77.3ˆyx = 【分析】(1)代入线性相关系数r 公式即可得到答案,给出判断.(2)由(1)得到线性相关性较弱,淘汰销售额为75万元的数据,再利用最小二乘法求回归直线方程即可. 【详解】 (1)1510.9412.0813.27r ==≈⨯.因为0.940.95r ≈<,所以线性相关性较弱,(2)由(1)可得没有达到较强线性相关,则淘汰销售额为75万元的数据. 剔除数据后的25.25x '=,82.5y '=.4122783490258620768446i ii x y==⨯+⨯+⨯+⨯=∑,4425.2582.58332.5x y ''⋅=⨯⨯=,2241222223425202665ii x==+++=∑,2425.2525.252550.254x =⨯⨯=',所以84468332.5ˆ126652550.25b-=≈-,ˆ82.525.2577.3a y bx ''=-=-≈. 所以线性回归方程为 +77.3ˆy x =. 【点睛】本题考查线性相关强弱的判断,考查最小二乘法求线性回归方程,解题的关键是正确处理数据,正确计算. 22.(1)列联表见解析.(2) 有99.9%的把握认为性别与支持有关. 【解析】分析:(1)先由题得到抽取的男性市民为120人,持支持态度的为150人,男性公民中持支持态度的为80人,再完成2×2列联表.(2)先计算2K ,再判断是否有99.9%的把握认为性别与支持有关.详解:(1)抽取的男性市民为120人,持支持态度的为20075%=150⨯人,男性公民中持支持态度的为80人,列出22⨯列联表如下:(2)2200(80107040)1001.11110.82815050801209K ⨯-⨯==≈>⨯⨯⨯所以有99.9%的把握认为性别与支持有关.点睛:本题主要考查22⨯列联表和独立性检验,意在考查学生对这些知识的掌握水平和基本的计算能力.23.(1)10a =,120n =,36b =,53.25;(2)答案见解析,有. 【分析】(1)由已知求得a 、n 、b 的值,即可计算平均数A x ; (2)根据题意填写列联表,计算2K ,对照附表得出结论. 【详解】(1)由表格中的数据,可得802632201010a =-----=,20080120n =-=,12012242715636b =-----=,所以可估计A 产品质量指标值的平均数为:()137.5242.5647.51052.53257.52062.51053.2580A x =⨯⨯+⨯+⨯+⨯+⨯+⨯=; (2)根据题意,可得22⨯的列联表如下:计算()22006272184827.273 6.6358012011090K ⨯⨯-⨯=≈>⨯⨯⨯, 所以有99%的把握认为质量高低与引入甲、乙设备有关.【点睛】本题主要考查了统计的基础知识,卡方的计算,以及独立性检验的应用,其中解答中根据表格中的数据,得出22⨯的列联表,求得2K 的值是解答的关键,着重考查推理与计算能力.24.(1)填表见解析;(2)没有;答案见解析;(3)15. 【分析】(1)根据题目中所给的数据即可得出列联表; (2)根据公式求2K ,再与临界值比较即可做出判断;(3)用列举法列出满足题意得基本事件的总数,求出所求事件包含的基本事件的个数,根据古典概率公式计算即可. 【详解】 (1)(2)()()()()()223010866 1.158 3.8411066810668K ⨯⨯-⨯=≈<++++ 所以在犯错误的概率不超过0.050的前提下没有95%的把握认为喜欢运动会与性别有关. (3)喜欢运动会的女性志愿者有6人,设分别为A ,B ,C ,D ,E ,F ,其中A ,B ,C 懂得医疗救护,则从这6人中任取2人方法有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种,其中两人都懂得医疗救护的有AB ,AC ,BC ,共3种, 所以所求的概率31155p ==. 【点睛】本题主要考查了22⨯列联表,独立性检验卡方的计算,考查了古典概型概率公式,属于中档题.25.(1)列联表见解析;(2)在犯错误的概率不超过0.005的前提下,认为喜爱玩游戏与性别有关,理由见解析;(3)65. 【分析】(1)由喜爱游戏学生的概率计算后可填充列联表; (2)根据列联表计算2K 后可得;(3)由题意ξ的可能取值为0,1,2,3,且23,5B ξ⎛⎫⎪⎝⎭,计算出概率得概率分布列,然后由期望公式计算出期望. 【详解】(1)列联表补充如下:(2)∵()25020151058.3337.87930202525K ⨯⨯-⨯=≈>⨯⨯⨯∴在犯错误的概率不超过0.005的前提下,认为喜爱玩游戏与性别有关. (3)从全校女生中随机抽取1人,抽到喜爱游戏的女生的概率为25. 抽到喜爱游戏的女生人数ξ的可能取值为0,1,2,3,23,5B ξ⎛⎫ ⎪⎝⎭其概率为332355kkk P C -⎛⎫⎛⎫=⋅⎪ ⎪⎝⎭⎝⎭,0k =,1,2,3故ξ的分布列ξ的期望值26()355E ξ=⨯=.【点睛】本题考查独立性检验,考查列联表及卡方的计算,考查随机变量的分布列和数学期望,考查学生的数据处理能力,运算求解能力,属于中档题. 26.(1)列联表见解析;(2)大概有90%把握认为药物有效. 【分析】(1)根据服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本,根据各种数据,列好表格,填好数据,得到列联表.(2)根据列联表数据,代入临界值公式,做出观测值,进行比较,即可得出结果. 【详解】(1)根据服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本,得到列联表()()()()()22n ad bc K a b c d a c b d -=++++()210040202020 2.77860406040⨯⨯-⨯=≈⨯⨯⨯由()22.7060.10P K ≥=,所以大概有90%把握认为药物有效.【点睛】本题考查了完善列联表和独立性检验,考查了数据分析能力和计算能力,属于基础题目.。
人教A版选修2-3第三章统计案例章末综合检测.docx
高中数学学习材料唐玲出品(时间:100分钟;满分:120分)一、选择题(本大题共10小题,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.试验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( ) A.y ^=x +1 B.y ^=x +2 C.y ^=2x +1 D.y ^=x -1解析:选 A.由题意发现,(x ,y )的四组值均满足y ^=x +1,故y ^=x +1,即为回归直线方程,不必利用公式计算.2.已知x ,y 之间的一组数据如下表所示,则y 对x 的回归直线必经过( )x 0 1 2 3 y 1 3 5 7A.(0,1) B .(2,5) C .(1.5,0) D .(1.5,4)解析:选 D.由公式y -=b ^x -+a ^知回归直线必过点(x -,y -),由题意可求得x -=14(0+1+2+3)=1.5,y -=14(1+3+5+7)=4,所以y 对x 的回归直线必经过点(1.5,4),故选D.3.如果有95%的把握说事件A 和B 有关系,那么具体计算出的数据( ) A .K 2>3.841 B .K 2<3.841 C .K 2>6.635 D .K 2<6.635解析:选A.由独立性判断的方法可知,如果有95%的把握,则K 2>3.841.4.已知回归直线方程y ^=bx +a ,其中a =3且样本点中心为(1,2),则回归直线方程为( ) A.y ^=x +3 B.y ^=-2x +3 C.y ^=-x +3 D.y ^=x -3 解析:选C.∵回归直线必过样本点中心, ∴2=b +a .又∵a =3,∴b =-1,∴回归直线方程为y ^=-x +3. 故选C.5.一位母亲记录了儿子3~9岁的身高,数据如下表.由此建立的身高与年龄的回归模型为y =7.19x +73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )年龄/岁3 4 5 6 7 8 9 身高/cm94.8 104.2 108.7 117.8 124.3 130.8 139.0 A.身高一定在145.83 cm B .身高在145.83 cm 以上 C .身高在145.83 cm 左右 D .身高在145.83 cm 以下解析:选C.将x =10代入得y =145.83,但这种预测不一定准确,应该在这个值的左右.故选C. 6.下列关于等高条形图说法正确的是( ) A .等高条形图表示高度相对的条形图 B .等高条形图表示的是分类变量的频数 C .等高条形图表示的是分类变量的百分比 D .等高条形图表示的是分类变量的实际高度 解析:选C.由等高条形图的特点及性质进行判断. 7.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施( )优、良、中 差 总计实验班48 2 50 对比班38 12 50 总计86 14 100 A.有关 B .无关 C .关系不明确 D .以上都不正确解析:选A.K 2的观测值k =100×(48×12-38×2)250×50×86×14≈8.306>7.879,则在犯错误的概率不超过0.005的前提下认为实验效果与教学措施有关.8.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( ) A .83% B .72% C .67% D .66%解析:选A.因为当y ^=7.675时,x =7.675-1.5620.66≈9.262,所以7.6759.262≈0.829≈83%.9.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表如下:y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d a +b +c +d对于以下数据,对同一样本能说明X 与Y 有关的可能性最大的一组为( ) A .a =9,b =8,c =7,d =6 B .a =9,b =7,c =6,d =8 C .a =8,b =6,c =9,d =7 D .a =6,b =7,c =8,d =9解析:选B.对于同一样本|ad -bc |越小,说明X 与Y 之间的关系越弱,|ad -bc |越大,说明X 与Y 之间的关系越强.|ad -bc |越大,K 2越大,|ad -bc |越小,则K 2越小.10.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35.若X 与Y 有关系的可信程度不小于97.5%,则c 等于( ) A .3 B .4 C .5 D .6解析:选A.列2×2列联表如下:x 1 x 2 总计 y 1 10 21 31 y 2 c d 35总计 10+c 21+d66 故K 2的观测值k =66×[10(35-c )-21c ]231×35×(10+c )(56-c )≥5.024.把选项A,B,C,D 代入验证可知选A.二、填空题(本大题共5小题,把答案填在题中横线上) 11.下列是关于出生男婴与女婴调查的列联表晚上 白天 总计男婴45 A B 女婴E 35 C 总计98 D 180 那么A =__________,B =__________,C =__________,D =__________,E =__________.解析:∵45+E =98,∴E =53;∵E +35=C ,∴C =88;∵98+D =180,∴D =82;∵A +35=D ,∴A =47;∵45+A =B ,∴B =92. 答案:47 92 88 82 53 12.某单位为了了解用电量y (千瓦时)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温/℃ 18 13 10 -1 用电量/千瓦时24 34 38 64 由表中数据得线性回归方程y ^=b ^x +a ^中b ^=-2,预测当气温为-4 ℃时,用电量的度数约为________.解析:x -=10,y -=40,∵回归直线过点(x -,y -),∴40=-2×10+a ^,∴a ^=60,∴y ^=-2x +60.令x =-4,∴y ^=(-2)×(-4)+60=68. 答案:6813.下列说法正确的有________(填写你认为正确的序号).①线性回归方法就是利用样本点去寻找一条贴近这些样本点的直线的数学方法; ②利用样本的散点图可以直观判断两个变量的关系是否可用线性关系表示;③通过线性回归方程y ^=a ^+b ^x 及回归系数b ^,可以估计和预测变量的取值及变化规律.解析:样本的散点图可以直观判断两个变量是否线性相关,只有线性相关才能用线性回归的方法找到回归直线,并预测变量的取值及变化规律,故正确的答案是①②③. 答案:①②③14.已知样本容量为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ^=0.3x +a ^,则x -≈________,a^≈________.(精确到0.01)解析:由题意得x -=111∑i =111x i =51011≈46.36,y -=111∑i =111y i =21411,因为y -=0.3x -+a ^,所以21411=0.3×51011+a ^,可得a ^≈5.55.答案:46.36 5.5515.某部门通过随机调查89名工作人员的休闲方式是看电视还是运动,得到的数据如下表:看电视 运动 总计女24 31 55 男8 26 34 总计32 57 89你认为性别与休闲方式有关系的把握为________. 解析:由列联表中的数据,得K 2的观测值为 k =89×(24×26-31×8)255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系,即认为性别与休闲方式有关系的把握为90%. 答案:90%三、解答题(本题共5小题,解答应写出文字说明、证明过程或演算步骤)16.为了调查患胃病是否与生活不规律有关,调查某地540名40岁以上的人得结果如下:患胃病 未患胃病 总计生活不规律60 260 320 生活有规律20 200 220 总计80 460 540 根据以上数据回答,40岁以上的人患胃病与生活不规律有关吗? 解:K 2的观测值为k =540×(60×200-260×20)2320×220×80×460≈9.638.∵9.638>6.635,∴有99%的把握认为40岁以上的人患胃病与生活不规律有关.17.某个服装店经营某种服装,在某周内获纯利y (元)与该周每天销售这种服装件数x 之间的一组数据关系见表:x 3 4 5 6 7 8 9 y 66 69 73 81 89 90 91已知∑i =17x 2i =280,∑i =17y 2i =45 309,∑i =17x i y i =3 487.(1)求x -,y -;(2)判断纯利y (元)与每天销售件数x 之间是否线性相关,如果线性相关,求出回归方程.解:(1)x -=3+4+5+6+7+8+97=6;y -=66+69+73+81+89+90+917=5597.(2)画出散点图知,y 与x 有线性相关关系,设回归直线方程:y ^=b ^x +a ^,b ^=3 487-7×6×5597280-7×36=13328=4.75, a ^=5597-6×4.75≈51.36.∴回归方程为y ^=4.75x +51.36.18.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧人数占女生人数的23.若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?解:设男生人数为x ,依题意可得列联表如下:喜欢韩剧 不喜欢韩剧 总计男生 x 6 5x6x 女生 x 3 x 6 x2总计 x 2 x 32x若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则k >3.841,K 2=3x 2(x 6×x 6-5x 6×x 3)2x ·x 2·x 2·x =38x >3.841,解得x >10.24, ∵x 2,x6为整数, ∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人.19.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:性别 是否需要志愿者男 女需要40 30 不需要160 270P (K 2≥k )0.05 0.01 0.001 k 3.841 6.635 10.828附:K 2的观测值k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)在犯错误的概率不超过0.01的前提下是否可认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?请说明理由.解:(1)调查的500位老人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为70500=14%.(2)k =500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,因此,在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关.(3)由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据中能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并且采用分层抽样方法比采用简单随机抽样的方法更好.20.在某次试验中,有两个试验数据x ,y ,统计的结果如下面的表格1x 1 2 3 45 y 23 4 4 5表格1(1)在给出的坐标系中画出x ,y 的散点图;(2)补全表格2,然后根据表格2的内容和公式序号x y x 2 xy 1 1 2 1 2 2 2 3 4 6 3 3 4 912 4 4 4 16 16 5 5 5 2525 ∑表格2b ^=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x -2,a ^=y --b ^x -. ①求出y 对x 的回归直线方程y ^=b ^x +a ^中回归系数a ^,b ^;②估计当x 为10时y ^的值是多少? 解:(1)x 、y 的散点图如图所示(2)表格如下序号 x y x 2 xy 1 1 2 1 2 2 2 3 4 6 3 3 4 9 12 4 4 4 16 16 5 5 5 25 25 ∑15185561①计算得x -=3,y -=3.6,b ^=∑i =15x i y i -5x -y -∑i =15x 2i -5x -2=61-5×3×3.655-5×32=0.7,a ^=y --b ^x -=3.6-0.7×3=1.5.②由①得,y ^=b ^x +a ^=0.7x +1.5,当x 为10时,y ^=8.5.。
(典型题)高中数学高中数学选修2-3第三章《统计案例》测试题(有答案解析)
一、选择题1.以下四个命题:①从匀速传递的产品生产流水线上,每30分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②某市进行了一次全市高中男生身高统计调查,数据显示某市30000高中男生的身高ξ(单位:cm )服从正态分布()2172,N σ,且(172180)0.4P ξ<≤=,那么该市身高高于180cm 的高中男生人数大约为3000;③随机交量X 服从二项分布(100,0.4)B ,若随机变量21Y X =+,则Y 的数学期望为()81E Y =,方差为()48D Y =;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系的把握程度越大其中正确的个数是( ) A .1B .2C .3D .42.下列说法错误的是( )A .在回归直线方程0.2 0.8y x =+中,当解释变量x 每增加1个单位时,预报变量y 平均增加0.2个单位.B .对分类变量X 与Y ,随机变量2K 的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小.C .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1.D .回归直线过样本点的中心(),x y . 3.下列命题是假命题...的是( ) A .某企业有职工150人,其中高级职称15人,中级职称45人,一般职员90人,若用分层抽样的方法抽出一个容量为30的样本,则一般职员应抽出18人; B .用独立性检验(列联表法)来考察两个分类变量是否有关系时,算出的随机变量的值越大,说明“与有关系”成立的可能性越大;C .已知向量,,则是的必要条件; D .若,则点的轨迹为抛物线.4.通过随机询问250名不同性别的高中生在购买食物时是否看营养说明书,得到如下列联表:女 男 总计 读营养说明书 90 60 150 不读营养说明书 30 70 100 总计120130250从调查的结果分析,认为性别和读营养说明书的关系为( ) 附:()20P K k ≥ 0.150.10 0.05 0.025 0.010 0.005 0.001 0k 2.0722.7063.8415.0246.6357.87910.828()()()()()22n ad bc K a b c d a c b d -=++++ . A .95%以上认为无关 B .90%~95%认为有关 C .95%~99.9%认为有关D .99.9%以上认为有关5.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系: x 2 4 5 6 8 y3040605070y 与x 的线性回归方程为 6.5175ˆ.y x =+,当广告支出5万元时,随机误差的效应(残差)为( ) A .40 B .20 C .30D .106.如图所示,茎叶图记录了甲、乙两组各4名学生完成某道数学题的得分情况,该题满分为12分.已知甲、乙两组学生的平均成绩相同,乙组某个数据的个位数字模糊,记为x .则下列命题正确的是( )A .甲组学生的成绩比乙组稳定B .乙组学生的成绩比甲组稳定C .两组学生的成绩有相同的稳定性D .无法判断甲、乙两组学生的成绩的稳定性 7.对于相关指数R2,下列说法正确的是 A .R2的取值越小,模型拟合效果越好B .R2的取值可以任意大,且R2取值越大,拟合效果越好C .R2的取值越接近于1,模型拟合效果越好D .以上答案都不对8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学 数学 总计85~100分85分以下物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005 B .0.01C .0.02D .0.059.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.00110.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关 11.下列说法中正确的是①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心(),x y ; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度;④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好.( ) A .①②B .③④C .①④D .②③12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )2()P K k ≥… 0.25 0.15 0.10 0.025 0.010 0.005 …k … 1.323 2.072 2.706 5.024 6.635 7.879 …A .90%B .95%C .97.5%D .99.5%二、填空题13.x 和y 的散点图如图所示,则下列说法中所有正确命题的序号为______.①x ,y 是负相关关系;②x ,y 之间不能建立线性回归方程;③在该相关关系中,若用21c x y c e =拟合时的相关指数为21R ,用y bx a =+拟合时的相关指数为22R ,则2212R R >.14.以下四个命题中:①在回归分析中,可用相关系数r 的值判断模型的拟合效果,|r |越大,模拟的拟合效果越好;②在一组样本数据()()()112212,,,,...,,(2,,,...,n n n x y x y x y n x x x ≥不全相等)的散点图中,若所有样本点()()11,1,2,...x y i n =都在直线112y x =-+上,则这组样本数据的线性相关系数为12-;③对分类变量x 与y 的随机变量2k 来说,2k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为__________. 15.已知方程是根据女大学生的身高预报她的体重的回归方程,其中的单位是,的单位是,那么针对某个体的残差是______.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.已知与之间的一组数据如图所示,当m 变化时,与的回归直线方程ˆybx a =+必过定点 .0 1 2 3135m -7m +18.已知下列说法: ①分类变量A 与B 的随机变量越大,说明“A 与B 有关系”的可信度越大;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.其中说法正确的为_____________.(填序号)19.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是_____________. ①若K 2的观测值满足K 2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.20.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大.三、解答题21.近年来,共享单车进驻城市,绿色出行引领时尚.某公司计划对未开通共享单车的A 县城进行车辆投放,为了确定车辆投放量,对过去在其他县城的投放量情况以及年使用人次进行了统计,得到了投放量x (单位:千辆)与年使用人次y (单位:千次)的数据如下表所示,根据数据绘制投放量x 与年使用人次y 的散点图如图所示.x1 2 3 4 5 67y6 112134 66 101196(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型lg =+y a b x 或指数函数模型(0,0)=⋅>>x y c d c d 对两个变量的关系进行拟合,请问哪个模型更适宜作为投放量x 与年使用人次y 的回归方程类型(给出判断即可,不必说明理由),并求出y 关于x 的回归方程;(2)已知每辆单车的购入成本为200元,年调度费以及维修等的使用成本为每人次0.2元,按用户每使用一次,收费1元计算,若投入8000辆单车,则几年后可实现盈利? 参考数据:y v71i ii x y =∑71i i i x v =∑0.5410 62.141.54 2535 50.123.47其中lg i i v y =,17i i v v ==∑.参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线ˆˆˆv a u β=+的斜率和截距的最小二乘估计公式分别为1221ˆni i i nii u v nu vunu β==-=-∑∑,ˆˆa v u β=-. 22.某土特产超市为预估2021年元旦期间游客购买土特产的情况,对2020年元旦期间的购买情况进行随机抽样并统计,得到如下数据: 购买金额(元) [0,15)[15,30)[30,45)[45,60)[60,75)[75,90]人数101520252010(1)估计游客平均购买金额(同一组中的每个数据可用该组区间的中点值代替); (2)根据以上数据完成22⨯列联表,并判断是否有90%的把握认为购买金额是否少于60元与性别有关.不少于60元 少于60 合计附:参考公式和数据:22(),()()()()n ad bcK n a b c da b c d a c b d-==+++ ++++.附表:23.中央电视台“国家品牌计划”栏目组为了做好新能源汽车的品牌推介,利用网络平台对年龄(单位:岁)在[20,60]内的人群进行了调查,并从参与调查者中随机选出600人,把这600人分为对新能源汽车比较关注和不太关注两类,并制成如下表格:(1)填写列联表,并根据列联表判断能否在犯错误的概率不超过0.01的前提下认为性别与对新能源汽车关注度有关;这600人中选出6人进行访谈,最后从这6人中随机选出3人参与电视直播节目,记3人中女性的人数为X,求X的分布列与期望.附:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 24.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:2()()()()()n ad bc K a b c d a c b d -=++++,25.某火锅店为了解气温对营业额的影响,随机记录了该店1月份中5天的日营业额y (单位:千元)与该地当日最低气温x (单位:℃)的数据,如下表:(1)求y 关于x 的回归方程y bx a =+;(2)判定y 与x 之间是正相关还是负相关;若该地1月份某天的最低气温为6℃,用所求回归方程预测该店当日的营业额;附:①a y bx =-;1221ni ii nii x y nx yb xnx==-⋅=-∑∑.②参考数据如下:26.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区1000名患有某种传染病的患者的相关信息,得到如表: 该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表.(Ⅰ)请将列联表补充完整;(Ⅱ)根据列联表判断是否有95%的把握认为潜伏期与患者年龄有关?附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】根据抽样方式的特征,可判断①;根据正态分布的性质,可判断②;根据二项分布的期望与方差特点,可判断③;根据独立性检验的方法和步骤,可判断④. 【详解】解:①根据抽样是间隔相同,且样本间无明显差异,故①应是系统抽样,即①为假命题;②某市进行了一次全市高中男生身高统计调查,数据显示某市30000高中男生的身高ξ(单位:cm )服从正态分布()2172,N σ,且(172180)0.4P ξ<≤=,所以()1(180)1721800.12P P ξξ>=-<≤=,所以该市身高高于180cm 的高中男生人数大约为300000.13000⨯=人,故②为真命题;③随机交量X 服从二项分布(100,0.4)B ,则()1000.440E X =⨯=,()()1000.410.424D X =⨯⨯-=,若随机变量21Y X =+,则Y 的数学期望为()()2181E Y E X =+=,方差为()()2296D Y D X ==;故③为假命题;④对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越小,故④为假命题. 故选:A . 【点睛】本题以命题的真假判断为载体考查了抽样方法,正态分布,二项分布及独立性检验等知识点,属于中档题.2.B解析:B 【分析】根据线性回归方程,相关系数,独立性检验的相关知识即可判断选项的正误. 【详解】对于选项A :在回归直线方程0.2.8ˆ0yx =+中,当解释变量x 每增加1个单位时,预报变量y 平均增加0.2个单位,正确.对于选项B :对分类变量X 与Y ,随机变量2K 的观测值k 越大,则判断“X 与Y 有关系"的把握程度越大,错误.对于选项C :两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1,正确. 对于选项D :回归直线过样本点的中心(),x y ,正确. 故选: B 【点睛】本题主要考查了线性回归的有关知识,考查了随机变量的相关性,考查了推理能力,属于中档题.3.D解析:D 【分析】根据分层抽样的概念易得,解出方程即可判断为真;用独立性检验(列联表法)的判定方法即可得出B 为真;根据充分条件和必要条件的定义以及向量的数量积的应用,进行判断即可得到C 为真;可将原式化为,表示动点到定点和到动直线距离相等的点的轨迹,但是定点在定直线上,故可判断D. 【详解】设一般职员应抽出人,根据分层抽样的概念易得,解得,即一般职员应抽出18人,故A 为真; 用独立性检验(列联表法)来考察两个分类变量是否有关系时,算出的随机变量的值越大,说明“与有关系”成立的可能性越大,可知B 为真;若,则,即不成立,若,则,即成立,故是的必要条件,即C 为真;方程即:,化简得,即表示动点到定点的距离和到直线的距离相等的点的集合,且在直线上,故其不满足抛物线的定义,即D 为假,故选D.【点睛】本题主要考查了分层抽样的概念,独立性检验在实际中的应用,充分条件、必要条件的判定,抛物线的定义等,属于中档题.4.D解析:D 【解析】分析:由列联表中的数据,利用公式()()()()()22n ad bc K a b c d a c b d -=++++求得2K ,与邻界值比较,即可得到结论. 详解:()222509070603021.6310.828120130150100K ⨯⨯-⨯=≈>⨯⨯⨯,∴有0099.9的把握认为性别和读营养说明书的有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)5.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.y x =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-= 故选D .6.A解析:A 【解析】()x 甲=14×(9+9+11+11)=10,x 乙=14×(8+9+10+x +12)=10,解得x =1.又2s 甲=1 4×[(9-10)2+(9-10)2+(11-10)2+(11-10)2]=1,2s乙=14×[(8-10)2+(9-10)2+(11-10)2+(12-10)2]=52,∴2s甲<2s乙,∴甲组学生的成绩比乙组稳定.故答案为A.7.C解析:C【解析】两个变量y与x的回归模型中,它们的相关指数R2越接近于1,这个模型的拟合效果越好.故选C.8.D解析:D【解析】因为K2的观测值k=2300(371433585) 12217872228⨯-⨯⨯⨯⨯≈4.514>3.841,所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.D解析:D【解析】10.828,10.0010.99999.90k≥∴-==,则有099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bcKa b a d a c b d-=++++计算2K的值;(3) 查表比较2K与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)10.C解析:C【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.11.D解析:D【解析】①相关系数r 用来衡量两个变量之间线性关系的强弱,r 越接近于1,则相关性越强,所以错误;②回归直线y bx a =+一定经过样本点的中心(),x y ,正确; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度,正确;④相关指数2R 用来刻画回归的效果,2R 越小,说明模型的拟合效果越不好,所以错误. 所以正确的有②③.故选D .12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章统计案例过关检测(时间:45分钟,满分:100分)一、选择题(每小题6分,共48分)1.(2013广西南宁模拟)如下图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是().答案:A解析:题图A中的点不成线性排列,故两个变量不适合线性回归模型,故选A.2.(2014重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是().A.=0.4x+2.3B.=2x-2.4C.=-2x+9.5D.=-0.3x+4.4答案:A解析:由变量x与y正相关,可知x的系数为正,排除C,D.而所有的回归直线必经过点(),由此排除B,故选A.3.某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562.若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为().A.83%B.72%C.67%D.66%答案:A解析:由已知=7.675,代入方程=0.66x+1.562,得x≈9.2621,所以百分比为≈83%.故选A.4.若两个变量的残差平方和是325,(y i-)2=923,则随机误差对预报变量的贡献率约为().A.64.8%B.60%C.35.2%D.40%答案:C解析:由题意可知随机误差对预报变量的贡献率约为≈0.352.5.下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②用相关指数可以刻画回归的效果,值越小说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型拟合效果越好.其中说法正确的是().A.①②B.②③C.①③D.①②③答案:C解析:相关指数R2越大,说明模型拟合效果越好,故②错误.6.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是().①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A.①B.①③C.③D.②答案:C解析:若K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,不表示有99%的可能患有肺病,也不表示在100个吸烟的人中必有99人患有肺病,故①不正确.也不表示某人吸烟,那么他有99%的可能患有肺病,故②不正确,若从统计量中求出有95%是吸烟与患肺病的比例,表示有5%的可能性使得推断出现错误,故③正确.7.下表是性别与喜欢足球与否的统计列联表,依据表中的数据,得到().喜欢足球不喜欢足球总计男40 28 68 女 5 12 17 总计45 40 85A.K2=9.564B.K2=3.564C.K2<2.706D.K2>3.841答案:D解析:由K2=,得K2的观测值k=≈4.722>3.841.8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大22 10 32课外阅读量一般8 20 28总计30 30 60由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是().A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关答案:D解析:根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.二、填空题(每小题6分,共18分)9.对具有线性相关关系的变量x和y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为.答案:=-10+6.5x解析:设回归直线方程为=kx+,由题知,k=6.5,且直线恒过点(2,3),将(2,3)代入直线方程,得=-10,所以回归方程为=-10+6.5x.10.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1,2,…,n),若e i恒为0,则R2为.答案:1解析:e i恒为0,说明随机误差总为0,于是y i=,故R2=1.11.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39 157 196血管清障手术29 167 196合计68 324 392试根据上述数据计算K2=,能否得出这两种手术对病人又发作心脏病的影响有差别的结论?(填“能”或“不能”).答案:1.78不能解析:提出假设H0:两种手术对病人又发作心脏病的影响没有差别.根据列联表中的数据,可以求得K2的观测值k=≈1.78.当H0成立时,K2≈1.78,而K2<2.072的概率为0.85.所以,不能否定假设H0.也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.三、解答题(共34分)12.(10分)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)频数30 40 20 10表2:注射药物B后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)[80,85)频数10 25 20 30 15完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:疱疹面积小于70 mm2疱疹面积不小于70mm2总计注射药物Aa=b=注射药物Bc=d=总计n=解:疱疹面积小于70 mm2疱疹面积不小于70mm2总计注射药物Aa=70 b=30 100 注射药物Bc=35 d=65 100总计105 95 n=20 0由列联表中的数据,得K2的观测值为k=≈24.561>10.828.因此,有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.13.(12分)(2014课标全国Ⅱ高考)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份200720082009201201120122013年份代号t 1 2 3 4 5 6 7人均纯收入y2.93.3 3.64.4 4.85.2 5.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:.解:(1)由所给数据计算得(1+2+3+4+5+6+7)=4,(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,(t i-)2=9+4+1+0+1+4+9=28,(t i-)(y i-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,=0.5,=4.3-0.5×4=2.3,所求回归方程为=0.5t+2.3.(2)由(1)知,=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.14.(12分)某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A,B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下.记成绩不低于90分者为“成绩优秀”.(1)在乙班样本中的20个个体中,从不低于86分的成绩中随机抽取2个,求抽出的两个均“成绩优秀”的概率;(2)由以上统计数据填写下面列联表,并判断是否有90%的把握认为:“成绩优秀”与教学方式有关.甲班(A方式) 乙班(B方式)总计成绩优秀成绩不优秀总计(附:K2=,其中n=a+b+c+d.)P(K2≥k) 0.25 0.15 0.10 0.050.0250.010.0050.001k 1.3232.0722.7063.8415.0246.6357.87910.828解:(1)设“抽出的两个均…成绩优秀‟”为事件A.从不低于86分的成绩中随机抽取2个的基本事件个数为=15,而事件A包含的基本事件个数为=10,所以所求概率为P(A)=.(2)由已知数据得甲班(A方式) 乙班(B方式)总计成绩优秀 1 5 6成绩不优秀19 15 34总计20 20 40根据列联表中数据,得K2=≈3.137.由于3.137>2.706,所以有90%的把握认为“成绩优秀”与教学方式有关.。