数学:第三章《统计案例》测试(1)(新人教A版选修2-3)

合集下载

(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)

(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)

一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。

人教a版数学【选修2-3】第3章《统计案例》归纳总结ppt课件

人教a版数学【选修2-3】第3章《统计案例》归纳总结ppt课件

B.75% D.97.5%
第三章 章末归纳总结
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
[答案] D [解析] 有关系”. 查表可得K2>5.024.因此有97.5%的把握认为“x和y
第三章
章末归纳总结
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
算可得 k≈0.04145,而 0.04145<2.706,所以没有充分的证据表 明该药品对防治 A 疾病有效.
第三章
章末归纳总结
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
[点评]
利用独立性检验可以帮助我们定量地分析两个分
第三章
章末归纳总结
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
[解析] 将问题中的数据写成 2×2 列联表如下表: 患病 使用 不使用 总计 5 18 23 不患病 100 400 500 总计 105 418 523
2 n ad - bc 将上述数据代入公式 K2= 中,计 a+bc+da+cb+d
3.(2014· 唐山模拟)对具有线性相关关系的变量 x、y 有一 1 ^ 组观测数据(xi,yi)(i=1,2,„,8),其回归直线方程是:y=3x +a, 且 x1+x2+x3+„+x8=2(y1+y2+y3+„+y8)=6, 则实数 a 的值是( 1 A.16 1 C.4 [答案] B ) 1 B.8 1 D.2
成才之路 · 数学
人教A版 · 选修2-3
路漫漫其修远兮 吾将上下而求索
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3

人教A版高中数学选修2-3全册同步练习及单元检测含答案

人教A版高中数学选修2-3全册同步练习及单元检测含答案

⼈教A版⾼中数学选修2-3全册同步练习及单元检测含答案⼈教版⾼中数学选修2~3 全册章节同步检测试题⽬录第1章《计数原理》同步练习 1.1测试1第1章《计数原理》同步练习 1.1测试2第1章《计数原理》同步练习 1.1测试3第1章《计数原理》同步练习 1.2排列与组合第1章《计数原理》同步练习 1.3⼆项式定理第1章《计数原理》测试(1)第1章《计数原理》测试(2)第2章同步练习 2.1离散型随机变量及其分布列第2章同步练习 2.2⼆项分布及其应⽤第2章测试(1)第2章测试(2)第2章测试(3)第3章练习 3.1回归分析的基本思想及其初步应⽤第3章练习 3.2独⽴性检验的基本思想及其初步应⽤第3章《统计案例》测试(1)第3章《统计案例》测试(2)第3章《统计案例》测试(3)1. 1分类加法计数原理与分步乘法计数原理测试题⼀、选择题1.⼀件⼯作可以⽤2种⽅法完成,有3⼈会⽤第1种⽅法完成,另外5⼈会⽤第2种⽅法完成,从中选出1⼈来完成这件⼯作,不同选法的种数是()A.8 B.15C.16 D.30答案:A2.从甲地去⼄地有3班⽕车,从⼄地去丙地有2班轮船,则从甲地去丙地可选择的旅⾏⽅式有()A.5种B.6种C.7种D.8种答案:B3.如图所⽰为⼀电路图,从A 到B 共有()条不同的线路可通电()A.1 B.2 C.3 D.4答案:D4.由数字0,1,2,3,4可组成⽆重复数字的两位数的个数是()A.25 B.20 C.16 D.12答案:C5.李芳有4件不同颜⾊的衬⾐,3件不同花样的裙⼦,另有两套不同样式的连⾐裙.“五⼀”节需选择⼀套服装参加歌舞演出,则李芳有()种不同的选择⽅式()A.24 B.14 C.10 D.9答案:B 6.设A ,B 是两个⾮空集合,定义{}()A B a b a A b B *=∈∈,,|,若{}{}0121234P Q ==,,,,,,,则P *Q 中元素的个数是()A.4 B.7 C.12 D.16答案:C⼆、填空题7.商店⾥有15种上⾐,18种裤⼦,某⼈要买⼀件上⾐或⼀条裤⼦,共有种不同的选法;要买上⾐,裤⼦各⼀件,共有种不同的选法.答案:33,2708.⼗字路⼝来往的车辆,如果不允许回头,共有种⾏车路线.答案:129.已知{}{}0341278a b ∈∈,,,,,,,则⽅程22()()25x a y b -+-=表⽰不同的圆的个数是.答案:1210.多项式123124534()()()()a a a b b a a b b ++++++··展开后共有项.答案:1011.如图,从A →C ,有种不同⾛法.答案:612.将三封信投⼊4个邮箱,不同的投法有种.答案:34三、解答题 13.⼀个⼝袋内装有5个⼩球,另⼀个⼝袋内装有4个⼩球,所有这些⼩球的颜⾊互不相同.(1)从两个⼝袋内任取⼀个⼩球,有多少种不同的取法?(2)从两个⼝袋内各取⼀个⼩球,有多少种不同的取法?解:(1)549N =+=种;(2)5420N =?=种.14.某校学⽣会由⾼⼀年级5⼈,⾼⼆年级6⼈,⾼三年级4⼈组成.(1)选其中1⼈为学⽣会主席,有多少种不同的选法?(2)若每年级选1⼈为校学⽣会常委,有多少种不同的选法?(3)若要选出不同年级的两⼈参加市⾥组织的活动,有多少种不同的选法?解:(1)56415N =++=种;(2)564120N =??=种;(3)56644574N =?+?+?=种15.已知集合{}321012()M P a b =---,,,,,,,是平⾯上的点,a b M ∈,.(1)()P a b ,可表⽰平⾯上多少个不同的点?(2)()P a b ,可表⽰多少个坐标轴上的点?解:(1)完成这件事分为两个步骤:a 的取法有6种,b 的取法也有6种,∴P 点个数为N =6×6=36(个);(2)根据分类加法计数原理,分为三类:①x 轴上(不含原点)有5个点;②y 轴上(不含原点)有5个点;③既在x 轴,⼜在y 轴上的点,即原点也适合,∴共有N =5+5+1=11(个).1. 1分类加法计数原理与分步乘法计数原理测试题⼀、选择题 1.从集合{ 0,1,2,3,4,5,6}中任取两个互不相等的数a ,b 组成复数a bi +,其中虚数有() A .30个 B .42个 C .36个 D .35个答案:C2.把10个苹果分成三堆,要求每堆⾄少1个,⾄多5个,则不同的分法共有() A .4种 B .5种 C .6种 D .7种答案:A3.如图,⽤4种不同的颜⾊涂⼊图中的矩形A ,B ,C ,D 中,要求相邻的矩形涂⾊不同,则不同的涂法有() A .72种 B .48种 C .24种 D .12种答案:A4.教学⼤楼共有五层,每层均有两个楼梯,由⼀层到五层的⾛法有() A .10种 B .52种C.25种D.42种答案:D5.已知集合{}{}023A B x x ab a b A ===∈,,,,,|,则B 的⼦集的个数是()A.4 B.8 C.16 D.15答案:C6.三边长均为正整数,且最⼤边长为11的三⾓形的个数为()A.25 B.26 C.36 D.37答案:C⼆、填空题7.平⾯内有7个点,其中有5个点在⼀条直线上,此外⽆三点共线,经过这7个点可连成不同直线的条数是.答案:128.圆周上有2n 个等分点(1n >),以其中三个点为顶点的直⾓三⾓形的个数为.答案:2(1)n n -9.电⼦计算机的输⼊纸带每排有8个穿孔位置,每个穿孔位置可穿孔或不穿孔,则每排可产⽣种不同的信息.答案:25610.椭圆221x y m n+=的焦点在y 轴上,且{}{}123451234567m n ∈∈,,,,,,,,,,,,则这样的椭圆的个数为.答案:20 11.已知集合{}123A ,,ü,且A 中⾄少有⼀个奇数,则满⾜条件的集合A 分别是.答案:{}{}{}{}{}13122313,,,,,,,12.整数630的正约数(包括1和630)共有个.答案:24三、解答题 13.⽤0,1,2,3,4,5六个数字组成⽆重复数字的四位数,⽐3410⼤的四位数有多少个?解:本题可以从⾼位到低位进⾏分类.(1)千位数字⽐3⼤.(2)千位数字为3:①百位数字⽐4⼤;②百位数字为4: 1°⼗位数字⽐1⼤;2°⼗位数字为1→个位数字⽐0⼤.所以⽐3410⼤的四位数共有2×5×4×3+4×3+2×3+2=140(个).14.有红、黄、蓝三种颜⾊旗⼦各(3)n n >⾯,任取其中三⾯,升上旗杆组成纵列信号,可以有多少种不同的信号?若所升旗⼦中不允许有三⾯相同颜⾊的旗⼦,可以有多少种不同的信号?若所升旗⼦颜⾊各不相同,有多少种不同的信号?解: 1N =3×3×3=27种; 227324N =-=种; 33216N =??= 种.15.某出版社的7名⼯⼈中,有3⼈只会排版,2⼈只会印刷,还有2⼈既会排版⼜会印刷,现从7⼈中安排2⼈排版,2⼈印刷,有⼏种不同的安排⽅法.解:⾸先分类的标准要正确,可以选择“只会排版”、“只会印刷”、“既会排版⼜会印刷”中的⼀个作为分类的标准.下⾯选择“既会排版⼜会印刷”作为分类的标准,按照被选出的⼈数,可将问题分为三类:第⼀类:2⼈全不被选出,即从只会排版的3⼈中选2⼈,有3种选法;只会印刷的2⼈全被选出,有1种选法,由分步计数原理知共有3×1=3种选法.第⼆类:2⼈中被选出⼀⼈,有2种选法.若此⼈去排版,则再从会排版的3⼈中选1⼈,有3种选法,只会印刷的2⼈全被选出,有1种选法,由分步计数原理知共有2×3×1=6种选法;若此⼈去印刷,则再从会印刷的2⼈中选1⼈,有2种选法,从会排版的3⼈中选2⼈,有3种选法,由分步计数原理知共有2×3×2=12种选法;再由分类计数原理知共有6+12=18种选法.第三类:2⼈全被选出,同理共有16种选法.所以共有3+18+16=37种选法.1. 1 分类加法计数原理与分步乘法计数原理综合卷⼀.选择题:1.⼀个三层书架,分别放置语⽂书12本,数学书14本,英语书11本,从中取出⼀本,则不同的取法共有()(A ) 37种(B ) 1848种(C ) 3种(D ) 6种2.⼀个三层书架,分别放置语⽂书12本,数学书14本,英语书11本,从中取出语⽂、数学、英语各⼀本,则不同的取法共有()(A ) 37种(B ) 1848种(C ) 3种(D ) 6种3.某商业⼤厦有东南西3个⼤门,楼内东西两侧各有2个楼梯,从楼外到⼆楼的不同⾛法种数是()(A ) 5 (B )7 (C )10 (D )124.⽤1、2、3、4四个数字可以排成不含重复数字的四位数有()(A )265个(B )232个(C )128个(D )24个5.⽤1、2、3、4四个数字可排成必须含有重复数字的四位数有()(A )265个(B )232个(C )128个(D )24个6.3科⽼师都布置了作业,在同⼀时刻4名学⽣都做作业的可能情况有()(A )43种(B )34种(C )4×3×2种(D ) 1×2×3种7.把4张同样的参观券分给5个代表,每⼈最多分⼀张,参观券全部分完,则不同的分法共有()(A )120种(B )1024种(C )625种(D )5种8.已知集合M={l ,-2,3},N={-4,5,6,7},从两个集合中各取⼀个元素作为点的坐标,则这样的坐标在直⾓坐标系中可表⽰第⼀、⼆象限内不同的点的个数是()(A )18 (B )17 (C )16 (D )109.三边长均为整数,且最⼤边为11的三⾓形的个数为()(A )25 (B )36 (C )26 (D )3710.如图,某城市中,M 、N 两地有整齐的道路⽹,若规定只能向东或向北两个⽅向沿途中路线前进,则从M 到N 不同的⾛法共有()(A )25 (B )15 (C)13 (D )10 ⼆.填空题:11.某书店有不同年级的语⽂、数学、英语练习册各10本,买其中⼀种有种⽅法;买其中两种有种⽅法.12.⼤⼩不等的两个正⽅形玩具,分别在各⾯上标有数字1,2,3,4,5,6,则向上的⾯标着的两个数字之积不少于20的情形有种.13.从1,2,3,4,7,9中任取不相同的两个数,分别作为对数的底数和真数,可得到个不同的对数值.14.在连结正⼋边形的三个顶点组成的三⾓形中,与正⼋边形有公共边的有个.15.某班宣传⼩组要出⼀期向英雄学习的专刊,现有红、黄、⽩、绿、蓝五种颜⾊的粉笔供选⽤,要求在⿊板中A 、B 、C 、D 每⼀部分只写⼀种颜⾊,如图所⽰,相邻两块颜⾊不同,则不同颜⾊的书写⽅法共有种.三.解答题:16.现由某校⾼⼀年级四个班学⽣34⼈,其中⼀、⼆、三、四班分别为7⼈、8⼈、9⼈、10⼈,他们⾃愿组成数学课外⼩组.(1)选其中⼀⼈为负责⼈,有多少种不同的选法?(2)每班选⼀名组长,有多少种不同的选法?(3)推选⼆⼈做中⼼发⾔,这⼆⼈需来⾃不同的班级,有多少种不同的选法?17.4名同学分别报名参加⾜球队,蓝球队、乒乓球队,每⼈限报其中⼀个运动队,不同的报名⽅法有⼏种?[探究与提⾼]1.甲、⼄两个正整数的最⼤公约数为60,求甲、⼄两数的公约数共有多个?2.从{-3,-2,-1,0,l,2,3}中,任取3个不同的数作为抛物线⽅程y=ax2+bx+c(a≠0)的系数,如果抛物线过原点,且顶点在第⼀象限,这样的抛物线共有多少条?3.电视台在“欢乐今宵”节⽬中拿出两个信箱,其中存放着先后两次竞猜中成绩优秀的群众来信,甲信箱中有30封,⼄信箱中有20封.现由主持⼈抽奖确定幸运观众,若先确定⼀名幸运之星,再从两信箱中各确定⼀名幸运伙伴,有多少种不同的结果?综合卷1.A 2.B 3.D 4.D 5.B 6.B 7.D 8.B 9.B 10.B11.30;300 12.513.17 14.40 15.1801. 2排列与组合1、排列综合卷1.90×9l ×92×……×100=()(A )10100A (B )11100A (C )12100A (D )11101A 2.下列各式中与排列数mn A 相等的是()(A )!(1)!-+n n m (B )n(n -1)(n -2)……(n -m) (C )11m n nA n m --+ (D )111m n n A A --3.若 n ∈N 且 n<20,则(27-n )(28-n)……(34-n)等于()(A )827n A - (B )2734nn A -- (C )734n A - (D )834n A -4.若S=123100123100A A A A ++++,则S 的个位数字是()(A )0 (B )3 (C )5 (D )85.⽤1,2,3,4,5这五个数字组成没有重复数字的三位数,其中偶数共有()(A )24个(B )30个(C )40个(D )60个6.从0,l ,3,5,7,9中任取两个数做除法,可得到不同的商共有()(A )20个(B )19个(C )25个(D )30个7.甲、⼄、丙、丁四种不同的种⼦,在三块不同⼟地上试种,其中种⼦甲必须试种,那么不同的试种⽅法共有()(A )12种(B )18种(C )24种(D )96种8.某天上午要排语⽂、数学、体育、计算机四节课,其中体育不排在第⼀节,那么这天上午课程表的不同排法共有()(A )6种(B )9种(C )18种(D )24种9.有四位司机、四个售票员组成四个⼩组,每组有⼀位司机和⼀位售票员,则不同的分组⽅案共有()(A )88A 种(B )48A 种(C )44A ·44A 种(D )44A 种10.有4位学⽣和3位⽼师站在⼀排拍照,任何两位⽼师不站在⼀起的不同排法共有()(A )(4!)2种(B )4!·3!种(C )34A ·4!种(D )3 5A ·4!种11.把5件不同的商品在货架上排成⼀排,其中a ,b 两种必须排在⼀起,⽽c ,d 两种不能排在⼀起,则不同排法共有()(A )12种(B )20种(C )24种(D )48种⼆.填空题::12.6个⼈站⼀排,甲不在排头,共有种不同排法.13.6个⼈站⼀排,甲不在排头,⼄不在排尾,共有种不同排法.14.五男⼆⼥排成⼀排,若男⽣甲必须排在排头或排尾,⼆⼥必须排在⼀起,不同的排法共有种.15.将红、黄、蓝、⽩、⿊5种颜⾊的⼩球,分别放⼊红、黄、蓝、⽩、⿊5种颜⾊的⼝袋中,但红⼝袋不能装⼊红球,则有种不同的放法.16.(1)有5本不同的书,从中选3本送给3名同学,每⼈各⼀本,共有种不同的送法;(2)有5种不同的书,要买3本送给3名同学,每⼈各⼀本,共有种不同的送法.三、解答题:17.⼀场晚会有5个唱歌节⽬和3个舞蹈节⽬,要求排出⼀个节⽬单(1)前4个节⽬中要有舞蹈,有多少种排法?(2)3个舞蹈节⽬要排在⼀起,有多少种排法?(3)3个舞蹈节⽬彼此要隔开,有多少种排法?18.三个⼥⽣和五个男⽣排成⼀排.(1)如果⼥⽣必须全排在⼀起,有多少种不同的排法?(2)如果⼥⽣必须全分开,有多少种不同的排法?(3)如果两端都不能排⼥⽣,有多少种不同的排法?(4)如果两端不能都排⼥⽣,有多少种不同的排法?(5)如果三个⼥⽣站在前排,五个男⽣站在后排,有多少种不同的排法?综合卷1.B 2.D 3.D 4.C 5.A 6.B 7.B 8.C 9.D 10.D 11.C12.600 13.504 14.480 15.9616.(1) 60;(2) 12517.(1) 37440;(2) 4320;(3) 1440018.(1) 4320;(2) 14400;(3) 14400;(4) 36000;(5) 7202、组合综合卷⼀、选择题:1.下列等式不正确的是()(A )!!()!mn n C m n m =- (B )11mm n n m C C n m++=- (C )1111m m n n m C C n +++=+ (D )11m m n n C C ++= 2.下列等式不正确的是()(A )m n m n n C C -= (B )11m m mm m m C C C -++=(C )123455555552C C C C C ++++= (D )11 111m m m m n n n n C C C C --+--=++3.⽅程2551616x x x C C --=的解共有()(A )1个(B )2个(C )3个(D )4个4.若372345n n n C A ---=,则n 的值是()(A )11 (B )12 (C )13 (D )145.已知7781n n n C C C +-=,那么n 的值是()(A )12 (B )13 (C )14 (D )15 6.从5名男⽣中挑选3⼈,4名⼥⽣中挑选2⼈,组成⼀个⼩组,不同的挑选⽅法共有()(A )3254C C 种(B ) 3254C C 55A 种(C ) 3254A A 种(D ) 3254A A 55A 种7.从4个男⽣,3个⼥⽣中挑选4⼈参加智⼒竞赛,要求⾄少有⼀个⼥⽣参加的选法共有()(A )12种(B )34种(C )35种(D )340种8.平⾯上有7个点,除某三点在⼀直线上外,再⽆其它三点共线,若过其中两点作⼀直线,则可作成不同的直线()(A )18条(B )19条(C )20条(D )21条9.在9件产品中,有⼀级品4件,⼆级品3件,三级品2件,现抽取4个检查,⾄少有两件⼀级品的抽法共有()(A )60种(B )81种(C )100种(D )126种10.某电⼦元件电路有⼀个由三节电阻串联组成的回路,共有6个焊点,若其中某⼀焊点脱落,电路就不通.现今回路不通,焊点脱落情况的可能有()(A )5种(B )6种(C )63种(D )64种⼆.填空题:11.若11m m n n C xC --=,则x= .12.三名教师教六个班的课,每⼈教两个班,分配⽅案共有种。

高中数学 第三章 统计案例综合训练学案 新人教A版选修2-3-新人教A版高二选修2-3数学学案

高中数学 第三章 统计案例综合训练学案 新人教A版选修2-3-新人教A版高二选修2-3数学学案

第三章统计案例(综合训练1)一、学习要求1.通过典型案例的探究,了解统计学中对两个变量统计分析的思想方法和步骤;2.能综合运用概率、统计的知识解决有关问题。

二、问题探究■合作探究例1.【10新课标(文19)】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要40 30不需要160 270(1)估计该地区老年人中,需要志愿者提供帮助的老年人比例;(2)能否有的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:0.050 0.010 0.0013.841 6.635 10.828。

【解析】(1)样本中,该地区的老年人需要志愿者提供帮助的有:403070+=(人),∴估计该地区老年人中,需要志愿者提供帮助的老年人比例为:707 50050=。

(2)根据表中数据,得到:,∵,∴有的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关。

(3)根据(2)的结论可知,地区的老年人是否需要志愿者提供帮助与性别有关,所以可按性别进行分层抽样调查,从而能更好地估计该地区的老年人中需要志愿者提供帮助的老年人的比例。

■自主探究1.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查,得到了如下的列联表:喜爱打篮球不喜爱打篮球合计男生 5女生10合计50已知在全部50人中随机抽取1人,抽到喜爱打篮球的学生的概率为。

(Ⅰ)补充完整上面的列联表,并判断是否有的把握认为喜爱打篮球与性别有关?(Ⅱ)若采用分层抽样的方法从喜爱打篮球的学生中随机抽取3人,则男生和女生抽取的人数分别是多少?解:(Ⅰ)这50人中喜爱打篮球的人数为:(人)。

列联表补充如下:喜爱打篮球不喜爱打篮球合计男生20 5 25女生10 15 25合计30 20 50,∵,∴有的把握认为喜爱打篮球与性别有关。

数学教案 人教a版选修2_3 同步练习-第3章统计案例跟踪训练含解析

数学教案 人教a版选修2_3 同步练习-第3章统计案例跟踪训练含解析

回归分析的基本思想及其初步应用[A 组 学业达标]1.下列两个变量之间的关系不是函数关系的是( ) A .角度和它的余弦值 B .正方形的边长和面积 C .正n 边形的边数和内角度数和 D .人的年龄和身高解析:函数关系就是一种变量之间的确定性的关系.A ,B ,C 三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f(θ)=cos θ,g(a)=a 2,h(n)=nπ-2π.D 选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高.故选D.答案:D2.设一个线性回归方程为y ^=2-1.5x ,则变量x 增加一个单位时( ) A.y ^平均增加1.5个单位 B.y ^平均增加2个单位 C.y ^平均减少1.5个单位 D.y ^平均减少2个单位解析:由线性回归方程y ^=2-1.5x 中x 的系数为-1.5,知C 项正确. 答案:C 3.有下列数据:x 1 2 3 y35.9912.01A .y =3×2x -1B .y =log 2xC .y =3xD .y =x 2解析:当x =1,2,3时,分别代入求y 值,离y 最近的值模拟效果最好,可知A 模拟效果最好. 答案:A4.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=-2.756x +7.325.②y 与x 负相关且y ^=3.476x +5.648 ③y 与x 正相关且y ^=-1.226x -6.578 ④y 与x 正相关且y ^=8.967x +8.163 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④解析:根据题意,依次分析4个结论:对于①,y 与x 负相关且y ^=-2.756x +7.325,此结论正确,线性回归方程符合负相关的特征; 对于②,y 与x 负相关且y ^=3.476x +5.648,此结论错误,由线性回归方程知,此两变量的关系是正相关;对于③,y 与x 正相关且y ^=-1.226x -6.578,此结论错误,由线性回归方程知,此两变量的关系是负相关;对于④,y 与x 正相关且y ^=8.967x +8.163,此结论正确,线性回归方程符合正相关的特征;故②③一定错误.答案:B5.对具有线性相关关系的变量x ,y ,测得一组数据如下表:x 2 4 5 6 8 y2040607080根据上表,利用最小二乘法得它们的回归直线方程为y ^=10.5x +a ^,据此模型来预测当x =20时,y 的估计值为________.解析:由已知得x -=5,y -=54,则(5,54)满足回归直线方程y ^=10.5x +a ^,解得a ^=1.5,因此y ^=10.5x +1.5,当x =20时y ^=10.5×20+1.5=211.5.答案:211.56.如图是x 和y 的一组样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.解析:去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.答案:D(3,10)7.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围,令z =ln y ,求得回归直线方程为z ^=0.25x -2.58,则该模型的回归方程为____________________.解析:由z =ln y ,z ^=0.25x -2.58, 得ln y ^=0.25x -2.58,∴y ^=e 0.25x -2.58. 故该模型的回归方程为y ^=e 0.25x -2.58. 答案:y ^=e 0.25x -2.588.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,求社区一户年收入为15万元的家庭的年支出.解析:由题意可得x -=15×(8.2+8.6+10.0+11.3+11.9)=10,y -=15×(6.2+7.5+8.0+8.5+9.8)=8,可得a ^=8-0.76×10=0.4. ∴回归直线方程为y ^=0.76x +0.4.把x =15代入可得y ^=0.76×15+0.4=11.8.故社区一户年收入为15万元的家庭的年支出为11.8万元.9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求线性回归方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解析:(1)x -=8+8.2+8.4+8.6+8.8+96=8.5,y -=16(90+84+83+80+75+68)=80,∵b ^=-20,a ^=y --b ^ x -, ∴a ^=80+20×8.5=250, ∴线性回归方程y ^=-20x +250;(2)设工厂获得的利润为L 元,则L =x(-20x +250)-4(-20x +250)=-20⎝⎛⎭⎪⎫x -3342+361.25,∴该产品的单价应定为8.25元,工厂获得的利润最大.[B 组 能力提升]10.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是a 1,a 2,R 2的值分别为b 1,b 2,下列说法正确的是( )A .若a 1<a 2,则b 1<b 2,A 的拟合效果更好B .若a 1<a 2,则b 1<b 2,B 的拟合效果更好C .若a 1<a 2,则b 1>b 2,A 的拟合效果更好D .若a 1<a 2,则b 1>b 2,B 的拟合效果更好解析:由残差平方和以及R 2的定义式可得若a 1<a 2,则b 1>b 2,A 的拟合效果更好. 答案:C11.近10年来,某市社会商品零售总额与职工工资总额(单位:亿元)数据如下:A.y ^=2.799 1x -27.248 552 B.y ^=2.799 1x -23.548 452 C.y ^=2.699 2x -23.749 352 D.y ^=2.899 2x -23.749 452解析:x -=41.72,y -=93.23,代入验证可知B 选项正确. 答案:B12.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.解析:将x =160代入y ^=0.85x -82.71,得y ^=0.85×160-82.71=53.29, 所以残差e ^=y -y ^=53-53.29=-0.29.答案:-0.2913.已知一个线性回归方程为y ^=1.5x +45,x ∈{1,5,7,13,19},则y -=________. 解析:∵x -=1+5+7+13+195=9,且y ^=1.5x +45, ∴y -=1.5×9+45=58.5. 答案:58.514.假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如表统计资料:x 2 3 4 5 6 y2.23.85.56.57.0已知∑i =15x 2i=90,∑i =15x i y i =112.3.b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2,a =y --b ^ x -. (1)求x -,y -.(2)x 与y 具有线性相关关系,求出线性回归方程. (3)估计使用年限为10年时,维修费用约是多少? 解析:(1)x -=4,y -=5.(2)b ^=∑i =15x i y i -5x - y-∑i =15x 2i -5x -2=1.23,a ^=y --b ^ x -=5-1.23×4=0.08.所以线性回归方程为y ^=1.23x +0.08.(3)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用年限为10年时,维修费用约为12.38万元.15.菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的统计表:x1 2 3 4 5y 58 54 39 29 10(1)令w =x 2,利用给出的参考数据求出y 关于w 的回归方程y ^=b ^w +a ^.(a ^,b ^精确到0.1)参考数据:∑i =15w i =55,∑i =15(w i -w -)(y i -y -)=-751,∑i =15(w i -w -)2=374,其中w i =x 2i ,w -=15∑i =15w i .(2)对于某种残留在蔬菜上的农药,当它的残留量不高于20微克时对人体无害,为了放心食用该蔬菜,请估计至少需要用多少千克的清水清洗1千克蔬菜?(精确到0.1,参考数据5≈2.24)附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为β^=∑i =1nu i -u-v i -v-∑i =1nu i -u-2,α^=v --β^ u -.解析:(1)由题意得,w -=11,y -=38.b ^=∑i =15w i -w-y i -y-∑i =15w i -w-2=-751374≈-2.0,a ^=y --b ^w =60.0,所以y ^=-2.0w +60.0. (2)由(1)得,y ^=-2.0w +60.0, 所以y ^=-2.0x 2+60.0,当y ^≤20时,即-2.0x 2+60.0≤20,解得x≥25≈4.5,所以为了放心食用该蔬菜,估计需要用4.5千克的清水清洗1千克蔬菜.独立性检验的基本思想及其初步应用[A组学业达标]1.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是( )A.频率分布直方图B.回归分析C.独立性检验D.用样本估计总体解析:根据题意,结合题目中的数据,列出2×2列联表,求出K2观测值,对照数表可得出概率结论,这种分析数据的方法是独立性检验.答案:C2.观察下列各图,其中两个分类变量x,y之间关系最强的是( )解析:观察等高条形图发现x1x1+y1和x2x2+y2相差越大,就判断两个分类变量之间关系越强.答案:D3.如表是一个2×2列联表:则表中a,b的值分别为( )y1y2总计x1 a 21 73x222 25 47总计 b 46 120A.94,72C.52,74 D.74,52解析:a=73-21=52,b=a+22=74,故选C.答案:C4.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果K2的观测值k>5.024,那么在犯错误的概率不超过________的前提下认为“X与Y有关系”()P(K2≥k 0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.87910.828A.0.25 B .0.05 C .0.1D .0.025解析:因为K 2的观测值k >5.024,而在临界值表中对应于5.024的是0.025,所以可以在犯错误的概率不超过0.025的前提下认为“X 和Y 有关系”.答案:D5.分类变量X 和Y 的列表如下,则下列说法判断正确的是( )y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c +dA.ad -bc 越小,说明X 与Y 的关系越弱 B .ad -bc 越大,说明X 与Y 的关系越强 C .(ad -bc)2越大,说明X 与Y 的关系越强 D .(ad -bc)2越接近于0,说明X 与Y 的关系越强解析:列联表可以较为准确地判断两个变量之间的相关关系程度, 由K 2=a +b +c +dad -bc2a +b a +cb +dc +d,当(ad -bc)2越大,K 2越大,表明X 与Y 的关系越强.(ad -bc)2越接近0,说明两个分类变量X 和Y 无关的可能性越大. 即所给说法判断正确的是C. 答案:C6.某部门通过随机调查89名工作人员的休闲方式,了解读书和健身的人数,得到的数据如表:读书 健身 总计 女 24 31 55 男 8 26 34 总计325789在犯错误的概率不超过________的前提下认为性别与休闲方式有关系. 解析:由列联表中的数据,得K 2的观测值为k =89×24×26-31×8255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.答案:0.107.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天的结果如下表所示:死亡 存活 总计 第一种剂量 14 11 25 第二种剂量 6 19 25 总计203050进行统计分析的统计假设是________,K 2=________,说明两种电离辐射剂量对小白鼠的致死作用________.(填“相同”或“不相同”)参考公式:K 2=n ad -bc2a +bc +d a +cb +d解析:统计假设是“小白鼠的死亡与使用的电离辐射剂量无关”,由列联表中数据得K 2=5.33>3.841,所以在犯错误的概率不超过0.05的前提下认为小白鼠的死亡与使用的电离辐射剂量有关.所以两种电离辐射剂量对小白鼠的致死作用不相同.答案:小白鼠的死亡与使用的电离辐射剂量无关 5.33 不相同 8.下表是关于男婴与女婴出生时间调查的列联表:晚上 白天 总计 男婴 45 A B 女婴 E 35 C 总计98D180那么,A =________,B =E =________. 解析:由列联表知识得⎩⎪⎨⎪⎧ 45+E =98,98+D =180,A +35=D ,E +35=C ,B +C =180,解得⎩⎪⎨⎪⎧A =47,B =92,C =88,D =82,E =53.答案:47 92 88 82 539.网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?解析:根据题目所给的数据得到如下2×2列联表:经常上网 不经常上网总计 不及格80120200及格 120 680 800 总计2008001 000得出等高条形图如图所示:比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关.10.随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n 个人,其中男性占调查人数的25.已知男性中有一半的人的休闲方式是运动,而女性中只有13的人的休闲方式是运动.(1)完成下列2×2列联表:运动 非运动总计 男性 女性 总计n(2)数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动? 解析:(1)补全2×2列联表如下:运动 非运动 总计 男性 15n 15n 25n 女性 15n 25n 35n 总计25n 35n n(2)则P(K 2≥k 0)=3.841. 由于K 2的观测值k =n ⎝ ⎛⎭⎪⎫n 5·2n 5-n 5·n 522n 5·3n 5·2n 5·3n 5=n 36,故n36≥3.841,即n≥138.276. 又由15n ∈Z ,故n≥140.故若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的至少有140人.(3)根据(2)的结论,本次被调查的人中,至少有25×140=56(人)的休闲方式是运动.[B 组 能力提升]11.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,故在犯错误的概率不超过________的前提下认为糖尿病患者与遗传有关系.( )A .0.001B .0.005C .0.01D .0.025解析:可以先作出如下列联表(单位:人): 糖尿病患者与遗传列联表糖尿病发病糖尿病不发病总计 阳性家族史 16 93 109 阴性家族史17 240 257 总计33333366根据列联表中的数据,得到K 2的观测值为 k =366×16×240-17×932109×257×33×333≈6.067>5.024.故在犯错误的概率不超过0.025的前提下认为糖尿病患者与遗传有关系. 答案:D12.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是________(填序号). ①若K 2的观测值k =6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.解析:K 2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.答案:③13.根据下表计算:不看电视 看电视 男 37 85 女35143K 2的观测值k≈________(保留3位小数). 解析:k =300×37×143-85×352122×178×72×228≈4.514.答案:4.51414.某学校为了解该校高三年级学生在市一练考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在[120,150]内为优秀.(1)由以上频率分布直方图填写下列2×2列联表.若按是否优秀来判断,是否有99%的把握认为该校的文理科数学成绩有差异.文科 理科 总计 优秀 非优秀 总计5050100(2)某高校派出2140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试.若甲教授面试的学生人数为ξ,求ξ的分布列和均值.解析:(1)由频率分布直方图知,该校文科学生中数学成绩优秀的人数为(0.010+0.004+0.002)×10×50=8,故非优秀人数为50-8=42.该校理科学生中数学成绩优秀的人数为(0.020+0.014+0.006)×10×50=20,故非优秀人数为50-20=30.则2×2列联表如下:文科 理科 总计 优秀 8 20 28 非优秀 42 30 72 总计5050100∴K 2的观测值k =100×8×30-42×20250×50×28×72≈7.143>6.635,故有99%的把握认为该校文理科数学成绩有差异.(2)由(1)知,该校随机抽取的学生成绩中一练数学成绩在140分以上的学生为4人,ξ的可能取值为1,2,3.将4人分给两名教授每名教授至少1名学生的不同分法种数为⎝⎛⎭⎪⎫C 34+C 24C 22A 22A 22=14,则P(ξ=1)=C 1414=27,P(ξ=2)=C 2414=37,P(ξ=3)=C 3414=27.∴ξ的分布列为:ξ 1 2 3 P273727∴E(ξ)=1×27+2×37+3×27=2.15.某校为了了解学生对消防知识的了解情况,从高一年级和高二年级各选取100名同学进行消防知识竞赛.图(1)和图(2)分别是对高一年级和高二年级参加竞赛的学生成绩按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.(1)请计算高一年级和高二年级成绩小于60分的人数.(2)完成2×2列联表,并回答:在犯错误的概率不超过多少的前提下认为“学生所在的年级与消防常识的了解存在相关性”?成绩小于60分人数成绩不小于60分人数总计高一 高二 总计附:临界值表及参考公式: K 2=n ad -bc 2a +bc +d a +cb +d ,n =a +b +c +d. P(K 2≥k 0)0.15 0.100.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828解析:(1)高一年级成绩低于60分的人数为:(0.03+0.04)×10×100=70; 高二年级成绩低于60分的人数为: (0.035+0.015)×10×100=50. (2)2×2列联表如下:成绩小于60分人数成绩不小于60分人数总计 高一 70 30 100 高二 50 50 100 总计12080200由于K 2的观测值k =200×50×70-50×302100×100×120×80≈8.333>7.879,所以在犯错误的概率不超过0.005的前提下认为“学生所在的年级与消防知识的了解存在相关性”.。

高中数学 第三章 统计案例 3.1 第2课时 残差分析及回归模型的选择学案 新人教A版选修23

高中数学 第三章 统计案例 3.1 第2课时 残差分析及回归模型的选择学案 新人教A版选修23

3.1 第二课时 残差分析及回归模型的选择一、课前准备 1.课时目标(1) 了解残差分析回归效果; (2) 了解相关指数2R 分析回归效果;(3) 了解常见的非线性回归转化为线性回归的方法. 2.基础预探1.在线性回归模型y bx a e =++中,a b 和为模型的未知参数,e y 是与y bx a =+之间的误差,通常e为随机变量,称为_______.它的均值E(e)=0,方差2()0D e σ=>.线性回归模型的完整表达形式为2()0,()y bx a eE e D e σ=++⎧⎨==⎩.在此模型中,随机误差r的方差2σ越小,通过回归直线y bx a =+预报真实值y的精度越高. 2.对于样本点1122(,),(,),,(,)n n x y x y x y 而言,相应于它们的随机误差为(1,2,,)i i i i e y y y bx a i n =-=--=,其估计值为(1,2,,)i i i i i e y y y bx a i n =-=--=,i e 称为相应于点(,)i i x y 的______.类比样本方差估计总体方差的思想,可以用21(,)2Q a b n σ=-(n>2)作为2σ的估计量,其中a b 和由公式给出,()Q a b ,称为残差平方和.可以用2σ衡量回归直线方程的预报精度.通常2σ越小,预报精度越高.3.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差12,,n e e e 来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为_______.4.用相关指数2R 来刻画回归的效果,其计算公式是:22121()1()nii nii y y R y y ==-=--∑∑.显然2R 取值越大,意味着残差平方和_______,也就是说模型的拟合效果________. 二、学习引领1. 进行回归分析的步骤是什么?(1)确定研究对象,明确是哪两个变量之间的相关关系.(2)画出散点图,观察它们之间的关系是否存在线性关系,也可计算变量间的线性相关系数的值来精确判断它们之间是否存在相关关系.如果不存在线性相关关系,判断散点图是否存在非线性相关关系.(3)若存在相关关系,则由经验确定回归方程的类型:如观察到数据呈线性关系,则选用线性回归方程ˆy=bx+a ;否则可选择指数模型、对数模型或二次函数模型等. (4)利用残差图或者相关指数2R 对回归效果进行判断2.随机误差e的产生及估计的方法(1)在实际中,随机变量y除了受随机变量x的影响之外,还受其它变量的影响;(2)由于前面相关关系公式中的a b 和为截距和斜率的估计值,它们与真实值a b 和之间也存在误差.(3)因为随机误差是随机变量,因此可以通过这个随机变量的数字特征来刻画它的一些总体特征.均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机变量的均值为0,因此可以用方差2来衡量随机误差的大小. 3.如何利用2R 判断回归效果在线性回归模型中,2R 表示解释变量对于预报变量变化的贡献率. 2R 越接近于1,表示回归的效果越好(因为2R 越接近于1,表示解释变量和预报变量的相关性越强).如果对某组数据可能采取几种不同的回归方程进行回归分析.也可以通过比较几个2R ,选择其值大的模型.4.常见的可线性化的回归模型(1)幂函数曲线y=ax b(如图所示), 作变换u=lny ,v=lnx,c=lna,得线性函数u=c+bv.(2)指数函数y=ae bx(如图所示) 作变换u=lny, c= lna,得线性函数u=c+bx.(3)倒指数曲线y=a b xe (如图所示).(4)对数曲线y=a+blnx(如图所示)三、典例导析题型一相关系数的应用例1 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断交通事故数与机动车r,由此判断交通事故数y与机动车辆数x是否线性相关.解析:将数据列成下表由此可知x=128.875 y=8.95,进而求得0.9927≈.因为|r|接近1 ,所以可得交通事故数y和机动车辆数x有较强的线性相关关系.规律总结:进行回归分析时,通常先进行相关性检验,若能确定两个变量具有线性相关关系,再去求其线性回归方程,否则所求的方程无意义.两个变量正(负)相关时,它们就有相同(反)的变化趋势,即当由小变大时,相应的有由小(大)变大(小)的趋势.变式训练:某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系?从这个工完成下列要求:(1)计算x 与y 的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验。

(北师大版)南京市高中数学选修2-3第三章《统计案例》测试题(答案解析)

(北师大版)南京市高中数学选修2-3第三章《统计案例》测试题(答案解析)

一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.2019年10月18日-27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为12;②在犯错误的概率不超过1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”;则正确命题的个数为( )附:22()()()()()n ad bc K a b c d a c b d -=++++A .0B .1C .2D .33.下列关于回归分析与独立性检验的说法正确的是() A .回归分析和独立性检验没有什么区别;B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;C .独立性检验可以100%确定两个变量之间是否具有某种关系.D .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;4.已知x 与y 之间的几组数据如下表:x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a'D .b<b',a>a'5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k ,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响6.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示: 序号 12345678910 11 12 13 14 15 16 17 18 19 20数学成绩 95 75 80 94 92 65 67 84 987167 93 64 787790 57 83 72 83物理成绩90 63 72 87 917158 82 93 817782 48 85 69 91 61 84 78 86若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系( )A .95%B .97.5%C .99.5%D .99.9%7.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;8.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bc K a c b d a d b c -++++,其中n a b c d =+++.20()P K k ≥0.100.050.01 0.0050k 2.7063.8416.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们( )A .没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”9.通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表女 男 合计读营养说明 16 28 44 不读营养说明 20 8 28 总计363672请问性别和读营养说明之间在多大程度上有关系 ( ) A .99%的可能性 B .99.75%的可能性 C .99.5%的可能性 D .97.5%的可能性10.下列命题中:①线性回归方程y bx a =+必过点(),x y ;②在回归方程35y x =-中,当变量增加一个单位时,y 平均增加5个单位; ③在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好;④在回归直线0.58ˆyx =-中,变量2x =时,变量y 的值一定是-7. 其中假命题的个数是 ( ) A .1 B .2C .3D .411.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:由上表中数据计算得2K =()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )A .1%B .99%C .2.5%D .97.5%12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 14.若两个分类变量X 与Y 的列联表为:则“X 与Y 之间有关系”这个结论出错的可能性为________.15.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”. 参考附表:(参考公式:K 2=()()()()()2n ad bc a b c d a c b d -++++,其中n=a+b+c+d)16.如表是降耗技术改造后生产某产品过程中记录产量(吨)与相应的生产能耗(吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆˆ0.70.3yx =+,那么表中m 的值为__________.17.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 18.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c互不相同,则这个三位数为”有缘数”的概率是__________. 19.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上)20.在2017年3月15日,某市物价部门对本市的5家商场的某种商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示: 价格x 9 9.5 10 10.5 11 销售量y1110865由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,其线性回归方程是:3.2y x a =-+,则a =__________.三、解答题21.某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,该农场选取了20间大棚(每间一亩)进行试点,得到各间大棚产量数据绘制成散点图.光照时长为x (单位:小时),大棚蔬菜产量为y (单位:千斤每亩),记ln w x =.(1)根据散点图判断,y a bx =+与ln y c d x =+⋅,哪一个适宜作为大棚蔬菜产量y 关于光照时长x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(结果保留小数点后两位)(3)根据实际种植情况,发现上述回归方程在光照时长位于6~14小时内拟合程度良好,利用(2)中所求方程估计当光照时长为2e 小时(自然对数的底 2.71828e ≈),大棚蔬菜亩产约为多少. 参数数据:参考公式:β关于α的线性回归方程m n βα=⋅+中,1221i ii nii n m n αβαβαα==-⋅=-∑∑,n m βα=-⋅22.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状的这一阶段称为潜伏期.一研究团队统计了某地区200名患者的相关信息,得到如下表格:(1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,根据上表数据将如下列联表补充完整,并根据列联表判断是否有99%的把握认为该传染病的潜伏期与患者年龄有关.(2)将200名患者的潜伏期超过6天的频率视为该地区每名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该团队随机调查了该地区20名患者,其中潜伏期超过6天的人数为X ,求随机变量X 的期望和方差. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 23.新冠肺炎疫情防控时期,各级各类学校纷纷组织师生开展了“停课不停学”活动,为了解班级线上学习情况,某位班主任老师进行了有关调查研究.(1)从班级随机选出5名同学,对比研究了线上学习前后两次数学考试成绩,如下表:参考公式:在线性回归方程y bx a =+,()()()()1122211n niii ii i nniii i x x y y x y nx yb x x xn x====---==--∑∑∑∑,a y bx =-(2)针对全班45名同学(25名女生,20名男生)的线上学习满意度调查中,女姓满意率为80%,男生满意率为75%,填写下面列联表,判断能否在犯错误概率不超过0.01的前提下,认为线上学习满意度与学生性别有关?参考公式和数据:()()()()()2n ad bc x a b c d a c b d -=++++,()20.0500.0100.0013.8416.63510.828P x k k ≥24.为了了解某校高中生的身体质量情况,某调查机构进行了一次高一学生体重和身高的抽样调查,从中抽取了8名学生(编号为18)的身高(cm)x 和体重(kg)y 数据.如下表,某调查机构分析发现学生的身高和体重之间有较强的线性相关关系,在编号为6的体检数据丢失之前,调查员甲已进行相关的数据分析并计算出该组数据的线性回归方程为ˆˆ0.5ya x =+,且根据回归方程预估一名身高为180cm 的学生体重为71kg ,计算得到的其他数据如下:81170,89920i ii x x y===∑.(1)求a 的值及表格中8名学生体重的平均值y ;(2)在数据处理时,调查员乙发现编号为8的学生体重数据有误,应为63kg ,身高数据无误.请你根据调查员乙更正的数据重新计算线性回归方程,并据此预估一名身高为180cm 的学生的体重.附:回归直线方程ˆˆˆy a bx=+的斜率和截距的最小二乘法估计分别为:1221ˆni ii ni i x ynx ybx nx==-=-∑∑,ˆˆa y bx=-. 25.冠状病毒是一个大型病毒家族,今年出现的新型冠状病毒(nCoV )是以前从未在人体中发现的冠状病毒新毒株.(1)某科研团队为研究潜伏期与新冠肺炎患者年龄的关系,组织专家统计了该地区新冠肺炎患者新冠病毒潜伏期的相关信息,其中被统计的患者中60岁以下的人数与60岁以上的人数相同,60岁以下且潜伏期在7天以下的人数约占15,60岁以上且潜伏期在7天以下的人数约占35,若研究得到在犯错误概率不超过0.010的前提下,认为潜伏期与新冠肺炎患者年龄有关,现设被统计的60岁以上的人员人数为5x ,请完成下面2×2列联表并计算被统计的60岁以上的人员至少多少人?附1:()()()()()22n ad bc X a b c d a c b d -=++++,其中n a b c d =+++()20P X k ≥0.100 0.050 0.010 0.005 0.001 0k 2.7063.8416.6357.87910.828(2)某地区的新冠肺炎治愈人数y (人)与3月份的时间x (日)满足回归直线方程ˆˆˆybx a =+,统计数据如下: 3月日期(日) 2 3 4 5 6治愈人数(人)25304045t已知5=11405i i y y ==∑,52=190i i x =∑,5=1885i i i x y =∑,请利用所给数据求t 和回归直线方程ˆˆˆy bx a =+;附2:()1221ˆni ii ni i x y nx ybx n x ==-⋅=-∑∑,ˆˆa y bx=-. 26.某企业组织应聘该企业的100名应届毕业生参加专业能力测试(满分100分),这100名毕业生的成绩的频率分布直方图如图所示.(Ⅰ)该企业拟以成绩的中位数作为分数线来确定进入面试阶段的毕业生名单,根据频率分布直方图求进入该企业面试的分数线;(Ⅱ)若被测试的毕业生中有40名女生,进入面试的有15名女生,35名男生,填写下面列联表,并根据列联表判断是否有95%的把握认为成绩与性别有关.成绩<分数线成绩≥分数线 总计附:()()()()()22n ad bc K a b c d a c b d -=++++)2k【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B 【分析】依次判断每个选项:计算概率为25得到①错误;计算2 5.952K ≈得到②错,③对得到答案. 【详解】任取1名参赛人员,抽到对主办方表示满意的男性运动员的概率为20025005=,故①错误;22(2003050220)5005.95225025042080K ⨯-⨯⨯=≈⨯⨯⨯,故②错,③对故选:B . 【点睛】本题考查了概率的计算和独立性检验,意在考查学生的综合应用能力.3.D解析:D 【分析】根据题意可知,利用回归分析和独立性检验的定义,排除错误选项,即可求解出答案. 【详解】回归分析是指将具有相关关系的两个变量之间的数量关系进行测定,通过建立数学表达式进行统计估计和预测的统计研究方法.独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.根据以上定义,可知A 、B 、C 均错误,故答案选D . 【点睛】本题主要考查了回归分析与独立性检验的定义的区别.4.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.C解析:C 【解析】分析:根据题意,列出22⨯列联表,求出观测值2K ,根据观测值对应的数值得出结论. 详解:根据题意,列出22⨯列联表,如下;则220(51212)8.80177.879671413K ⨯⨯-⨯==>⨯⨯⨯,因为观测值对应的数值为0.005,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.故选C.点睛:本题考查了独立性检验的应用,属于基础题.考查利用数学知识研究实际问题的能力以及相应的运算能力.7.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.8.B解析:B 【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K 的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人, 又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人, 又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530) 4.762 3.8412109075225K ⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”, 故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.9.C解析:C 【详解】由题意可知16,28,20,8a b c d ====,44,28,36,36a b c d a c c d +=+=+=+=,72n a b c d =+++=,代入公式()()()()()22n ad bc K a b c d a c b d -=++++得()227216828208.4244283636K ⨯⨯-⨯=≈⨯⨯⨯,由于28.427.879K ≈>,我们就有0099.5的把握认为性别和读营养说明之间有关系,即性别和读营养说明之间有0099.5的可能是有关系的,故选C .10.C解析:C 【解析】对于①,线性回归方程 ˆˆˆybx a =+必过点)x y (,,满足回归直线的性质,所以①正确;对于②,在回归方程ˆ35y x =-中,当变量x 增加一个单位时,y 平均减少5个单位,不是增加5个单位;所以②不正确;对于③,在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好,该判断恰好相反;所以③不正确;对于④,在回归直线0.58ˆy x =-中,变量2x =时,变量y 的值一定是-7.不是一定为7,而是可能是7,也可能在7附近,所以④不正确;故选C.11.D解析:D 【解析】 试题由题根据二列联表得出;2K=()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,对应参考值得 2 5.024K >,则有10.0250.975-=,即有97.5%的把握认为文化程度与月收入有关系。

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)

一、选择题1.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==2.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a' D .b<b',a>a'3.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系 4.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .45.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y3040506070根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元7.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005 B .0.01C .0.02D .0.059.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位 B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.x ,y 的取值如下表: x-2-1.5-1-0.50.51y 0.26 0.35 0.51 0.71 1.1 1.41 2.05则x ,y 之间的关系可选用函数___进行拟合.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________. 15.教材上一例问题如下:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据如下表,试建立y 与x 之间的回归方程. 温度 x /℃ 21 23 25 27 29 32 35 产卵数y /个711212466115325某同学利用图形计算器研究它时,先作出散点图(如图所示),发现两个变量不呈线性相关关系. 根据已有的函数知识,发现样本点分布在某一条指数型曲线21c xy c e =的附近(1c 和2c 是待定的参数),于是进行了如下的计算:根据以上计算结果,可以得到红铃虫的产卵数y 对温度x 的回归方程为__________.(精确到0.0001) (提示:21c xy c e =利用代换可转化为线性关系) 16.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.19.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c 互不相同,则这个三位数为”有缘数”的概率是__________. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:男生 女生 合计 喜欢抖音上课 10不喜欢抖音上课8合计 30已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.某校从高三年级的男女生中各随机抽取了100人的体育测试成绩(以下称体测成绩,单位:分),数据都落在[)60100,内,其统计数据如表所示(其中不低于80分的学生为优秀).(1)请根据如表数据完成22⨯列联表,并通过计算判断,是否有95%的把握认为体测成绩与性别有关?(2)视频率为概率,在全校的高三学生中任取3人,记取出的3人中优秀的人数为X ,求X 的分布列和数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++23.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付 支付宝支付 总计附:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++.24.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:(1)根据等高条形图填写下面22⨯列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;数学成绩不超过120分 数学成绩超过120分 总计 每天在线学习数学不超过1小时 25每天在线学习数学超过1小时总计45(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数ξ的分布列与数学期望. 附临界值表()20P K k ≥0.050 0.010 0.001 0k3.8416.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.2.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.3.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > , 2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.4.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D. 【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.7.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.C解析:C 【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。

(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(有答案解析)

(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(有答案解析)

一、选择题1.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是()A.①回归分析,②取平均值B.①独立性检验,②回归分析C.①回归分析,②独立性检验D.①独立性检验,②取平均值2.某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,参考公式和数据:22()()()()()n ad bcKa cb d a bc d-=++++,其中n a b c d=+++.则以下判断正确的是A.至少有97.5%的把握认为学生选报文理科与性别有关B.至多有97.5%的把握认为学生选报文理科与性别有关C.至少有95%的把握认为学生选报文理科与性别有关D.至多有95%的把握认为学生选报文理科与性别有关3.某班主任对全班50名学生进行了作业量的调查,数据如表:若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过()附:()()()()()22n ad bcKa b c d a c b d-=++++A.0.01 B.0.025 C.0.10 D.0.054.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合5.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()P(K2≥k)…0.250.150.100.0250.0100.005…k…1.3232.0722.7065.0246.6357.879…A.90% B.95% C.97.5% D.99.5%6.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1; ③若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为2;④对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为( ) A .1 B .2 C .3 D .47.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关8.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率 9.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程^^^y b x a =+必过(),x y ;④在一个22⨯列联表中,由计算得213.079K =,则有99%以上的把握认为这两个变量间有关系.其中错误..的个数是( ) A .0 B .1 C .2D .310.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321011.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系 12.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: )C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .58二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.14.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.15.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表: 专业 性别非统计专业统计专业男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2的观测值为.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.16.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程=+x 中=﹣2,据此预测当气温为5℃时,用电量的度数约为_____.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③某项测量结果ξ服从正态分布()21,σN ,()50.81ξP ≤=,则()30.19ξP ≤-=;④对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为ˆ0.7973.56yx =-,数据列表是:则其中的数据a =__________.19.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B 的距离是19; ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表: 年龄段(岁) ()0,20[)20,40[)40,60[)60100,网购人数 2632348 男性人数1510 105(1)若把年龄在[2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?网购迷 非网购迷 总计男性 女性 总计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥0.10 0.05 0.01 0.001两人年龄都小于20岁的概率.22.为了解使用手机是否对学生的学习有影响,某校随机抽取50名学生,对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出9人,再从这9人中随机抽取3人,记这3人中“学习成绩优秀”的人数为X,试求X的分布列与数学期望.参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:23.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x和对应的销售额y(万元)进行了调查得到以下数据:关系数r的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii xx =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii n ii x y nx y bxnx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑24.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,25.为了响应国家号召,某校组织部分学生参与了“垃圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类与“问卷的结果”有关?(1)是否有90%以上的把握认为“性别”与“问卷的结果”有关?(2)在成绩合格的学生中,利用性别进行分层抽样,共选取9人进行座谈,再从这9人中随机抽取5人发送奖品,记拿到奖品的男生人数为X,求X的分布列及数学期望()E X.附:22()()()()()n ad bcKa b c d a c b d-=++++26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.2.C解析:C【解析】由题易得22⨯列联表如下:则2K的观测值为()220235104.432 3.841128713k⨯⨯-⨯=≈>⨯⨯⨯,所以至少有95%的把握认为学生选报文理科与性别有关,故选:C.【解题必备】(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. (3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α, 然后查下表确定临界值0k ; ②利用公式()()()()()22n ad bc K a c b d a b c d -=++++,计算随机变量2K 的观测值k ;③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.说明:通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.3.B解析:B 【解析】分析:根据表格中所给数据,代入公式()()()()()22n ad bc K a b c d a c b d -=++++,求出观测值,把所求的观测值同临界值进行比较,从而可得结果. 详解:根据表中数据得到()2250181589 5.059 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,所以,若推断“学生的性别与认为作业量大有关”, 则这种推断犯错误的概率不超过0.025,故选B.点睛:本题主要考查独立性检验的应用,解题的关键是正确求出这组数据的观测值,计算过程一定要细心,避免出现计算错误,属于基础题.4.A解析:A 【解析】回归直线方程过样本中心点,过A 选项正确.5.C解析:C 【详解】∵2 6.023 5.024K=>∴可断言市民收入增减与旅游欲望有关的把握为97.5%.故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bcKa b c d a c b d-=++++,计算出2K的值;(3)查表比较2K与临界值的大小关系,作统计判断.6.B解析:B【解析】由题意得,若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为4,所以③不正确;对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.7.C解析:C【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.8.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.考点:独立性检验的意义.9.B解析:B【解析】一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y35x=-,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y= b x+a必过点(),x y,③正确;因为213.079 6.635K=>,故有0099以上的把握认为这两个变量间有关系,④正确,即错误的个数为1,故选B. 10.B解析:B【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.C解析:C 【解析】由22⨯列联表数据计算得随机变量2K 的观测值是 6.879 6.635k =>,通过对照表中数据得,在犯错误的概率不超过1.0%的前提下,认为这两个变量间有关系,故选C.12.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:则 3.841k>,即2452()3636969 3.84171711931818x x x x xxkx x xx⋅-⋅==>⋅⋅⋅,解得12.697x>.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人.故答案为:18.【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题. 14.(1)(3)【解析】分析:根据独立性检验残差图相关系数回归分析的定义及性质逐一分析四个答案的真假即可详解:对于(1)根据2×2列联表中的数据计算得出≥6635而P(≥6635)≈001则有99的把握解析:(1)(3).【解析】分析:根据独立性检验、残差图、相关系数、回归分析的定义及性质,逐一分析四个答案的真假即可.详解:对于(1),根据2×2列联表中的数据计算得出2K≥6.635, 而P(2K≥6.635)≈0.01,则有99%的把握认为两个分类变量有关系,故(1)正确.对于(2),根据残差图的意义可得,当带状区域的宽度较小时,说明选用的模型比价合适,而当带状区域的宽度较大时,说明选用的模型不合适,故(2)不正确.对于(3),在线性回归分析中,相关系数为r,|r|越接近于1,则相关程度越大;|r|越接近于0,则相关程度越小.故(3)正确.对于(4),在回归直线y=0.5x−85中,当x=200时,y=15,但实际观测值可能不是15,故(4)不正确.综上可得(1)(3)正确.点睛:本题考查回归分析和独立性检验的基本知识,属于基础类题目,解题的关键是熟记相关的的概念和性质.15.5【解析】因为随机变量K2的观测值k>3841所以在犯错误的概率不超过005的前提下认为主修统计专业与性别有关系故这种判断出现错误的可能性为5考点:独立性检验思想解析:5% 【解析】因为随机变量K 2的观测值k >3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%. 考点:独立性检验思想.16.40【解析】试题分析:根据所给的表格做出本组数据的样本中心点根据样本中心点在线性回归直线上利用待定系数法做出a 的值现在方程是一个确定的方程根据所给的x 的值代入线性回归方程预报要销售的件数解:由表格得解析:40 【解析】试题分析:根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出a 的值,现在方程是一个确定的方程,根据所给的x 的值,代入线性回归方程,预报要销售的件数.解:由表格得=(14+12+8+6)÷4=10,=(22+26+34+38)÷4=30 即样本中心点的坐标为:(10,40), 又∵样本中心点(10,40)在回归方程 上且b=﹣2∴30=10×(﹣2)+a , 解得:a=50, ∴当x=5时,y=﹣2×(5)+50=40. 故答案为40.考点:回归分析的初步应用.17.【解析】试题分析:对于①从匀速传递的新产品生产流水线上质检员每20分钟抽取一件新产品进行某项指标检测这样的抽样是系统抽样而不是分层抽样故①错;对于②两个随机变量的相关性知识可知②正确;对于③变量所以 解析:2【解析】试题分析:对于①,从匀速传递的新产品生产流水线上,质检员每20分钟抽取一件新产品进行某项指标检测,这样的抽样是系统抽样,而不是分层抽样,故①错;对于②,两个随机变量的相关性知识可知②正确;对于③变量2(1,)N ξσ~,所以()()30.191510.810.19ξξP ≤-==-P ≤=-=,故③正确;对于④,随机变量2K 观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大,故④错,所以真命题有2个. 考点:1. 回归分析的基本思想及其应用初步;2.统计与概率.18.163【解析】由根据回归直线经过样本中心即得由得故答案为解析:163 【解析】由4953565864565y ++++==,根据回归直线经过样本中心(),x y ,即560.7973.56x =⨯-,得164x =,由1551611671741645a x ++++==,得163a =,故答案为163.19.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④ 【解析】①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.20.①④【解析】分析:根据性回归方程独立性检验相关关系以及命题的否定等知识选出正确的得到结果详解:线性回归方程必过样本中心点故①正确命题的否定是故②错误③相关系数r 绝对值越小表明两个变量相关性越弱故不正解析:①④ 【解析】分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.详解:线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,故①正确.命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃≥+<” 故②错误 ③相关系数r 绝对值越小,表明两个变量相关性越弱,故不正确;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系,正确. 故答案为①④.点睛:本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.三、解答题21.(1)列联表答案见解析,能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)310.【分析】(1)根据表格中的数据可题中信息可完善22⨯列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)计算得出年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b ,列举出所有的基本事件,并确定事件“所抽的两人年龄都小于20岁”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率. 【详解】(1)由题中信息可完善22⨯列联表如下表所示:计算得()2100201446207.605 6.63566344060K ⨯⨯-⨯=≈>⨯⨯⨯,故能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)年龄在()0,20、[)20,40网购男性分别有15人、10人.按分层抽样的方法随机抽取5人,年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b .从中随机抽取2人的一切可能结果所组成的基本事件共10个:()1,2、()1,3、()1,a 、()1,b 、()2,3、()2,a 、()2,b 、()3,a 、()3,b 、(),a b .用A 表示“两人年龄都小于20岁”这一事件,则事件A 由3个基本事件组成:()1,2、()1,3、()2,3.故事件A 的概率为()310P A =. 【点睛】方法点睛:求解古典概型的概率方法如下: (1)列举法; (2)列表法; (3)树状图法; (4)排列、组合数的应用.22.(1)没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)分布列见解析,()2E X =.【分析】(1)根据表格中数据和题中信息可完善22⨯列联表,计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知,随机变量X 的可能取值有0、1、2、3,计算出随机变量X 在不同取值下的概率,可得出随机变量X 的分布列,进而可求得随机变量X 的数学期望值. 【详解】(1)22⨯列联表如下表所示:()22505102015258.33310.828203025253χ⨯⨯-⨯==≈<⨯⨯⨯,所以,没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)9人中学习成绩优秀的人有209630⨯=人,学习成绩一般的有109330⨯=人, X 可能的取值有0、1、2、3,()3911084P X C ===,()1263393114C C P X C ===,()21633915228C C P X C ===,()363953?21C P X C ===.所以,随机变量X 的分布列为()1232142821E X =⨯+⨯+⨯=. 【点睛】思路点睛:求解随机变量分布列的基本步骤如下:(1)明确随机变量的可能取值,并确定随机变量服从何种概率分布; (2)求出每一个随机变量取值的概率;(3)列成表格,对于抽样问题,要特别注意放回与不放回的区别,一般地,不放回抽样由排列、组合数公式求随机变量在不同取值下的概率,放回抽样由分步乘法计数原理求随机变量在不同取值下的概率.23.(1)0.94r ≈,线性相关性较弱;(2) +77.3ˆyx =。

2019年高中数学人教A版选修2-3习题:第三章统计案例3.2

2019年高中数学人教A版选修2-3习题:第三章统计案例3.2

3.2 独立性检验的基本思想及其初步应用课时过关·能力提升基础巩固1.为调查中学生近视情况,随机抽取某校男生150名,女生140名,其中,男生中有80名近视,女生中有70名近视.在检验这些中学生眼睛近视是否与性别有关时,最有说服力的方法是( ) A.期望与方差 B.排列与组合 C.概率 D.独立性检验2.两个分类变量A ,B 的列联表如下,对随机变量K 2的观测值k 计算正确的是( )A.k=(a+b+c+d )(ab+cd )2(a+c )(b+d )(c+d )(a+b )B.k=(a+b+c+d )(ad+bc )2(a+c )(b+d )(c+d )(a+b )C.k=(a+b+c+d )(ac -bd )2(a+c )(b+d )(c+d )(a+b )D.k=(a+b+c+d )(ad -bc )2(a+c )(b+d )(c+d )(a+b )3.观察下列各图,其中两个分类变量之间关系最强的是( ),D 图中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选D .4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n (ad -bc )2(a+b )(c+d )(a+c )(b+d )算得,K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:参照附表,得到的正确结论是( )A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别无关”K2≈7.8>6.635,∴在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”.5.下列说法正确的个数为()①若事件A与B无关,则两个事件互不影响;②事件A与B关系越密切,则K2就越大;③K2的大小是判定事件A与B是否有关的唯一根据;④若判定两事件A与B有关,则A发生,B一定发生.A.1B.2C.3D.4正确.6.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验()A.H0:男性喜欢参加体育活动B.H0:女性不喜欢参加体育活动C.H0:喜欢参加体育活动与性别有关D.H0:喜欢参加体育活动与性别无关,应假设两类变量(而非变量的属性)无关,故选D.7.下面是2×2列联表:则表中a,b的值分别为()A.94,96B.52,50C.52,54D.54,52a+21=73,∴a=52,又a+2=b,∴b=54.8.独立性检验所采用的思路是:要研究A,B两类型变量彼此相关,首先假设这两类变量彼此,在此假设下构造随机变量K2.如果K2的观测值较大,那么在一定程度上说明假设.不成立9.某地震观测站对地下水位的变化和发生地震的情况共进行了1 700次观测,列联表如下:试问观测结果是否能说明地下水位的变化与地震的发生相关?,随机变量K2的观测值为k=1700×(98×618-82×902)21000×700×180×1520≈1.594<2.072,所以没有充分的证据说明“地下水位的变化与地震的发生相关”.能力提升1.对于独立性检验,下列说法中错误的是()A.K2的值越大,说明两事件相关程度越大B.K2的值越小,说明两事件相关程度越小C.当K2<3.841时,则在犯错误的概率不超过0.05的前提下认为事件A与B有关D.当K2≥6.635时,则在犯错误的概率不超过0.01的前提下认为事件A与B有关,随机变量K2的取值大小可说明两个变量相关的程度.一般地,随机变量K2的值越大,两变量的相关程度越大;反之就越小.若K2≥6.635,则说明在犯错误的概率不超过0.01的前提下认为二者有关系;若K2≥3.841,则在犯错误的概率不超过0.05的前提下认为事件A与B有关,故C错误.2.用旧设备和改造后的新设备冶炼某种金属,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表:根据以上数据,则()A.在犯错误的概率不超过0.001的前提下认为含杂质的高低与设备改造有关B.含杂质的高低与设备改造无关C.新设备生产的产品中所含杂质比旧设备低D.以上答案都错误2×2列联表:由公式得k=382×(37×202-121×22)2158×224×59×323≈13.11.由于13.11>10.828,则在犯错误的概率不超过0.001的前提下认为含杂质的高低与设备改造是有关的.3.某机构调查市民收入增减与购买愿望的关系时,采用独立性检验法抽查了6 000人,计算发现k=7.831,则根据这一数据查阅下表,该机构断言市民收入增减与购买愿望有关系的可信程度是()A.90%B.95%C.99%D.99.5%k=7.831>6.635,∴可断言市民收入增减与购买愿望有关系的可信程度为99%,故选C.4.某班主任对全班50名学生进行了对作业量态度的调查,数据如下表,则“学生的性别与认为作业量的大小有关”的把握大约为()A.99%B.97.5%C.90%D.无充分证据K2=50×(18×15-9×8)227×23×26×24≈5.06,且P(K2≥5.024)≈0.025,∴学生的性别与认为作业量的大小有关的把握大约为1-0.025=97.5%,故选B.5.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了检验主修统计专业是否与性别有关系,根据表中的数据,得到k=50(13×20-10×7)223×27×20×30≈4.844.因为k≥3.841,所以断定主修统计专业与性别有关系.这种判断出错的可能性为.k=4.844>3.841,因此,在犯错误的概率不超过0.05的前提下认为主修统计专业与性别有关系.故出错的概率为0.05..056.某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,阴性家族史者糖尿病发病的有17例,不发病的有240例,那么,在犯错误的概率不超过的前提下认为糖尿病患者与遗传有关系.2×2列联表:所以随机变量K2的观测值为k=366×(16×240-17×93)2109×257×33×333≈6.067>5.024,因此,在犯错误的概率不超过0.025的前提下认为糖尿病患者与遗传有关..0257.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是.(填序号)①若K2的观测值k=6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.2的观测值是支持确定有多大的把握认为“吃零食与性别有关系”的随机变量值,所以由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.★8.随着工业化以及城市车辆的增加,城市的空气污染越来越严重,空气质量指数一直居高不下,对人体的呼吸系统造成了严重的影响.现调查了某市500名居民的工作场所和呼吸系统健康情况,得到2×2列联表如下:(1)补全2×2列联表.(2)能否在犯错误的概率不超过0.05的前提下认为感染呼吸系统疾病与工作场所有关?(3)现采用分层抽样从室内工作的居民中抽取一个容量为6的样本,将该样本看成一个总体,从中随机地抽取两人,求两人都有呼吸系统疾病的概率.补全列联表如下:(2)计算得K 2的观测值为k=500×(150×100-200×50)2350×150×200×300≈3.968>3.841.所以能在犯错误的概率不超过0.05的前提下认为感染呼吸系统疾病与工作场所有关. (3)采用分层抽样从室内工作的居民中抽取6名,其中有呼吸系统疾病的抽4人,无呼吸系统疾病的抽2人,A=“从中随机地抽取两人,两人都有呼吸系统疾病”,则P (A )=C 42C 62=25.。

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)

一、选择题1.已知x 与y 之间的几组数据如下表: x 1 2 3 4 y1mn4参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑.上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 4.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01k k kP k C ξ-==5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响 6.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .17.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.对于独立性检验,下列说法正确的是( ) A .K 2>3.841时,有95%的把握说事件A 与B 无关 B .K 2>6.635时,有99%的把握说事件A 与B 有关 C .K 2≤3.841时,有95%的把握说事件A 与B 有关 D .K 2>6.635时,有99%的把握说事件A 与B 无关9.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.97510.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )A .90%B .95%C .97.5%D .99.5%12.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.为了解某班学生喜爱打篮球是否与性别有关,对该班50名 学生进行了问卷调查, 得到了如下22⨯ 列联表喜爱打篮球 不喜爱打篮球 合计男生20 525 女生 10 1525合计30 2050则至少有_____的把握认为喜爱打篮球与性别有关(请用百分数表示). 17.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.18.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温(如表),并求得线性回归方程为^=-2x +60.不小心丢失表中数据c ,d ,那么由现有数据知2c+d=______. x c 13 10 -1 y243438d19.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.)三、解答题21.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据:关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii x x =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii ni i x y nx y bx nx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑22.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?23.2020年初,新型冠状病毒(2019-nCoV )肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为22.25.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:(1)是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(ⅰ)现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(ⅱ)以题目中的样本频率估计概率,设1000个病例中恰有()*k k ∈N 个属于“长期潜伏”的概率是()g k ,当k 为何值时,()g k 取得最大值. 附:()()()()()22n ad bc a b c d a c b d χ-=++++若()2,N ξμσ则()0.6862P μσξμσ-<<+=.()220.9544P μσξμσ-<<+=,()330.9974P μσξμσ-<<+=.24.某地一所妇产科医院为了解婴儿性别与出生时间(白天或晚上)之间的联系,从该医院最近出生的200名婴儿获知如下数据:这200名婴儿中男婴的比例为55%,晚上出生的男婴比白天出生的男婴多75%,晚上出生的女婴人数与白天出生的男婴人数恰好相等. (1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99%的把握认为婴儿的性别与出生时间有关,说明你的理由.附:22()()()()()n ad bcKa b c d a c b d-=++++(n=a+b+c+d),参考数据:221999≈0.0368.25.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.26.“微粒贷”是腾讯旗下2015年9月开发上市的微众银行网货产品.腾讯公司为了了解“微粒贷”上市以来在C市的使用情况,统计了C市2015年至2019年使用了“微粒货”贷款的累计人数,统计数据如表所示:(1)已知变量x ,y 具有线性相关关系,求累计人数y (万人)关于年份代号x 的线性回归方程y bx a =+;并预测2020年使用“微粒贷“贷款的累计人数;(2)“微粒贷”用户拥有的贷款额度是根据用户的账户信用资质判定的,额度范围在500元至30万元不等,腾讯公司在统计使用人数的同时,对他们所拥有的贷款额度也作了相应的统计.我们把拥有货款额度在500元至5万元(不包括5万元)的人群称为“低额度贷款人群”,简称“A 类人群”;把拥有贷款额度在5万元及以上的人群称为“高额度贷款人群”,简称“B 类人群”.根据统计结果,随机抽取6人,其中A 类人群4人,B 类人群2人.现从这6人中任取3人,记随机变量ξ为A 类人群的人数,求ξ的分布列及其期望.参考公式:1122211()()()()nni iiii i nniii i x y nx y x x y y b xn x x x ====---==--∑∑∑∑, a y bx =-参考数据:5162i ii x y=≈∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()42222211.50.50.5 1.55i i x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.B解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.3.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 4.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4).【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B【解析】由独立性检验的知识知:K 2>3.841时,有95%的把握认为“变量X 与Y 有关系”;K 2>6.635时,有99%的把握认为“变量X 与Y 有关系”.故选项B 正确.9.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A.点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。

北京市高中数学 统计案例课后练习 新人教A版选修23

北京市高中数学 统计案例课后练习 新人教A版选修23

专题统计案例课后练习题一:为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:理科文科合计男131023女72027合计203050根据表中数据,得到χ2=50×(13×20-10×7)223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性约为________.题二:在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误概率不超过0.01的前提下认为这个结论是成立的,则下列说法中正确的是( ) A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有题三:在一次对性别与说谎是否相关的调查中,得到如下数据:说谎不说谎合计男6713女8917合计141630根据表中数据,得到如下结论中正确的一项是( )A.在此次调查中有95%的把握认为是否说谎与性别有关B.在此次调查中有99%的把握认为是否说谎与性别有关C.在此次调查中有99.5%的把握认为是否说谎与性别有关D.在此次调查中没有充分的证据显示说谎与性别有关题四:通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女合计爱好4020[来源:Z+x60x+k .Co m]不爱好 20 30 50 合计6050110由χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2算得,χ2=110×(40×30-20×20)260×50×60×50≈7.8.根据具体数据算出的χ2,得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”题五:已知数组(x 1,y 1),(x 2,y 2),…,(x 10,y 10)满足线性回归方程y ^=b ^x +a ^,则“(x 0,y 0)满足线性回归方程y ^=b ^x +a ^”是“x 0=121010y y y ++…+,y 0=121010x x x ++…+”的( )A .充分不必要条件B .必要不充分条件C .充要条件D .既不充分也不必要条件题六:某考察团对全国10大城市的居民人均工资收入x (万元/年)与居民人均消费y (万元/年)进行统计调查,发现y 与x 具有相关关系,且y 对x 的回归方程为y ^=0.66x +1.562.若某城市居民人均消费为7.675(万元/年),估计该城市人均消费占人均工资收入的百分比约为________.题七:某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=bx +a ;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想.参考公式:b =11222211()(),()n ni iiii i nniii i x y nx y x x y y b a y bx xnxxx ====---===---∑∑∑∑题八:已知x ,y 的一组数据如下表:x 1 3 6 7 8 y12345(1)从x ,y 中各取一个数,求x +y ≥10的概率;(2)对于表中数据,甲、乙两同学给出的拟合直线分别为y =13x +1与y =12x +12,试利用“最小平方法(也称最小二乘法)”判断哪条直线拟合程度更好.题九:已知x ,y 之间的数据如表所示,则回归直线过点________.x 1 2 3 4 5 y1.21.82.53.23.8题十:在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1题十一: 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀 非优秀 总计 甲班 10b乙班 c 30总计105已知在全部105人中随机抽取1人,成绩优秀的概率为7,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 题十二: 某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照北京暴雨前后两个时间收集有效投票,暴雨后的投票收集了50份,暴雨前的投票也收集了50份,所得统计结果如下表:支持 不支持 总计 北京暴雨后 xy50 北京暴雨前 203050 总计A B100已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为25.(1)求列联表中的数据x ,y ,A ,B 的值;(2)绘制条形统计图,通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度?(3)能够有多大把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关? 附:K 2=n (ad -bc )2(a +b)(c +d )(a +c)(b +d )P (K 2≤k )0.15 0.10 0.05 0.025 0.010 0.005 0.001 k2.0722.7063.8415.0246.6357.87910.828题十三: 在研究色盲与性别的关系调查中,调查了男性480人,其中有38人患色盲,调查的520名女性中,有6人患色盲.(1)根据以上数据建立一个2×2列联表;(2)若认为“性别与患色盲有关系”,求出错的概率.题十四: 某班主任对全班50名学生进行了作业量多少的调查.数据如下表:认为作业多认为作业不多总计 喜欢玩游戏 18 9 不喜欢玩游戏8 15 总计(1)请完善上表中所缺的有关数据;(2)试通过计算说明能否认为喜欢玩游戏与作业量的多少有关系?附:χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2.题十五:某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)(1)根据茎叶图,帮助这位学生说明其亲属30人的饮食习惯; (2)根据以上数据完成下列2×2的列联表:主食蔬菜主食肉类合计 50岁以下 50岁以上 合计(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析.题十六: 通过随机询问某校110名高中学生在购买食物时是否看营养说明,得到如下的列联表:男 女 总计 看营养说明503080不看营养说明10 20 30 总计6050110(1)从这50名女生中按是否看营养说明采取分层抽样的方法抽取一个容量为5的样本,则样本中看与不看营养说明的女生各有多少名?(2)从(1)中的5名女生样本中随机选取两名作深度访谈,求选到看与不看营养说明的女生各一名的概率;(3)根据以上列联表,问有多大把握认为“性别与在购买食物时是否看营养说明”有关? 参考公式:K 2=n (ad -bc )2(a +b)(c +d )(a +c)(b +d ),其中n =a +b +c +d .参考数据:P (K 2≥k 0)0.10 0.05 0.025 0.010 0.005 k 02.7063.8415.0246.6357.879题十七:某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,所得数据如下表:x 6 8 10 12 y2356则y 对x A.y ^=2.3x -0.7 B.y ^=2.3x +0.7 C.y ^=0.7x -2.3D.y ^=0.7x +2.3题十八:某种产品的广告费支出x 与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y3040605070(1)求回归直线方程;(2)试预测广告费支出为10万元时,销售额多大?(3)在已有的五组数据中任意抽取两组,求至少有一组数据其预测值与实际值之差的绝对值不超过5的概率.( 参考数据:∑i =15x 2i =145,∑i =15y 2i =13 500,∑i =15x i y i =1 380 )专题 统计案例课后练习参考答案题一: 5%详解: 因为χ2=4.844>3.841,所以有95%的把握认为选修文科与性别有关系.故认为选修文科与性别有关系出错的可能性约为5%.题二: D.详解:统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发生. 题三: D. 详解:由于K 2=30×(6×9-7×8)213×17×14×16≈0.0024,由于K 2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.题四: C.详解:根据独立性检验的定义,由χ2≈7.8>6.635可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.题五: B.详解: x 0,y 0为这10组数据的平均值,又因为线性回归方程y ^=b ^x +a ^必过样本中心点(x ,y ),因此(x ,y )一定满足线性回归方程,但满足线性回归方程的除了(x ,y )外,可能还有其他样本点.题六: 83%.详解:因为当y ^=7.675时,x =7.675-1.5620.66≈9.262,则7.6759.262≈0.829≈83%. 题七: (1) 13. (2) y ^=187x -307. (3)该小组所得线性回归方程是理想的. 详解: (1)设抽到相邻两个月的数据为事件A .因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中抽到相邻两个月的数据的情况有5种,所以P (A )=515=13.(2)由数据求得x =11,y =24,由公式求得b =187,再由a =y -b x =-307,得y 关于x 的线性回归方程为y ^=187x -307.(3)当x =10时,y ^=1507,|1507-22|<2;同样,当x =6时,y ^=787,|787-12|<2,所以,该小组所得线性回归方程是理想的.题八: (1)925. (2) y =12x +12的拟合程度更好. 详解:(1)从x ,y 中各取一个数组成数对(x ,y ),共有25对,其中满足x +y ≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对.故所求概率P =925. (2)用y =13x +1作为拟合直线时,所得y 值与y 的实际值的差的平方和为S 1=⎝ ⎛⎭⎪⎫43-12+(2-2)2+(3-3)2+⎝ ⎛⎭⎪⎫103-42+⎝ ⎛⎭⎪⎫113-52=73.用y =12x +12作为拟合直线时,所得y 值与y 的实际值的差的平方和为S 2=(1-1)2+(2-2)2+⎝ ⎛⎭⎪⎫72-32+(4-4)2+⎝ ⎛⎭⎪⎫92-52=12.∵S 2<S 1,∴直线y =12x +12的拟合程度更好.题九: (3,2.5).详解:x =3,y =2.5,∴样本点中心为(3,2.5),回归直线过样本点中心.题十: D.详解:因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.题十一: C.详解: 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.题十二: (1) y =10,B =40,x =40,A =60.(2)由图可以看出暴雨影响到民众对加大修建城市地下排水设施的投入的态度.(3)至少有99.9%的把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关. 详解:(1)设“从所有投票中抽取一个,取到不支持投入的投票”为事件A ,由已知得P (A )=y +30100=25,所以y =10,B =40,x =40,A =60. (2)由(1)知北京暴雨后支持率为4050=45,不支持率为1-45=15,北京暴雨前支持率为2050=25,不支持率为1-25=35.条形统计图如图所示,由图可以看出暴雨影响到民众对加大修建城市地下排水设施的投入的态度.(3)K 2=100(30×40-20×10)250×50×40×60=1000 00050×20×60=503≈16.78>10.828.故至少有99.9%的把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关.题十三: (1)2×2列联表如下:患色盲 不患色盲 总计男 38 442 女 6 514 520 总计449561 000(2) 0.1%.详解:(1)2×2列联表如下:患色盲 不患色盲 总计 男 38 442 480 女 6 514 520 总计449561 000(2)假设H 0:“性别与患色盲没有关系”,根据(1)中2×2列联表中数据,可求得K 2=1 000×(38×514-6×442)2480×520×44×956≈27.14,又P (K 2≥10.828)=0.001,即H 0成立的概率不超过0.001,故若认为“性别与患色盲有关系”,则出错的概率为0.1%.题十四: (1)认为作业多认为作业不多总计 喜欢玩游戏 18 9 27 不喜欢玩游戏8 15 23 总计262450(2)有95%把握认为喜欢玩游戏与作业量的多少有关系.详解:(1)认为作业多认为作业不多总计 喜欢玩游戏 18 9 27 不喜欢玩游戏8 15 23 总计262450(2)将表中的数据代入公式χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2得到χ2=50×(18×15-8×9)226×24×27×23≈5.059>3.841,所以有95%把握认为喜欢玩游戏与作业量的多少有关系.题十五: (1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主.(2)主食蔬菜主食肉类合计 50岁以下 4 8 12 50岁以上 16 2 18 合计201030(3)有99%的把握认为亲属的饮食习惯与年龄有关.详解: (1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主.(2)主食蔬菜主食肉类合计 50岁以下 4 8 12 50岁以上 16 2 18 合计201030(3)K 2=30(8-128)212×18×20×10=30×120×12012×18×20×10=10>6.635,有99%的把握认为亲属的饮食习惯与年龄有关.题十六: (1)看营养说明的女生有3名,样本中不看营养说明的女生2名. (2) 35.(3)有99%的把握认为“性别与在购买食物时是否看营养说明”有关.详解:(1)根据分层抽样可得:样本中看营养说明的女生有550×30=3名,样本中不看营养说明的女生有550×20=2名.(2)记样本中看营养说明的3名女生为a 1,a 2,a 3,不看营养说明的2名女生为b 1,b 2,从这5名女生中随机选取2名,共有10个等可能的基本事件:a 1,a 2;a 1,a 3;a 1,b 1;a 1,b 2;a 2,a 3;a 2,b 1;a 2,b 2;a 3,b 1;a 3,b 2;b 1,b 2.其中事件A “选到看与不看营养说明的女生各一名”包含了6个基本事件:a 1,b 1;a 1,b 2;a 2,b 1;a 2,b 2;a 3,b 1;a 3,b 2.所以所求的概率为P (A )=610=35.(3)根据题中的列联表得K 2=110×(50×20-30×10)280×30×60×50=53972≈7.486.由P (K 2≥6.635)=0.010,P (K 2≥7.879)=0.005可知,有99%的把握认为“性别与在购买食物时是否看营养说明”有关. 题十七: C.详解:∵∑i =14x i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4.∴b ^=158-4×9×436+64+100+144-4×81=0.7,a ^=4-0.7×9=-2.3.故线性回归直线方程为y ^=0.7x -2.3.题十八: (1)回归直线方程为y ^=6.5x +17.5. (2) 82.5万元. (3)910. 详解:(1)x =2+4+5+6+85=255=5,y =30+40+60+50+705=2505=50,又已知∑i =15x 2i =145,∑i =15x i y i =1 380,于是可得:b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=1380-5×5×50145-5×5×5=6.5, a ^=y -b ^x =50-6.5×5=17.5,因此,所求回归直线方程为y ^=6.5x +17.5.(2)根据上面求得的回归直线方程,当广告费支出为10万元时,y ^=6.5×10+17.5=82.5(万元),即这种产品的销售收入大约为82.5万元. (3)x 2 4 5 6 8 y30 40 60 50 70 y ^30.543.55056.569.5基本事件:(30,40),(30,60),(30,50),(30,70),(40,60),(40,50),(40,70),(60,50),(60,70),(50,70)共10个.两组数据其预测值与实际值之差的绝对值都超过5有(60,50),所以至少有一组数据其预测值与实际值之差的绝对值不超过5的概率为1-110=910.。

高中数学选修2-3统计案例之线性回归方程习题课

高中数学选修2-3统计案例之线性回归方程习题课

1.相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.2.线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则b^,a^其中,b是回归方程的斜率,a是在y轴上的截距.4.样本相关系数r=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2∑i=1n(y i-y)2,用它来衡量两个变量间的线性相关关系.(1)当r>0时,表明两个变量正相关;(2)当r<0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.5.线性回归模型(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差.(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2=,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.注意(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.考向一相关关系的判断例1.下列选项中,两个变量具有相关关系的是( )A.正方形的面积与周长B.匀速行驶车辆的行驶路程与时间C.人的身高与体重D.人的身高与视力答案:C例2.对变量x、y有观测数据(x i,y i)(i =1,2,…,10),得散点图1;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:选C.由题图1可知,各点整体呈递减趋势,x与y负相关,由题图2可知,各点整体呈递增趋势,u与v正相关.例3.下面哪些变量是相关关系().A.出租车车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁块的大小与质量解析A,B,D都是函数关系,其中A一般是分段函数,只有C是相关关系.答案 C例4.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据的线性相关性最大.解析:因为A、B、C、E四点分布在一条直线附近且贴近某一直线,D点离得远.答案:D例5.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v 有观测数据(u i、v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断().A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.答案 C例6.下列关系属于线性负相关的是( )A.父母的身高与子女身高的关系B.球的体积与半径之间的关系C.汽车的重量与汽车每消耗1 L汽油所行驶的平均路程D.一个家庭的收入与支出解析:选C.A、D中的两个变量属于线性正相关,B中两个变量是函数关系.例7.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):(1)画出散点图;(2)判断是否具有相关关系.[审题视点] (1)用x 轴表示化肥施用量,y 轴表示棉花产量,逐一画点.(2)根据散点图,分析两个变量是否存在相关关系.解 (1)散点图如图所示(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.例8. 根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________(填“是”与“否”).解析从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系.答案否考向二线性回归方程例9.对有线性相关关系的两个变量建立的回归直线方程y^=a+bx中,回归系数b( )A.不能小于0 B.不能大于0C.不能等于0 D.只能小于0解析:选C.∵b=0时,r=0,这时不具有线性相关关系,但b能大于0也能小于0.例10.已知回归方程y^=4.4x+838.19,则可估计x与y的增长速度之比约为________.解析:x与y的增长速度之比即为回归方程的斜率的倒数14.4=1044=522.答案:5 22例11.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是().A.y^=-10x+200 B.y^=10x+200 C.y^=-10x-200 D.y^=10x-200 解析因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数,再排除C,故选A.答案 A例12.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程.预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)[审题视点] (2)问利用公式求a ^、b ^,即可求出线性回归方程.(3)问将x =100代入回归直线方程即可. 解 (1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得:i =14x 2i =86,x =3+4+5+64= 4.5(吨),y =2.5+3+4+4.54=3.5(吨). 已知∑i =14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为:b ^=∑i =14x i y i -4x ·y ∑i =14x 2i -4x 2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨标准煤).在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间有线性相关关系,再求回归直线方程.例13.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y对x的线性回归方程为().A.y=x-1 B.y=x+1C.y=88+12x D.y=176解析由题意得x=174+176+176+176+1785=176(cm),y=175+175+176+177+1775=176(cm),由于(x,y)一定满足线性回归方程,经验证知选C.答案 C例14.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y^=bx+a;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:对预处理后的数据,容易算得,x=0,y=3.2,b=26040=6.5,a=y-b x=3.2.由上述计算结果,知所求回归直线方程为y -257=b(x-2 006)+a=6.5(x-2 006)+3.2,即y^=6.5(x-2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨).例15.下列有关回归直线方程y^=bx+a 的叙述正确的是( )①反映y^与x之间的函数关系;②反映y与x之间的函数关系;③表示y^与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.A.①② B.②③C.③④ D.①④解析:选D.y^=bx+a表示y^与x之间的函数关系,而不是y与x之间的函数关系;但它反映的关系最接近y与x之间的真实关系,故选D.例16.设有一个回归方程y^=3-5x,变量x增加一个单位时( )A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位解析:选B.∵-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.例17.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则下列说法中不.正确的是( ) A.由样本数据得到的回归方程y^=b^x+a^必过样本中心(x,y)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r =-0.9362,则变量y和x之间具有线性相关关系解析:选C.C中应为R2越大拟合效果越好.例18.已知回归方程y^=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是( )A .0.01B .0.02C .0.03D .0.04解析:选C.当x =2时,y ^=5, 当x =3时,y ^=7,当x =4时,y ^=9.∴e ^1=4.9-5=-0.1,e ^2=7.1-7=0.1, e ^3=9.1-9=0.1.∴ i =13e ^i 2=(-0.1)2+(0.1)2+(0.1)2=0.03.例19.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②回归方程y ^=bx +a 必过点(x ,y ); ③曲线上的点与该点的坐标之间具有相关关系;④在一个2×2列联表中,由计算得K2=13.079,则其两个变量间有关系的可能性是 90%.其中错误的是________.解析:①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确.答案:③④例20.在2009年十一国庆8天黄金周期间,某市物价部门,对本市五个商场销售的某商品的一天销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:9通过分析,发现销售量对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________.解析:由数据表可得x=10,y=8,离差x-x:-1,-0.5,0,0.5,1;离差y-y:3,2,0,-2,-3.∴b^=-1×3-0.5×2-0.5×2-1×3 1+0.25+0+0.25+1=-3.2,a ^=y -b ^x =40,∴回归直线方程为y ^=-3.2x +40. 答案:y ^=-3.2x +40例21.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.解:以x 轴表示身高,y 轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关.12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程y^=b^ x+a^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?解:(1)设抽到不相邻2组数据为事件A,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻2组数据的情况有4种,所以P(A)=1-410=35.(2)由数据求得,x=12,y=27,由公式求得.b^=52,a^=y-b^x=-3.所以y关于x的线性回归方程为y^=5 2 x-3.(3)当x=10时,y^=52×10-3=22,|22-23|<2;当x=8时,y^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的.。

新北师大版高中数学高中数学选修2-3第三章《统计案例》测试(答案解析)(2)

新北师大版高中数学高中数学选修2-3第三章《统计案例》测试(答案解析)(2)

一、选择题1.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是( )A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关2.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问400名不同的大学生是否爱好某项运动,利用22⨯列联表,计算可得2K 的观测值7.556k ≈,附表:参照附表,得到的正确结论是A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关” 3.对于独立性检验,下列说法正确的是( ) A .2 3.841K >时,有95%的把握说事件A 与B 无关 B .2 6.635K >时,有99%的把握说事件A 与B 有关 C .2 3.841K ≤时,有95%的把握说事件A 与B 有关 D .2 6.635K >时,有99%的把握说事件A 与B 无关 4.对两个分类变量A ,B 的下列说法中正确的个数为( ) ①A 与B 无关,即A 与B 互不影响; ②A 与B 关系越密切,则K 2的值就越大; ③K 2的大小是判定A 与B 是否相关的唯一依据A .0B .1C .2D .35.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响6.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -7.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大合计 男生 18 9 27 女生 8 15 23 合计262450( )附:()()()()()22n ad bc K a b c d a c b d -=++++ P(K 2>k 0) 0.15 0.10 0.05 0.025 0.01 0.001 k 02.0722.7063.8415.0246.63510.828A .0.01B .0.025C .0.10D .0.059.假设有两个分类变量X 和Y 的22⨯列联表如下:注:2K 的观测值2()()()()()()()n ad bc a b a ck n a b c d a c b d a c b d a b c d-==--++++++++.对于同一样本,以下数据能说明X 和Y 有关系的可能性最大的一组是( ) A .45,15a c ==B .40,20a c ==C .35,25a c ==D .30,30a c ==10.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)2433 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5811.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表 数学 物理 85~100分 85分以下 合计 85~100分 37 85 122 85分以下35143178附:经计算2 4.514K ≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过 A .0.5%B .1%C .2%D .5%12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.在吸烟与患肺病是否相关的判断中,有下面的说法:(1)从独立性分析可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.(2)从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;(3)若2 6.635K >,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病; 其中说法正确的是________.14.登山族为了了解某山高y (km)与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表: 气温x (℃) 18 13 10 -1 山高y (km)24343864由表中数据,得到线性回归方程ˆy=-2x+ˆa (ˆa ∈R),由此估计出山高为72(km)处的气温为_____℃.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:不生二胎 40 40则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附表:参照附表,在犯错误的概率不超过______(填百分比)的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.17.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”. 18.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上) 19.下列命题中,正确的命题有__________.①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;②将一组数据的每个数据都加一个相同的常数后,方差不变;③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于1,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越小;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做函数关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.2019年4月,中国电信公布了2019年的终端洞察报告,其中,国产手机品牌表现抢眼,统治地位不容置疑.在2018年6~11月上市的新机中,用户最满意机型与用户推荐机型的项目中国产手机优势明显,华为及荣耀手机分别占据不同价位段的榜单第一,OPPO 、vivo 、小米、魅族均有机型占据榜单.在用户满意机型调研项目中,曾经位于神坛地位的苹果手机也仅仅只有iPhone XR 一款位列第三.(1)从上表中15个机型中任取3个,求这3个机型恰好有2个是“华为”或“荣耀”的概率; (2)测试数据源于消费者的反馈,从反馈信息中随机抽取500个“华为畅享9plus ”消费者,其中来自城市300个,来自农村200个,统计他们对“华为畅想9plus ”的满意情况如下:满意 不满意城市 270 30农村170 30根据上表数据,问是否有95%的把握认为消费者是否满意与城市用户还是农村用户有关? (附:()()()()()22n ad bc a b c d a c b d χ-=++++,当2 3.841χ>时,有95%的把握说事件A 与B 有关;当26.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的)22.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值; (2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bc K a b c d a c b d -=++++.(其中n a b c d =+++为样本容量)23.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?24.某火锅店为了解气温对营业额的影响,随机记录了该店1月份中5天的日营业额y (单位:千元)与该地当日最低气温x (单位:℃)的数据,如下表: x 2 5 8 9 11 y1210887(1)求y 关于x 的回归方程y bx a =+;(2)判定y 与x 之间是正相关还是负相关;若该地1月份某天的最低气温为6℃,用所求回归方程预测该店当日的营业额;附:①a y bx =-;1221ni ii nii x y nx yb xnx==-⋅=-∑∑.②参考数据如下: i i xi y2i xi i x y1 2 12 4 24 2510255038864644988172511712177∑354529528725.2016年欧洲杯将于2016年6月10日到7月10日在法国举行.为了使得赛会有序进行,欧足联在全球范围内选聘了30名志愿者(其中男性16名,女性14名).调查发现,男性中有10人会英语,女性中有6人会英语.(1)根据以上数据完成以下2×2列联表:并回答能否在犯错的概率不超过0.10的前提下认为性别与会英语有关?参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++参考数据:(2)会英语的6名女性志愿者中曾有4人在法国工作过,若从会英语的6名女性志愿者中随机抽取2人做导游,则抽出的2人都在法国工作过的概率是多少?26.为了了解某班学生喜欢数学是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表,已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为3 5 .喜欢数学不喜欢数学合计男生5女生10(1)能否在犯错误的概率不超过0.005的前提下认为喜欢数学与性别有关?说明你的理由;(2)现从女生中抽取2人进一步调查,设其中喜欢数学的女生人数为ξ,求ξ的分布列与期望.临界表供参考:(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D2.B解析:B 【分析】根据2K 的观测值7.556k ≈,对照表中数据,即可得到相应的结论. 【详解】根据2K 的观测值7.556k ≈,对照表中数据得出有0.01的几率说明这两个变量之间的关系是不可信的,即有10.0199%-=的把握说明两个变量之间有关系,故选B . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)3.B解析:B 【分析】根据独立性检验中卡方的概念知,选B. 【详解】根据独立性检验中卡方的概念知,2 6.635K >时,有99%的把握说事件A 与B 有关选B. 【点睛】本题主要考查了独立性检验中卡方的概念,属于中档题.4.B解析:B 【解析】 【分析】根据独立性检验的思想,对题目中的命题进行分析、判断正误即可. 【详解】对于①,对事件A 与B 无关时,说明两事件的影响较小,不是两个互不影响,①错误; 对于②,事件A 与B 关系密切,说明事件A 与B 的相关性就越强,K 2就越大,②正确; 对于③,K 2的大小不是判定事件A 与B 是否相关的唯一根据,判定两事件是否相关除了公式外;还可以用三维柱形图和二维条形图等方法来判定,③错误; 故选:B . 【点睛】本题考查了独立性检验思想的应用问题,属于基础题.K 2值是用来判断两个变量相关的把握度的,不是用来判断两个变量是否相关的.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.D解析:D由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B 【解析】 K 2=≈5.059>5.024,因为P(K 2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B9.A解析:A 【解析】根据独立性检验的方法和22⨯列联表可得,当10a a +与10cc +相差越大,则分类变量X 和Y 有关系的可能性越大,即,a c 相差越大,10a a +与10cc +相差越大.由各选项可得A 满足条件,选A .10.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.11.D解析:D23.841 4.514 6.635k <=<,则0.010.05P <<,出错概率不超过5%选D.12.D解析:D 【解析】57(0.85165ˆ85.7) 2.45Y Y σ=-=-⨯-= 二、填空题13.(1)【分析】根据题意利用独立性检验的定义与基本思想对题目中的命题进行逐个分析判断即可求解出答案【详解】根据独立性检验的基本思想在犯错误的概率不超过005的前提下认为吸烟与患肺病有关系的意思为有的把解析:(1) 【分析】根据题意,利用独立性检验的定义与基本思想,对题目中的命题进行逐个分析、判断,即可求解出答案. 【详解】根据独立性检验的基本思想,在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系的意思为有95%的把握认为这个推理是正确的,所以(1)正确.从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系的意思为有99%的把握认为这个推理是正确的,而不是说某个人吸烟就有99%的可能患有肺病,所以(2)错误.同(2)中的推论,所以也不能在100个吸烟的人中必有99人患有肺病,故(3)错误.故答案为(1). 【点睛】本题主要考查了独立性检验的基本思想,2K 是检验两个事件相关程度的量,是相关关系,是反映有关和无关的概率.14.-6【解析】由题意可得=10=40所以+2=40+2×10=60所以=-2x+60当=72时-2x+60=72解得x=-6解析:-6 【解析】由题意可得x =10,y =40,所以ˆay =+2x =40+2×10=60,所以ˆy =-2x+60,当ˆy =72时,-2x+60=72,解得x=-6.15.没有【解析】由于K2=<6635故没有99以上的把握认为生二胎与性别有关解析:没有 【解析】由于K 2=2200(80404040)5012080120809⨯-⨯=⨯⨯⨯<6.635,故没有99%以上的把握认为“生二胎与性别有关”.16.%【解析】试题分析:所以在犯错误不超过%的前提下认为小动物是否被感染与有没有服用疫苗有关考点:1卡方统计量2统计;【易错点晴】本题主要考查的是统计中的卡方统计量属于容易题解题时一定要注意计算问题很多解析:% 【解析】 试题分析:,所以在犯错误不超过%的前提下,认为“小动物是否被感染与有没有服用疫苗有关” . 考点:1.卡方统计量,2.统计;【易错点晴】本题主要考查的是统计中的卡方统计量,属于容易题.解题时一定要注意计算问题,很多同学列式正确计算错误,从而不能正确得到结果.另外,学生容易把答案写为%,所以一定要注意本题中的问题是什么,否则很容易出现错误.17.%【解析】试题分析:根据表中数据计算得所以有%以上的把握认为喜欢足球与性别有关考点:1列联表;2独立性假设检验解析:99.5% 【解析】试题分析:根据表中数据计算得,2250(1520105)8.3337.87925252030k ⨯⨯-⨯=≈>⨯⨯⨯,所以有99.5%以上的把握认为“喜欢足球与性别有关”.考点:1.列联表;2.独立性假设检验.18.(1)(3)(4)【分析】根据相关指数离散型随机变量随机变量的方差和标准差绝对值不等式和相互独立事件相关的知识对五个结论逐一分析由此得出正确结论的序号【详解】对于(1)R2越大模型的拟合效果越好结论解析:(1),(3),(4) 【分析】根据相关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,对五个结论逐一分析,由此得出正确结论的序号. 【详解】对于(1),R 2越大,模型的拟合效果越好,结论正确.对于(2),内径与规定的内径尺寸之差是连续型随机变量,结论错误.对于(3),根据随机变量的方差和标准差的知识可判断出结论正确.对于(4),根据绝对值不等式有22x x a a a -+-≥-≥,所以2a a -≤-或2a a -≥,前者解得1a ≤,后者无解,故a 的最大值为1,结论正确.对于(5),事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是对立事件,不是相互独立事件,结论错误.综上所述,正确结论为(1),(3),(4). 【点睛】本小题主要考查关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,考查分析与解决问题的能力,属于基础题.19.②⑥⑦【解析】①回归直线恒过样本点的中心可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后根据方差公式可知方差恒不变;③用相关指数来刻面回归效果;表示预报变量对解释变量变化的贡献率越解析:②⑥⑦ 【解析】①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后,根据方差公式可知方差恒不变; ③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于0,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越大;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做相关关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 故答案为:②⑥⑦20.①④【解析】对于①从匀速传递的产品生产流水线上质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测这样的抽样方法是系统抽样故①正确;对于②两个变量的线性相关程度越强则相关系数的绝对值越接近于1解析:①④ 【解析】对于①,从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样,故①正确;对于②,两个变量的线性相关程度越强,则相关系数的绝对值越接近于1,故②错误; 对于③,两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越小,故③错误;对于④,∵随机变量X ∼N (0,1),设P (|X |<1)=p ,则1(1)(1)2pP X P X ->=<-=, ∴11(1)1(1)122p pP X P X -+<=->=-=, ∴2(1)1P X p <-=,即(1)2(1)1P X P X <=<-,故④正确。

《统计案例》教案新人教A版选修

《统计案例》教案新人教A版选修

《统计案例》教案1(新人教A版选修2-3)第三章统计案例3.1回归分析的基本思想及其初步应用(共计4课时)授课类型:新授课一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。

二、学习目标1、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。

2、过程与方法本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路-进行回归分析,进而介绍残差分析的方法和利用R的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。

3、情感、态度与价值观通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。

加强与现实生活的联系,以科学的态度评价两个变量的相关系。

教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时。

体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神。

培养学生运用所学知识,解决实际问题的能力。

三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤;通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。

教学难点:求回归系数 a , b ;相关指数的计算、残差分析;了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。

最新北师大版高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)

最新北师大版高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)

一、选择题1.下列四个命题中,正确的有( )①两个变量间的相关系数r 越小,说明两变量间的线性相关程度越低;②命题“x ∃∈R ,使得210x x ++<”的否定是:“对x ∀∈R ,均有210x x ++>”; ③命题“p g ∧为真”是命题“p q ∨为真”的必要不充分条件;④若函数322()3f x x ax bx a =+++在1x =-有极值0,则2a =,9b =或1a =,3b =.A .0B .1C .2D .32.为检测某药品服用后的多长时间开始有药物反应,现随机抽取服用了该药品的1000人,其服用后开始有药物反应的时间(分钟)与人数的数据绘成的频率分布直方图如图所示.若将直方图中分组区间的中点值设为解释变量x (分钟),这个区间上的人数为y (人),易见两变量x ,y 线性相关,那么一定在其线性回归直线上的点为( )A .()1.5,0.10B .()2.5,0.25C .()2.5,250D .()3,3003.为研究某两个分类变量是否有关系,根据调查数据计算得到k≈15.968,因为P(K 2≥10.828)=0.001,则断定这两个分类变量有关系,那么这种判断犯错误的概率不超过( ). A .0.1B .0.05C .0.01D .0.0014.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示: 序号 12345678910 11 12 13 14 15 16 17 18 19 20数学成95 75 80 94 92 65 67 84 98 7167 93 64 787790 57 83 72 83若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系( ) A .95%B .97.5%C .99.5%D .99.9%5.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%6.为了考查两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2,已知两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,那么下列说法正确的是( ) A .l 1和l 2有交点(s ,t )B .l 1与l 2相交,但交点不一定是(s ,t )C .l 1与l 2必定平行D .l 1与l 2必定重合7.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:不秃发 5 450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0018.假设有两个分类变量X 和Y 的22⨯列联表如下:注:2K 的观测值2()()()()()()()n ad bc a b a ck n a b c d a c b d a c b d a b c d-==--++++++++.对于同一样本,以下数据能说明X 和Y 有关系的可能性最大的一组是( ) A .45,15a c ==B .40,20a c ==C .35,25a c ==D .30,30a c ==9.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58 总计8880168则认为多看电视与人冷漠有关系的把握大约为( ) 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.828A .99%B .97.5%C .95%D .90%10.有下列数据: x123y35.9912.01下列四个函数中,模拟效果最好的为( ) A .B .C .D .11.某家具厂的原材料费支出x 与销售量y (单位:万元)之间有如下数据,根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为ˆ8ˆy x b =+,则^b为( ) x 2 4 5 6 8 y2535605575A .5B .15C .10D .2012.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表 数学 物理 85~100分 85分以下 合计 85~100分 37 85 122 85分以下 35 143 178 合计722283002()P K k ≥ 0.050 0.010 0.001 k 3.8416.63510.828附:经计算2 4.514K ≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过 A .0.5%B .1%C .2%D .5%二、填空题13.若两个分类变量X 与Y 的列联表为:y 1 y 2 x 1 10 15 x 24016则“X 与Y 之间有关系”这个结论出错的可能性为________.14.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参照附表,在犯错误的概率最多不超过______(填百分比)的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”.参考公式:K 2=2()()()()()n ad bc a b c d a c b d -++++15.已知方程是根据女大学生的身高预报她的体重的回归方程,其中的单位是,的单位是,那么针对某个体的残差是______.16.给出下列四个结论:(1)如图Rt ABC ∆中,2,90,30.AC B C =∠=︒∠=︒是斜边上的点,.以为起点任作一条射线交于点,则点落在线段上的概率是3;(2)设某大学的女生体重与身高具有线性相关关系,根据一组样本数据,用最小二乘法建立的线性回归方程为,则若该大学某女生身高增加,则其体重约增加;(3)若()f x 是定义在上的奇函数,且满足,则函数()f x 的图像关于对称;(4)已知随机变量ξ服从正态分布()()21,,40.79,N Pσξ≤=则.其中正确结论的序号为________________17.已知下列说法:①分类变量A与B的随机变量越大,说明“A与B有关系”的可信度越大;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.其中说法正确的为_____________.(填序号)18.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cossinxyθθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y+=;③极坐标系中,22,3Aπ⎛⎫⎪⎝⎭与()3,0B19④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误.19.某班主任对全班50名学生的积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太积极参加班级工作合计学习积极性高18725学习积极性一般61925合计242650则至少有________的把握认为学生的学习积极性与对待班级工作的态度有关.(请用百分数表示).注:独立性检验界值表()2P K k≥0.0250.0100.0050.001k 5.024 6.6357.87910.82820.下列说法中,正确的有_______.①回归直线ˆˆˆy bx a =+恒过点(),x y ,且至少过一个样本点;②根据22⨯列列联表中的数据计算得出2 6.635K ≥,而()26.6350.01P K ≥≈,则有99%的把握认为两个分类变量有关系;③2k 是用来判断两个分类变量是否相关的随机变量,当2k 的值很小时可以推断两个变量不相关;三、解答题21.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表:(1)若把年龄在2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?附:()()()()()2n ad bc K a b c d a c b d -=++++.两人年龄都小于20岁的概率.22.为了解某企业生产的某产品的年利润与年广告投入的关系,该企业对最近一些相关数据进行了调查统计,得出相关数据见下表:根据以上数据,研究人员分别借助甲、乙两种不同的回归模型,得到两个回归方程:方程甲,2(1)(1) 2.75yb x =-+^^;方程乙,(2)1.6yc x =-^^.(1)求b ^(结果精确到0.01)与c ^的值.(2)为了评价两种模型的拟合效果,完成以下任务.①完成下表(备注:i i ie y y =-^^,i e ^称为相应于点(x i ,y i )的残差); 年广告投入x (万元) 2 3 4 5 6 年利润y (十万元)346811模型甲估计值(1)iy^ 残差(1)i e ^模型乙估计值(2)iy^ 残差(2)ie^②分别计算模型甲与模型乙的残差平方和Q 1及Q 2,并通过比较Q 1,Q 2的大小,判断哪个模型拟合效果更好.23.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg 合 计(2)在新养殖法养殖的网箱中,按照分层抽样的方法从箱产量少于50kg 和不少于50kg 的网箱中随机抽取5箱,再从中抽取3箱进行研究,这3箱中产量不少于50kg 的网箱数为X ,求X 的分布列和数学期望.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++24.某中学在2020年元旦校运动会到来之前,在高三年级学生中招募了16名男性志愿者和14名女性志愿者,其中男性志愿者,女性志愿者中分别有10人和6人喜欢运动会,其他人员均不喜欢运动会.(1)根据题设完成下列22⨯列联表:(2)在犯错误的概率不超过0.050的前提下能否有95%的把握认为喜欢运动会与性别有关?并说明理由.(3)如果喜欢运动会的女性志愿者中只有3人懂得医疗救护,现从喜欢运动会的女性志愿者中随机抽取2人负责医疗救护工作,求“抽取得2名志愿者都懂得医疗救护”的概率.注:()()()()()()22n ad bc K n a b c d a b c d a c b d -==+++++++临界值表k 3.841 5.024 6.63510.82825.某公司(人数众多)为鼓励员工利用网络进行营销,准备为员工办理手机流量套餐.为了解员工手机流量使用情况,按照男员工和女员工1:3的比例分层抽样,得到200名员工的月使用流量L(单位:M)的数据,其频率分布直方图如图所示.求a的值,并估计这200名员工月使用流量的平均值x(同一组中的数据用中点值代表);(2)若将月使用流量在800M以上(含800M)的员工称为“手机营销达人”,填写下面的22⨯列联表,能否有超过0095的把握认为“成为手机营销达人与员工的性别有关”;男员工女员工合计手机营销达人5非手机营销达人合计200(3)若这200名员工中有2名男员工每月使用流量在[]900,1000,从每月使用流量在[]900,1000的员工中随机抽取名3进行问卷调查,记女员工的人数为X,求X的分布列和数学期望.参考公式及数据:()()()()()22n ab bcKa b c d a c b d-=++++,其中n a b c d=+++.()2P K k≥0.150.100.050.0250.0100.005k 2.072 2.706 3.841 5.024 6.6357.87926.云南是世界茶树的原产地之一,也是中国四大茶产区之一,独特的立体气候为茶叶的种质资源多样性创造了良好的自然条件,茶叶产业是云南高原特色农业的闪亮名片.某大型茶叶种植基地为了比较A、B两品种茶叶的产量,某季采摘时,随机选取种植A、B两品种茶叶的茶园各30亩,得到亩产量(单位:kg/亩)的茎叶图如下(整数位为茎,小数位为叶,如55.4的茎为55,叶为4):亩产不低于60kg的茶园称为“高产茶园”,其它称为“非高产茶园”.(1)请根据已知条件完成以下22⨯列联表,并判断是否有95%的把握认为“高产茶园”与茶叶品种有关?A品种茶叶(亩数)B品种茶叶(亩数)合计高产茶园非高产茶园合计(2)用样本估计总体,将频率视为概率,现从该种植基地A品种的所有茶园中随机抽取4亩,且每次抽取的结果相互独立,设被抽取的4亩茶园中“高产茶园”的亩数为X,求X 的分布列和数学期望()E X.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++ ()2P K k≥0.0500.0100.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.A【分析】根据相关系数的定义可知①错误;根据特称命题(又叫存在性命题)的否定可知②错误;根据真值表即可判断“p q ∧为真”是命题“p q ∨为真”的充分不必要条件,故③错误;由条件可得,(1)0,(1)0,f f '-=-= 解得a=2,b=9或a=1,b=3,经检验,当a=1,b=3时,22()3633(1)0f x x x x '=++=+≥恒成立,此时()f x 没有极值点,故④错误。

高中数学选修2-3 第三章 统计案例 章末检测题

高中数学选修2-3 第三章 统计案例 章末检测题

高中数学选修2-3第三章 统计案例 章末检测题(满分150分,时间120分钟)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.分析人的身高与体重的关系,可以用( ) A .残差分析 B .回归分析 C .等高条形图D .独立性检验【解析】因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 【答案】B2.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K 2≈0.99,根据这一数据分析,下列说法正确的是( )A .有99%的人认为栏目优秀B .有99%的人认为栏目是否优秀与改革有关系C .有99%的把握认为电视栏目是否优秀与改革有关系D .没有理由认为电视栏目是否优秀与改革有关系【解析】由于K 2=0.99<3.841,所以没有理由认为电视栏目是否优秀与改革有关系,故选D.【答案】D3.已知一个线性回归方程为y ∧=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y =( ) A .58.5 B .46.5 C .60 D .75【解析】x =1+7+5+13+195=9,因为回归直线方程过点(x ,y ),所以y =1.5×x +45=1.5×9+45=58.5【答案】A4.设有一个回归方程为y ∧=3-5x ,当变量x 增加一个单位时( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位D .y 平均减少3个单位【解析】-5是斜率的估计值,说明x 每增加一个单位,y 平均减少5个单位. 【答案】B5.若由一个2×2列联表中的数据计算得K 2=6.630,则判断“这两个分类变量有关系”时,犯错误的最大概率是( )A .0.025B .0.01C .0.005D .0.001【解析】∵P (K 2>5.024)=0.025.又K 2=6.630>5.024,∴犯错误的最大概率为0.025. 【答案】A6.如图5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变小C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强【解析】由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.【答案】B7.假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:以下数据中,对于同一样本能说明X 与Y 有关的可能性最大的一组为( ) A .A =5,b =4,c =3,d =2 B .A =5,b =3,c =4,d =2 C .A =2,b =3,c =4,d =5 D .A =2,b =3,c =5,d =4【解析】可计算|ad -bc|的值,值越大说明X 与Y 有关的可能性越大. 【答案】D8.变量x 、y 具有线性相关关系,当x 取值为16,14,12,8时,通过观测得到y 的值分别为11,9,8,5.若在实际问题中,y 最大取值是10,则x 的最大取值不能超过( )A .14B .15C .16D .17【解析】根据题意y 与x 呈正相关关系,由最小二乘法或计算器求得回归系数a ∧≈-0.857,b ∧≈0.729,所以线性回归方程为y ∧=0.729x -0.857.当y ∧=10时,得x ≈15.【答案】B9.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:根据以上数据,则( )A .性别与获取学位类别有关B .性别与获取学位类别无关C .性别决定获取学位的类别D .以上都是错误的【解析】由列联表可得:博士:男性占2735≈77%,女性占835≈23%,相差很大,所以性别与获取学位的类别有关,故选A.【答案】A10.在两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的R 2如下,其中拟合效果最好的模型是( )A .模型1的R 2为0.30B .模型2的R 2为0.50C .模型3的R 2为0.75D .模型4的R 2为0.98 【解析】R 2越大,拟合效果越好. 【答案】D11.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x A .y =x -1 B .y =x +1 C .y =88+12x D .y =176【解析】将表中的五组数据分别代入选项验证,可知y =88+12x 最适合.【答案】C12.若对于变量y 与x 的10组统计数据的回归模型中,相关指数R 2=0.95,又知残差平方和为120.53,那么()1021i i y y=-∑的值为( )A .241.06B .2 410.6C .253.08D .2 530.8【解析】R 2=1-∑i =110(y i -y ∧i )2∑i =110(y i -y )2,得0.95=1-120.53∑i =110 (y i -y )2,得()1021i i y y=-∑=120.531-0.95=2 410.6.【答案】B二、填空题(本大题共4小题,每小题4分,共16分.请把正确的答案填在题中的横线上)13.在两个变量的回归分析中,R 2=________,R 2的值越________________________________________________________________________,说明残差平方和越________,也就是说模型的拟合效果越________.【答案】1-∑i =1n(y i -y ∧i )2∑i =1n(y i -y )2大 小 好14.已知样本数为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ∧=0.3x +a ∧,则x ≈________,a ∧≈________.(精确到0.01)【解析】由题意,x =111∑i =111x i =51011≈46.36,y =111∑i =111y i =21411,因为y =0.3x +a ∧,所以21411=0.3×51011+a ∧,可求得a ∧≈5.55. 【答案】46.36 5.5515.某单位为了了解用电量y (度)与气温x (°C )之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ∧=b ∧x +a ∧,其中b ∧=-2.现预测当气温为-4°C 时,用电量的度数约为________.【解析】x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ∧=-2.又回归方程y ∧=-2x +a ∧过点(10,40),故a ∧=60,所以当x =-4时,y ∧=-2×(-4)+60=68. 【答案】6816.若两个分类变量X 与Y 的列联表为:则“X 与Y 【解析】由列联表数据,可求得随机变量K 2的观测值k =81×(10×16-40×15)225×56×50×31≈7.227>6.635.因为P(K 2≥6.635)≈0.01.所以“x 与y 之间有关系”出错的概率仅为0.01.【答案】0.01三、解答题(本大题共6个小题,共74分.解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题满分12分)某研究者欲考察某一高考试题的得分情况是否与性别有关系,统计结果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人.试根据这些数据判断这一高考试题的得分情况与性别是否有关系.【解析】根据题中数据得如下列联表:由列联表中的数据得k =900×(290×350-100×160)2450×450×390×510≈163.348>10.828,所以在犯错误的概率不超过0.001的前提下认为“这一高考试题的得分情况与性别有关系.”18.(本小题满分12分)有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化.下面是试验的结果:(1)(2)求出机床运转的速度x 与每小时生产二级品数量y 的回归直线方程;(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?【解析】(1)散点图如下图所示:(2)易求得x =12.5,y =8.25,∴b ∧=∑i =14x i y i -4x y∑i =14x 2i -4x2≈0.728 6,a ∧=y -b ∧x =-0.857 5, 即所求回归直线的方程为:y ∧=0.728 6x -0.857 5.(3)根据公式,要使y ∧≤10, 只要0.728 6x -0.857 5≤10, 解得x ≤14.901 9,即机床的运转速度不能超过14.901 9转/秒.19.(本小题满分12分)有两个分类变量X 与Y ,其一组观测值如下面的2×2列联表所示:其中,a ,15-a 均为大于50.10的前提下认为“X 与Y 之间有关系”?【解析】要使在犯错误的概率不超过0.10的前提下认为“X 与Y 之间有关系”,需要随机变量K 2的观测值大于2.706.∵a +(20-a )=20, (15-a )+(30+a )=45,a +(15-a )=15,(20-a )+(30+a )=50, a +(20-a )+(15-a )+(30+a )=65,则 K 2=65×[a (30+a )-(20-a )(15-a )]220×45×15×50=13(13a -60)25 400>2.706,解之可得,a >7.19或a <2.04,而由原题知a >5且15-a >5,a ∈Z ,即a =6,7,8,9.故当a =8或9时,可在犯错误的概率不超过0.10的前提下认为X 和Y 之间有关系. 20.(本小题满分12分)下表提供了某厂生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧; (2)请求出R 2,并说明残差变量对预报变量的影响约占百分之几.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【解析】(1)∑i =14x i y i =66.5,∑i =14x 2i =32+42+52+62=86,x =4.5,y =3.5b ∧=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7a ∧=y -b ∧x =3.5-0.7×4.5=0.35所求的线性回归方程为y ∧=0.7x +0.35 (2)计算得残差及偏差的数据如下表:从而得∑i =14(y i -y ∧i )2=0.05,∑i =14(y i -y )2=2.5所以R 2=1-∑i =14(y i -y ∧i )2∑i =14(y i -y )2=1-0.052.5=0.98.所以残差变量对预报变量的贡献率约为2%.21.(本小题满分13分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”做了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.(1)若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人? 【解析】设男生人数为x ,依题意可得列联表如下:(1)则K 2>3.841, 由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x 2·x 2·x =38x >3.841,解得x >10.24, ∵x 2,x6为整数, ∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人;(2)若没有充分的证据显示是否喜欢韩剧和性别有关, 则K 2≤2.706,由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x2·x 2·x =38x ≤2.706,解得x ≤7.216, ∵x 2,x6为整数, ∴若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有6人.22.(本小题满分13分)某种生物的产卵数与温度有一定的关系,现在收集了7组数据,如下表:【解析】将上表中的数据作成散点图(如图1),可以发现这些点并不是分布在一条直线的附近,而是近似地分布在一个二次函数的图象的附近,因此可用非线性回归模型进行分析,令t =x 2,得到下表:再做出y 和t 的散点图(如图2),发现这些点分布在一条直线的附近,所以y 与t 线性相关,由公式可计算求得:b ∧=∑t i y i -7t y ∑t 2i -7t2≈0.37,a ∧=y -b ∧t =-204.90,于是y ∧=0.37t -204.90,故y 与x 之间的回归方程是y ∧=0.37x 2-204.90,当x =50时,代入可得y ∧=720.1,故由此可以估计温度在50°C 时的产卵数量大约为720个.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高中新课标选修(2-3)第三章统计案例综合测试题
一、选择题
1.下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费;
③家庭的支出与收入.
其中不是函数关系的有()
A.0个B.1个C.2个D.3个
答案:D
2.当2 3.841
K>时,认为事件A与事件B()
A.有95%的把握有关
B.有99%的把握有关
C.没有理由说它们有关
D.不确定
答案:A
3.已知回归直线方程$y bx a
=+,其中3
a=且样本点中心为(12)
,,则回归直线方程为()A.3
y x
=+B.23
y x
=-+C.3
y x
=-+D.3
y x
=-
答案:C
4.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表:
喜欢数学
不喜欢
数学


男37 85
1 22
女35 143
1 78
合计72 228
3
00
你认为性别与是否喜欢数学课程之间有关系的把握有()A.0 B.95%C.99%D.100%
答案:B
5
广
告费
245 6 8
销售额
3
4
6
5
7
则广告费与销售额间的相关系数为()
A.0.819 B.0.919 C.0.923 D.0.95
答案:B
6.在回归直线方程$y a bx
=+中,回归系数b表示()
A.当0
x=时,y的平均值
B.x变动一个单位时,y的实际变动量
C.y变动一个单位时,x的平均变动量
D.x变动一个单位时,y的平均变动量
答案:D
7.对于回归分析,下列说法错误的是()
A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的,也可以是负的
C.回归分析中,如果21
r=,说明x与y之间完全相关
D.样本相关系数(11)
r∈-,
答案:D
8
中国





罗斯



色列

拿大






授课天数
2
51
2
22
2
07
21
1
74
21
5
18
8
1
92
1
80
1
91
分数
8
7
3
7
1
70
6
4
63 62
61
5
5
4
6
对于授课天数与分数是否存在回归直线,下列说法正确的是()A.一定存在
B.可能存在也可能不存在
C.一定不存在
D.以上都不正确
答案:A
9.下列关于残差图的描述错误的是()
A.残差图的横坐标可以是编号
B.残差图的横坐标可以是解释变量和预报变量
C.残差点分布的带状区域的宽度越窄相关指数越小
D.残差点分布的带状区域的宽度越窄残差平方和越小
答案:C
10.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成份含量之间的相关关系,现取了8对观测值,计算得:8
1
52i i x ==∑,8
1
228i i y ==∑,8
21
478i
i x ==∑,8
1
1849i i i x y ==∑,则y 与x 的
回归直线方程是( ) A.$
11.47 2.62y x =+ B.$
11.47 2.62y x =-+ C.$ 2.6211.47y x x =+
D.$
11.47 2.62y x =-
答案:A
二、填空题
11.直线回归方程$
y a bx =+恒过定点 .
答案:()x y ,
12.下表给出了某些地区的鸟的种类与这些地区的海拔高度(m ):
种类
数 36
3
0 3
7 11 12
13
17 18
2
9 4
15
海拔高度
1250 1158 1067 457 701 731 610 670 1493 762 549
分析这些数据,可得鸟的种类与海拔高度间的相关系数为 .
答案:0.782
13.设对变量x ,Y 有如下观察数据:
151
152
153
154 156
157 158
160
161
162
163
164 40
41 41 41.5
42
42.5
43
44 45 45 4
6
45.5
则Y 的线性回归方程为 .
答案:$
0.446327.2920y x =-
42
4
2 4
6 4
6 4
6 5
5
5
5
2
5
2
5
8
5
8
2.55 2.20 2.75 2.40 2.80 2.81
3.41 3.10 3.46 2.85 3.50 3.00
的同学的肺活约量为 .
答案:3.24
三、解答题
15.某市统计1994~2004年在校中学生每年高考考入大学的百分比,把农村、县镇、城市分开统计,为了便于计算,把1994年编号为0,1995年编号为1,…,2004年编号为10,如果把每年考入大学的百分比作为统计变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线:
城市:$9.50 2.54
y x
=+;
县镇:$ 6.76 2.32
y x
=+;
农村:$1.800.42
y x
=+.
(1)在同一坐标系中作出三条回归直线;
(2)对于农村学生来讲,系数等于0.42意味着什么?
(3)在这一阶段,哪里的大学入学率增长最快?
解:(1)散点图略;
(2)对于农村学生来讲,系数等于0.42意味着1994~2004年在校中学生每年高考考入大学的百分比逐年增加0.42;
(3)在这一阶段,城市的大学入学率增长最快.
16.调查在2~3
晕船

晕船


男人
1
2
25
3
7
女人
1
24
3
4
合计
2
2
49
7
1
根据此资料,你是否认为在
解:
2
2
71(12242510)
0.08
22493734
K
⨯⨯-⨯
=≈
⨯⨯⨯

因为0.08 2.706
<,所以我们没有理由说晕船与男女性别有关.
17.对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)
焦虑






女 5 113
解:对于上述三种心理障碍分别构造三个随机变量22
212
3K K K ,,, 由表中数据可得
2
21
110(5602520)0.86330802585
K ⨯⨯-⨯=≈⨯⨯⨯,
2
22
110(10702010) 6.36630802090
K ⨯⨯-⨯=≈⨯⨯⨯,
2
23
110(15301550) 1.41030806545
K ⨯⨯-⨯=≈⨯⨯⨯.
因为22K 的值最大,所以说谎与性别关系最大.
18.一机器可以按各种不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x 表示转速(单位:转/秒),用y 表示每小时生产的有缺点物件个数,现观测得到()x y ,的4组观测值为(8,5),(12,8),(14,9),(16,11). (1)假定y 与x 之间有线性相关关系,求y 对x 的回归直线方程;
(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒.(精确到1转/秒)
解:(1)设回归直线方程为$
y bx a =+,12.5=x ,8.25y =,4
21
660i i x ==∑,4
1
438i i i x y ==∑. 于是2
438412.58.2525.551660412.53570b -⨯⨯=
==-⨯,513351256
8.2512.57047027
a y bx =-=-⨯=-⨯=-. ∴所求的回归直线方程为$
516
707
y x =-; (2)由$51610707y x =-≤,得760
1551
x ≈≤,
即机器速度不得超过15转/秒.。

相关文档
最新文档